2025 IMO真題撕碎AI數學神話,全球頂尖模型齊翻車!

新浪長文:

 

2025 IMO真題撕碎AI數學神話,全球頂尖模型齊翻車!冠軍銅牌都拿不到

如果你以為,如今的LLM已經無所不能,那剛剛出爐的2025大模型數學競賽結果,恐怕要讓你大跌眼鏡了。

現在,各模型的分數已經在MathArena上發布。

怎麽說呢,所有大模型都翻車了。

即使得分最高的冠軍Gemini,也隻拿到了31%的分數。憑這個成績,連拿銅牌都不大可能。

。。。

所有跟帖: 

真的嗎?看看這新聞: -大觀園的賈探春- 給 大觀園的賈探春 發送悄悄話 大觀園的賈探春 的博客首頁 (265 bytes) () 07/21/2025 postreply 15:38:36

看看裏麵穀歌官網的新聞。穀歌的AI達到金牌標準: -大觀園的賈探春- 給 大觀園的賈探春 發送悄悄話 大觀園的賈探春 的博客首頁 (369 bytes) () 07/21/2025 postreply 15:43:11

OpenAI -挖礦- 給 挖礦 發送悄悄話 挖礦 的博客首頁 (0 bytes) () 07/21/2025 postreply 15:45:37

穀歌的AI是貨真價實的2025 IMO金牌標準。 -大觀園的賈探春- 給 大觀園的賈探春 發送悄悄話 大觀園的賈探春 的博客首頁 (0 bytes) () 07/21/2025 postreply 15:47:23

按照現在的出題邏輯 完全有可能的 出題也是有規律的 -挖礦- 給 挖礦 發送悄悄話 挖礦 的博客首頁 (0 bytes) () 07/21/2025 postreply 15:48:21

裏麵隻是說openAI 沒和官方合作,在閉幕式以前就搶發新聞,壞了規矩。不是AI造假 -STEMkid- 給 STEMkid 發送悄悄話 (0 bytes) () 07/21/2025 postreply 16:25:16

黎曼猜想躺在那裡等AI們去掘金。。。 -喀爾判0715- 給 喀爾判0715 發送悄悄話 (0 bytes) () 07/21/2025 postreply 16:16:25

請您先登陸,再發跟帖!