新浪長文:
2025 IMO真題撕碎AI數學神話,全球頂尖模型齊翻車!冠軍銅牌都拿不到
如果你以為,如今的LLM已經無所不能,那剛剛出爐的2025大模型數學競賽結果,恐怕要讓你大跌眼鏡了。
現在,各模型的分數已經在MathArena上發布。
怎麽說呢,所有大模型都翻車了。
即使得分最高的冠軍Gemini,也隻拿到了31%的分數。憑這個成績,連拿銅牌都不大可能。
。。。
如果你以為,如今的LLM已經無所不能,那剛剛出爐的2025大模型數學競賽結果,恐怕要讓你大跌眼鏡了。
現在,各模型的分數已經在MathArena上發布。
怎麽說呢,所有大模型都翻車了。
即使得分最高的冠軍Gemini,也隻拿到了31%的分數。憑這個成績,連拿銅牌都不大可能。
。。。
•
真的嗎?看看這新聞:
-大觀園的賈探春-
♀
(265 bytes)
()
07/21/2025 postreply
15:38:36
•
看看裏麵穀歌官網的新聞。穀歌的AI達到金牌標準:
-大觀園的賈探春-
♀
(369 bytes)
()
07/21/2025 postreply
15:43:11
•
OpenAI
-挖礦-
♂
(0 bytes)
()
07/21/2025 postreply
15:45:37
•
穀歌的AI是貨真價實的2025 IMO金牌標準。
-大觀園的賈探春-
♀
(0 bytes)
()
07/21/2025 postreply
15:47:23
•
按照現在的出題邏輯 完全有可能的 出題也是有規律的
-挖礦-
♂
(0 bytes)
()
07/21/2025 postreply
15:48:21
•
裏麵隻是說openAI 沒和官方合作,在閉幕式以前就搶發新聞,壞了規矩。不是AI造假
-STEMkid-
♂
(0 bytes)
()
07/21/2025 postreply
16:25:16
•
黎曼猜想躺在那裡等AI們去掘金。。。
-喀爾判0715-
♀
(0 bytes)
()
07/21/2025 postreply
16:16:25
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy