2025 IMO真題撕碎AI數學神話,全球頂尖模型齊翻車!
新浪長文:
2025 IMO真題撕碎AI數學神話,全球頂尖模型齊翻車!冠軍銅牌都拿不到
如果你以為,如今的LLM已經無所不能,那剛剛出爐的2025大模型數學競賽結果,恐怕要讓你大跌眼鏡了。
現在,各模型的分數已經在MathArena上發布。
怎麽說呢,所有大模型都翻車了。
即使得分最高的冠軍Gemini,也隻拿到了31%的分數。憑這個成績,連拿銅牌都不大可能。
。。。
如果你以為,如今的LLM已經無所不能,那剛剛出爐的2025大模型數學競賽結果,恐怕要讓你大跌眼鏡了。
現在,各模型的分數已經在MathArena上發布。
怎麽說呢,所有大模型都翻車了。
即使得分最高的冠軍Gemini,也隻拿到了31%的分數。憑這個成績,連拿銅牌都不大可能。
。。。