AI象棋比賽在比什麽

這個象棋比賽是對比現在市麵上主要的幾款通用大模型,在關鍵的Chain of Thought上的推理能力。這些模型不是那種專門設計的象棋比賽模型,是沒有針對象棋進行過訓練的。就類似於,一個大學生,每人看過幾本象棋知識書,然後就開始比賽。這個比的就是對未知情況下,對邏輯的推理能力。
這個比賽是Google躥搓的,本來他是想證明一下它的最新模型的能力,現在被嚴重打臉丟人…因為它最powerful的大模型,隻和openAI的一個快速小模型相當。這個實在是差呀。
Musk的grok 4也幹不過openAI的o3, 更別說快要上市的GPT5。 所以,老馬也不要隨便吹牛了。

所有跟帖: 

就是業餘棋手下著玩 -zaocha2002- 給 zaocha2002 發送悄悄話 zaocha2002 的博客首頁 (0 bytes) () 08/07/2025 postreply 12:12:33

請您先登陸,再發跟帖!