評論: GPT-4.5震撼上線!OpenAI最大最貴模型最像人類
隻有登錄用戶才能發表評論,
點擊此處
登錄
返回新聞帖
Bhistory
發表評論於 2025-02-28 08:51:39
在知識和情商上,GPT-4.5提高了
其他好像沒什麽突破
----------------------------------------------------------------------------------------
| Benchmark | GPT-4.5 Score | Grok 3 (Standard) | Grok 3 (Think Mode) | Notes |
----------------------------------------------------------------------------------------
| Math (AIME 2024) | 36.7% | 52.2% | 93.3% | Grok 3 excels in math |
| Science (GPQA) | 71.4% | 75.0% | 84.6% | Close in standard mode |
| Coding (LiveCode) | ~70-75% (est.)| 57.0% | 79.4% | GPT-4.5 est. from o1 |
----------------------------------------------------------------------------------------
彎刀月
發表評論於 2025-02-28 07:44:00
這個小白猶上竄下跳,好像這都是他發明的
碼農個體戶
發表評論於 2025-02-28 05:45:06
AI 還處於初級階段,追蹤這些“進步”實在是浪費時間,過幾年再關注吧
thinredline
發表評論於 2025-02-28 04:45:45
Grok3比它更有性價比,而且免費。
寶刀屠龍
發表評論於 2025-02-28 04:16:10
令胡衝 發表評論於 2025-02-27 23:45:29
說明堆積GPU的方式已經窮途末路,行不通的。再堆積10倍的GPU,甚至都取得不了10%的提升。
Token價格比DeepSeek貴65倍。這你怎麽能夠生存下去?無法持續。
=========================================================
算上研發成本,innovator drug比generic drug生產成本高幾十倍甚至幾百倍
generic每天都在揩original玩家的油,全球這些頂級原研藥開發企業都死了?
事實上,所有AI玩家都在優化算力算法,但同時也都在擴大算力中心
兩條腿走路才是最佳路徑,隻有傻叉才會認為這些大玩家隻會堆算力而不知道優化算法算力
就這還出來自以為是的做專家,還是洗洗睡吧
令胡衝
發表評論於 2025-02-27 23:45:29
說明堆積GPU的方式已經窮途末路,行不通的。再堆積10倍的GPU,甚至都取得不了10%的提升。
Token價格比DeepSeek貴65倍。這你怎麽能夠生存下去?無法持續。
———————
GPT-410倍計算量,token價格太離譜
heisse
發表評論於 2025-02-27 22:34:12
4.5+o3+deep research+agent=Chatgpt 5,雖然還沒有到AGI,但會把其他AI模型又拋到了後麵, API 價格這麽貴,就是防著其他人copy output數據,no more chance for distillation!!!
ca_lowhand
發表評論於 2025-02-27 21:25:00
增加了模擬情商能力,自然對話有表現力感染力。然而這麽離譜的價格,決定了它隻是個高級玩具,沒有任何商業價值。
頁次:
1
/1
每頁
50
條記錄, 本頁顯示
1
到
8
, 共
8
分頁: [
1
]
其他好像沒什麽突破
----------------------------------------------------------------------------------------
| Benchmark | GPT-4.5 Score | Grok 3 (Standard) | Grok 3 (Think Mode) | Notes |
----------------------------------------------------------------------------------------
| Math (AIME 2024) | 36.7% | 52.2% | 93.3% | Grok 3 excels in math |
| Science (GPQA) | 71.4% | 75.0% | 84.6% | Close in standard mode |
| Coding (LiveCode) | ~70-75% (est.)| 57.0% | 79.4% | GPT-4.5 est. from o1 |
----------------------------------------------------------------------------------------