DeepSeek R1 最多也就是趕上 OpenAI o1-1217

Bob007 · 2025-01-27 19:04:14Z

DeepSeek R1 最多也就是趕上 OpenAI o1-1217簡介

來源: Bob007 於 2025-01-27 19:04:14 [檔案] [舊帖] [給我悄悄話] 閱讀數 : (14743 bytes)

Benchmark	DeepSeek-R1 (%)	OpenAI o1-1217 (%)	Verdict
AIME 2024 (Pass@1)	79.8	79.2	DeepSeek-R1 wins (better math problem-solving)
Codeforces (Percentile)	96.3	96.6	OpenAI-o1-1217 wins (better competitive coding)
GPQA Diamond (Pass@1)	71.5	75.7	OpenAI-o1-1217 wins (better general QA performance)
MATH-500 (Pass@1)	97.3	96.4	DeepSeek-R1 wins (stronger math reasoning)
MMLU (Pass@1)	90.8	91.8	OpenAI-o1-1217 wins (better general knowledge understanding)
SWE-bench Verified (Resolved)	49.2	48.9	DeepSeek-R1 wins (better software engineering task handling)

您的位置：文學城 » 論壇 » 時事述評 » DeepSeek R1 最多也就是趕上 OpenAI o1-1217

• 輕鬆趕上，超越後就一騎絕塵了 -Amerix- ♂ (0 bytes) () 01/27/2025 postreply 19:06:44

• 說啥呢，o1 o3 哪來的第四代 -監考老師- ♂ (0 bytes) () 01/27/2025 postreply 19:32:03

• GPT-4 -victor1988- ♂ (0 bytes) () 01/27/2025 postreply 20:17:38

• o1 不是 GPT-1 -監考老師- ♂ (0 bytes) () 01/27/2025 postreply 21:53:15

• 比的還是OpenAI 一個月前的產品 -Bob007- ♂ (0 bytes) () 01/27/2025 postreply 19:07:28

• 海量燒錢，後勁不足了 -Amerix- ♂ (0 bytes) () 01/27/2025 postreply 19:10:56

• 這是AI比較ChatGPT和Mathematica -Bob007- ♂ (1108 bytes) () 01/28/2025 postreply 06:09:29