DeepSeek 的 paper

來源: 2025-01-26 10:12:58 [舊帖] [給我悄悄話] 本文已被閱讀:

 

DeepSeek V3

https://arxiv.org/pdf/2412.19437v1

 

DeepSeek R1:

https://arxiv.org/pdf/2501.12948

 

算法上:

V3: MoE Google Gemini and OpenAI 都是, 但 DeepSeek is the first one open-source 吧

R1: 同樣V3. DeepSeek is the first one open-source

 

cost 上:

這個差太遠了

 

估計半年見分曉。美國大模型一般半年升級一次。讓子彈飛一會。