DeepSeek 反映了中國研究工作的多快好省特點

來源: viBravo5 於 2025-01-28 11:58:08 [檔案] [舊帖] [給我悄悄話] 閱讀數 : (1868 bytes)

本帖於 2025-01-28 12:01:20 時間, 由普通用戶 viBravo5 編輯

DeepSeek一直於用別的AI模型產生的synthetic數據去訓練大型語言模型（LLM):

去年 OpenAI 推出ChatGPT o1版，其特點是用 reinforcement learning（RL) 訓練讓 LLM 去“想”

接著，DeepSeek學的很快，並把 synthetic data 與 reinforcement learning 結合起來推出 DeepSeek r1

這就是中國研究工作的多快好省特點.

您的位置：文學城 » 論壇 » AI 潮流社 » DeepSeek 反映了中國研究工作的多快好省特點