簡體 | 繁體

loading...

熱點論壇

全部論壇列表

用“蒸餾”過的數據，直接上RL，省了pre-taining ，是大膽，也算是“二次開發”。當然省時省錢。

來源: kl3527 於 2025-01-26 21:43:00 [檔案] [博客] [舊帖] [給我悄悄話] 閱讀數 : (0 bytes)

字體:調大/重置/調小 | 加入書簽 | 打印 | 所有跟帖 | 加跟貼 | 當前最熱討論主題

回答: 從穀歌Gemini失利，談中國DeepSeek到底是中草藥還是AI利器？由金筆於 2025-01-26 21:00:32

您的位置：文學城 » 論壇 » 時事述評 » 用“蒸餾”過的數據，直接上RL，省了pre-taining ，是大膽，也算是“二次開發”。當然省時省錢。

所有跟帖：

• 蒸餾？那就更沒有原汁原味了。謝謝補充。沒有花時間研究它，隻是覺得DeepSeek不會靠譜而已。。。！ -金筆- ♂ (0 bytes) () 01/26/2025 postreply 21:57:51

• 蒸餾是指從用大模型比如DeepSeek R1去訓練參數少的小模型，從而得到8B，14B，32B等等對資源要求較少的版本。 -監考老師- ♂ (0 bytes) () 01/26/2025 postreply 22:55:17

請您先登陸，再發跟帖！