不是蒸餾阿裏的,而是蒸餾穀歌的。Gemini 2.0是穀歌的,不是阿裏的。
所有跟帖:
•
說的是這個 s1模型的訓練並非從零開始,而是基於阿裏雲通義千問(Qwen)模型進行監督微調。二級蒸餾
-Zhivago-
♂
(0 bytes)
()
02/06/2025 postreply
09:53:55
•
報道裏我沒看到提到阿裏的Qwen,隻提到穀歌的Gemini 2.0。
-大觀園的賈探春-
♀
(0 bytes)
()
02/06/2025 postreply
09:58:12
•
那你現在看到了 再評論一下?
-Zhivago-
♂
(0 bytes)
()
02/06/2025 postreply
09:58:57
•
在你主帖鏈接的那篇報道裏還是沒看到。
-大觀園的賈探春-
♀
(0 bytes)
()
02/06/2025 postreply
10:01:55
•
是蒸餾阿裏Qwen, 這是李飛飛的論文。
-Knight_2024-
♂
(81 bytes)
()
02/06/2025 postreply
11:33:34
•
哈哈,被打臉的不出聲了
-manyworlds-
♂
(0 bytes)
()
02/08/2025 postreply
23:11:03
•
基礎模型是千問。準備的1000條推理訓練數據是從Gemini Flash爬下來的。
-林誠毅德-Lincoln-
♂
(0 bytes)
()
02/08/2025 postreply
09:51:44