說的是這個 s1模型的訓練並非從零開始,而是基於阿裏雲通義千問(Qwen)模型進行監督微調。二級蒸餾

來源: 2025-02-06 09:53:55 [舊帖] [給我悄悄話] 本文已被閱讀: