說的是這個 s1模型的訓練並非從零開始,而是基於阿裏雲通義千問(Qwen)模型進行監督微調。二級蒸餾
來源:
Zhivago
於
2025-02-06 09:53:55
[
舊帖
] [
給我悄悄話
] 本文已被閱讀:次