當初DS就是最先蒸餾OpenAI的數據來訓練它的R1模型

來源: 2026-02-23 14:12:52 [舊帖] [給我悄悄話] 本文已被閱讀: