當初DS就是最先蒸餾OpenAI的數據來訓練它的R1模型

本帖於 2026-02-23 14:14:17 時間, 由普通用戶 黃一枚 編輯
請您先登陸,再發跟帖!