馬斯克並沒有這樣的判斷,蒸溜法小參數模型性能不會超過原始大參數模型,根本不是DS的情況

來源: 2025-01-28 23:12:57 [舊帖] [給我悄悄話] 本文已被閱讀: