就像商店免費給的東西,不要白不要,人人都拿一個。DS蒸餾,的確會運行效率高一點,但也絕對不是10x, 最多2x。蒸餾就是站在巨人肩膀上,學習省很多勁。就像牛頓發現三大定律花了很長時間,我們在學校一個星期就全學會了,考試100分。
DeepSeek沒有新算法,不值什麽錢,基本都是已知的。如果不是開源免費,不會有太多人用
本帖於 2025-01-30 16:30:18 時間, 由普通用戶 未知 編輯
所有跟帖:
• 這個有點誇大了。好像Nature上有篇文章上說distillation會出gibberish。DS弄出來說明此路可通。 -mobius- ♂ (0 bytes) () 01/30/2025 postreply 17:38:11