我覺得扯淡

DeepSeek自己說是用了260萬個H800的GPU小時,現在開源了,Alex Wang要是覺得H800是個閹割版不足以訓練出這麽複雜的模型,自己跑一下不就知道了?開源了DeepSeek還敢在訓練時間上造假?

所有跟帖: 

CIA和FBI都沒說,他怎麽知道的? -新年2012- 給 新年2012 發送悄悄話 (0 bytes) () 01/26/2025 postreply 00:28:10

請您先登陸,再發跟帖!