shakuras2000 發表評論於 2025-01-27 07:14:291. deepseek確實很強
2. deepseek大概率用了gpt的數據做了distill,所以脫離了更好的模型,deepseek可能做不到這麽好
3. 550萬是訓練成本,實際成本可能高幾倍,但是還是很低。
4. 有人說其實deepseek用了10000張A卡,隻是因為眾說周知的原因不能說,不過沒證據我暫時當成謠言。
5. 這家公司是做量化的,就算deepseek不賺錢,發布配合沽空美股也能賺翻,汗
網友說
所有跟帖:
• 我也過量化這一塊,還有總理見麵鼓勵這一塊。但是做量化的人和做人工智能的人本來就高度重合,所以也沒啥特殊的 -龍灣故事會- ♀ (0 bytes) () 01/27/2025 postreply 13:45:12