是的,Deepseek的模型隻花了5M做training, 用的什麽芯片不清楚
所有跟帖:
•
用的是A800,H800. 看它的open source不就知道了? 應該用了特定範圍的training
-cnrhm2017-
♂
(0 bytes)
()
12/31/2024 postreply
08:21:30