他自己說的

"I came up with this whole idea while optimizing wllama to run deepseek-r1-distilled-qwen-1.5B faster. So the bigger deepseek helping optimize code to run the smaller deepseek."

所有跟帖: 

這個和gpu 指令優化沒關係。 -BeyondWind- 給 BeyondWind 發送悄悄話 (0 bytes) () 01/29/2025 postreply 17:27:18

the bigger deepseek helping optimize code to run the smaller -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 17:34:54

請您先登陸,再發跟帖!