舉個例子,Linux 計算 blas庫裏麵嵌套匯編的例子太多了,不代表blas可以輕鬆移植到其他cpu.

所有跟帖: 

這些最終的匯編不是自己寫的,是AI根據標注生成的 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 16:39:04

Blas 庫裏麵SIMD 是最基本的匯編嵌入指令了,隻不過這年頭都不學匯編了,搞得很先進似的。 -BeyondWind- 給 BeyondWind 發送悄悄話 (0 bytes) () 01/29/2025 postreply 16:42:04

他自己說的 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (937 bytes) () 01/29/2025 postreply 17:20:48

這個和gpu 指令優化沒關係。 -BeyondWind- 給 BeyondWind 發送悄悄話 (0 bytes) () 01/29/2025 postreply 17:27:18

the bigger deepseek helping optimize code to run the smaller -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 17:34:54

請您先登陸,再發跟帖!