深度求索開發了一個匯編語言人工智能,生成的匯編效率超過CUDA

本帖於 2025-01-29 16:11:27 時間, 由普通用戶 cn_abcd 編輯
 

所有跟帖: 

雖然還不能說英偉達的護城河已經被打破,但起碼可以說這條護城河不那麽深了 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 16:16:02

華為費了老大勁做的事,DS輕輕鬆鬆接近解決 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 16:17:42

英偉達的護城河是cuda生態,如果META可以用,別人也可以,那麽英偉達20年的努力白費了 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 16:28:21

看META工程師的post -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 16:34:21

綠色的那一段 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 16:41:03

他不說了是prompt了嗎?SIMD在Intel 剛出MMX的時候是很簡單的優化。 -BeyondWind- 給 BeyondWind 發送悄悄話 (0 bytes) () 01/29/2025 postreply 16:45:27

舉個例子,Linux 計算 blas庫裏麵嵌套匯編的例子太多了,不代表blas可以輕鬆移植到其他cpu. -BeyondWind- 給 BeyondWind 發送悄悄話 (0 bytes) () 01/29/2025 postreply 16:37:28

這些最終的匯編不是自己寫的,是AI根據標注生成的 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 16:39:04

Blas 庫裏麵SIMD 是最基本的匯編嵌入指令了,隻不過這年頭都不學匯編了,搞得很先進似的。 -BeyondWind- 給 BeyondWind 發送悄悄話 (0 bytes) () 01/29/2025 postreply 16:42:04

他自己說的 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (937 bytes) () 01/29/2025 postreply 17:20:48

這個和gpu 指令優化沒關係。 -BeyondWind- 給 BeyondWind 發送悄悄話 (0 bytes) () 01/29/2025 postreply 17:27:18

the bigger deepseek helping optimize code to run the smaller -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 17:34:54

這個比較有用,讓代碼需要的資源更少,速度更快,也更容易運行在別的AI硬件上。如果用中國自產的AI芯片,替代女大,將是 -硬碼工- 給 硬碼工 發送悄悄話 (15 bytes) () 01/29/2025 postreply 16:17:44

現在隻是可能,對於其他卡,需要花精力去理解優化 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 16:20:33

和中國的AI廠家合作,很方便 -硬碼工- 給 硬碼工 發送悄悄話 (0 bytes) () 01/29/2025 postreply 16:55:01

這個類似於C語言高性能計算時嵌套個匯編指令,又不是完全用匯編寫的,很常見,哪有那麽神。 -BeyondWind- 給 BeyondWind 發送悄悄話 (0 bytes) () 01/29/2025 postreply 16:30:27

這些最終的匯編不是自己寫的,是AI根據標注生成的 -cn_abcd- 給 cn_abcd 發送悄悄話 cn_abcd 的博客首頁 (0 bytes) () 01/29/2025 postreply 16:33:44

AI會個simd匯編指令一點不奇怪,因為SIMD指令是很常用的優化指令. -BeyondWind- 給 BeyondWind 發送悄悄話 (0 bytes) () 01/29/2025 postreply 16:53:55

抄襲openAI的幾乎做實了 -5678910- 給 5678910 發送悄悄話 (0 bytes) () 01/29/2025 postreply 16:37:23

就看deep seek能不能開發出一個超過CUDA的軟件 -年輪- 給 年輪 發送悄悄話 (0 bytes) () 01/29/2025 postreply 16:51:10

還是幾十年前的事,先寫機器語言,然後再匯編語言。語言不複雜,但是編起來要費點腦筋。 -chufang- 給 chufang 發送悄悄話 chufang 的博客首頁 (0 bytes) () 01/29/2025 postreply 17:08:14

架構師+AI就能整個更好的軟件出來的日子不遠了。 -dakinglaile- 給 dakinglaile 發送悄悄話 dakinglaile 的博客首頁 (0 bytes) () 01/29/2025 postreply 19:10:38

請您先登陸,再發跟帖!