Deepseek 這幾天一直開源各類用cuda寫的函數庫，昨天是fp8 的GEMM庫

kittybunny · 2025-02-27 09:51:03Z

Deepseek 這幾天一直開源各類用cuda寫的函數庫，昨天是fp8 的GEMM庫簡介

來源: kittybunny 於 2025-02-27 09:51:03 [檔案] [舊帖] [給我悄悄話] 閱讀數 : (1054 bytes)

回答: 馬後炮：nvda 財報，成長性體現在 deepseek時刻之前由 Helen1817 於 2025-02-27 08:48:39

這個還是在cuda之上，pytorch之下的中間實現，主要用8位浮點數計算以前16/32位的矩陣乘法。
另外優化了內存之間數據移動。這個還是機遇nvidia體係的優化，讓大家知道低精度運算一樣可靠。
新的nvidia顯卡加入了FP4的支持，明顯會因deepseek開源獲益。
我其實覺得deekseek這個開源操作是對nvidia利好，以前一直是ASIC可以代替NVIDIA，因為ASIC可以更加高效得實現矩陣乘法。
但是deepseek一開源，馬上可以讓nvidia效率提升，如果我負責數據中心硬件采購，我投入ASIC之前會想想，是我用舊的nvidia卡挖掘效率簡單還是用ASIC用固定精度實現矩陣乘法容易？如果那天又有人實現了一個完全不同的優化並且開源一個新的模型，是不是我的ASIC就不能跑新模型？我的投資泡湯？市場在衡量ASIC vs NVIDIA, 看看最近AVGO/MRVL vs NVDA走勢吧，看哪個analysist 知道GPU跟ASIC實現細節吧

您的位置：文學城 » 論壇 » 大千股壇 » Deepseek 這幾天一直開源各類用cuda寫的函數庫，昨天是fp8 的GEMM庫

所有跟帖：

• Top insight. Thanks -newbie2014- ♀ (0 bytes) () 02/27/2025 postreply 10:29:52

• 主要用8位浮點數計算以前16/32位的矩陣乘法是否可在ASIC直接實現？通過driver來setup？ -win8888- ♂ (0 bytes) () 02/27/2025 postreply 10:47:50

請您先登陸，再發跟帖！

Deepseek 這幾天一直開源各類用cuda寫的函數庫， 昨天是fp8 的GEMM庫

所有跟帖：

Deepseek 這幾天一直開源各類用cuda寫的函數庫，昨天是fp8 的GEMM庫