不覺得多神秘,product design勝出吧。

如何在閹割版芯片上trade off精度到達符合大多數應用的結果。

所有跟帖: 

搞不好閹割版都不讓賣了 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/27/2025 postreply 14:56:14

黃教主還是想做生意的。 -加州lalin- 給 加州lalin 發送悄悄話 加州lalin 的博客首頁 (0 bytes) () 01/27/2025 postreply 14:58:14

老黃作不了主啊,商務部決定 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/27/2025 postreply 14:59:26

老黃一直在偷跑。閹割版也是他搞出來的 -加州lalin- 給 加州lalin 發送悄悄話 加州lalin 的博客首頁 (0 bytes) () 01/27/2025 postreply 15:00:51

有錢不賺白不賺,他又不是傻子 -我是誰的誰- 給 我是誰的誰 發送悄悄話 (0 bytes) () 01/27/2025 postreply 15:01:45

H800和H100的性能差,原來主要就GPU之間的通信寬度。理解Deep Seek的做法。所以老美芯片限製沒用的 -加州lalin- 給 加州lalin 發送悄悄話 加州lalin 的博客首頁 (0 bytes) () 01/27/2025 postreply 16:10:37

上鏈接,解釋Deep Seek53頁的paper -加州lalin- 給 加州lalin 發送悄悄話 加州lalin 的博客首頁 (145 bytes) () 01/27/2025 postreply 14:56:56

早茶姊妹,看這個link。我偷懶,快速聽了這位博主講解deep seek tech paper. -加州lalin- 給 加州lalin 發送悄悄話 加州lalin 的博客首頁 (0 bytes) () 01/27/2025 postreply 15:08:37

請您先登陸,再發跟帖!