如何在閹割版芯片上trade off精度到達符合大多數應用的結果。
不覺得多神秘,product design勝出吧。
所有跟帖:
• 搞不好閹割版都不讓賣了 -我是誰的誰- ♂ (0 bytes) () 01/27/2025 postreply 14:56:14
• 黃教主還是想做生意的。 -加州lalin- ♀ (0 bytes) () 01/27/2025 postreply 14:58:14
• 老黃作不了主啊,商務部決定 -我是誰的誰- ♂ (0 bytes) () 01/27/2025 postreply 14:59:26
• 老黃一直在偷跑。閹割版也是他搞出來的 -加州lalin- ♀ (0 bytes) () 01/27/2025 postreply 15:00:51
• 有錢不賺白不賺,他又不是傻子 -我是誰的誰- ♂ (0 bytes) () 01/27/2025 postreply 15:01:45
• H800和H100的性能差,原來主要就GPU之間的通信寬度。理解Deep Seek的做法。所以老美芯片限製沒用的 -加州lalin- ♀ (0 bytes) () 01/27/2025 postreply 16:10:37
• 上鏈接,解釋Deep Seek53頁的paper -加州lalin- ♀ (145 bytes) () 01/27/2025 postreply 14:56:56
• 早茶姊妹,看這個link。我偷懶,快速聽了這位博主講解deep seek tech paper. -加州lalin- ♀ (0 bytes) () 01/27/2025 postreply 15:08:37