如何在閹割版芯片上trade off精度到達符合大多數應用的結果。
不覺得多神秘,product design勝出吧。
所有跟帖:
•
搞不好閹割版都不讓賣了
-我是誰的誰-
♂
(0 bytes)
()
01/27/2025 postreply
14:56:14
•
黃教主還是想做生意的。
-加州lalin-
♀
(0 bytes)
()
01/27/2025 postreply
14:58:14
•
老黃作不了主啊,商務部決定
-我是誰的誰-
♂
(0 bytes)
()
01/27/2025 postreply
14:59:26
•
老黃一直在偷跑。閹割版也是他搞出來的
-加州lalin-
♀
(0 bytes)
()
01/27/2025 postreply
15:00:51
•
有錢不賺白不賺,他又不是傻子
-我是誰的誰-
♂
(0 bytes)
()
01/27/2025 postreply
15:01:45
•
H800和H100的性能差,原來主要就GPU之間的通信寬度。理解Deep Seek的做法。所以老美芯片限製沒用的
-加州lalin-
♀
(0 bytes)
()
01/27/2025 postreply
16:10:37
•
上鏈接,解釋Deep Seek53頁的paper
-加州lalin-
♀
(145 bytes)
()
01/27/2025 postreply
14:56:56
•
早茶姊妹,看這個link。我偷懶,快速聽了這位博主講解deep seek tech paper.
-加州lalin-
♀
(0 bytes)
()
01/27/2025 postreply
15:08:37