“閹割版”AI芯片,為何能讓英偉達賺瘋?
文章來源: 虎嗅APP 於
- 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
本文為《進擊的AI巨頭》係列第001篇文章,《進擊的AI巨頭》聚焦頭部AI公司的最新動向,我們將持續追蹤這些正在影響AI未來走向的核心參與者。本文聚焦於英偉達發布的H20
GPU 芯片。
一枚性能大幅縮水AI芯片,可能會讓英偉達在中國掙上900億。
7月5日,谘詢機構SemiAnalysis發布報告稱,英偉達在今年有望交付100萬枚H20 GPU。
考慮到這是一枚閹割過,且性價比較低的“對華特供版”芯片,基本可以認定,這100萬枚芯片將在今年全部流入中國大陸市場。以目前該型芯片1.2-1.3萬美元的渠道定價來看,H20芯片可以為英偉達帶來至少120億美元的收入,已經超過了這家公司去年在華總營收。
不過,H20在中國市場的實際情況,可能並沒有如谘詢機構預估的那般樂觀。
一位服務器經銷商向虎嗅表示,目前一台H20八卡服務器,定價大約在120萬元,而性能大幅領先的滿配H100
NVLink版本的八卡服務器價格為270萬元上下,而且是現貨。
盡管後者早早被列入禁止對華出售的名單中,但在非官方渠道中,這款芯片的貨源基本沒有斷過,甚至在今年二季度H200開售後,這款芯片的價格還下跌了約10%。
“無論怎麽看,H20的性價比都還是太低。”這位服務器經銷商提到,即便是同國內的解決方案相比,H20都難言有多大的競爭優勢。
“閹割版”,但還挺良心的?
與同係列芯片不同,H20是一枚“趕工”性質非常明顯的產品。
在去年10月美國升級芯片禁令後,原本就被視為閹割版芯片的A800/H800,甚至是消費級產品RTX4090都被納入禁令的管製範圍。
但僅在一個月後,就有台灣地區媒體報道稱,英偉達向代工廠下了H20芯片的訂單。
在如此短的時間內,英偉達不可能重新設計一款芯片,最大的可能是基於既有型號進行有針對性的調整。
比如新規中取消了將“互聯帶寬”作為限製芯片的識別參數,英偉達就將H20的HBM3顯存容量拉高到96Gb,使顯存帶寬提高到4.0Tb/s;又比如新規新增了“性能密度”的限製,英偉達就向算力規格大砍一刀,使其理論性能僅為296TFLOP,相當於H100芯片的15%。
至於那些新規沒有提到的,比如PCIe
Gen5擴展卡、八路HGX,英偉達全部保留了下來。值得一提的是,H20還有非常高的卡間互聯速度,其NV
Link帶寬達到900Gb/s,很適合組建大規模集群。
但這些特征組合在一起,卻形成了一個很尷尬的事實:在算力大幅削減的情況下,H20的BOM(綜合硬件成本)很可能跟H100齊平,甚至高於後者。
原因在於,存儲顆粒一直是高性能計算卡成本的“大頭”,比如H100芯片中,HBM3顆粒的采購就要占到60%左右,而在H20芯片上,英偉達又不得不為其配備更高規格的顯存容量,以彌補算力不足的缺陷。
基本可以斷定,H20在英偉達高性能計算卡中,屬於利潤率最低的存在。相較於1.2-1.3萬美元的售價,與它同成本的H100目前定價為2.5-3萬美元。
從這個角度來看,H20算是英偉達的一款良心產品了。
英偉達自然不甘心於讓一款單品拉低公司整體的毛利表現,但自去年芯片禁令升級後,英偉達四季度在中國大陸的營收,從上一季度的40.3億降低至19.46億,其中國區數據中心營收占比也從22%滑落至8%,英偉達急需用一款產品去穩住在中國的市場份額。
H20就是英偉達拿出的誠意之作,但還是那個問題,H20的算力實在羸弱,這個硬傷無法被忽視。
華為或與之一戰?
實際上,英偉達曾在今年2月進行過一次官方調價,在調價之前H20芯片的價格為2.3萬美元,盡管英偉達表示降價的原因是“供貨充足”,但如此大幅的價格調整,主要原因大概率還是銷量沒有達到預期。
“國內大廠基本不會考慮H20服務器,都是閉眼買H100,而那些體量相對小的廠商也認為有點劃不來。”
有服務器經銷商向筆者算了一筆賬,現在H100的服務器單機租賃費用大概是8-9萬元/月,而算力僅有前者六分之一的H20服務器價格為120萬元上下,即便不考慮算力損耗的問題,廠商也需要購買6台H20服務器,才能與H100服務器相齊平。
這樣一對比,H20雖然是英偉達利潤率最低的產品,但對於客戶來說,實在稱不上有性價比。
而對於英偉達來說,還有一個不可忽視的因素是國內同類型競品,比如華為昇騰910B。
與H20相比,910B在單卡算力(FP16)上幾乎相當於前者的一倍。相應地,910B價格也要高於H20,服務器經銷商向筆者表示,目前910B的服務器價格已經超過170萬元。
拋開價格,從實際表現來看,二者的競爭互有勝負手。910B強在算力和能效比上,H20則勝在軟件生態與互聯上。最直接的例子就是,H20兼容所有的英偉達H係列卡,而且具備極高的訪存能力,在搭建算力集群時,能夠更好地避免算力損耗。
當然,這個集群規模是有上限的,比如各地籌劃的“萬P計算集群”,如果用H20搭建,那麽0.15P單卡運算能力就意味著十萬顆級別的GPU,組網難度極大。
另外一個值得關注的問題是,英偉達與華為誰能更加穩定地供應產品?
此前,就有業內人士向筆者提到過,對於那些急於購買搭建算力中心的廠商來說,H20可能是更現實的選擇。
一方麵,英偉達的軟件生態更加成熟,廠商的適配工作量要小得多;另一方麵,目前無論是政策還是資本方,都對於算力中心的芯片國產化率有一定要求,910B的需求量非常大,相應地交付周期也比較長。
這一說法筆者也在服務器經銷商處得到了驗證,對方向筆者表示,“在英偉達調價前,行業內客戶對於910B的谘詢要遠大於H20,但現在也有客戶對H20展現出了興趣,因為有充足的現貨。”
有趣的是,二者可能並不是完全意義上的競爭關係,因為有業內人士向筆者表示,在他所在的公司,910B和H20被歸為不同分級,在采購上並不衝突。