為了保持在AI芯片領域的領先地位,英偉達押注“越大越好”的理念。然而,規模的擴大也變得更加困難。 英偉達最新的人工智能芯片的數字核心,大約是四個拚字遊戲牌子拚成正方形的大小,比去年推動英偉達業務爆炸性增長的芯片大了近兩倍。這些新芯片被命名為Blackwell,其性能有了更大的提升——擁有2.6倍的晶體管數量。
英偉達首席執行官黃仁勳表示,這款芯片的需求非常旺盛。 然而,在周三公布強勁的季度銷售額和利潤的同時,英偉達也提到,製造新芯片的挑戰是導致利潤率下降以及最近一個季度計入的9.08億美元預提費用的主要原因。這些因素導致該公司股價在周四下跌6.4%。
英偉達尚未詳細說明問題的性質,但分析師和業內人士表示,其工程難題主要源於Blackwell芯片的尺寸,這需要在設計上做出重大調整。與一塊大矽片不同,Blackwell由兩個新的先進英偉達處理器和多個內存組件組成,它們被組合成一個由矽、金屬和塑料構成的精細網格。
每個芯片的製造都必須接近完美:任何一部分的嚴重缺陷都可能導致災難性的結果,並且由於涉及的組件更多,出現問題的幾率也更大。此外,所有這些組件產生的熱量可能會導致封裝中的不同材料以不同的速度變形。 這是一個聽起來非常技術性的挑戰,涉及到微小的電路,但它卻可能對財務表現產生重大影響。任何顯著缺陷都可能使價值4萬美元的Blackwell芯片作廢,並損害芯片製造商的整體製造“良率”,這是衡量行業產出可用百分比的關鍵指標。
行業分析公司TechInsights的副主席G. Dan Hutcheson表示:“問題在於讓這些芯片協同工作並提高良率。”當芯片各部分的良率不夠高時,“你會發現一切都會迅速走向不利局麵。”
英偉達周三表示,為了提高良率,它對Blackwell的設計進行了修改。黃仁勳在與分析師的電話會議上表示,芯片不需要做“功能性改變”。 英偉達首席財務官Colette Kress表示,公司計劃增加Blackwell的產量,並預計它將在截至1月份的季度內為收入貢獻數十億美元。 瑞銀分析師本月早些時候在一份報告中表示,英偉達在Blackwell上的主要問題是采用台灣積體電路製造公司(台積電)提供的新芯片連接方式,這種方式是由於Blackwell的尺寸所需,但其製造複雜性增加以及變形問題影響了可靠性和性能。台積電對此未予置評。
這些問題是Blackwell推出麵臨的主要挑戰,盡管隨著生產良率的上升,英偉達應該能夠按照計劃在明年生產這些芯片。
英偉達最近轉向每年發布一代新芯片,而不是以前的每兩年一代,這加大了迅速解決製造問題的壓力。公司在周三的證券備案中承認了這一動態,稱“新產品的頻繁發布和複雜性增加可能導致質量或生產問題”,這可能會增加成本或導致延遲。 ‘
一個巨大的芯片’ 這些問題並非英偉達獨有,業內人士表示,隨著芯片製造商試圖通過增加芯片尺寸來提升處理能力,類似的問題將更加常見。通過芯片設計的改變來消除缺陷或提高良率在業內也很普遍。 隨著公司試圖通過將芯片堆疊在一起並使用更多矽來提高性能,複雜性將進一步增加,英偉達的競爭對手AMD首席執行官蘇姿豐表示。
“要讓這一切技術正常運作並不容易,”她說。“未來的芯片會變得更加複雜和龐大嗎?絕對會。這就是我們所處的世界。” 她還表示,下一代芯片在更節能、功耗更低方麵具有優勢——這是AI數據中心吞噬電網容量時日益關注的問題。
黃仁勳曾將Blackwell的尺寸作為賣點之一。他在3月份的英偉達大會上表示:“它就是一個巨大的芯片。” “當我們被告知Blackwell的目標超出了物理學的極限時,工程師們回答說,‘那又怎樣?’”
通過Hopper——英偉達現有的AI芯片——英偉達已經達到了芯片製造的尺寸上限。最先進的光刻機隻能製造出麵積約為800平方毫米的芯片,即邊長約1.1英寸的正方形。
為了突破這一限製,英偉達選擇將兩個最大尺寸的芯片連接在一起,成為一個芯片,這是在商業圖形芯片中前所未有的。
Cerebras Systems創始人Andrew Feldman表示:“要在AI領域進行有意義的工作,你需要大量的計算能力,而這轉化為許多晶體管,遠遠超出了單個芯片的容量。” “將兩個芯片連接起來的技術很難開發,將四個連接起來更難,連接八個則更難。”
Cerebras由OpenAI首席執行官Sam Altman投資,解決該問題的辦法是開發出有史以來最大的芯片——通常被切割成小芯片的矽片,但Cerebras找到了如何將其連接並作為一個巨大芯片運行的方法。
該公司本周推出了一項針對AI部署的雲計算服務,挑戰英偉達的主導地位,並已吸引了包括阿斯利康和梅奧診所在內的客戶。該公司最近在美國秘密提交了IPO申請。