穀歌正尋求與芯片設計商Marvell Technology合作,開發兩款專為AI推理工作負載定製的新芯片,此舉是穀歌係統性削減對長期合作夥伴博通依賴的最新舉措,也折射出AI行業對推理芯片需求的急劇升溫。
據The Information 19日報道,知情人士透露,穀歌與Marvell的談判涉及兩款芯片:一款是配合穀歌張量處理器(TPU)運行的內存處理單元(MPU),另一款是專為運行AI模型而設計的新型TPU。與穀歌此前向Marvell采購現貨芯片不同,此次合作旨在為穀歌量身定製專屬半導體產品。
此次談判對芯片市場格局具有直接影響。博通股價麵臨潛在壓力——盡管博通本月剛與穀歌簽署了延續至2031年的新協議,但穀歌多元化供應商的戰略意圖已愈發清晰。與此同時,Marvell有望進一步擴大其定製芯片業務版圖,該業務目前已是其增速最快的板塊。
據兩位知情人士透露,穀歌與Marvell合作開發的內存處理單元將與現有TPU協同工作,根據計算需求與內存需求的差異,在兩類芯片之間動態分配AI工作負載。
這一設計思路源於推理任務的內在異質性——生成響應的某些步驟對算力要求極高,另一些步驟則受製於芯片讀寫內存的速度,單一處理器難以兼顧兩者。
穀歌計劃生產近200萬個內存處理單元,但知情人士指出,由於談判仍處於早期階段,該數字存在變動可能。作為參照,摩根士丹利估計穀歌2027年的TPU產量約為600萬個。雙方目標是最快於明年完成內存處理單元的設計定稿,隨後移交試產。
第二款芯片——專為推理場景打造的新型TPU——的設計完成時間及計劃產量目前尚不明確。穀歌目前在台積電生產芯片,新芯片是否仍由台積電代工同樣有待確認。
穀歌加速推進這一合作,部分原因在於英偉達的競爭壓力。
據一名穀歌員工透露,穀歌此前已有開發推理芯片的計劃,英偉達在今年3月GTC大會上發布語言處理單元(LPU)後,穀歌隨即加快了相關工作。英偉達的LPU基於其以200億美元從初創公司Groq授權的技術構建,而Marvell正是Groq第一代LPU的芯片設計合作夥伴——這意味著Marvell已具備設計推理芯片的實戰經驗。
推理芯片需求的爆發,根本上源於AI產品形態的演進。隨著自主智能體等更複雜的AI應用落地,其所需算力遠超傳統聊天機器人。OpenAI近期與Cerebras簽署了逾200億美元的推理芯片采購協議,同時也在與博通聯合開發自有推理芯片,行業整體正加速布局這一賽道。
穀歌尋求與Marvell合作,是其自2023年以來持續推進供應商多元化戰略的組成部分。
博通長期作為穀歌TPU的唯一設計合作夥伴,並按每顆TPU產量收取授權費——隨著TPU需求激增,穀歌支付給博通的費用水漲船高,這是穀歌尋求替代方案的核心動因。
穀歌已於去年引入聯發科參與TPU芯片的設計與生產。此次與Marvell的談判,則進一步拓寬了穀歌的合作夥伴矩陣。穀歌此前已向Marvell采購過CXL控製器芯片,用於管理數據中心內服務器間的內存共享,這段合作經曆為雙方建立了互信基礎。
然而,博通的核心地位短期內難以撼動。博通本月剛與穀歌簽署新協議,將為穀歌下一代AI數據中心機架提供定製TPU及網絡組件,合作期限延伸至2031年。這表明,穀歌的多元化戰略更多是在現有格局上疊加新選項,而非徹底切換。
對Marvell而言,與穀歌的深度合作意味著其定製芯片業務有望再獲重量級客戶背書。Marvell的主營業務涵蓋數據中心標準網絡、存儲及光互聯芯片,但近年來協助客戶設計專屬芯片的定製業務已成為其增速最快的板塊。
穀歌TPU的商業化進程也為此次合作提供了更廣闊的市場想象空間。穀歌去年開始向非穀歌數據中心的客戶租賃TPU,直接挑戰英偉達在AI芯片市場的主導地位,Anthropic、Meta和蘋果均已成為TPU客戶。若新型推理芯片研發順利,其潛在市場將不局限於穀歌內部需求。