紮克伯格的算盤
與幾十億美金的賭注
Meta正在與穀歌進行一場可能改變行業格局的談判。
消息人士稱,這家社交巨頭考慮斥資數十億美元,在2027年將穀歌的TPU芯片引入Meta自己的數據中心。
這是一個重要信號。
長期以來,外界普遍認為隻有英偉達的GPU才能勝任最前沿的模型訓練,而其他芯片隻能做做推理。
但隨著穀歌最新大模型Gemini 3的發布,這種偏見正在瓦解。
Gemini 3在技術上抹平了與OpenAI的差距,而它完全是在TPU集群上訓練出來的。
Meta顯然看懂了這一點。
他們除了談租用,更多在談「私有化部署」。
對於擁有海量敏感數據和極高合規要求的巨頭來說,把芯片鎖在自家機房裏,顯然比在公有雲上裸奔更有安全感。
硬碰硬:Ironwood TPU v7
vs. Blackwell B200
讓穀歌敢於走出雲端、直麵英偉達的底氣,源自其硬件實力的驚人進化。
如果我們剝開市場營銷的迷霧,單純看矽片上的參數,會發現這不再是一場不對稱戰爭。
最新的穀歌Ironwood TPU v7與英偉達目前的旗艦Blackwell B200在核心指標上幾乎處於同一水平線,甚至在某些維度上形成了鏡像般的對標。
算力對轟:在關鍵的FP8精度下,Ironwood TPU v7的峰值算力約為4.6PFLOPS,而英偉達B200為4.5 PFLOPS。穀歌不僅沒輸,甚至還以微弱優勢險勝。
顯存平手:兩者均配備了192GB的HBM3e高帶寬內存。對於受限於顯存容量的大模型訓練來說,穀歌並沒有讓英偉達拉開半個身位。
互聯架構:雖然英偉達有NVLink,但穀歌的ICI(芯片間互聯)技術讓Ironwood在單Pod內能以9.6 Tb/s的帶寬連接數千顆芯片,這種極其高效的擴展性正是Gemini模型能迅速迭代的秘訣。
這意味著,對於Meta這樣的客戶而言,選擇TPU不再是為了省錢而做的「降級消費」,而是一種真正的「平替」,甚至是在大規模集群效率上更優的選擇。
拆除CUDA護城河
英偉達最深的護城河是CUDA軟件生態。
穀歌深知這一點,因此它並沒有強推自己的JAX語言,而是擁抱了Meta發明的PyTorch。
通過新開發的「TPU Command Center」軟件,穀歌正在讓開發者能夠像使用GPU一樣順滑地通過PyTorch調用TPU。
這招非常精明,既利用了Meta的開源遺產,又降低了客戶的遷移門檻。
穀歌雲的高管們甚至在內部放話,依靠這套組合拳,他們有信心從英偉達口中奪下10%的市場份額。
黃仁勳的反擊與焦慮
英偉達顯然感受到了背後的呼吸聲。
市值4.44萬億美元的世界第一股市霸主並沒有坐以待斃。
最近幾個月,黃仁勳頻繁出手,通過對OpenAI、Anthropic等明星初創公司的巨額投資,換取他們對英偉達GPU的長期承諾。
就在穀歌宣布向Anthropic提供TPU算力後不久,黃仁勳也迅速跟進了一筆數十億美元的投資。
穀歌也開始模仿英偉達的「鈔能力」策略。
今年夏天,穀歌與雲服務商Fluidstack達成協議,甚至承諾在對方無法支付數據中心租金時提供高達32億美元的「兜底」。
這種激進的財務手段,以往通常是英偉達用來綁定CoreWeave等核心夥伴的專利。
黃仁勳曾在最近的一次播客中罕見地向對手致意:「穀歌已經做了七代TPU,我們必須給予應有的尊重。」
這份尊重背後,或許更多的是警惕。
當市場開始意識到TPU v7的性能足以比肩B200,當Meta這樣的巨頭開始嚐試「去英偉達化」,這場芯片戰爭就不再是英偉達的獨角戲了。
壟斷總是伴隨著一種令人沉醉的舒適感,但曆史告訴我們,當唯一的賣鏟人開始感到背後的呼吸聲,這場淘金熱才算真正進入了高潮。