正文

穀歌訓出Gemini 3的TPU,已成老黃心腹大患

(2025-11-25 06:28:51) 下一個

紮克伯格的算盤

與幾十億美金的賭注

Meta正在與穀歌進行一場可能改變行業格局的談判。

消息人士稱,這家社交巨頭考慮斥資數十億美元,在2027年將穀歌的TPU芯片引入Meta自己的數據中心。

這是一個重要信號。

長期以來,外界普遍認為隻有英偉達的GPU才能勝任最前沿的模型訓練,而其他芯片隻能做做推理。

但隨著穀歌最新大模型Gemini 3的發布,這種偏見正在瓦解。

Gemini 3在技術上抹平了與OpenAI的差距,而它完全是在TPU集群上訓練出來的。

Meta顯然看懂了這一點。

他們除了談租用,更多在談「私有化部署」。

對於擁有海量敏感數據和極高合規要求的巨頭來說,把芯片鎖在自家機房裏,顯然比在公有雲上裸奔更有安全感。

硬碰硬:Ironwood TPU v7

vs. Blackwell B200

讓穀歌敢於走出雲端、直麵英偉達的底氣,源自其硬件實力的驚人進化。

如果我們剝開市場營銷的迷霧,單純看矽片上的參數,會發現這不再是一場不對稱戰爭。

最新的穀歌Ironwood TPU v7與英偉達目前的旗艦Blackwell B200在核心指標上幾乎處於同一水平線,甚至在某些維度上形成了鏡像般的對標。

算力對轟:在關鍵的FP8精度下,Ironwood TPU v7的峰值算力約為4.6PFLOPS,而英偉達B200為4.5 PFLOPS。穀歌不僅沒輸,甚至還以微弱優勢險勝。

顯存平手:兩者均配備了192GB的HBM3e高帶寬內存。對於受限於顯存容量的大模型訓練來說,穀歌並沒有讓英偉達拉開半個身位。

互聯架構:雖然英偉達有NVLink,但穀歌的ICI(芯片間互聯)技術讓Ironwood在單Pod內能以9.6 Tb/s的帶寬連接數千顆芯片,這種極其高效的擴展性正是Gemini模型能迅速迭代的秘訣。
這意味著,對於Meta這樣的客戶而言,選擇TPU不再是為了省錢而做的「降級消費」,而是一種真正的「平替」,甚至是在大規模集群效率上更優的選擇。

拆除CUDA護城河

英偉達最深的護城河是CUDA軟件生態。

穀歌深知這一點,因此它並沒有強推自己的JAX語言,而是擁抱了Meta發明的PyTorch。

通過新開發的「TPU Command Center」軟件,穀歌正在讓開發者能夠像使用GPU一樣順滑地通過PyTorch調用TPU。

這招非常精明,既利用了Meta的開源遺產,又降低了客戶的遷移門檻。

穀歌雲的高管們甚至在內部放話,依靠這套組合拳,他們有信心從英偉達口中奪下10%的市場份額。

黃仁勳的反擊與焦慮

英偉達顯然感受到了背後的呼吸聲。

市值4.44萬億美元的世界第一股市霸主並沒有坐以待斃。

最近幾個月,黃仁勳頻繁出手,通過對OpenAI、Anthropic等明星初創公司的巨額投資,換取他們對英偉達GPU的長期承諾。

就在穀歌宣布向Anthropic提供TPU算力後不久,黃仁勳也迅速跟進了一筆數十億美元的投資。

穀歌也開始模仿英偉達的「鈔能力」策略。

今年夏天,穀歌與雲服務商Fluidstack達成協議,甚至承諾在對方無法支付數據中心租金時提供高達32億美元的「兜底」。

這種激進的財務手段,以往通常是英偉達用來綁定CoreWeave等核心夥伴的專利。

黃仁勳曾在最近的一次播客中罕見地向對手致意:「穀歌已經做了七代TPU,我們必須給予應有的尊重。」

這份尊重背後,或許更多的是警惕。

當市場開始意識到TPU v7的性能足以比肩B200,當Meta這樣的巨頭開始嚐試「去英偉達化」,這場芯片戰爭就不再是英偉達的獨角戲了。

壟斷總是伴隨著一種令人沉醉的舒適感,但曆史告訴我們,當唯一的賣鏟人開始感到背後的呼吸聲,這場淘金熱才算真正進入了高潮。

[ 打印 ]
評論
目前還沒有任何評論
登錄後才可評論.