
兩年時間,穀歌從被OpenAI按在地上摩擦,到用Gemini 3.0 Pro把「落後」兩個字徹底撕碎,狠狠甩了奧特曼一臉。AI江湖的王座,穀歌終於還是坐實了!
最近穀歌的Nano Banana Pro和Gemini 3,大家都玩嗨了吧~
就連奧特曼都在全員信中承認,穀歌已經「反超」。
可以說,年底這波大招,成功地「讓穀歌再次偉大」!
尤其是Nano Banana Pro展現了生成式AI技術的重大突破。
所有人都讚不絕口,很多大佬都成了自來水,比如Shopify的CEO直誇Nano Banana Pro簡直瘋狂!
穀歌這把王座,基本是坐穩了。
回看這個11月,全球科技格局經曆了一場劇烈的板塊漂移,準確地說,是在穀歌和OpenAI之間。
兩家產品都是密集發布,GPT-5.1、Gemini 3,你方唱罷我登場。
在經曆了長達三年的被動防禦戰,穀歌以一種近乎挑釁的自信姿態重回人工智能霸主的地位!
上個月,作為對手的奧特曼告訴OpenAI的同事們:
穀歌最近在AI方麵的進展可能會「給我們公司帶來一些暫時的經濟阻力」。
穀歌這把王座,基本是坐穩了。
回看這個11月,全球科技格局經曆了一場劇烈的板塊漂移,準確地說,是在穀歌和OpenAI之間。
兩家產品都是密集發布,GPT-5.1、Gemini 3,你方唱罷我登場。
在經曆了長達三年的被動防禦戰,穀歌以一種近乎挑釁的自信姿態重回人工智能霸主的地位!
上個月,作為對手的奧特曼告訴OpenAI的同事們:
穀歌最近在AI方麵的進展可能會「給我們公司帶來一些暫時的經濟阻力」。
身價千億創始人
親自下場修配置
如果說劈柴是穀歌AI轉型的執行者,那麽聯合創始人謝爾蓋·布林(Sergey Brin)的回歸則是這場變革的精神圖騰。
據外媒報道,布林早已重返穀歌山景城總部。
他並沒有選擇坐在高管套房裏,而是直接入駐了被稱為「Building 43」的工程中心。
X的網友將布林的回歸定義為:穀歌在一年內從「遠遠落後」到「輕鬆稱霸」。
這個觀點引發了社區廣泛的討論!
網友迅速從嗨到不行的狀態立馬上升到哲學層麵:穀歌怎麽一下子能做出兩個這麽厲害的產品?
一個觀點是,穀歌在技術上從未落後,但是穀歌得了一個病:「大公司病」。
OpenAI作為創業公司,加上奧特曼的激進戰略,OpenAI一直敢於發布產品,即使市場認為這個產品並不完美。
而布林的回歸和影響力,正是打破了穀歌的這種僵局。
這充分展示了強大領導力的重要性。
甚至有網友認為,如果不是創始人打通了穀歌部門之間的壁壘,Gemini 3或者Nano Banana Pro並不會以「全麵出擊」的方式上線。
作為穀歌的創始人和圖騰人物,謝爾蓋放棄退休後在私人小島享受生活。
而是腳踏實地的重返矽穀,拯救穀歌。
布林的回歸不是為了發表願景演講,而是為了寫代碼。
據說,他回到穀歌後提交了多年來的第一個CL(Changelist,穀歌內部的代碼修改請求),這一行為在工程師內部產生了地震般的效應:
如果身價千億的創始人都在修補配置文件,那麽任何產品經理都沒有理由以「流程」為借口阻礙發布。
布林的存在直接催化了Gemini 3項目的加速,他專注於解決模型在長邏輯鏈推理上的「長尾問題」,這是之前職業經理人們因追求短期指標而忽視的領域。
很多網友表達了類似的看法。
穀歌太強,也太大,它得了大公司病,到處是繁文縟節。
但布林的回歸,讓穀歌再次成為一家AI時代的「創業公司」。
創始人的回歸,不僅重塑了文化。
有網友說,穀歌將所有人工智能相關工作整合到哈薩比斯旗下的DeepMind也是至關重要的一步棋。
這裏就有人問了,創始人雖然具有圖騰般的象征和號召力,但是他有實權嗎?
最有名的獨立開發者levelsio給出了答案:
謝爾蓋·布林與拉裏·佩奇仍共同持有Alphabet的股份。
更重要的是,他們共同持有87.4%的B類投票股,這賦予了他們51.4%的總投票權
想象一下,當穀歌的官僚體係(他們確實存在不少)試圖阻礙你時,有謝爾蓋站在你這邊——隻需給他發條消息,就能獲得通行許可。
這相當於獲得了一張創新的通行證:你可以自由創造任何產品、發布任何功能、推出任何項目,幾乎不受限製。
這讓穀歌重新像一家小型初創公司那樣運作,我認為這正是他們再次取勝的原因
雖然這波穀歌有望重奪王座,但是在此前麵對OpenAI時,穀歌一度掉以輕心。
拉響紅色警報
AI部門緊急重組
起初,ChatGPT剛出來時,穀歌並沒有放在眼裏——
這不就是我們自己玩過的LaMDA嗎?
那個內部跑過、甚至把一個工程師忽悠到以為它有意識、但死活沒敢放出來的生成式AI聊天機器人。
誰也沒想到,ChatGPT眨眼間就成了史上增長最快的消費級產品,甚至還能替代搜索引擎拿來查資料、做研究。
這時穀歌才反應過來:壞了,真要出大事了。
雖然沒人正式喊,但公司裏實質上已經「code red」了。
於是,穀歌趕緊把自家兩個最強的AI實驗室縫在了一起——穀歌DeepMind由此誕生。
從追趕到碾壓,穀歌王者歸來
這次合並把DeepMind在強化學習、神經科學啟發AI上的深厚積累,和穀歌Brain在大規模機器學習係統上的優勢完美結合,直接加速了頂級模型的研發。
Gemini正是合並之後,第一個落地的大項目。
它從設計之初,便堅定地走上了原生多模態路線,而不是在單模態模型上後期縫補,從而徹底避開了GPT-4等競品的後天短板。
同時,也完全由穀歌自研的TPU進行訓練。
2023年12月6日,第一代Gemini正式發布。
Gemini 1.0共有三大版本:Gemini Ultra、Gemini Pro、Gemini Nano,其中Pro和Ultra支持最長32k token上下文。
作為當時穀歌最強大的模型,Gemini Ultra在MMLU拿下90.0%,數學(MATH 53.4%)和視覺問答等多項榜單碾壓GPT-4。
2024年2月15日,Gemini 1.5發布。
上下文窗口直接拉到100萬token(Pro),性能追平甚至超Gemini 1.0 Ultra,但算力需求更低。同時,新增Gemini 1.5 Pro和Gemini 1.5 Flash。
2024年6月,穀歌再次將Pro的上下文窗口,提到了驚人的200萬token。
2024年9月24日,Gemini 1.5 Pro-002和Flash-002上線,更成熟、更便宜
2024年12月11日,Gemini 2.0亮相,主打「agentic」能力,原生支持實時音視頻流,新推出Multimodal Live API。
2025年2月,穀歌帶來了更快Flash-Lite和Pro Experimental,並且還新增了Thinking Mode——推理過程完全可見。
2025年3月25日,Gemini 2.5以Pro Experimental首秀。
穀歌稱,這是迄今最聰明的模型,內置超強推理、編程、多模態複雜任務能力無敵。
2025年6月17日,2.5 Pro與Flash全麵開放,支持企業級高吞吐。
2025年10月7日,Gemini 2.5 Computer Use上線,專攻瀏覽器操控,在手機UI控製上也極具潛力,把整條產品線的智能體能力又拉高一個台階。
2025年11月18日,全新亮相的Gemini 3.0 Pro和Gemini 3.0 Deep Think,直接成了2025年11月最猛的現役模型。
一上線,Gemini 3.0 Pro就在20個基準測試裏狂砍19勝,把一眾大模型按在地上摩擦。
尤其是在Humanity's Last Exam上,它憑借著41%的準確率把OpenAI的GPT-5 Pro(31.64%)打得滿地找牙。
模型核心設計原則
正如前麵提到的,Gemini全係列從零開始聯合訓練,原生多模態,訓練數據直接覆蓋文本、圖像、音頻、視頻,能輕鬆處理各種模態混排輸入輸出。
這種天生多模態設計徹底甩開後期改造的老路子,自然湧現出了跨模態推理能力,比如邊看視頻邊回答文本問題。
架構采用僅解碼器Transformer,加入多查詢注意力等優化,優先保證泛化能力而非堆砌專用編碼器。
效率方麵,第一代采用分層設計(Ultra極致能力、Pro平衡、Nano/Flash低延遲設備端)+ 混合專家(MoE)稀疏激活,隻點亮當前輸入需要的子網絡,訓練推理都省算力。
Gemini 1.5及2.5則進一步用稀疏MoE Transformer,把上下文窗口標配做到100萬token,幾小時視頻也能輕鬆吃下。
CEO也有功勞?
除了創始人回歸,穀歌本身內部的快速迭代。
很多人也忽略現在CEO 劈柴的能力。
正如很多人在3年前將穀歌的落後歸咎於劈柴,卻不敢承認,正是劈柴讓穀歌重回正軌,並完成對OpenAI的超越。
劈柴在2015年接任CEO時,被視為矽穀最完美的職業經理人:溫和、外交手腕高超、善於達成共識。
在移動互聯網的紅利期,這些特質確保了穀歌這艘巨輪的平穩航行。
然而,當2022年AI軍備競賽爆發,這種「和平時期」的領導風格迅速成為眾矢之的。
但今天外媒BI的一篇文章,深入分析了劈柴在穀歌這波逆襲中扮演的重要角色。
像Gemini 3這樣強大的產品需要多年時間、大量技術研究和底層架構才能實現。
穀歌在這方麵已深耕許久,正是因為劈柴推動公司轉向「AI優先」理念也已近十年。
如今這些努力終於結出碩果。
背景故事:
2017年,穀歌的漢堡emoji把奶酪放在肉餅下麵,瞬間全網炸鍋。這直接引發了一場又好笑又撕裂的互聯網大戰,大家瘋狂爭論「正確」的漢堡該怎麽疊。
皮查伊當時發推調侃:你們要是能統一意見,我就放下手頭一切馬上修。結果大家真的統一了,Android沒幾天就更新,把奶酪挪到了肉餅上麵。
現在看來,Gemini 3.0也完美遵守了這個「正確順序」。
算力不夠用
容量必須每6個月翻一番
穀歌這波成功,除了在戰略和文化上,被「創始人模式」帶飛了一波。
但千萬不要忽略最根本的原因,穀歌的算力!
即使布林給所有穀歌工程師都打了「雞血」,沒有算力一切都白搭。
這就要歸功於穀歌的TPU了。
本月早些時候的全體員工大會上,穀歌AI基礎設施負責人Amin Vahdat直接說:公司必須每六個月就把服務容量翻一倍,才能滿足人工智能服務的需求。
據CNBC報道,這位穀歌Cloud副總裁還放了幻燈片,上麵寫著未來4-5年要實現「1000倍」擴展。
支撐這1000倍增長的核心,是穀歌在2025年發布的第七代張量處理單元(TPU),代號「Ironwood」。
這款芯片不僅是硬件的迭代,更是穀歌垂直整合戰略的巔峰之作。
千倍擴展的難題
目前AI最大的瓶頸就是英偉達GPU產能跟不上。
幾天前英偉達財報電話會上還說AI芯片「賣到斷貨」,數據中心收入單季暴增100億美元。
芯片和其他基礎設施限製直接影響穀歌新AI功能上線。
11月6日的全體大會上,劈柴舉了上個月剛升級的視頻生成工具Veo的例子:
「Veo剛出來的時候多令人興奮啊,如果能在Gemini App裏放開給更多人用,用戶量肯定爆,但我們就是給不了——算力根本不夠。」
雖然哪家AI公司都缺算力,但是相比OpenAI,穀歌TPU正是他們製勝的法寶。
穀歌的「1000倍」算力擴張揭示了一個殘酷的現實:AI行業正在經曆劇烈的階級分化。
地主階級: 擁有吉瓦級數據中心和自研芯片的巨頭,比如穀歌。他們製定規則,出租算力,收取租金。
佃農階級: 依賴巨頭基礎設施構建應用的初創公司。無論他們的模型多優秀,最終的利潤大頭都將流向基礎設施提供商。
因此,這也是為何OpenAI也想要做芯片的根本原因。
從年初的Gemini 2.5到年底的Gemini 3,如果單從版本號來看,穀歌的行動可以說緩慢至極。
關於GPT-5和Gemini 2.5誰更好用的話題也是經久不衰。
但是隨著Gemini 3、Nano Banana Pro的出世,所有人都突然回過神來,穀歌還是那個穀歌,穀歌還是SOTA!
這裏麵既有創始人放棄私人小島重回一線的魄力,也有穀歌TPU多年來的厚積薄發。
作為AI領域唯一一家技術全棧的科技公司,讓我們期待一下2026年,Gemini 4甚至Gemini 5能否讓我們看到AGI的曙光。