
當地時間11月18日,Alphabet旗下的穀歌正式推出Gemini 3係列模型。Gemini 3 Pro已於即日起在Gemini應用、Search AI Mode、AI Studio、Vertex AI以及全新代理式開發平台Google Antigravity中開放預覽。
性能全麵躍升:多項前沿基準測試奪冠

穀歌表示,Gemini 3 Pro在推理與多模態能力上實現了“前所未有的深度與細膩度”,並在幾乎所有主流AI基準上全麵超越前代2.5 Pro。它以1501 Elo(Elo評分體係,用於衡量模型在盲測對戰中的相對實力)的突破性成績登頂LMArena榜單,在“人類終極考試”(Humanity’s Last Exam)中取得37.5%(無工具)成績,並在高難度科學推理測試GPQA Diamond中拿下91.9%的頂級表現。
在數學方麵,Gemini 3 Pro再次刷新前沿模型記錄,以23.4%的成績奪得MathArena Apex新高,顯示出其在結構化邏輯思維與複雜計算上的強勢提升。
作為一款完全多模態的基礎模型,Gemini 3 Pro在視覺和視頻理解同樣創下新紀錄:多模態大考MMMU-Pro得分81%,視頻推理基準Video-MMMU得分87.6%,均創當前SOTA。在強調事實一致性的SimpleQA Verified中,它也以72.1%的成績領先同類模型。
穀歌稱,這些能力意味著Gemini 3 Pro可以在科學、數學、工程等高複雜度任務中提供更可靠的分析與建議,並在日常交互中給出“更直接、更有洞察力”的回應。
除了在多項基準測試中刷新紀錄外,Gemini 3 Pro也為每一次交互帶來了全新的深度與細膩度。穀歌表示,新模型的回答更加聰明、簡潔且直截了當,避免陳詞濫調和無謂的恭維,更傾向於提供具有洞見的結論與判斷——“告訴你需要知道的,而不是你想聽的”。
這一代模型更像一個真正的思考夥伴。它能夠幫助用戶以全新的方式理解信息和表達觀點,例如將晦澀難懂的科學概念轉譯為高保真的可視化代碼,或在創作、規劃等場景中進行更具啟發性的頭腦風暴。穀歌強調,這種“深度交互體驗”是Gemini 3 Pro在推理與多模態能力躍升後的自然結果,使其在專業分析與日常創意任務中都表現得更加可靠而富有洞察力。
Gemini 3 Deep Think:推理能力進一步躍升

穀歌同步預覽了增強版Gemini 3 Deep Think。該模型進一步突破了智能邊界,在Gemini 3的推理和多模態理解能力上實現了階躍式提升,能夠幫助用戶解決更為複雜的問題。
Gemini 3 Deep Think在極難測試中再次刷新記錄:Humanity’s Last Exam提升至41%(無工具),GPQA Diamond提升至93.8%,並在核心AGI測試ARC-AGI-2(帶代碼執行、官方驗證)中獲得前所未有的45.1%。穀歌稱該模式代表其在自主推理與新穎任務解決能力上的重大突破。
Gemini 3係列模型的發布規劃
穀歌表示,Gemini 3的推出隻是新一代模型周期的起點。自發布起,Gemini 3已開始在不同產品與平台中分階段上線:
·麵向普通用戶:Gemini應用已全麵接入新模型;Google AI Pro與Ultra用戶也可在穀歌搜索的AI Mode中直接體驗。
·麵向開發者:Gemini 3已同步登陸Gemini API、AI Studio,以及全新的智能體開發平台Google Antigravity,並可通過Gemini CLI使用。
·麵向企業客戶:Vertex AI與Gemini Enterprise現已支持Gemini 3部署,覆蓋更多企業級應用場景。
對於高階版本Gemini 3 Deep Think,穀歌強調正在進行額外的安全審查,並收集來自獨立安全團隊的反饋,預計將在未來幾周向Google AI Ultra用戶開放。
穀歌同時透露,未來將陸續推出更多Gemini 3係列模型,以擴展其在不同場景下的能力與覆蓋範圍。“我們期待看到用戶使用 Gemini 在學習、構建與規劃中解鎖更多可能性。”
演示環節:多模態推理、代碼生成與視覺理解的全麵展示
在發布現場,穀歌展示了一係列基於Gemini 3的實時演示,覆蓋學習、構建與視覺分析等核心場景,重點體現其在多模態理解、跨介質推理以及端到端代碼生成方麵的躍升能力。

Gemini 3生成的生成帶有封麵與章節導航的數字化家庭食譜電子書
在學習場景的展示中,Gemini 3通過多模態處理能力展現出強大的信息整合能力。穀歌工程師向模型上傳了一張帶有折痕與油漬的手寫家族食譜照片。Gemini 3能夠準確識別並翻譯不同語言的筆跡,再將內容自動排版,生成帶有封麵與章節導航的數字化家庭食譜電子書。

Gemini 3生成的RNA聚合酶結構與運動流程等交互式動畫截圖
隨後,演示切換到科研學習場景:麵對超40頁的PDF學術論文與一段長時教學視頻,Gemini 3一次性提取核心理論,生成變量關係圖,並編寫可執行的可視化代碼,實時繪製出如RNA聚合酶結構與運動流程等交互式動畫,同時自動產出可點擊的學習閃卡與結構化學習指南。

Gemini 3在運動訓練中展示其視覺理解與動作分析能力
在運動訓練演示中,Gemini 3則展示其視覺理解與動作分析能力。模型對一段匹克球比賽視頻進行逐幀解析,在畫麵中疊加揮拍角度軌跡、移動路徑熱力圖以及失誤動作標注,並基於分析結果給出專業訓練建議與改進計劃,類似一位具備視頻分析能力的體育教練。

基於Gemini 3的Search AI Mode生成式界麵
穀歌還首次展示了基於Gemini 3的Search AI Mode生成式界麵。用戶搜索“RNA 聚合酶如何工作?”時,係統會即時生成沉浸式、互動式的可視化布局,包括結構模型、工作模擬和可操控的動態圖示,使複雜概念以全新方式呈現。

Gemini 3可用簡單提示生成3D太空射擊遊戲
在構建類演示中,Gemini 3展示出麵向開發者的強大代碼生成能力。工程師僅以簡短提示,即可讓模型從零生成一個帶有光影效果的 3D 太空射擊遊戲,包括可操控飛船、實時渲染場景與完整遊戲邏輯。

Gemini 3生成的複雜3D voxel像素結構
Gemini 3還可根據自然語言描述生成複雜的3D voxel像素結構,支持自動拆解與重混,並能構建帶有自定義shader的可探索科幻世界。穀歌表示,這些能力體現了 Gemini 3 在自主編碼(agentic coding)與零樣本生成方麵的顯著提升。
整場演示顯示,Gemini 3 在理解文本、圖像、視頻與代碼方麵的能力已能支撐多類端到端工作流程,從數字化家庭記憶、科研學習到內容創作與應用開發,呈現出顯著的靈活性與實用價值。
推出全新的“智能體優先”開發體驗

隨著Gemini 3模型智能能力的躍升,穀歌認為開發者體驗正迎來一次被徹底重塑的機會。此次發布中,穀歌同步推出了麵向未來“智能體開發環境”的Google Antigravity平台,讓開發者能夠以更高層次、更任務導向的方式進行軟件構建。
借助Gemini 3的高級推理、工具使用能力與智能體編碼(agentic coding)能力,Google Antigravity將AI從傳統意義上“開發者工具箱中的一個工具”,提升為能夠主動協作的開發夥伴。雖然 Antigravity的核心界麵仍保留了AI IDE的常見形態,但平台為AI智能體提供了專屬工作空間,並賦予其對編輯器、終端與瀏覽器的直接訪問權限。開發者可以讓這些智能體自主規劃並執行複雜且端到端的軟件任務,包括多步驟流程的並行執行與代碼自我驗證。
除了Gemini 3 Pro之外,Google Antigravity還與穀歌的Gemini 2.5 Computer Use(用於瀏覽器操作)以及圖像編輯模型Nano Banana(Gemini 2.5 Image)深度集成,為自動化開發和跨工具操作提供更強支持。
規劃能力:長鏈推理與自動化執行的大幅增強

Gemini 3在長鏈任務規劃方麵取得明顯提升
在智能體能力不斷增強的背景下,Gemini 3 在長鏈任務規劃方麵也取得了明顯提升。穀歌指出,自Gemini 2引入“agentic”概念以來,團隊持續強化模型的自主編碼和任務執行能力,而Gemini 3則在更長時間尺度上的決策一致性上邁出關鍵一步。
在最新的Vending-Bench 2基準中,Gemini 3 Pro登頂榜首。該測試模擬經營一項自動售貨機業務,要求模型在長達一年的虛擬運營周期內進行定價、補貨、策略調整等決策。Gemini 3 Pro在整個過程中保持穩定的工具調用和策略一致性,不偏離任務目標,並最終獲得明顯高於其他前沿模型的整體收益。
穀歌表示,這意味著Gemini 3在現實生活中的“任務執行”能力也顯著增強。通過更深的推理能力和更可靠的工具使用能力,模型能夠在用戶授權下完成更複雜的多步驟工作流,例如自動預訂本地服務或整理電子郵箱,並從流程開始到結束保持連貫執行。
目前,Google AI Ultra用戶已經可以在Gemini應用中試用這些智能體能力,包括由 Gemini Agent驅動的Gmail自動整理功能。穀歌稱,隨著相關能力不斷完善,公司計劃將其擴展至更多穀歌產品線。
附:Alphabet兼穀歌首席執行官桑達爾·皮查伊(Sundar Pichai)的寄語
將近兩年前,穀歌開啟了Gemini時代,這是公司有史以來規模最大、影響最深遠的科學與產品項目之一。此後,用戶對它的喜愛超出了預期。AI Overviews每月活躍用戶已達20億,Gemini應用月活躍用戶超過6.5億,超過70%的穀歌雲客戶正在使用我們的 AI 服務,已有1300萬開發者基於我們的生成式模型進行開發。這些僅僅是我們觀察到影響力的冰山一角。
憑借在AI創新方麵的全棧優勢,包括領先的基礎設施、世界一流的研究、模型與工具鏈,以及觸達全球數十億用戶的終端產品,我們得以以前所未有的速度將前沿能力推向全世界。
每一代Gemini都在前一代的基礎上持續進化,使用戶能夠實現更多可能。Gemini 1 實現了原生多模態和超長上下文窗口的突破,極大拓展了可處理的信息種類與規模。Gemini 2為代理能力奠定基礎,並在推理與思考維度上大幅提升,幫助用戶應對更複雜的任務與想法。Gemini 2.5 Pro在LMArena榜單上連續六個月穩居榜首。
今天,我們正式推出Gemini 3,這一代模型是迄今為止最智能的Gemini,將係列所有能力融為一體,幫助用戶將任何想法轉化為現實。Gemini 3在推理能力上達到全新高度,能夠深刻把握細微差別與深層含義,無論是捕捉創意中的微妙線索,還是剖析複雜問題的多層結構。
它能夠更精準地理解用戶上下文與真實意圖,使用戶隻需提供更少提示便能獲得所需結果。短短兩年時間,AI 已從單純“讀懂文字和圖片”進化為能夠理解場景和氛圍的智能體。
從今天起,穀歌將以全球規模全麵推送Gemini 3,包括在搜索的AI Mode中引入Gemini 3,以支持更複雜的推理和全新動態體驗,這也是首次在發布當天將模型部署到搜索中。
同時,Gemini 3也在Gemini應用、開發者平台AI Studio、Vertex AI以及全新智能體開發平台Google Antigravity上同步上線。
與前幾代模型一樣,Gemini 3再次刷新了業界最先進水平。穀歌將持續推動智能、智能體能力和個性化的突破,致力於讓AI成為每個人的得力助手。我們期待用戶借助 Gemini 3創造出更多精彩作品,同時也將繼續迭代優化,為未來帶來更多驚喜。
