當地時間11月18日，Alphabet旗下的穀歌正式推出Gemini 3係列模型。Gemini 3 Pro已於即日起在Gemini應用、Search AI Mode、AI Studio、Vertex AI以及全新代理式開發平台Google Antigravity中開放預覽。

性能全麵躍升：多項前沿基準測試奪冠

穀歌表示，Gemini 3 Pro在推理與多模態能力上實現了“前所未有的深度與細膩度”，並在幾乎所有主流AI基準上全麵超越前代2.5 Pro。它以1501 Elo（Elo評分體係，用於衡量模型在盲測對戰中的相對實力）的突破性成績登頂LMArena榜單，在“人類終極考試”（Humanity’s Last Exam）中取得37.5%（無工具）成績，並在高難度科學推理測試GPQA Diamond中拿下91.9%的頂級表現。

在數學方麵，Gemini 3 Pro再次刷新前沿模型記錄，以23.4%的成績奪得MathArena Apex新高，顯示出其在結構化邏輯思維與複雜計算上的強勢提升。

作為一款完全多模態的基礎模型，Gemini 3 Pro在視覺和視頻理解同樣創下新紀錄：多模態大考MMMU-Pro得分81%，視頻推理基準Video-MMMU得分87.6%，均創當前SOTA。在強調事實一致性的SimpleQA Verified中，它也以72.1%的成績領先同類模型。

穀歌稱，這些能力意味著Gemini 3 Pro可以在科學、數學、工程等高複雜度任務中提供更可靠的分析與建議，並在日常交互中給出“更直接、更有洞察力”的回應。

除了在多項基準測試中刷新紀錄外，Gemini 3 Pro也為每一次交互帶來了全新的深度與細膩度。穀歌表示，新模型的回答更加聰明、簡潔且直截了當，避免陳詞濫調和無謂的恭維，更傾向於提供具有洞見的結論與判斷——“告訴你需要知道的，而不是你想聽的”。

這一代模型更像一個真正的思考夥伴。它能夠幫助用戶以全新的方式理解信息和表達觀點，例如將晦澀難懂的科學概念轉譯為高保真的可視化代碼，或在創作、規劃等場景中進行更具啟發性的頭腦風暴。穀歌強調，這種“深度交互體驗”是Gemini 3 Pro在推理與多模態能力躍升後的自然結果，使其在專業分析與日常創意任務中都表現得更加可靠而富有洞察力。

Gemini 3 Deep Think：推理能力進一步躍升

穀歌同步預覽了增強版Gemini 3 Deep Think。該模型進一步突破了智能邊界，在Gemini 3的推理和多模態理解能力上實現了階躍式提升，能夠幫助用戶解決更為複雜的問題。

Gemini 3 Deep Think在極難測試中再次刷新記錄：Humanity’s Last Exam提升至41%（無工具），GPQA Diamond提升至93.8%，並在核心AGI測試ARC-AGI-2（帶代碼執行、官方驗證）中獲得前所未有的45.1%。穀歌稱該模式代表其在自主推理與新穎任務解決能力上的重大突破。

Gemini 3係列模型的發布規劃

穀歌表示，Gemini 3的推出隻是新一代模型周期的起點。自發布起，Gemini 3已開始在不同產品與平台中分階段上線：

·麵向普通用戶：Gemini應用已全麵接入新模型；Google AI Pro與Ultra用戶也可在穀歌搜索的AI Mode中直接體驗。

·麵向開發者：Gemini 3已同步登陸Gemini API、AI Studio，以及全新的智能體開發平台Google Antigravity，並可通過Gemini CLI使用。

·麵向企業客戶：Vertex AI與Gemini Enterprise現已支持Gemini 3部署，覆蓋更多企業級應用場景。

對於高階版本Gemini 3 Deep Think，穀歌強調正在進行額外的安全審查，並收集來自獨立安全團隊的反饋，預計將在未來幾周向Google AI Ultra用戶開放。

穀歌同時透露，未來將陸續推出更多Gemini 3係列模型，以擴展其在不同場景下的能力與覆蓋範圍。“我們期待看到用戶使用 Gemini 在學習、構建與規劃中解鎖更多可能性。”

演示環節：多模態推理、代碼生成與視覺理解的全麵展示

在發布現場，穀歌展示了一係列基於Gemini 3的實時演示，覆蓋學習、構建與視覺分析等核心場景，重點體現其在多模態理解、跨介質推理以及端到端代碼生成方麵的躍升能力。

Gemini 3生成的生成帶有封麵與章節導航的數字化家庭食譜電子書

在學習場景的展示中，Gemini 3通過多模態處理能力展現出強大的信息整合能力。穀歌工程師向模型上傳了一張帶有折痕與油漬的手寫家族食譜照片。Gemini 3能夠準確識別並翻譯不同語言的筆跡，再將內容自動排版，生成帶有封麵與章節導航的數字化家庭食譜電子書。

Gemini 3生成的RNA聚合酶結構與運動流程等交互式動畫截圖

隨後，演示切換到科研學習場景：麵對超40頁的PDF學術論文與一段長時教學視頻，Gemini 3一次性提取核心理論，生成變量關係圖，並編寫可執行的可視化代碼，實時繪製出如RNA聚合酶結構與運動流程等交互式動畫，同時自動產出可點擊的學習閃卡與結構化學習指南。

Gemini 3在運動訓練中展示其視覺理解與動作分析能力

在運動訓練演示中，Gemini 3則展示其視覺理解與動作分析能力。模型對一段匹克球比賽視頻進行逐幀解析，在畫麵中疊加揮拍角度軌跡、移動路徑熱力圖以及失誤動作標注，並基於分析結果給出專業訓練建議與改進計劃，類似一位具備視頻分析能力的體育教練。

基於Gemini 3的Search AI Mode生成式界麵

穀歌還首次展示了基於Gemini 3的Search AI Mode生成式界麵。用戶搜索“RNA 聚合酶如何工作？”時，係統會即時生成沉浸式、互動式的可視化布局，包括結構模型、工作模擬和可操控的動態圖示，使複雜概念以全新方式呈現。

Gemini 3可用簡單提示生成3D太空射擊遊戲

在構建類演示中，Gemini 3展示出麵向開發者的強大代碼生成能力。工程師僅以簡短提示，即可讓模型從零生成一個帶有光影效果的 3D 太空射擊遊戲，包括可操控飛船、實時渲染場景與完整遊戲邏輯。

Gemini 3生成的複雜3D voxel像素結構

Gemini 3還可根據自然語言描述生成複雜的3D voxel像素結構，支持自動拆解與重混，並能構建帶有自定義shader的可探索科幻世界。穀歌表示，這些能力體現了 Gemini 3 在自主編碼（agentic coding）與零樣本生成方麵的顯著提升。

整場演示顯示，Gemini 3 在理解文本、圖像、視頻與代碼方麵的能力已能支撐多類端到端工作流程，從數字化家庭記憶、科研學習到內容創作與應用開發，呈現出顯著的靈活性與實用價值。

推出全新的“智能體優先”開發體驗

隨著Gemini 3模型智能能力的躍升，穀歌認為開發者體驗正迎來一次被徹底重塑的機會。此次發布中，穀歌同步推出了麵向未來“智能體開發環境”的Google Antigravity平台，讓開發者能夠以更高層次、更任務導向的方式進行軟件構建。

借助Gemini 3的高級推理、工具使用能力與智能體編碼（agentic coding）能力，Google Antigravity將AI從傳統意義上“開發者工具箱中的一個工具”，提升為能夠主動協作的開發夥伴。雖然 Antigravity的核心界麵仍保留了AI IDE的常見形態，但平台為AI智能體提供了專屬工作空間，並賦予其對編輯器、終端與瀏覽器的直接訪問權限。開發者可以讓這些智能體自主規劃並執行複雜且端到端的軟件任務，包括多步驟流程的並行執行與代碼自我驗證。

除了Gemini 3 Pro之外，Google Antigravity還與穀歌的Gemini 2.5 Computer Use（用於瀏覽器操作）以及圖像編輯模型Nano Banana（Gemini 2.5 Image）深度集成，為自動化開發和跨工具操作提供更強支持。

規劃能力：長鏈推理與自動化執行的大幅增強

Gemini 3在長鏈任務規劃方麵取得明顯提升

在智能體能力不斷增強的背景下，Gemini 3 在長鏈任務規劃方麵也取得了明顯提升。穀歌指出，自Gemini 2引入“agentic”概念以來，團隊持續強化模型的自主編碼和任務執行能力，而Gemini 3則在更長時間尺度上的決策一致性上邁出關鍵一步。

在最新的Vending-Bench 2基準中，Gemini 3 Pro登頂榜首。該測試模擬經營一項自動售貨機業務，要求模型在長達一年的虛擬運營周期內進行定價、補貨、策略調整等決策。Gemini 3 Pro在整個過程中保持穩定的工具調用和策略一致性，不偏離任務目標，並最終獲得明顯高於其他前沿模型的整體收益。

穀歌表示，這意味著Gemini 3在現實生活中的“任務執行”能力也顯著增強。通過更深的推理能力和更可靠的工具使用能力，模型能夠在用戶授權下完成更複雜的多步驟工作流，例如自動預訂本地服務或整理電子郵箱，並從流程開始到結束保持連貫執行。

目前，Google AI Ultra用戶已經可以在Gemini應用中試用這些智能體能力，包括由 Gemini Agent驅動的Gmail自動整理功能。穀歌稱，隨著相關能力不斷完善，公司計劃將其擴展至更多穀歌產品線。

附：Alphabet兼穀歌首席執行官桑達爾·皮查伊（Sundar Pichai）的寄語

將近兩年前，穀歌開啟了Gemini時代，這是公司有史以來規模最大、影響最深遠的科學與產品項目之一。此後，用戶對它的喜愛超出了預期。AI Overviews每月活躍用戶已達20億，Gemini應用月活躍用戶超過6.5億，超過70%的穀歌雲客戶正在使用我們的 AI 服務，已有1300萬開發者基於我們的生成式模型進行開發。這些僅僅是我們觀察到影響力的冰山一角。

憑借在AI創新方麵的全棧優勢，包括領先的基礎設施、世界一流的研究、模型與工具鏈，以及觸達全球數十億用戶的終端產品，我們得以以前所未有的速度將前沿能力推向全世界。

每一代Gemini都在前一代的基礎上持續進化，使用戶能夠實現更多可能。Gemini 1 實現了原生多模態和超長上下文窗口的突破，極大拓展了可處理的信息種類與規模。Gemini 2為代理能力奠定基礎，並在推理與思考維度上大幅提升，幫助用戶應對更複雜的任務與想法。Gemini 2.5 Pro在LMArena榜單上連續六個月穩居榜首。

今天，我們正式推出Gemini 3，這一代模型是迄今為止最智能的Gemini，將係列所有能力融為一體，幫助用戶將任何想法轉化為現實。Gemini 3在推理能力上達到全新高度，能夠深刻把握細微差別與深層含義，無論是捕捉創意中的微妙線索，還是剖析複雜問題的多層結構。

它能夠更精準地理解用戶上下文與真實意圖，使用戶隻需提供更少提示便能獲得所需結果。短短兩年時間，AI 已從單純“讀懂文字和圖片”進化為能夠理解場景和氛圍的智能體。

從今天起，穀歌將以全球規模全麵推送Gemini 3，包括在搜索的AI Mode中引入Gemini 3，以支持更複雜的推理和全新動態體驗，這也是首次在發布當天將模型部署到搜索中。

同時，Gemini 3也在Gemini應用、開發者平台AI Studio、Vertex AI以及全新智能體開發平台Google Antigravity上同步上線。

與前幾代模型一樣，Gemini 3再次刷新了業界最先進水平。穀歌將持續推動智能、智能體能力和個性化的突破，致力於讓AI成為每個人的得力助手。我們期待用戶借助 Gemini 3創造出更多精彩作品，同時也將繼續迭代優化，為未來帶來更多驚喜。

切換到網頁版

穀歌全新AI模型Gemini 3發布：宣稱"全球最智能模型"

騰訊科技 2025-11-18 19:54:14