以下文章來源于谷歌黑板報,作者谷歌黑板報
Sundar Pichai 寄語
Google 和 Alphabet 首席執行官
大約兩年前,我們開啟了 Gemini 時代,這是公司迄今為止投入最大的科研和產品項目之一。自那時起,看到大家對它的喜愛程度,著實令人驚嘆。現在,每月有 20 億用戶使用 AI 概覽 (AI Overviews)。Gemini app 的月用戶量已突破 6.5 億,超過 70% 的 Cloud 客戶使用我們的 AI,1300 萬開發者在使用我們的生成模型進行構建——而這只是我們所看到的巨大影響的一個縮影。
我們能夠以前所未有的速度將先進的能力帶給全世界,這得益于我們獨有的全棧式 AI 創新研究——從業界領先的基礎設施、世界一流的研究與模型工具,再到服務全球數十億用戶的產品。
每一代 Gemini 都在前一代基礎上進行構建,讓您能夠實現更多可能。Gemini 1 在原生多模態和長上下文窗口方面的突破,擴展了可處理的信息種類及其信息量。Gemini 2 則為智能體能力奠定了基礎,并在推理和思考方面推動了前沿,幫助處理更復雜的任務和想法,使得 Gemini 2.5 Pro 連續六個多月在 LMArena 上位居榜首。
而現在,我們即將推出 Gemini 3,這是我們最智能的模型,它集合了 Gemini 的所有功能,能夠幫助您將任何想法變為現實。
它具備最先進的推理能力,能夠理解深層次內容與細微差別——無論是感知創意中細微的線索,還是剖析復雜難題中相互交織的結構維度。Gemini 3 在理解用戶請求的上下文和真實意圖方面也更為出色,您只需更精簡的提示就能獲取所需結果。更令人驚嘆的是,僅僅用了兩年時間,AI 已經從單純的文本和圖像識別,發展到能夠 "洞察語境"。
從今天起,我們將 Gemini 全面融入谷歌的產品生態。其中包括在搜索的 AI 模式 (AI Mode) 下的 Gemini 3,具備更復雜的推理能力和全新的動態體驗。這是我們首次在產品發布當日就將 Gemini 引入搜索。此外,Gemini 3 今天也同步向 Gemini app 用戶、AI Studio 和 Vertex AI 的開發者、以及我們全新的智能體開發平臺 Google Antigravity 中同步推出。——更多信息詳見下文。
正如其前幾代模型一樣,Gemini 3 再次推動了技術的最前沿。在這個全新的篇章中,我們將繼續推動智能、智能體和個性化服務的邊界,讓 AI 能夠真正助力于每個人。
我們希望您會喜歡 Gemini 3,我們也將持續改進它,并期待看到您用它創造的成果。更多精彩,敬請期待!
作者:
Demis Hassabis,Google DeepMind 首席執行官
Koray Kavukcuoglu,Google DeepMind 首席技術官兼 Google 首席 AI 架構師
謹代表 Gemini 團隊
今天,我們在通往 AGI (通用人工智能) 的道路上又邁出重要一步,正式發布 Gemini 3。
它不僅是全球領先的多模態理解模型,更是我們迄今為止最強大的智能體 (Agentic) 和氛圍編程 (Vibe Coding) 模型,能夠提供更豐富的可視化效果和更深度的交互體驗——而這一切都構建在最先進的推理能力之上。
我們現已正式開啟 Gemini 3 時代,并于今日推出 Gemini 3 Pro 預覽版,將其集成到 Google 的全棧產品中。用戶在日常生活中即可使用它來學習、構建和規劃一切事務。同時,我們還推出了 Gemini 3 Deep Think 模式——這一增強型推理模式將 Gemini 3 的性能再次提升至全新高度。該模式在向 Google AI Ultra 訂閱用戶開放前,會首先供安全測試人員試用。
最先進的推理能力
具備前所未有的深度與洞察力
憑借領先的推理能力和強大的多模態功能,Gemini 3 Pro 能夠將任何創意變為現實。在每個關鍵的 AI 基準測試中,它的性能均顯著超越 2.5 Pro。
它在 LMArena 排行榜上以 1501 的突破性 Elo 評分高居榜首。其在推理能力上展現出博士水平,在 "人類終極考試" 中 (未使用任何工具的情況下得分率達 37.5%) 及 GPQA Diamond 基準測試中 (準確率高達 91.9%) 均獲得最高分。此外,它在數學領域為前沿模型樹立了全新標桿,在 MathArena Apex 測試中,以 23.4% 達到了最先進水平 (State-of-the-Art)。
除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成績,在 Video-MMMU 上達到 87.6%。同時,該模型在 SimpleQA Verified 基準測試中也斬獲了當前最先進的 72.1% 得分,展現出其在事實準確性方面的顯著進步。這意味著 Gemini 3 Pro 具備高度可靠性,能夠有效解決跨越科學和數學等廣泛主題的復雜問題。

Gemini 3 在一系列關鍵 AI 基準測試中達到了最先進水平
Gemini 3 Pro 為每一次交互帶來了全新的深度和細致入微的體驗。它的回復智能、簡潔、直接,用真知灼見取代了陳詞濫調和奉承——它會告訴您真正需要了解的信息,而不僅僅是您希望聽到的。作為您真正的思考伙伴,Gemini 3 Pro 提供了理解信息和自我表達的全新途徑,無論是通過生成高保真可視化代碼來解析深奧的科學概念,還是進行創意頭腦風暴,都能為您提供強大助力。
Gemini 3 可以編寫托卡馬克 (tokamak) 中等離子體流動的可視化代碼,并創作一首詩歌來捕捉核聚變的物理學原理
Gemini 3 深度思考
Gemini 3 的 "深度思考模式 (Deep Think mode)" 進一步拓展了智能的邊界,為 Gemini 3 的推理和多模態理解能力帶來了跨越式提升,能夠助力您攻克更復雜的難題。
在測試中,Gemini 3 Deep Think 在 "人類最終考試 (Humanity's Last Exam)" 中的表現 (未使用工具的情況下達到 41.0%) 以及在 GPQA Diamond 測試中的表現 (達到 93.8%),均超越了 Gemini 3 Pro 已經令人印象深刻的成績。此外,它還在 ARC-AGI-2 基準測試中取得了 45.1% 的突破性成績 (啟用代碼執行),充分展現了其解決新型挑戰的能力。

Gemini 3 的 "深度思考模式 (Deep Think mode)" 在一些最具挑戰性的 AI 基準測試中表現出色
Gemini 3 助力學習、構建和規劃一切
學習一切
Gemini 從設計之初,就致力于無縫整合任何主題的跨模態信息,涵蓋文本、圖像、視頻、音頻和代碼。Gemini 3 以其領先的推理能力、視覺與空間理解能力、多語言性能以及 100 萬令牌的上下文窗口,進一步突破了多模態推理的前沿,幫助您以最適合自己的方式進行學習。
舉例來說,如果您想學習烹飪家族傳統菜肴,Gemini 3 可以解讀并翻譯不同語言的手寫菜譜,整理成一本可分享的家族食譜。又或者,當您希望研究一個新主題時,只需提供學術論文、冗長的視頻講座或教程,它便能生成用于交互式閃卡、可視化圖表或其他形式的代碼,幫助您快速掌握素材。它甚至可以分析您匹克球比賽的視頻,識別技術短板,并生成全面提升動作技巧的訓練計劃。
為了幫助您更好地理解網絡信息,Search 中的 AI 模式 (AI Mode) 現已整合 Gemini 3,帶來全新的生成式用戶界面 (Generative UI) 體驗,例如沉浸式視覺布局、交互式工具和模擬,所有內容均可根據您的查詢實時生成。
構建一切
在 2.5 Pro 成功的基礎上,Gemini 3 兌現了幫助開發者將創意變為現實的承諾。它在零樣本生成 (Zero-shot Generation) 方面表現出色,能夠處理復雜的提示和指令,從而渲染出更豐富、更具交互性的網頁用戶界面 (Web UI)。
Gemini 3 是我們迄今為止構建的最出色的氛圍編程 (Vibe Coding) 和智能體編程 (Agentic Coding) 模型——讓我們的產品更具自主性,同時提高開發者生產力。它在 WebDev Arena 排行榜上以令人矚目的 1487 ELO 名列前茅。在 Terminal-Bench 2.0 測試 (一個測試模型通過終端操作計算機的工具使用能力) 中也取得 54.2% 的好成績;同時,在衡量編程智能體 (coding agents) 的 SWE-bench Verified (76.2%) 基準測試中,其表現遠超 2.5 Pro。
您現在可以通過 Google AI Studio、Vertex AI、Gemini CLI 以及我們全新的智能體開發平臺 Google Antigravity 中使用 Gemini 3 進行開發和構建。同時,它也已在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平臺上線。
通過代碼構建、解構和混編精細的 3D 體素 (voxel) 藝術,將您的想象力變為現實。請在 AI Studio 中試用
推出全新的以智能體為核心的開發體驗
隨著 Gemini 3 模型智能的不斷加速,我們有機會重新構想整個開發者體驗 (developer experience)。今天,我們正式發布 Google Antigravity,我們全新的智能體開發平臺,讓開發者能夠在更高層次上,以任務為導向的方式進行開發。
Google Antigravity 利用 Gemini 3 的高級推理、工具使用和智能編碼能力,將 AI 輔助從開發者工具包中的工具轉變為一個活躍的伙伴。盡管 Google Antigravity 的核心仍沿用熟悉的 AI 集成開發環境 (IDE),但其智能體已被提升到一個專屬的界面,并被賦予直接訪問編輯器、終端和瀏覽器的權限。現在,智能體能夠代表您自主規劃和執行復雜的端到端軟件任務,并在此過程中自行驗證代碼。
除了 Gemini 3 Pro 之外,Google Antigravity 還深度整合了我們最新的用于瀏覽器控制的 Gemini 2.5 Computer Use 模型,以及我們廣受好評的圖像編輯模型 Nano Banana (Gemini 2.5 Image)。
Google Antigravity 使用 Gemini 3 來驅動航班追蹤應用所需的端到端智能體工作流程。該智能體能夠獨立規劃、編寫應用程序代碼,并通過基于瀏覽器的計算機使用來驗證其執行效果
規劃一切
自從 Gemini 2 開啟智能體時代以來,我們取得了巨大的進展,不僅提升了 Gemini 的編碼智能體 (coding agent) 能力,還提高了它在更長周期內可靠地提前規劃能力。Gemini 3 在 Vending-Bench 2 排行榜上名列榜首,印證了這一點。該基準測試通過管理模擬自動售貨機業務來測試長周期規劃能力。Gemini 3 在整整一年的模擬運營過程中,保持了工具使用和決策的一致性,在沒有偏離任務的前提下,帶來了更高的回報。

Gemini 3 Pro 展示了更優秀的長期規劃能力,與其他前沿模型相比,能夠產生顯著更高的回報
這意味著 Gemini 3 能更好地幫助您完成日常事務。憑借更深入的推理能力和更穩定的工具使用,Gemini 3 能在您的控制和指導下,幫您完成整個復雜、多步驟的工作流程——例如整理 Gmail 收件箱或規劃完整的旅行行程。
Google AI Ultra 訂閱者今天就可以在 Gemini 應用中使用 Gemini Agent 來體驗這些智能體能力。我們在提升 Gemini 的智能體能力方面收獲良多,我們也很快會將這些功能擴展到更多 Google 產品,非常期待看到您如何使用它。
負責任地構建 Gemini 3
Gemini 3 是我們迄今為止最安全的模型,并且接受了 Google AI 模型中最全面的一套安全評估。該模型展現了更低的諂媚性 (sycophancy),更高的抗提示注入 (prompt injection) 能力,并強化了抵御網絡攻擊濫用的保護措施。
除了對我們前沿安全框架 (Frontier Safety Framework) 中關鍵領域進行內部測試外,我們還與全球前沿領域的專家合作進行了評估,向英國人工智能安全研究所 (UK AISI) 等機構提供了早期訪問,并獲得了 Apollo、Vaultis、Dreadnode 等行業專家的獨立評估意見。更多信息,詳見 Gemini 3 模型卡。
Gemini 的下一個時代
這僅僅是 Gemini 3 時代的開始。從今天起,Gemini 3 逐步向用戶開放,供您試用體驗:
適用于所有 Gemini app 的用戶,以及在 Search 的 AI Mode 下的 Google AI Pro 和 Ultra 訂閱用戶。
適用于 AI Studio 中 Gemini API 的開發者,我們全新的智能體開發平臺 Google Antigravity 以及 Gemini CLI。
適用于 Vertex AI 和 Gemini Enterprise 的企業用戶。
對于 Gemini 3 "深度思考模式 (Deep Think mode)",我們正在投入更多時間進行安全評估并收集安全測試人員的反饋,預計將在未來幾周內向 Google AI Ultra 訂閱用戶開放該功能。
我們計劃很快發布 Gemini 3 系列中的其他模型,以便您能夠借助 AI 完成更多任務。我們期待收到您的反饋,也期待看到您使用 Gemini 進行學習、構建和規劃的成果。
-
Gemini
+關注
關注
0文章
74瀏覽量
8146 -
AI
+關注
關注
91文章
39755瀏覽量
301359 -
模型
+關注
關注
1文章
3751瀏覽量
52099
原文標題:Gemini 3 開啟智能新紀元
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時代
Gemini CLI 中轉站配置使用教程
迅為iTOP-Hi3403開發板:解鎖多目拼接相機的10.4TOPS強“芯”動力,開啟4K智能視覺新紀元
谷歌Gemini 3模型開啟智能新紀元
評論