電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)北京時(shí)間5月21日,谷歌2025 Google I/O開發(fā)者大會正式召開,從其發(fā)布的新品來看,這可以說是一場AI盛會。
在AI大模型方面,發(fā)布了Gemini 2.5 Pro、擴(kuò)散語言模型Gemini Diffusion、視頻生成模型Veo 3+ Flow應(yīng)用、圖像生成模型Imagen 4等。在硬件端,分別與三星、Xreal發(fā)布了Android XR頭顯、AR智能眼鏡等。在搜索端,發(fā)布了AI Mode搜索模式、Search Live等。
谷歌宣布新的Gemini訂閱計(jì)劃:AI Pro用戶定價(jià)月付19.99美元(折合人民幣約144元),就能夠使用Veo 2、Gemini 2.5 Pro等入門級產(chǎn)品;AI Ultra用戶定價(jià)月付249.99美元(折合人民幣約1804元),可一次性獲得Veo 3的無限訪問權(quán)限、使用Gemini 2.5 Pro深度思考模式等多項(xiàng)高級功能。
從軟件到應(yīng)用,谷歌的AI生態(tài)已經(jīng)越來越成熟,其AI大模型以及相應(yīng)的服務(wù)也將越來越強(qiáng)大。
以Gemini 2.5 Pro為技術(shù)底座,谷歌開始反擊OpenAI
自上屆Google I/O開發(fā)者大會以來,谷歌已經(jīng)宣布了十幾種模型的突破,并且發(fā)布了20多款A(yù)I產(chǎn)品和功能。自第一代Gemini模型發(fā)布以來,Gemini模型的Elo分?jǐn)?shù)上升了300多分。此外,在AI代碼編輯器Cursor上,Gemini 2.5 Pro是今年增長最快的模型,能夠?qū)崿F(xiàn)每分鐘產(chǎn)出數(shù)十萬行可接受的代碼。

谷歌DeepMind創(chuàng)始人兼CEO戴密斯·哈薩比斯表示,Gemini 2.5 Pro是谷歌有史以來最智能的模型,也是全球最強(qiáng)大的基礎(chǔ)模型。就在兩周前,谷歌發(fā)布了Gemini 2.5 Pro的預(yù)覽版,因此開發(fā)者可以立即使用并構(gòu)建它,例如將草圖轉(zhuǎn)化為交互式應(yīng)用程序、模擬3D城市等。

Gemini 2.5 Pro模型也已經(jīng)接入LearnLM(專為學(xué)習(xí)場景微調(diào)的模型),提升了Gemini 2.5 Pro在學(xué)習(xí)場景的能力。
在大會上,谷歌還發(fā)布了Gemini 2.5 Flash的升級版。Gemini 2.5 Flash是一款輕量化AI大模型,具備速度更快、低成本的優(yōu)勢。Gemini 2.5 Flash的升級版提升了推理、代碼和長上下文理解的能力,效率提升了 22%。Gemini 2.5 Flash將在6月初上市,Pro 版本也會緊隨其后。
Gemini 2.5 Pro 新增“思考預(yù)算”控件、更好的成本控制。Gemini 2.5 Pro和Gemini 2.5 Flash還支持原生音頻輸出,可以輕松地在24種不同語言之間切換,且能夠區(qū)分說話者背景聲音,建立更自然的對話體驗(yàn)。在安全方面,谷歌表示,通過增強(qiáng)安全防護(hù),Gemini 2.5 Pro和Gemini 2.5 Flash是谷歌迄今為止最安全的型號。
谷歌還發(fā)布了全新的模型:擴(kuò)散語言模型Gemini Diffusion,其利用并行生成來實(shí)現(xiàn)極低的延遲,生成速度比Gemini 2.5 Flash還快5倍,編碼能力與之相當(dāng)。
另外,谷歌一直在探索Gemini 思維、推理能力的前沿技術(shù),基于使用 AlphaGo 的經(jīng)驗(yàn),谷歌推出了Gemini 2.5 Pro "Deep Think"(深度思考模式)模型,采用了類AlphaGo的并行推理技術(shù),能夠?qū)崿F(xiàn)更加深入的思考,提升了Gemini 2.5 Pro 在學(xué)術(shù)與推理基準(zhǔn)上應(yīng)用體驗(yàn)。在美國數(shù)學(xué)奧林匹克2025測試和Live Codebench編程測試取得領(lǐng)先的地位。

在過去十年,谷歌為現(xiàn)代AI時(shí)代奠定了很多技術(shù)基礎(chǔ),從開創(chuàng)性推出Transformer等大模型架構(gòu)支撐著所有大語言模型,到AlphaGo 和 Alphazero 等代理系統(tǒng)。谷歌也將持續(xù)加大基礎(chǔ)研究的廣度和深度,以實(shí)現(xiàn)通用AI所需的下一個(gè)突破。
谷歌與OpenAI的AI競爭,由于ChatGPT的出現(xiàn),讓OpenAI反超谷歌一局,谷歌的搜索業(yè)務(wù)和AI產(chǎn)品都大受打擊。如今Gemini AI的重磅更新,是谷歌奪回技術(shù)和市場高地的關(guān)鍵。谷歌表示,Gemini AI已經(jīng)是最好的基礎(chǔ)模型,但公司的目標(biāo)是:努力拓展Gemini AI,使它成為“世界模型”。

谷歌在AI技術(shù)競賽中找回自己的節(jié)奏,選擇主動出擊、引領(lǐng)行業(yè)。除了Gemini AI,本次 I/O 大會的重磅:全新的AI搜索模式AI Mode。AI Mode模式也被認(rèn)為是谷歌的一場“革命”,用AI機(jī)器人替代原來的搜索功能,將聊天機(jī)器人的對話能力嵌入搜索體驗(yàn)中,支持繼續(xù)追問。該模式將在美國推出。
從技術(shù)路徑看,AI Mode模式以Gemini 2.5 Pro為底層模型,引入“查詢扇出(query fan-out)”技術(shù),可跨子主題和多個(gè)數(shù)據(jù)源并行處理,再匯總成一段多模態(tài)長答復(fù)。技術(shù)路徑與DeepResearch相似。但也是谷歌試圖通過引入更先進(jìn)的多模態(tài)數(shù)據(jù)處理能力、優(yōu)化用戶體驗(yàn)以及加強(qiáng),反擊OpenAI的必要之舉。

當(dāng)前,AI技術(shù)產(chǎn)業(yè)正在以超過預(yù)期的速度發(fā)展,不僅僅是谷歌和OpenAI。蘋果也在加速進(jìn)入這個(gè)賽道,例如蘋果推出了Apple Intelligence。業(yè)內(nèi)消息顯示蘋果也在推進(jìn)AI技術(shù)的布局,未來或?qū)⒃试S第三方開發(fā)者使用其AI模型編寫軟件。這將成為蘋果推動新應(yīng)用的開發(fā),成為蘋果在推動AI領(lǐng)域趕超競爭對手的“底牌”。這一消息將在6月9日的全球開發(fā)者大會(WWDC)上有所答案。
“殺回”智能眼鏡戰(zhàn)場:Android XR發(fā)布、與生態(tài)伙伴聯(lián)手
除了大模型,谷歌此次Google I/O開發(fā)者大會的亮點(diǎn)還有“殺回”智能眼鏡行業(yè)。谷歌再次介紹了Android XR、Wear OS 6這兩大操作系統(tǒng),并展示了兩款智能眼鏡產(chǎn)品。
谷歌在智能眼鏡項(xiàng)目上也有著超過10年的經(jīng)驗(yàn),它不僅是這一領(lǐng)域的開拓者,也是不斷演進(jìn)的見證者。從2015年的第一款智能眼鏡Google Glass(消費(fèi)版)至今,谷歌在這個(gè)領(lǐng)域經(jīng)歷了起起伏伏。谷歌并沒有放棄對智能眼鏡的追求。相反,它利用這段時(shí)間積累了豐富的經(jīng)驗(yàn),并結(jié)合了最新的AI技術(shù),以全新的視角重新審視這個(gè)市場。
一個(gè)有用的AI助手能夠讓你的生活更輕松,但是這種新形式能否讓你以新的方式體驗(yàn)AI助手呢?谷歌表示,這正是我們推出Android XR的原因。
Android XR是谷歌聯(lián)合三星、高通打造的首個(gè)專為 Gemini 時(shí)代打造的 Android 平臺,支持不同形態(tài)的設(shè)備,包括VR頭顯、AR智能眼鏡等,包括支持VST(視頻透視)和OST(光學(xué)透視)在內(nèi)的多樣化沉浸式設(shè)備。開發(fā)者可以基于Android XR定制自己的產(chǎn)品。

自去年發(fā)布Android XR開發(fā)者預(yù)覽版本以來,已有數(shù)百名開發(fā)者為該平臺進(jìn)行開發(fā),并且手機(jī)、平板電腦應(yīng)用程序都可以運(yùn)行。
在大會上,谷歌演示了基于Android XR的智能眼鏡功能,它支持實(shí)時(shí)翻譯、圖像記憶、地圖導(dǎo)航、拍照等功能。就在演示實(shí)時(shí)翻譯時(shí),Gemini卡住,導(dǎo)致一副智能眼鏡的實(shí)時(shí)窗口死機(jī)。谷歌表示,“這是一個(gè)非常冒險(xiǎn)的演示,但我們會嘗試一下。”這也說明,真正無縫銜接的AI虛擬世界還有一段距離,谷歌也在直面這個(gè)過程中的問題。

在大會上,谷歌介紹了兩款基于Android XR打造的AR設(shè)備,第一款是與三星合作的Project Moohan,這是一款谷歌眼鏡原型機(jī),支持全彩顯示,能夠通過語音實(shí)現(xiàn)AI交互,搭載攝像頭能夠提供圖像識別功能。
谷歌宣布,公司與三星的合作關(guān)系將會提升至新的水平,將Android XR從頭顯拓展至智能眼鏡領(lǐng)域,雙方也已經(jīng)在合作開發(fā)軟件和參考硬件平臺方面取得進(jìn)展。
第二款是Project Aura,這是谷歌聯(lián)合XREAL共同推出的專為 Android XR 平臺打造的旗艦級 AR 眼鏡,Project Aura 基于 OST(光學(xué)透視)技術(shù)路線。這款產(chǎn)品的發(fā)布也標(biāo)志著AR產(chǎn)業(yè)正式跨入“安卓時(shí)刻”。
Google副總裁、Android XR 負(fù)責(zé)人 Shahram Izadi介紹,表示,通過平臺開放性與 XREAL 在輕量化、便攜XR 硬件上的領(lǐng)先能力結(jié)合,我們正在推動空間體驗(yàn)進(jìn)入更直觀、更可及的 OST 時(shí)代,這是我們生態(tài)系統(tǒng)發(fā)展史上的重要時(shí)刻。

XREAL表示,此次聯(lián)合發(fā)布,集結(jié)了Google、XREAL與高通三方技術(shù)實(shí)力,形成覆蓋“平臺-硬件-芯片”的黃金鐵三角。
這一次,我們可以相信谷歌在經(jīng)過多年的技術(shù)投入之后,不會輕易放棄AI智能眼鏡市場。從2025 Google I/O開發(fā)者大會可以看到,谷歌在智能眼鏡行業(yè)將不再是單打獨(dú)斗,包括與上游芯片企業(yè)合作、與下游智能眼鏡品牌合作。通過軟件、硬件賦能,加上谷歌在安卓 近數(shù)十億用戶基礎(chǔ),谷歌正在擁抱一個(gè)更大的智能眼鏡生態(tài)。
谷歌認(rèn)為人工智能的機(jī)遇是巨大的,而這取決于開發(fā)人員、技術(shù)建設(shè)者和解決方案商,以確保它能被更多人使用。
-
谷歌
+關(guān)注
關(guān)注
27文章
6255瀏覽量
111909 -
AI
+關(guān)注
關(guān)注
91文章
40732瀏覽量
302385
發(fā)布評論請先 登錄
Gemini CLI 中轉(zhuǎn)站配置使用教程
晶晨攜手谷歌,助力端側(cè)大模型Gemini的硬件落地
谷歌正式推出Gemini 3 Flash模型
OpenAI前首席科學(xué)家Ilya Sutskever重磅預(yù)言:純靠“堆算力”的AI時(shí)代正在終結(jié)?
每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri
Gemini AI 再進(jìn)化:谷歌聯(lián)合XREAL發(fā)布Project Aura, 打開“看見世界”的新能力
谷歌正式推出最新Gemini 3 AI模型
谷歌Gemini 3模型開啟智能新紀(jì)元
AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時(shí)代
AI 邊緣計(jì)算網(wǎng)關(guān):開啟智能新時(shí)代的鑰匙?—龍興物聯(lián)
迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦一下?
“天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型
RK3576安卓OPS, 谷歌大屏新選擇
谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時(shí)代
評論