作者 / 產(chǎn)品經(jīng)理 Lucas Gonzalez 和軟件工程師 Rakesh Shivanna
繼 Gemma 3 和 Gemma 3 QAT 的成功發(fā)布之后,我們的先進(jìn)開放模型系列具備了在單一云端或桌面加速器上運(yùn)行的能力,我們正在進(jìn)一步推進(jìn)我們對可訪問 AI 的愿景。Gemma 3 為開發(fā)者提供了強(qiáng)大的功能,現(xiàn)在我們正將這一愿景擴(kuò)展到能夠在您日常使用的設(shè)備 (您的手機(jī)、平板電腦和筆記本電腦) 上直接運(yùn)行的高性能實(shí)時(shí) AI。
為了驅(qū)動(dòng)下一代的 On-device AI 并支持各種應(yīng)用,包括提升 Gemini Nano 的能力,我們設(shè)計(jì)了一種全新的尖端架構(gòu)。這個(gè)下一代基礎(chǔ)架構(gòu)是在與高通技術(shù) (Qualcomm Technologies)、聯(lián)發(fā)科 (MediaTek) 和三星系統(tǒng) LSI (Samsung System LSI) 等移動(dòng)硬件領(lǐng)導(dǎo)者的緊密合作下打造的,并針對閃電般快速的多模態(tài) AI 進(jìn)行了優(yōu)化,從而能夠在您的設(shè)備上直接實(shí)現(xiàn)真正個(gè)性化和私密的體驗(yàn)。
Gemma 3n 是我們首個(gè)基于此突破性的共享架構(gòu)構(gòu)建的開放模型,開發(fā)者即日起就可以在早期預(yù)覽版中開始體驗(yàn)這項(xiàng)技術(shù)。同樣的先進(jìn)架構(gòu)也為下一代 Gemini Nano 提供支持,它將這些功能帶到 Google 應(yīng)用和我們的 On-device 生態(tài)系統(tǒng)的廣泛功能中,并將在今年晚些時(shí)候推出。Gemma 3n 使您能夠開始在此基礎(chǔ)上進(jìn)行構(gòu)建,該基礎(chǔ)將應(yīng)用于 Android 和 Chrome 等主要平臺。
Gemma 3n 利用了 Google DeepMind 一項(xiàng)名為 Per-Layer Embeddings (PLE) 的創(chuàng)新技術(shù),該技術(shù)顯著降低了 RAM 的使用量。雖然原始參數(shù)規(guī)模為 5B 和 8B,但這項(xiàng)創(chuàng)新允許您在移動(dòng)設(shè)備上運(yùn)行更大的模型,或從云端進(jìn)行實(shí)時(shí)流式傳輸,其內(nèi)存消耗與 2B 和 4B 模型相當(dāng),這意味著這些模型可以在僅 2GB 和 3GB 的動(dòng)態(tài)內(nèi)存占用下運(yùn)行。
通過探索 Gemma 3n,開發(fā)者可以提前預(yù)覽開放模型的核心功能以及將通過 Gemini Nano 在 Android 和 Chrome 上提供的移動(dòng)優(yōu)先架構(gòu)創(chuàng)新。
在本文中,我們將探討 Gemma 3n 的新功能、我們負(fù)責(zé)任的開發(fā)方法,以及如何訪問預(yù)覽版。
Gemma 3n 的關(guān)鍵功能
Gemma 3n 專為在本地運(yùn)行的快速、低占用空間的 AI 體驗(yàn)而設(shè)計(jì),提供:
優(yōu)化的 On-Device 性能和效率: 與 Gemma 3 4B 相比,Gemma 3n 在移動(dòng)設(shè)備上的響應(yīng)速度提升了約 1.5 倍,質(zhì)量顯著提高,并通過 Per Layer Embeddings、KVC sharing 和高級 activation quantization 等創(chuàng)新技術(shù)降低了內(nèi)存占用。
Many-in-1 靈活性: 一個(gè)具有 4B 活躍內(nèi)存占用 (active memory footprint) 的模型,原生包含一個(gè)嵌套的先進(jìn) 2B 活躍內(nèi)存占用子模型 (這要?dú)w功于 MatFormer 訓(xùn)練)。這提供了在運(yùn)行中動(dòng)態(tài)權(quán)衡性能和質(zhì)量的靈活性,而無需托管單獨(dú)的模型。我們還在 Gemma 3n 中引入了 mix'n'match 能力,可以從 4B 模型中動(dòng)態(tài)創(chuàng)建子模型,以最佳地適應(yīng)您的特定用例以及相關(guān)的質(zhì)量/延遲權(quán)衡。敬請關(guān)注我們即將發(fā)布的技術(shù)報(bào)告中有關(guān)此研究的更多信息。
Privacy-First 和 Offline Ready: 即使沒有互聯(lián)網(wǎng)連接,也可以在本地執(zhí)行能夠?qū)崿F(xiàn)尊重用戶隱私并可靠運(yùn)行的功能。
通過音頻擴(kuò)展的多模態(tài)理解: Gemma 3n 可以理解和處理音頻、文本和圖像,并提供顯著增強(qiáng)的視頻理解能力。其音頻能力使模型能夠執(zhí)行高質(zhì)量的自動(dòng)語音識別 (轉(zhuǎn)錄) 和翻譯 (語音到翻譯文本)。此外,該模型還接受跨模態(tài)的交錯(cuò)輸入,從而能夠理解復(fù)雜的多模態(tài)交互。(相關(guān)功能即將公開發(fā)布)
改進(jìn)的多語言能力: 提升了多語言性能,特別是在日語、德語、韓語、西班牙語和法語方面。在多種語言基準(zhǔn)測試中表現(xiàn)出色,例如在 WMT24++ (ChrF) 上取得了 50.1% 的優(yōu)異成績。
解鎖全新 On-the-go 體驗(yàn)
Gemma 3n 將通過以下方式賦能新一代智能 On-the-go 應(yīng)用,使開發(fā)者能夠:
構(gòu)建實(shí)時(shí)的互動(dòng)體驗(yàn),能夠理解并響應(yīng)用戶環(huán)境中的實(shí)時(shí)視覺和聽覺信息。
利用組合的音頻、圖像、視頻和文本輸入 (全部在設(shè)備上私密處理) 來實(shí)現(xiàn)更深層次的理解和基于上下文的文本生成。
開發(fā)先進(jìn)的以音頻為中心的應(yīng)用,包括實(shí)時(shí)語音轉(zhuǎn)錄、翻譯和豐富的語音驅(qū)動(dòng)互動(dòng)。
攜手共建負(fù)責(zé)任的 AI
我們對負(fù)責(zé)任的 AI 開發(fā)的承諾至關(guān)重要。與所有 Gemma 模型一樣,Gemma 3n 經(jīng)過了嚴(yán)格的安全評估、數(shù)據(jù)治理以及與我們的安全政策進(jìn)行微調(diào)對齊。我們以謹(jǐn)慎的風(fēng)險(xiǎn)評估方式對待開放模型,并在 AI 領(lǐng)域不斷發(fā)展的同時(shí)持續(xù)完善我們的實(shí)踐。
開始使用: 立即預(yù)覽 Gemma 3n
您可以通過預(yù)覽版率先體驗(yàn) Gemma 3n 的強(qiáng)大功能:
初始訪問 (現(xiàn)已可用):
通過 Google AI Studio 進(jìn)行基于云的探索: 無需任何配置,您可直接通過瀏覽器訪問 Google AI Studio,即刻上手試用 Gemma 3n。立即探索其文本輸入能力。
使用 Google AI Edge 進(jìn)行 On-Device 開發(fā): 對于希望在本地集成 Gemma 3n 的開發(fā)者,Google AI Edge 提供了工具和庫。您即刻就可以開始使用文本和圖像理解/生成能力。
Gemma 3n 標(biāo)志著在普及前沿且高效 AI 的道路上又邁出了新的一步。我們非常期待能看到,隨著這項(xiàng)技術(shù)的預(yù)覽版開始逐步開放,您將構(gòu)建出怎樣的精彩應(yīng)用。
-
Google
+關(guān)注
關(guān)注
5文章
1812瀏覽量
60616 -
Gemini
+關(guān)注
關(guān)注
0文章
74瀏覽量
8171 -
AI
+關(guān)注
關(guān)注
91文章
40781瀏覽量
302407 -
模型
+關(guān)注
關(guān)注
1文章
3808瀏覽量
52235
原文標(biāo)題:Gemma 3n 預(yù)覽版發(fā)布: 強(qiáng)勁性能,高效運(yùn)行,專為移動(dòng)設(shè)備而生
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Google正式推出最新開放模型Gemma 4
谷歌推出TranslateGemma全新開放翻譯模型系列
開發(fā)智能體調(diào)試與預(yù)覽---真機(jī)測試
CastFox利用Google開放模型Gemma 3n重塑播客互動(dòng)體驗(yàn)
谷歌Android Studio Otter 3功能更新發(fā)布
谷歌正式發(fā)布Gemma Scope 2模型
微軟Visual Studio 2026 發(fā)布!AI 深度融合、性能提升
谷歌推出AI模型Gemma 3 270M
亞馬遜云科技推出Amazon Nova Act SDK預(yù)覽版,加速瀏覽器自動(dòng)化Agent落地
谷歌Gemma 3n模型的新功能
NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載
NVIDIA Isaac Sim和Isaac Lab現(xiàn)已推出早期開發(fā)者預(yù)覽版
樹莓派5上的Gemma 2:如何打造高效的邊緣AI解決方案?
谷歌Gemma 3n預(yù)覽版全新發(fā)布
評論