作者 / 小組產品經理 Olivier Lacombe、研究工程師 Kathleen Kenealy、Kat Black、Ravin Kumar、Francesco Visin、Jiageng Zhang
過去幾個月,Gemma 開放模型系列的發展是激動人心的。我們推出了 Gemma 3 和 Gemma 3 QAT,為單一云端和桌面加速器帶來了最先進的性能。以移動設備優先的架構 Gemma 3n 的推出,能夠將強大的實時多模態 AI 直接應用于邊緣設備。我們的目標是為開發者提供使用 AI 進行構建的實用工具,也一直對大家共同創造的 Gemmaverse 生態系統蓬勃發展而倍感欣喜,目前下載量已經突破 2 億次,讓我們共同慶祝這一時刻。
現在,我們在 Gemma 3 工具包中新增了一款高度專業化的工具: Gemma 3 270M。此模型是擁有 2.7 億參數的緊湊型模型,專為針對特定任務進行微調而設計,并且已內置強大的指令遵循和文本結構化能力。
Gemma 3 270M 為小尺寸模型帶來強大的指令遵循能力。正如 IFEval 基準測試 (該測試用于檢驗模型遵循可驗證指令的能力) 所示,它為同尺寸模型確立了新的性能水平,使復雜的 AI 功能更容易用于設備端和研究應用。
Gemma 3 270M 的核心能力
緊湊但功能強大的架構: 我們的新模型總共有 2.7 億參數: 其中的 1.7 億是嵌入參數 (因詞匯量較大),另外的 1 億參數用于我們的 Transformer 模塊。得益于 256k token 的大詞匯量,該模型可以處理特定和罕見的 token,使其成為可在特定領域和語言中進一步微調的強大基礎模型。
極致的能效表現: Gemma 3 270M 的一個關鍵優勢是其低功耗。在 Pixel 9 Pro SoC 上進行的內部測試顯示,由于采用了 INT4 量化技術,該模型在 25 次對話中僅消耗了 0.75% 的電量,成為我們最節能的 Gemma 模型。
指令遵循: 我們同步發布了指令微調版模型和預訓練檢查點。雖然此模型并非專為復雜的對話用例而設計,但它是一個強大的模型,能夠開箱即用直接遵循一般指令。
可用于生產環境的量化: 量化感知訓練 (QAT) 檢查點已正式推出,使您能夠在 INT4 精度下運行模型,同時將性能損失降至最低,這對于在資源受限的設備上部署模型至關重要。
選擇合適的工具
在工程領域,衡量成功的標準在于效率,而不僅僅是原始算力。避免 "大材小用",同樣的道理也適用于使用 AI 進行構建。
Gemma 3 270M 體現了 "選擇合適的工具" 這一理念。這是一款性能卓越的基礎模型,開箱即用即可遵循指令,而通過微調更能釋放其全部潛能。經過專業化設置后,模型能以驚人的準確率、速度和成本效益執行文本分類和數據提取等任務。從一款功能強大的緊湊型模型著手,您可以構建出精簡、快速且顯著降低運營成本的生產系統。
現實世界的成功藍圖
這種方法已經在現實世界中取得了令人驚嘆的成果。Adaptive ML 與 SK Telecom 合作完成的項目便是一個絕佳的例證。面對復雜、多語言的內容審核這一挑戰,他們選擇了走專業化路線。Adaptive ML 沒有使用大型通用模型,而是對 Gemma 3 4B 模型進行了微調。結果令人驚嘆: 專業的 Gemma 模型在特定任務上的性能不僅比肩、甚至超越了更大規模的專有模型。
Gemma 3 270M 旨在讓開發者更進一步地采用這種方法,從而更高效地處理明確的任務。該模型是打造小型專業模型的完美起點,因為每個模型都有各自擅長處理的任務類型。
而且,這種專業化的能力不僅適用于企業任務,還能賦能強大的創意應用。例如下面這款 "睡前故事生成器" Web 應用:
何時選擇使用 Gemma 3 270M
Gemma 3 270M 沿襲了 Gemma 3 系列的先進架構和強大的預訓練能力,為您的自定義應用奠定了堅實的基礎。
理想應用場景如下:
您有大量明確的任務。非常適合情感分析、實體提取、查詢路由、非結構化文本到結構化文本的轉換、創意寫作以及合規性檢查等功能。
您需要充分利用每分每秒的時間。大幅降低或消除生產環境中的推理成本,并為用戶提供更快的響應速度。經過微調的 270M 模型可以在輕量級、低成本的基礎設施上運行,也可以直接在設備上運行。
您需要快速迭代和部署。Gemma 3 270M 體積小巧,可進行快速微調實驗,幫助您在數小時而非幾天內找到適合用例的理想配置。
您需要確保用戶隱私。由于該模型可以完全在設備上運行,因此您可以構建處理敏感信息的應用,而無需將數據發送到云端。
您想擁有一系列能夠處理各種任務的專業模型。構建并部署多個自定義模型,每個模型都針對不同的任務經過專業訓練,并且不會超出您的預算。
微調入門
我們致力于讓每一位開發者都能輕松地將 Gemma 3 270M 打造為專屬的定制化解決方案。該模型采用與其他 Gemma 3 模型相同的架構,并配備了相關教程和工具,助您快速入門。您可以
在 Gemma 文檔中查閱關于使用 Gemma 3 270M 進行全面微調的指南。
下載模型: 從 Hugging Face、Ollama、Kaggle、LM Studio 或 Docker 獲取 Gemma 3 270M 模型。我們將發布經過預訓練和指令微調的模型。
試用模型: 在 Vertex AI 或熱門推理工具 (如 llama.cpp、Gemma.cpp、LiteRT、Keras 和 MLX) 上試用模型。
開始微調: 使用您最喜歡的工具,包括 Hugging Face、UnSloth 和 JAX。
部署解決方案: 微調完成后,您可以在任何地方部署您的專業模型,從您自己的本地環境到 Google Cloud Run。
Gemmaverse 建立在 "創新無關大小" 這一理念之上。借助 Gemma 3 270M,我們讓開發者能夠構建更智能、更迅捷、更高效的 AI 解決方案。我們熱切期待您創建的專業模型。
-
AI
+關注
關注
91文章
39755瀏覽量
301360 -
模型
+關注
關注
1文章
3751瀏覽量
52099
原文標題:Gemma 3 270M 發布 | 兼具輕量化與卓越性能的 AI 模型
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
谷歌推出TranslateGemma全新開放翻譯模型系列
谷歌正式發布Gemma Scope 2模型
谷歌正式推出Gemini 3 Flash模型
借助谷歌FunctionGemma模型構建下一代端側智能體
谷歌正式推出最新Gemini 3 AI模型
谷歌與耶魯大學合作發布最新C2S-Scale 27B模型
谷歌AlphaEarth和維智時空AI大模型的技術路徑
谷歌Gemma 3n模型的新功能
谷歌Gemma 3n預覽版全新發布
樹莓派5上的Gemma 2:如何打造高效的邊緣AI解決方案?
谷歌推出AI模型Gemma 3 270M
評論