作者 / 資深研究科學家David Vilar,產品經理Kat Black
我們已正式推出 TranslateGemma,這一全新的開放翻譯模型系列基于 Gemma 3 構建,并提供 4B、12B 和 27B 三種參數規模。TranslateGemma 的問世標志著開放翻譯領域邁出了重要一步,它可幫助人們跨越 55 種語言進行交流,無論身在何處或使用何種設備均可輕松實現。
我們將最先進的大模型相關知識提煉到緊湊的高性能開放模型中,由此打造出了這套效率與質量兼備的模型。
性能表現勝于其規模兩倍的模型
在我們的技術評估中,最引人注目的一項發現是這些模型的效率。得益于專項訓練流程,TranslateGemma 12B 模型在 WMT24++ 基準測試中的表現遠超 Gemma 3 27B 基準模型 (基于 MetricX 指標衡量)。
對于開發者而言,這是一項重大突破。僅需不到基準模型一半的參數量,即可實現高保真級的翻譯質量。這項效率突破可在不影響準確率的前提下,顯著提高吞吐量并降低延遲。同樣地,4B 模型的性能可與規模較大的 12B 基準模型的性能相媲美,這也使其成為適合移動端推理的強大模型。
我們基于 WMT24++ 數據集對 TranslateGemma 進行了全面評估。該數據集包含 55 種語言,涵蓋多種語系,高資源、中資源和低資源語言應有盡有。與 Gemma 基準模型相比,TranslateGemma 在所有語言中均可大幅降低錯誤率,并能以更高效率實現更高質量。
基于 Gemini 構建
這種智能密度究竟是如何實現的?這要歸功于一套獨特的兩階段微調過程,此過程將 Gemini 模型的 "直覺" 提煉到一個開放架構當中。
監督微調 (SFT): 我們在一個多樣化的平行數據數據集上對 Gemma 3 基準模型進行了微調。此數據集包含大量人工翻譯文本,并結合由最先進的 Gemini 模型生成的高質量合成翻譯,即使在低資源語言中也能實現廣泛的語言覆蓋率和高保真度。
強化學習 (RL): 為了進一步優化翻譯質量,我們引入了一個新穎的強化學習階段。我們使用包含 MetricX-QE 和 AutoMQM 等高級指標在內的多種獎勵模型,來引導模型產生更符合語境且聽起來更自然的翻譯。
前所未有的語言覆蓋率
我們對 TranslateGemma 在 55 個語言對上進行了嚴格的訓練和評估,以確保它能在主要語言 (如西班牙語、法語、中文和印地語) 以及多種低資源語言中均提供高質量的可靠性能。
除了這些核心語言外,我們還通過針對近 500 個其他語言對進行訓練來突破極限。TranslateGemma 的設計定位是成為深度優化的堅實基礎,使其成為研究人員針對特定語言對微調其前沿模型,或提升低資源語言翻譯質量的理想起點。雖然我們尚未確認此擴展集合的評估指標,但我們已將完整列表納入技術報告,以此鼓勵社區進行探索和深度研究。
強大的多模態能力
TranslateGemma 模型延續了 Gemma 3 強大的多模態功能。我們根據 Vistra 圖像翻譯基準執行的測試表明,文本翻譯能力的提升也會對圖像內文本的翻譯能力產生積極影響,即使在 TranslateGemma 訓練過程中未進行特定的多模態微調亦是如此。
全場景靈活部署
TranslateGemma 為開放翻譯模型樹立了全新標準,并在最優性能與卓越效率之間取得平衡。這些模型專為多樣化的部署環境而設計,還有三種規模任您選擇:
4B 模型: 針對移動端和邊緣部署進行了優化。
12B 模型: 設計為可在消費級筆記本電腦上流暢運行,為本地開發環境帶來研究級的強大性能。
27B 模型: 旨在提供最大保真度,能夠在云端的單個 H100 GPU 或 TPU 上運行。
即刻體驗 TranslateGemma
TranslateGemma 版本的發布為研究人員和開發者提供了功能強大且適配靈活的工具,以滿足各種翻譯相關任務的需求。我們期待看到社區在這些模型的基礎上進行構建并加以利用,共同打破語言障礙并促進跨文化深度理解。具體試用方式如下:
-
谷歌
+關注
關注
27文章
6254瀏覽量
111373 -
開源
+關注
關注
3文章
4203瀏覽量
46128 -
模型
+關注
關注
1文章
3751瀏覽量
52099
原文標題:TranslateGemma: 全新開放翻譯模型系列,助您實現高效的多模態翻譯
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
谷歌正式推出Gemini 3 Flash模型
NVIDIA在CES 2026發布全新開放模型、數據和工具
NVIDIA 推出 Nemotron 3 系列開放模型
NVIDIA攜手Mistral AI發布全新開源大語言模型系列
面向科學仿真的開放模型系列NVIDIA Apollo正式發布
NVIDIA推出面向語言、機器人和生物學的全新開源AI技術
騰訊地圖推出全新時空智能開放平臺“蓋亞”
谷歌推出AI模型Gemma 3 270M
當翻譯失去網絡,時空壺新T1翻譯機開創首個離線模型賦能全球溝通新體驗
TDK推出全新SmartMotion ICM-536xx系列高性能六軸IMU
2025聯想創新開放日正式開啟
亞馬遜云科技現已上線OpenAI開放權重模型
翼輝信息推出全新開發環境RealEvo-Stream
谷歌推出TranslateGemma全新開放翻譯模型系列
評論