伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌正式發布Gemma Scope 2模型

谷歌開發者 ? 來源:谷歌開發者 ? 2026-01-24 14:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者 / 語言模型可解釋性團隊

大語言模型 (LLM) 具備令人驚嘆的推理能力,但其內部決策過程在很大程度上仍然不透明。如果系統未按預期運行,對其內部運作機制缺乏可見性將難以準確定位問題根源。過去,我們通過發布Gemma Scope工具包推動了可解釋性科學的發展,該工具旨在幫助研究人員理解我們輕量級開放模型系列 Gemma 2 的內部運作機制。

近期我們正式發布了Gemma Scope 2: 這是一套全面且開放的可解釋性工具套件,適用于從 2.7 億到 270 億參數的所有Gemma 3模型規模。借助這套工具,我們可以追蹤模型整個 "大腦" 中的潛在風險。

據我們了解,這是迄今為止 AI 實驗室發布的最大規模可解釋性工具開源項目。構建 Gemma Scope 2 共涉及存儲約 110PB 數據,訓練的參數量更是超過了 1 萬億。

隨著 AI 持續發展,我們期待 AI 研究社區運用 Gemma Scope 2 來調試模型涌現行為,借助這些工具更有效地審計與調試 AI 智能體,最終實現加速開發實用且穩健的安全干預方案,以應對越獄攻擊、幻覺生成及諂媚傾向等問題。

我們與 Neuronpedia 合作推出的Gemma Scope 2 交互式演示現已開放體驗。

Gemma Scope 2 新功能

可解釋性研究旨在揭示 AI 模型的內部運作機制及其訓練中習得的算法。隨著 AI 的能力日益增強、系統日趨復雜,可解釋性對于構建安全可靠的 AI 至關重要。

與上一代工具類似,Gemma Scope 2 如同為 Gemma 系列語言模型配備的顯微鏡。通過結合稀疏自編碼器 (SAEs) 與轉碼器,研究人員得以深入模型內部,觀察其思考內容,溯源這些思維如何形成并與模型行為產生關聯。由此,這種洞察力進一步推動對越獄攻擊等 AI 安全相關問題的更深入研究,例如揭示模型對外表述的推理過程與其內部真實狀態之間的差異。

初代 Gemma Scope 已在模型幻覺、識別模型已知機密信息、訓練更安全模型等關鍵安全研究領域發揮作用,而 Gemma Scope 2 則通過以下重大升級來支持更具雄心的研究:

全規模覆蓋: 我們為整個 Gemma 3 系列 (參數規模最高達 270 億) 提供了一整套完整的工具,這對于研究僅在大規模模型中顯現的涌現行為至關重要。例如,此前270 億參數的 C2S Scale 模型曾協助科研人員發現潛在的新型癌癥治療路徑。盡管 Gemma Scope 2 并未在該模型上進行訓練,但這一案例體現了此工具套件未來有望解析的涌現行為類型。

更精細的復雜內部行為解析工具: Gemma Scope 2 包含針對 Gemma 3 模型系列每一層訓練的稀疏自編碼器與轉碼器。通過引入跳躍轉碼器和跨層轉碼器,讓解析貫穿在模型中的多步驟計算與算法變得更加輕松。

先進的訓練技術: 我們采用最前沿的訓練技術,特別是Matryoshka 訓練技術,該技術能幫助稀疏自編碼器識別更有價值的概念,并修正了在初代 Gemma Scope 中發現的部分缺陷。

對話機器人行為分析工具: 對于針對聊天場景微調的 Gemma 3 版本,我們還專門提供定制化的可解釋性工具。這些工具有助于分析復雜、多步驟的行為模式,例如越獄攻擊、拒絕響應機制以及思維鏈的忠實度。

推動領域發展

我們希望通過發布 Gemma Scope 2 為 AI 安全研究社區提供一套前沿的可解釋性工具,以推動該領域發展。針對那些僅在更大、更先進的大語言模型中出現的現實安全問題,這種全新的開放程度提供了至關重要的解決途徑。歡迎您持續關注 "谷歌開發者" 微信公眾號,及時了解更多開發技術和產品更新等資訊動態。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6255

    瀏覽量

    111710
  • AI
    AI
    +關注

    關注

    91

    文章

    40431

    瀏覽量

    302035
  • 模型
    +關注

    關注

    1

    文章

    3778

    瀏覽量

    52195

原文標題:Gemma Scope 2: 賦能 AI 安全社區,深度洞察大語言模型復雜行為

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA Jetson模型賦能AI在邊緣端落地

    和 Isaac GR00T 等模型以及千問大模型Gemma、Mistral AI、GPT-OSS、PI 等社區模型的通用平臺。
    的頭像 發表于 03-16 16:27 ?404次閱讀
    NVIDIA Jetson<b class='flag-5'>模型</b>賦能AI在邊緣端落地

    谷歌推出TranslateGemma全新開放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新的開放翻譯模型系列基于 Gemma 3 構建,并提供 4B、12B 和 27B 三種參數規模。TranslateGemma 的問世標志著開放翻譯領域邁出了重要一步,它可幫助人們跨越 55 種語言進行交流,無論身在何處或
    的頭像 發表于 02-26 10:22 ?633次閱讀

    解鎖谷歌FunctionGemma模型的無限潛力

    在智能體 AI 領域,工具調用能力是將自然語言轉化為可執行軟件操作的關鍵。此前,我們發布了專門針對函數調用而特別優化的 Gemma 3 270M 模型版本 FunctionGemma。該模型
    的頭像 發表于 02-04 11:30 ?389次閱讀
    解鎖<b class='flag-5'>谷歌</b>FunctionGemma<b class='flag-5'>模型</b>的無限潛力

    借助谷歌FunctionGemma模型構建下一代端側智能體

    對于 Gemma 模型系列而言,2025 年是充滿變革的一年。我們的下載量已從 1 億次增長到超過 3 億次,同時還展現了開放模型的變革潛力: 從憑借 Gemma 3 定義最先進的單加
    的頭像 發表于 01-20 09:11 ?710次閱讀
    借助<b class='flag-5'>谷歌</b>FunctionGemma<b class='flag-5'>模型</b>構建下一代端側智能體

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發布于 :2026年01月15日 17:02:00

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    該協議,下一代蘋果基礎模型(Apple Foundation Models)將基于谷歌的Gemini模型和云技術。 ? 蘋果:借Gemini之力,加速AI追趕 ? 長期以來,蘋果在AI領域的發展相對滯后,其語音助手Siri的功能
    的頭像 發表于 01-13 14:59 ?5698次閱讀

    泰凌微:布局端側AI,產品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發布的基于TL721X系列芯片的TL-EdgeAI平臺,支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯網連接協議平臺。其芯片已在谷歌(Google)
    的頭像 發表于 12-15 08:21 ?1w次閱讀

    谷歌與耶魯大學合作發布最新C2S-Scale 27B模型

    我們很榮幸發布與耶魯大學合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),這是一個新的 270 億參數基礎模型,旨在理解單個細胞的 "語言"。C
    的頭像 發表于 11-06 10:35 ?923次閱讀

    谷歌AlphaEarth和維智時空AI大模型的技術路徑

    谷歌AlphaEarth和維智時空AI大模型在應用場景和技術實現上各有側重,但兩者在底層技術理念上存在顯著共性。
    的頭像 發表于 10-22 14:48 ?963次閱讀

    谷歌推出AI模型Gemma 3 270M

    過去幾個月,Gemma 開放模型系列的發展是激動人心的。我們推出了 Gemma 3 和 Gemma 3 QAT,為單一云端和桌面加速器帶來了最先進的性能。
    的頭像 發表于 09-11 15:09 ?1207次閱讀

    谷歌Gemma 3n模型的新功能

    從第一個 Gemma 模型于去年年初推出以來,已逐漸發展為生機勃勃的 Gemmaverse 生態系統,累計下載量突破 1.6 億。這個生態系統包括十余款專業模型系列,涵蓋從安全防護到醫療應用的各領
    的頭像 發表于 07-25 10:16 ?1498次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemma</b> 3n<b class='flag-5'>模型</b>的新功能

    Liquid AI發布邊緣AI模型LFM2,實現毫秒級實時推理與離線運行

    源于對AI底層邏輯的重構。與傳統基于Transformer的模型不同,LFM2采用結構化、自適應的算子構建,其靈感源自動態系統理論、信號處理與數值線性代數的深度融合。 ? 這種設計使模型具備三大核心優勢:其一,訓練效率較上一代提
    的頭像 發表于 07-15 08:59 ?5932次閱讀

    谷歌Gemma 3n預覽版全新發布

    Gemma 3 和 Gemma 3 QAT 的成功發布之后,我們的先進開放模型系列具備了在單一云端或桌面加速器上運行的能力,我們正在進一步推進我們對可訪問 AI 的愿景。
    的頭像 發表于 06-26 17:18 ?1006次閱讀

    樹莓派5上的Gemma 2:如何打造高效的邊緣AI解決方案?

    從數學基礎到邊緣實現,研究團隊:Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成機器模型算法2.1模型架構2.2預訓練2.3后訓練3.邊緣AI實現1.引言GEMMA
    的頭像 發表于 06-20 16:57 ?1725次閱讀
    樹莓派5上的<b class='flag-5'>Gemma</b> <b class='flag-5'>2</b>:如何打造高效的邊緣AI解決方案?

    Google Gemma 3開發者指南

    自首次推出以來,Gemma 模型的下載量已超過 1 億次,社區為各種用例創建了超過 60,000 個變體1。我們很高興推出 Gemma 3,這是 Gemma 開放
    的頭像 發表于 04-08 10:50 ?1190次閱讀
    Google <b class='flag-5'>Gemma</b> 3開發者指南