国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌開源70億參數大語言模型,全方位超越Meta Llama-2?

E4Life ? 來源:電子發燒友 ? 作者:周凱揚 ? 2024-02-23 00:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/周凱揚)在Sora把AI生成領域的視線全部吸引過去的這段時間里,谷歌卻依然在竭盡全力推進新的生成模型發展。除了上周發布的下一代Gemini 1.5外,谷歌也在近日推出了一系列基于Gemini打造的開源模型Gemma。

谷歌加入AI模型開源陣營,Gemma橫空出世

根據谷歌的介紹,Gemma是由谷歌DeepMind以及其他團隊開發,由Gemini啟發并采用了相同的研究與技術的輕量級模型。與之一起發布的還有全新的響應式生成AI工具包,為利用Gemma創造更安全的AI應用提供關鍵工具和指導。

從參數大小上來看,Gemma分為20億參數(Gemma 2B)和70億(Gemma 7B)參數兩個版本,且每個版本又有基礎版(預訓練)和指令調整版兩個變體。其中70億參數的版本適合消費級的GPU和TPU開發,而20億參數的版本可以用于CPU和端側應用上。

在預訓練數據上,Gemma 2B和7B分別采用了2T和6T的Token進行訓練,數據來源是以英文為主的網絡文檔、數學計算和代碼。需要注意的是,盡管其背后所采用的技術與Gemini類似,但這些模型并不屬于多模態模型,也并不適合用于追求極致的多語言任務性能。

在訓練硬件上,谷歌采用了自研的TPUv5e,其中Gemma 7B用到了4096塊TPUv5e進行訓練,Gemma 2B用到了512塊TPUv5e進行訓練。

開源LLM混戰,Gemma 7B超越Llama-2 13B?

根據谷歌官方提供的數據,與Meta的Llama-2相比,Gemma 7B在多個項目上展現出了優勢,比如大規模多任務語言理解(MMLU)、GSM8K和Math計算和HumanEval Python代碼生成等應用上,都超過了Llama-2 7B,甚至不少超過了Llama-2 13B。

wKgaomXXHwmAORLbAAExLTvutQk859.png
開源模型文本任務性能對比 / 谷歌


谷歌表示,與同等體量的開源模型對比,比如LLaMA-2和Mistral等,18項文字相關的任務中,Gemma能夠做到在11項任務中性能勝出,且平均性能得分占優。

不過Gemma也并不是完全超越了Llama-2,從Huggingface給出的平均得分來看,Gemma 7B超過了同級別的Llama 2 7B,但還是低于LLama 2 70B Chat,不過考慮到這兩者之間的參數差異,也印證了Gemma 7B的強大。至于Gemma 2B,與同規格的其他優秀開源LLM相比,比如PHI-2(2.7B),也不存在優勢。

作為一個輕量級的模型,Gemma也對跨設備兼容性做了優化,可以在筆記本、PC、IoT設備、智能手機和云端運行。谷歌也與英偉達達成合作,Gemma針對英偉達的GPU硬件進行了優化,無論是云端的AI GPU還是桌面端的RTX AI PC,都能享受Gemma帶來的性能。

寫在最后

盡管Gemma是谷歌首個大型的開源LLM,但這早已經不是谷歌對開源AI社區做出的首個貢獻了,諸如Transformers, TensorFlow, BERT, T5, JAX, AlphaFold和AlphaCode等,可以說當前AI能夠有如此繁榮的開發生態,谷歌做出了不少貢獻。無疑Gemma的出現,也會給AI開發生態帶來新的選擇。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111406
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301428
  • 算力
    +關注

    關注

    2

    文章

    1532

    瀏覽量

    16744
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5185
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    “明牌”對局,自變量開源模型超越pi0

    “明牌”對局,自變量開源模型超越pi0
    的頭像 發表于 01-10 12:00 ?5594次閱讀
    “明牌”對局,自變量<b class='flag-5'>開源</b><b class='flag-5'>模型</b><b class='flag-5'>超越</b>pi0

    泰凌微:布局端側AI,產品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發布的基于TL721X系列芯片的TL-EdgeAI平臺,支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯網連接協議平臺。其芯片已在谷歌(Google)
    的頭像 發表于 12-15 08:21 ?1w次閱讀

    谷歌與耶魯大學合作發布最新C2S-Scale 27B模型

    我們很榮幸發布與耶魯大學合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),這是一個新的 270 參數基礎模型
    的頭像 發表于 11-06 10:35 ?854次閱讀

    NVIDIA ACE現已支持開源Qwen3-8B小語言模型

    為助力打造實時、動態的 NPC 游戲角色,NVIDIA ACE 現已支持開源 Qwen3-8B 小語言模型(SLM),可實現 PC 游戲中的本地部署。
    的頭像 發表于 10-29 16:59 ?1229次閱讀

    NVIDIA開源Audio2Face模型及SDK

    NVIDIA 現已開源 Audio2Face 模型與 SDK,讓所有游戲和 3D 應用開發者都可以構建并部署帶有先進動畫的高精度角色。NVIDIA 開源 Audio
    的頭像 發表于 10-21 11:11 ?827次閱讀
    NVIDIA<b class='flag-5'>開源</b>Audio<b class='flag-5'>2</b>Face<b class='flag-5'>模型</b>及SDK

    成都匯陽投資關于大模型白熱化,應用加速分化

    Gemini 2.5 Flash Image登頂 多主流圖像榜,Meta 也從 Midjourney 授權 AI 圖像模型;視頻領域,阿里字節等刷新能力高度 ,谷歌將視頻模型推進至實
    的頭像 發表于 09-09 09:30 ?920次閱讀

    OpenAI發布2開源模型

    OpenAI開源了兩款高性能權重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發布了!我們做了一個開放模型
    的頭像 發表于 08-06 14:25 ?1028次閱讀

    【VisionFive 2單板計算機試用體驗】3、開源語言模型部署

    1、ollama平臺搭建 ollama可以快速地部署開源模型,網址為https://ollama.com, 試用該平臺,可以在多平臺上部署 Deepseek-R1, Qwen3, Llama
    發表于 07-19 15:45

    華為宣布開源盤古7B稠密和72B混合專家模型

    電子發燒友網綜合報道 2025年6月30日,華為正式宣布開源盤古70參數的稠密模型、盤古Pro MoE 720
    的頭像 發表于 07-06 05:51 ?7412次閱讀

    華為正式開源盤古7B稠密和72B混合專家模型

    [中國,深圳,2025年6月30日] 今日,華為正式宣布開源盤古70參數的稠密模型、盤古Pro MoE 720
    的頭像 發表于 06-30 11:19 ?1336次閱讀

    使用 NPU 插件對量化的 Llama 3.1 8b 模型進行推理時出現“從 __Int64 轉換為無符號 int 的錯誤”,怎么解決?

    安裝了 OpenVINO? GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    發表于 06-25 07:20

    探索在Arm平臺運行的Llama 4 Scout模型

    人工智能 (AI) 正在加速發展,也越來越智能化。當今的開源語言模型不僅功能強大,而且在設計時充分考慮了實際部署的需求,因而具有輕量化和經濟高效的特點,可大規模部署到數十億臺設備上。簡而言之,對于開發者可能想到的各種情形,當今
    的頭像 發表于 05-20 09:54 ?749次閱讀

    ServiceNow攜手NVIDIA構建150參數超級助手

    Apriel Nemotron 15B 開源語言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama Nemotron 開放數據集以及 ServiceNow 專業
    的頭像 發表于 05-12 15:37 ?926次閱讀

    NVIDIA使用Qwen3系列模型的最佳實踐

    阿里巴巴近期發布了其開源的混合推理大語言模型 (LLM) 通義千問 Qwen3,此次 Qwen3 開源模型系列包含兩款混合專家
    的頭像 發表于 05-08 11:45 ?2990次閱讀
    NVIDIA使用Qwen3系列<b class='flag-5'>模型</b>的最佳實踐

    今日看點丨臺積電、Intel合資運營代工業務;韓國計劃向當地汽車行業注入3萬億韓元援助

    1. Meta 發布人工智能新模型系列 Llama 4 ,首次采用“混合專家”架構 ? 當地時間周六(4月5日),美國科技巨頭Meta推出了其最強大的
    發表于 04-07 11:26 ?624次閱讀