国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm率先適配騰訊混元HY-1.8B-2Bit模型

Arm社區 ? 來源:Arm社區 ? 2026-02-10 17:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能 (AI) 加速向智能手機、PC 與物聯網終端等滲透,如何在邊緣設備上實現高性能、低功耗的智能體驗,已成為行業共同關注的核心議題。

騰訊混元今日發布了 HY-1.8B-2Bit,這是一款等效參數量僅有 0.3B 的極低比特壓縮模型,有助于移動設備廠商和開發者加速實現生成式 AI 的創新落地。作為全球應用最為廣泛的高性能、高能效計算平臺,Arm 率先完成了對該模型的成功適配。HY-1.8B-2Bit 現已能夠在搭載啟用第二代可伸縮矩陣擴展 (SME2) 技術的 Armv9 計算平臺的移動設備上實現高效運行。

在資源受限的邊緣設備上部署與運行生成式 AI,普遍面臨性能、能效、內存等諸多挑戰。通過有效縮減模型規模,是將生成式 AI 用例拓展至更廣泛設備的行之有效的方法之一。規模更小的模型在與原始模型保持相近推理精度的前提下,能在端側實現更出色的性能表現與能效水平,進而在兼顧設備續航表現的同時,為用戶帶來響應更迅捷、運行更流暢的端側 AI 體驗。

騰訊混元此次推出的 HY-1.8B-2Bit 通過對 HY?1.8B?Instruct 模型進行 2 比特量化感知訓練 (QAT) 產出,對比原始精度模型等效參數量降低了 6 倍,可以在邊緣設備上靈活部署,并保持了與 INT4-PTQ 方法相當的模型性能。同時,該模型沿用了 HY-1.8B-Instruct 的全思考能力,用戶可以根據其應用的復雜性和資源限制,靈活地選擇推理模式。得益于上述優勢,HY-1.8B-2Bit 在實時性要求高、資源受限的場景中依然能夠提供快速且可靠的推理表現。

而在此基礎上,Arm SME2 技術使得移動端開發者能更輕松獲取端側 AI 加速功能。SME2 是 Armv9 架構中的高級 CPU 指令,能夠在 AI 異構計算框架下,高效支持各類實時移動端推理任務。實際測試結果顯示,HY-1.8B-2Bit 運行在啟用 SME2 技術的移動設備上時,對比 HY-1.8B-Q4 模型,在不同窗口大小下的首詞元延遲 (TTFT) 和生成速度均實現了顯著提升。這將有助于在資源受限的場景中,實現更卓越、流暢、智能的使用體驗。例如,通用聊天機器人和 AI 助手能夠在端側實現更復雜、自然的語言處理能力。與此同時,SME2 已被集成至多個主流框架中,深度嵌入軟件棧。開發者可通過 llama.cpp 直接在啟用 SME2 技術的硬件上部署 HY-1.8B-2Bit 模型,加速實現生成式 AI 應用的性能躍升。

模型地址:

https://huggingface.co/AngelSlim/HY-1.8B-2Bit

https://huggingface.co/AngelSlim/HY-1.8B-2Bit-GGUF

各位開發者們,也可點擊閱讀原文,跳轉模型地址,了解更多關于 HY-1.8B-2Bit 的信息及如何部署!

SME2 技術已獲得業界領先生態伙伴的廣泛采用與認可。vivo、OPPO 等手機廠商已推出集成啟用 SME2 的 Arm C1 CPU 與 Mali G1-Ultra GPU 的旗艦智能手機,為端側 AI 帶來了實際的體驗提升;此外,SME2 也已在 iOS 中大幅啟用。而開發者們正借助 SME2 技術,加速語言模型推理、圖像處理、音頻生成等核心能力,為各類主流應用打造出更迅捷的實時體驗。與此同時,Arm 也正積極將 SME2 技術擴展至更廣泛的 CPU 平臺。預計到 2030 年,SME 與 SME2 技術將為超過 30 億臺設備新增超 100 億 TOPS 的計算能力,持續降低端側 AI 的部署成本與隱私風險。

Arm 與騰訊混元持續依托技術創新,攜手推動端側應用功能與用戶體驗的優化升級,助力本土開發者更高效、順暢地開展端側 AI 創新開發。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9546

    瀏覽量

    391390
  • 騰訊
    +關注

    關注

    7

    文章

    1684

    瀏覽量

    50878
  • 模型
    +關注

    關注

    1

    文章

    3730

    瀏覽量

    52046

原文標題:SME2 技術加持,Arm 率先適配騰訊混元 HY-1.8B-2Bit 模型,為端側 AI 帶來卓越體驗

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    燧原科技訓推一體芯片L600適配階躍星辰基座模型Step 3.5 Flash

    ”的 Agent 底層模型選項,從而真正融入日常開發。燧原科技的新一代訓推一體芯片L600已率先完成適配,成為國內首批適配模型的國產算力。
    的頭像 發表于 02-02 17:50 ?1209次閱讀
    燧原科技訓推一體芯片L600<b class='flag-5'>適配</b>階躍星辰基座<b class='flag-5'>模型</b>Step 3.5 Flash

    沐曦曦云C500/C550 GPU產品適配騰訊圖像3.0圖生圖模型

    近日,騰訊團隊宣布開源圖像3.0圖生圖版本(HunyuanImage 3.0-Instruct),沐曦股份曦云C500/C550 2
    的頭像 發表于 02-02 14:43 ?335次閱讀

    沐曦曦云C500/C550 GPU產品適配騰訊開源翻譯模型1.5版本

    12月30日,騰訊宣布推出并開源翻譯模型1.5,共包含兩個模型:Tencent-HY-MT1.5-1
    的頭像 發表于 01-06 14:13 ?329次閱讀
    沐曦曦云C500/C550 GPU產品<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源翻譯<b class='flag-5'>模型</b>1.5版本

    壁仞科技壁礪166M產品適配騰訊開源翻譯模型1.5版本

    中文、英語、日語等常見語種,也包含捷克語、馬拉地語、愛沙尼亞語、冰島語等小語種。目前兩個模型均已在騰訊官網上線,在Github和Huggingface等開源社區也可直接下載使用。壁
    的頭像 發表于 01-05 15:39 ?280次閱讀
    壁仞科技壁礪166M產品<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源翻譯<b class='flag-5'>模型</b>1.5版本

    愛芯智邊緣AI芯片AX8850完成CosyVoice2模型適配

    今年下半年,隨著業務推廣需求增加,我們的大模型適配工作也有了新方向:不再只追求前沿模型的快速適配,而是更聚焦為銷售團隊提供“能打”的實戰“彈藥”——也就是貼近客戶剛需的、可快速落地的大
    的頭像 發表于 12-11 10:35 ?5153次閱讀
    愛芯<b class='flag-5'>元</b>智邊緣AI芯片AX8850完成CosyVoice<b class='flag-5'>2</b>大<b class='flag-5'>模型</b><b class='flag-5'>適配</b>

    騰訊地圖推出全新時空智能開放平臺“蓋亞”

    )。 該平臺基于騰訊位置服務開放平臺與位置大數據平臺的底層能力,深度融合騰訊模型與時空動態大模型
    的頭像 發表于 09-18 10:26 ?2000次閱讀

    Arm率先適配騰訊開源模型,助力端側AI創新開發

    本周初,騰訊宣布開源四款小尺寸模型(參數分別為 0.5B1.8B、4
    的頭像 發表于 08-08 09:16 ?1367次閱讀
    <b class='flag-5'>Arm</b><b class='flag-5'>率先</b><b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源<b class='flag-5'>模型</b>,助力端側AI創新開發

    硬件與應用同頻共振,英特爾Day 0適配騰訊開源模型

    于OpenVINO? 構建的 AI 軟件平臺的可擴展性,英特爾助力ISV生態伙伴率先實現應用端Day 0 模型適配,大幅加速了新模型的落地進程,彰顯了 “硬件 +
    的頭像 發表于 08-07 14:42 ?1341次閱讀
    硬件與應用同頻共振,英特爾Day 0<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b>開源<b class='flag-5'>混</b><b class='flag-5'>元</b>大<b class='flag-5'>模型</b>

    萬億參數!腦企智一體機率先支持Kimi K2模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布腦企智一體機已率先完成對Kimi K2 萬億參數大模型適配支持,并實現單用戶70
    的頭像 發表于 07-22 09:27 ?546次閱讀
    萬億參數!<b class='flag-5'>元</b>腦企智一體機<b class='flag-5'>率先</b>支持Kimi K<b class='flag-5'>2</b>大<b class='flag-5'>模型</b>

    摩爾線程率先支持騰訊-A13B模型

    近日,騰訊正式開源基于專家混合(MoE)架構的大語言模型-A13B。同日,摩爾線程團隊憑借技術前瞻性,
    的頭像 發表于 07-04 14:10 ?884次閱讀

    壁仞科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型的訓練適配和優化。由此,壁仞科技已實現Qw
    的頭像 發表于 05-16 16:23 ?963次閱讀

    Arm CPU適配通義千問Qwen3系列模型

    近日,阿里巴巴開源了新一代通義千問模型 Qwen3,Arm 率先成為首批成功適配模型的計算平臺廠商。與此同時,
    的頭像 發表于 05-12 16:37 ?1396次閱讀

    愛芯通NPU適配Qwen2.5-VL-3B視覺多模態大模型

    熟悉愛芯通NPU的網友很清楚,從去年開始我們在端側多模態大模型適配上一直處于主動緊跟的節奏。先后適配了國內最早開源的多模態大模MiniCPM V 2.0,上海人工智能實驗室的書生多模
    的頭像 發表于 04-21 10:56 ?2999次閱讀
    愛芯通<b class='flag-5'>元</b>NPU<b class='flag-5'>適配</b>Qwen2.5-VL-3<b class='flag-5'>B</b>視覺多模態大<b class='flag-5'>模型</b>

    銷售易在騰訊云城市峰會上發布中國首款AI CRM

    騰訊模型+DeepSeek開源模型”多模解決方案,通過整合
    的頭像 發表于 03-24 11:16 ?670次閱讀

    騰訊ima和Deepseek建立個人微信知識庫

    ---基于騰訊模型或Deepseek-r推理模型的個人知識庫。大模型是通才,知識庫是專家大
    的頭像 發表于 02-25 17:33 ?2434次閱讀
    用<b class='flag-5'>騰訊</b>ima和Deepseek建立個人微信知識庫