国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm與ExecuTorch合作加速端側生成式AI實現

Arm社區 ? 來源:Arm社區 ? 2024-11-15 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 戰略與生態部人工智能開發者平臺與服務高級副總裁 Alex Spinelli

通過 Arm 計算平臺與 ExecuTorch 框架的結合,使得更小、更優化的模型能夠在邊緣側運行,加速邊緣側生成式 AI 的實現。

新的 Llama 量化模型適用于基于 Arm 平臺的端側和邊緣側 AI 應用,可減少內存占用,提高精度、性能和可移植性。

全球 2,000 萬名 Arm 開發者能夠更迅速地在數十億臺邊緣側設備上大規模開發和部署更多的智能 AI 應用。

Arm 正在與 Meta 公司的 PyTorch 團隊攜手合作,共同推進新的 ExecuTorch 測試版 (Beta) 上線,旨在為全球數十億邊緣側設備和數百萬開發者提供人工智能 (AI) 和機器學習 (ML) 功能,進而確保 AI 真正的潛力能被最廣泛的設備和開發者所使用。

借助 ExecuTorch 和新的 Llama 量化模型,Arm 計算平臺優化生成式 AI 性能

Arm 計算平臺無處不在,為全球眾多邊緣側設備提供支持,而 ExecuTorch 則是專為移動和邊緣側設備部署 AI 模型而設計的 PyTorch 原生部署框架。兩者的緊密合作,使開發者能夠賦能更小、更優化的模型,包括新的 Llama 3.2 1B 和 3B 量化模型。這些新模型可以減少內存占用、提高準確性、增強性能和提供可移植性,成為小型設備上的生成式 AI 應用的理想選擇,如虛擬聊天機器人、文本摘要和 AI 助手。

開發者無需額外的修改或優化,便可將新的量化模型無縫集成到應用中,從而節省時間和資源。如此一來,他們能夠迅速在廣泛的 Arm 設備上大規模開發和部署更多的智能 AI 應用。

隨著 Llama 3.2 大語言模型 (LLM) 新版本的發布,Arm 正在通過 ExecuTorch 框架優化 AI 性能,使得在 Arm 計算平臺邊緣設備運行的真實生成式 AI 工作負載能更為快速。在 ExecuTorch 測試版發布的首日起,開發者便能享有這些性能的提升。

集成 KleidiAI,加速端側生成式 AI 的實現

在移動領域,Arm 與 ExecuTorch 的合作意味著眾多生成式 AI 應用,如虛擬聊天機器人、文本生成和摘要、實時語音和虛擬助手等,完全能夠在搭載 Arm CPU 的設備上以更高的性能運行。這一成果得益于 KleidiAI,它引入了針對 4 位量化優化的微內核,并通過 XNNPACK 集成到了 ExecuTorch 中,因此,在 Arm 計算平臺上運行 4 位量化的 LLM 時,無縫加速 AI 工作負載的執行。例如,通過 KleidiAI 的集成,Llama 3.2 1B 量化模型預填充階段的執行速度可以提高 20%,使得一些基于 Arm 架構的移動設備上的文本生成速度超過了每秒 400 個詞元 (token)。這意味著,終端用戶將從他們移動設備上獲得更快速、響應更靈敏的 AI 體驗。

物聯網的邊緣側 AI 應用加速實時處理能力

在物聯網領域,ExecuTorch 將提高邊緣側 AI 應用的實時處理能力,包括智能家電、可穿戴設備以及自動零售系統等。這意味著物聯網設備和應用能夠以毫秒級的速度響應環境變化,這對保障安全性和功能可用性至關重要。

ExecuTorch 可在 Arm Cortex-A CPU 和 Ethos-U NPU 上運行,以加速邊緣側 AI 應用的開發和部署。事實上,通過將 ExecuTorch 與 Arm Corstone-320 參考平臺(也可作為仿真固定虛擬平臺 (FVP) 使用)、Arm Ethos-U85 NPU 驅動程序和編譯器支持集成到一個軟件包中,開發者可在平臺上市前幾個月就著手開發邊緣側 AI 應用。

更易獲取、更快捷的邊緣側 AI 開發體驗

ExecuTorch 有潛力成為全球最受歡迎的高效 AI 和 ML 開發框架之一。通過將應用最廣泛的 Arm 計算平臺與 ExecuTorch 相結合,Arm 正在通過新的量化模型加速 AI 的普及,讓開發者能夠更快地在更多設備上部署應用,并將更多生成式 AI 體驗引入邊緣側。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9553

    瀏覽量

    391869
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301383
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265326

原文標題:ExecuTorch 測試版上線,加速 Arm 平臺邊緣側生成式 AI 發展

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    利用ExecuTorchArm SME2加速機器學習推理

    貼紙、分離主體以替換背景,或是對圖像局部進行選擇性增強。這些效果背后,是輕量級分割模型在運行,這些模型通過 ExecuTorch(PyTorch 的開源推理運行時)以及第二代 Arm
    的頭像 發表于 03-03 10:27 ?324次閱讀
    利用<b class='flag-5'>ExecuTorch</b>和<b class='flag-5'>Arm</b> SME2<b class='flag-5'>加速</b><b class='flag-5'>端</b><b class='flag-5'>側</b>機器學習推理

    應對AI算力、內存、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術錦囊

    AI大模型正加速從云端向邊緣與滲透,然而,算力、內存、功耗等卻成了制約其規模化落地的“高墻”。專為AI計算而生的神經網絡處理器(NPU)
    的頭像 發表于 12-18 13:45 ?403次閱讀
    應對<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>算力、內存、功耗“三堵墻”困境,安謀科技<b class='flag-5'>Arm</b> China “周易”X3給出技術錦囊

    重磅合作!Quintauris 聯手 SiFive,加速 RISC-V 在嵌入AI 領域落地

    據科技區角報道半導體解決方案提供商 Quintauris 最近宣布和 RISC-V 處理器 IP 領域的頭部廠商 SiFive 達成戰略合作,目標直接瞄準加速 RISC-V 在嵌入AI
    發表于 12-18 12:01

    Alif Semiconductor的Ensemble MCU新增對ExecuTorch Runtime的支持,助力其推動邊緣生成AI發展

    ·?Ensemble E4/E6/E8是業界首個為Transformer網絡提供硬件加速的MCU系列,可在邊緣設備及終端設備上實現本地生成AI
    的頭像 發表于 11-04 11:44 ?1494次閱讀
    Alif Semiconductor的Ensemble MCU新增對<b class='flag-5'>ExecuTorch</b> Runtime的支持,助力其推動邊緣<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>發展

    AI體驗躍遷,天璣9500用雙NPU開創AI新時代

    架構,從底層解決性能與功耗的矛盾:超性能 NPU 990 性能大幅提升,生成 AI 引擎 2.0 深度加速 Transformer 與大模型;行業首個超能效 NPU以存算一體
    的頭像 發表于 09-24 14:47 ?752次閱讀
    <b class='flag-5'>AI</b>體驗躍遷,天璣9500用雙NPU開創<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>新時代

    此芯科技發布“合一”AI加速計劃,賦能邊緣與AI創新

    此芯科技正式發布“合一”AI加速計劃,旨在為邊緣計算和AI場景提供高能效的全棧算力解決方案。該計劃由此芯科技聯合多家行業
    的頭像 發表于 09-15 11:53 ?2011次閱讀
    此芯科技發布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>計劃,賦能邊緣與<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>創新

    Arm神經技術是業界首創在 Arm GPU 上增添專用神經加速器的技術,移動設備上實現PC級別的AI圖形性能

    Arm 神經技術是業界首創在 Arm GPU 上增添專用神經加速器的技術,首次在移動設備上實現 PC 級別的 AI 圖形性能,為未來的
    的頭像 發表于 08-14 17:59 ?2760次閱讀

    Arm率先適配騰訊混元開源模型,助力AI創新開發

    伙伴共同賦能人工智能 (AI) 部署,助力本土開發者實現 AI 應用創新! 這次的首日開源適配是雙方再次攜手提升
    的頭像 發表于 08-08 09:16 ?1390次閱讀
    <b class='flag-5'>Arm</b>率先適配騰訊混元開源模型,助力<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>創新開發

    誠邁科技、智達誠遠隆重推出ArraymoAIOS 2.0 AI操作系統,開啟智能體協作新時代

    隨著生成AI技術的日益成熟,目前大模型正在從云側向云協同遷移。2025年,AI進一步加速向終
    的頭像 發表于 04-22 17:31 ?1318次閱讀
    誠邁科技、智達誠遠隆重推出ArraymoAIOS 2.0 <b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>操作系統,開啟智能體協作新時代

    首創開源架構,天璣AI開發套件讓AI模型接入得心應手

    的自有模型移植,使首字詞生態速度比云端方案提升70%,賦能絕影多模態智能座艙強大的運行能力,讓汽車擁有“有趣的靈魂”。 不僅如此,天璣AI開發套件已經接入NVIDIA TAO生態圈,實現
    發表于 04-13 19:52

    AI大模型側部署正當時:移遠端AI大模型解決方案,激活場景智能新范式

    AI技術飛速發展的當下,AI大模型的應用正從云端向加速滲透。 作為全球領先的物聯網整體解決方案供應商,移遠通信憑借深厚的技術積累與前瞻
    發表于 03-27 11:26 ?576次閱讀
    <b class='flag-5'>AI</b>大模型<b class='flag-5'>端</b>側部署正當時:移遠端<b class='flag-5'>側</b><b class='flag-5'>AI</b>大模型解決方案,激活場景智能新范式

    AI大模型側部署正當時:移遠端AI大模型解決方案,激活場景智能新范式

    AI技術飛速發展的當下,AI大模型的應用正從云端向加速滲透。作為全球領先的物聯網整體解決方案供應商,移遠通信憑借深厚的技術積累與前瞻性
    的頭像 發表于 03-26 19:05 ?1263次閱讀
    <b class='flag-5'>AI</b>大模型<b class='flag-5'>端</b>側部署正當時:移遠端<b class='flag-5'>側</b><b class='flag-5'>AI</b>大模型解決方案,激活場景智能新范式

    Arm與Stability AI攜手合作加快文本轉音頻的響應速度

    ”,幾秒鐘后,你的設備就會為你生成合適的聲音,甚至無需聯網就可實現。得益于 Arm 和 Stability AI 的新合作,這種完全在
    的頭像 發表于 03-25 15:54 ?794次閱讀

    Arm與阿里巴巴合作加速多模態AI體驗

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)近日發布與阿里巴巴淘天集團輕量級深度學習框架 MNN 的又一新合作
    的頭像 發表于 03-10 09:07 ?1225次閱讀

    芯訊通首次發布全新AI全棧解決方案SIMCom AI Stack

    Stack。攜手全球合作伙伴共同加速智能創新與應用。 構建
    的頭像 發表于 03-08 09:56 ?1269次閱讀