国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm Kleidi助力輕松加速AI工作負載

Arm社區 ? 來源:Arm社區 ? 2025-06-19 10:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

正如 Arm 工程部軟件高級副總裁 Mark Hambleton 在《2025 年芯片新思維》報告中所說:人工智能 (AI) 的未來發展離不開軟硬件的協同。

然而,在由 Arm 贊助的新 CIO 報告中所述,開發者工作流程的碎片化限制了開發者創建和擴展新 AI 應用的速度,而這也是目前其所面臨的最大挑戰之一。

Arm 深知軟件對于釋放 AI 的真正潛力至關重要,因而從基礎架構和整個技術棧入手,致力于簡化 AI 開發流程,并支持新 AI 應用和工作負載實現無縫性能加速。

基礎架構

Arm 持續發展自身架構,作為軟硬件之間的重要接口。如今,從云端到邊緣側的廣泛市場中,Armv9 架構已成為智能手機、數據中心、高性能計算和汽車應用等領域的現代技術基礎。

Arm 不斷為最新的架構引入新的功能,例如此前推出的可伸縮矩陣擴展 (SME) 和可伸縮向量擴展 (SVE2),有助于在各類應用中加速生成式 AI 和常見機器學習 (ML) 工作負載。SME 借由在通用指令集中引入復雜矩陣處理能力,使開發者能夠在其 AI 應用中實現出眾性能,并無縫遷移到不同的生態系統。由此不僅擴大了運行 AI 工作負載的硬件范圍,還顯著提升了用戶體驗。

CPU 對開發者的價值

上述架構特性都集成到了 Arm 的 CPU 中,使之成為軟件開發者首選的目標平臺。因為 Arm CPU 廣泛應用于從云端到邊緣側的各種應用,適合作為大多數 AI 推理工作負載的直接目標平臺,被廣泛應用于數十億臺設備中,例如當今的智能手機,以及全球的云端和數據中心。通過選擇 Arm CPU 作為目標平臺,開發者能夠以更多類型的數據格式運行更廣泛的軟件,而無需為專用 NPU 開發多個版本的代碼。

CPU 為開發者提供了所需的一致性,避免了定制硬件解決方案所帶來的碎片化和效率低下。

正如 Hambleton 在《2025 年芯片新思維》報告中指出:AI 框架的互操作性是開發者的核心訴求。因此開發者通常默認選擇 CPU 后端,因為 CPU 的普遍性確保了更廣泛的兼容性。

此外,推動 AI 工作負載擴展的因素不僅限于架構的進步。

在 CIO 報告中,Arm 工程部機器學習工程副總裁 Nick Horne 表示,AI 已經從依賴云端的龐大模型演變為可在邊緣側或端側運行的更小、更高效的模型。他指出:如今,有些出色的模型可在你隨身攜帶的設備上運行并提供高質量的結果,某些情況下甚至能夠完全在 CPU 上運行。

對開源不變的承諾

Arm 與開源社區廣泛合作,致力于推動 AI 的普及,為開發者提供便捷途徑,使開發者能夠輕松獲取來自廣泛 Arm 生態系統合作伙伴的硬件,及時利用其中的最新架構特性和性能。

Horne 在 CIO 報告中強調了這一方法為開發者帶來的優勢。他指出:采用具有良好硬件抽象的開源 AI 框架,能夠顯著避免對靈活性的影響。

如此一來,開發者無需受限于特定硬件、云服務提供商或軟件平臺。

Kleidi 助力輕松加速 AI

Arm Kleidi 很好地體現了上述優勢的實際應用效果。Kleidi 提供開發者支持技術、資源和微內核庫,能夠為在 Arm CPU 上運行的模型輕松實現 AI 工作負載加速。由于 Kleidi 庫已集成到主流的開源 AI 框架和運行時中,包括 Google 的 MediaPipe、Meta 的 ExecuTorch 和 PyTorch、llama.cpp,騰訊的 Angel,以及阿里巴巴的 MNN。開發者無需額外工作即可獲得性能優化,從而節省時間、精力和成本。Kleidi 現已集成至 Arm 技術覆蓋的所有市場,包括移動端、云、數據中心、汽車和物聯網領域。

與行業領先的生態系統合作

從更廣泛的層面來看,Arm 通過行業領先的軟件生態系統,與眾多合作伙伴開展協作,致力于安全、大規模地部署 AI。例如,Arm 與 GitHub 就 GitHub Runners 項目開展合作,使開發者能夠更高效地在云端測試和部署訓練好的模型。近期,面向 GitHub CoPilot 的 Arm 擴展程序為開發者提供了完全集成的原生 Arm 工作流,包括準確的代碼生成、測試用例創建和錯誤修復功能。

此外,Arm 還通過各種舉措推動底層軟件和固件部署的簡化和加速,實現順暢的軟件開發。Linaro OneLab、Trusted Firmware 和 PSA Certified 等項目促進了各方協作,并為快速發展的邊緣側 AI 和高性能物聯網領域的安全軟件部署和支持提供了藍圖。在汽車行業,Arm 發起的面向嵌入式邊緣的可擴展開放架構 (SOAFEE) 致力于提供基于標準的框架,以實現軟件的規模化復用,從而縮短開發周期,滿足了軟件定義汽車 (SDV) 應用中對更多 AI 的空前需求,同時提升了駕駛體驗。

開放標準推動創新

最后,缺乏標準化實踐可能會阻礙創新,并可能在未來給開發者制造復雜難題。開放標準使開發者和研究人員可以在不同平臺之間無縫切換,同時專注于訓練、量化和部署,通過模型的持續創新創造價值。

借助軟件加速 AI 創新

為了讓 AI 技術充分發揮潛力,軟件開發流程需要簡化、加速并開放。Arm 技術及其生態系統通過專注于開放標準、硬件抽象并與不斷演變的框架保持兼容,助力實現面向未來的 AI 開發。開發者因而能夠在不同硬件上無縫創建和部署 AI 應用、模型和工作負載并提升性能,從而基于 Arm 平臺為 AI 時代打造更優質的軟件。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9552

    瀏覽量

    391838
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11277

    瀏覽量

    224946
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301358

原文標題:選對運用軟件的方法,使 AI 創新如虎添翼

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用NORDIC AI的好處

    ,時延更低,系統在網絡不穩定甚至離線時也能繼續工作。[Edge AI 概述] 提升隱私與可靠性 原始傳感器數據(如運動、生理信號等)可以留在本地,只上傳推理結果,有利于隱私與數據安全。 本地決策
    發表于 01-31 23:16

    Arm架構助力Azure Cobalt 100虛擬機工作負載性能提升

    的 32 個地區上線,并且持續快速擴展,為新一代數據中心工作負載帶來了性能、能效和可擴展性的大幅提升。這些提升源于專為賦能現代云原生應用設計的創新 Arm Neoverse 計算子系統 (Compute Subsystems,
    的頭像 發表于 12-15 14:42 ?653次閱讀
    <b class='flag-5'>Arm</b>架構<b class='flag-5'>助力</b>Azure Cobalt 100虛擬機<b class='flag-5'>工作</b><b class='flag-5'>負載</b>性能提升

    Arm Neoverse平臺集成NVIDIA NVLink Fusion

    生態系統,實現全緩存一致性與高帶寬互連。 隨著 AI 數據中心對 Arm Neoverse 的需求持續增長,客戶在將工作負載加速器連接至
    的頭像 發表于 11-26 11:08 ?476次閱讀

    Arm Flexible Access方案引入Armv9邊緣AI計算平臺

    全球首個 Armv9 邊緣 AI 計算平臺(專為物聯網及邊緣 AI 工作負載優化)將納入 Arm Flexible Access 方案,
    的頭像 發表于 10-29 15:27 ?1044次閱讀

    如何加速實時工作負載

    對于需要實時響應的數據中心工作負載,性能不僅是指原始吞吐量或處理能力。挑戰在于:在保持吞吐量和能效的同時,實現確定性時延。
    的頭像 發表于 09-10 15:36 ?703次閱讀

    負載減少50%!ArmAI重新定義移動端圖形渲染

    是一項非常艱巨的任務。 ? Arm 終端事業部產品管理總監 Steve Steele 表示,Arm 始終專注于為市場提供高能效的計算能力,特別是針對當下 AAA 手游中常見的高分辨率圖形工作
    發表于 08-20 08:00 ?4009次閱讀
    <b class='flag-5'>負載</b>減少50%!<b class='flag-5'>Arm</b>用<b class='flag-5'>AI</b>重新定義移動端圖形渲染

    Arm神經技術是業界首創在 Arm GPU 上增添專用神經加速器的技術,移動設備上實現PC級別的AI圖形性能

    Arm 神經技術是業界首創在 Arm GPU 上增添專用神經加速器的技術,首次在移動設備上實現 PC 級別的 AI 圖形性能,為未來的端側 AI
    的頭像 發表于 08-14 17:59 ?2759次閱讀

    新思科技攜手微軟借助AI技術加速芯片設計

    近日,微軟Build大會在西雅圖盛大開幕,聚焦AI加速各行業(包括芯片設計行業)科學突破方面的變革潛力。作為Microsoft Discovery平臺發布的啟動合作伙伴,新思科技亮相本次大會,并攜手微軟將AI融入芯片設計,開發
    的頭像 發表于 06-27 10:23 ?1081次閱讀

    通過NVIDIA RTX PRO服務器加速企業工作負載

    從大語言模型(LLM)到代理式 AI 推理和物理 AI ,隨著 AI 工作負載的復雜性和規模不斷增加,人們對更快、擴展性更高的計算基礎設施的
    的頭像 發表于 06-12 15:31 ?928次閱讀
    通過NVIDIA RTX PRO服務器<b class='flag-5'>加速</b>企業<b class='flag-5'>工作</b><b class='flag-5'>負載</b>

    Arm與微軟合作加速邊緣設備上的AI體驗

    隨著人工智能 (AI) 成為當今個人電腦 (PC) 和移動設備使用體驗(從聊天機器人到生產力提升)中不可或缺的一部分,這些設備對 CPU 高效、可擴展的推理需求也在持續增長。Arm 與微軟正攜手合作
    的頭像 發表于 05-28 13:54 ?824次閱讀

    全新STM32MP257開發板震撼發布!異核架構x接口豐富x邊緣AI助力ARM嵌入式工業4.0應用!

    全新STM32MP257開發板震撼發布!異核架構x接口豐富x邊緣AI助力ARM嵌入式工業4.0應用! ATK-DLMP257B開發板是正點原子基于STM32MP257DAK3處理器研發的一款
    發表于 04-12 12:04

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業加速代理式AI推理

    Oracle 數據庫與 NVIDIA AI 相集成,使企業能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA 加速計算和推理軟件與 Oracle 的
    的頭像 發表于 03-21 12:01 ?1425次閱讀
    英偉達GTC2025亮點:Oracle與NVIDIA合作<b class='flag-5'>助力</b>企業<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b>推理

    Banana Pi 發布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    架構,賦能多場景應用 BPI-AI2N 采用 RZ/V2N 處理器,集成 4 核 Arm? Cortex?-A55(1.8GHz)與 Cortex?-M33(200MHz),提供強勁的計算能力,同時兼顧
    發表于 03-19 17:54

    Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

    Oracle 數據庫與 NVIDIA AI 相集成,使企業能夠更輕松、快捷地采用代理式 AI ? ? ? 美國加利福尼亞州圣何塞 —— GTC? —— 2025 年 3 月 18 日
    發表于 03-19 15:24 ?577次閱讀
    Oracle 與 NVIDIA 合作<b class='flag-5'>助力</b>企業<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理

    Arm Kleidi擴展到汽車市場 Arm Kleidi實現性能自動優化

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)近日宣布將 Arm Kleidi 技術擴展到汽車市場。
    的頭像 發表于 03-14 15:36 ?1596次閱讀