国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm Neoverse與AWS Graviton4加速云計算創新

Arm社區 ? 來源:Arm社區 ? 2024-12-17 10:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 基礎設施事業部服務器生態系統開發總監

Bhumik Patel

隨著人工智能 (AI) 技術的迅猛發展,云計算領域正在經歷顯著變革。愈發復雜的 AI 應用對計算解決方案的性能、效率和成本效益提出了更高要求。在云端部署工作負載的客戶正在重新評估其所需的基礎設施,以滿足現代工作負載需求,其中不僅包括提高性能和降低成本,還涵蓋了需符合監管要求或可持續發展目標的新能效基準。

Arm 與亞馬遜云科技 (AWS) 長期合作,為實現性能更強勁、更高效和可持續的云計算提供專用芯片和計算技術。在近期舉行的 AWS re:Invent 2024 大會上,AWS 進一步展示了 AWS Graviton4 所取得的顯著進展,使開發者和企業能夠充分發揮其云工作負載的性能潛力。

卓越的性能表現

相較于上一代 Graviton3 處理器,基于 Arm Neoverse V2 平臺的 AWS Graviton4 處理器在計算性能上提升了 30%,核心數增加了 50%,內存帶寬提高了 75%。憑借這些技術優勢,AWS Graviton 處理器在生態系統和客戶群體中得到了廣泛應用。

Arm Neoverse V2 平臺涵蓋 Armv9 架構的新特性,包括高性能浮點和向量指令支持,以及 SVE/SVE2、Bfloat16 和 INT8 MatMul 等特性。這些特性為 AI/機器學習 (ML) 以及高性能計算 (HPC) 工作負載提供了卓越性能。

AI/ML 工作負載

今年早些時候,Arm 與主流的 AI 框架和軟件生態系統合作,推出了 Arm Kleidi 軟件,以確保 Arm 平臺上開機即用的推理性能優化能惠及整個 ML 棧,開發者無需掌握額外的 Arm 專業知識即可構建其工作負載,從而進一步推動 AI 工作負載的廣泛應用。此前,我們已展示了 PyTorch 中的這些優化如何賦能 AWS Graviton4 上運行大語言模型 (LLM),如 Llama 3 70B 和 Llama 3.1 8B,并顯著改善了每秒生成詞元 (token) 數和詞元首次響應時間的表現指標。

歡迎閱讀《Arm KleidiAI 助力提升 PyTorch 上 LLM 推理性能》一文,詳細了解性能指標的提升細節。

HPC 和 EDA 工作負載

對于 HPC 工作負載,Graviton4 相較于 Graviton3E 在功能上實現了顯著提升。每個核心的主內存帶寬增加了16%,每個 vCPU 的 L2 緩存容量翻倍。這些改進對于 HPC 應用的性能至關重要,因為 HPC 應用通常受限于內存帶寬。AWS 已經在這些領域取得了顯著優勢,如下所示。

根據 Arm 工程團隊實際運行 EDA 工作負載所得出的結果,Graviton4 提供的 RTL 仿真工作負載性能比 Graviton3 高出 37%。

生態系統廣泛采用

近年來,隨著云計算用戶將各種云工作負載部署在 AWS Graviton 處理器上,其軟件生態系統持續擴展。如此一來,客戶不僅節省了費用,收獲了性能的提升,還能優化其碳足跡和可持續發展足跡。以下是部分示例:

著手利用 Graviton 的強大性能

我們堅信 Arm 將在云計算的未來中發揮關鍵作用,同時我們也非常自豪能夠支持 AWS Graviton 立于技術創新的前沿。Arm 將繼續投入,進一步強化我們的軟件生態系統,從而使開發者能夠更加輕松地在 Arm 平臺上構建其應用,并充分利用 Arm 計算平臺所提供的卓越性能和效率優勢。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20255

    瀏覽量

    252273
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9553

    瀏覽量

    391885
  • 云計算
    +關注

    關注

    39

    文章

    8021

    瀏覽量

    144405
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301404

原文標題:Arm Neoverse 賦能 AWS Graviton4 處理器,加速云計算創新

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何在Arm Neoverse N2平臺上提升llama.cpp擴展性能

    跨 NUMA 內存訪問可能會限制 llama.cpp 在 Arm Neoverse 平臺上的擴展能力。本文將為你詳細分析這一問題,并通過引入原型驗證補丁來加以解決。測試結果表明,在基于 Neoverse N2 平臺的系統上運行
    的頭像 發表于 02-11 10:06 ?166次閱讀

    AWS安全入門:數據上前必知的基礎防線

    前言智能廢料分揀系統在工廠邊緣運行,通過AWS服務將分揀準確率從70%提升至97%,背后是一套完整的云安全體系在默默守護。亞馬遜科技作為全球領先的
    的頭像 發表于 01-07 13:43 ?1257次閱讀
    <b class='flag-5'>AWS</b>安全入門:數據上<b class='flag-5'>云</b>前必知的基礎防線

    融合創新計算架構的全面解析與應用

    在當今數字化的時代,計算已經成為推動企業創新和發展的關鍵技術。隨著企業需求的多樣化和技術環境的不斷變化,單一的計算模式已無法滿足企業對靈
    的頭像 發表于 12-23 14:17 ?340次閱讀

    西門子EDA與Arm攜手合作加速系統設計驗證進程與軟件啟動

    對芯片設計而言,加速產品的上市流程至關重要。為此,西門子EDA與Arm攜手合作,為Arm的合作伙伴提供了一系列基于Arm Neoverse
    的頭像 發表于 12-19 09:06 ?674次閱讀
    西門子EDA與<b class='flag-5'>Arm</b>攜手合作<b class='flag-5'>加速</b>系統設計驗證進程與軟件啟動

    NVIDIA和AWS擴展全棧合作伙伴關系

    亞馬遜科技(AWS)將 NVIDIA NVLink Fusion 集成到其定制芯片中,包括新一代 Tranium4 芯片、GravitonA
    的頭像 發表于 12-13 09:20 ?960次閱讀

    Arm Neoverse平臺集成NVIDIA NVLink Fusion

    生態系統,實現全緩存一致性與高帶寬互連。 隨著 AI 數據中心對 Arm Neoverse 的需求持續增長,客戶在將工作負載加速器連接至 Arm 平臺時擁有更多選擇。 人工智能 (A
    的頭像 發表于 11-26 11:08 ?479次閱讀

    如何使用 ARM FPU 加速浮點計算

    文件名): -none-objdump -d build-fpu.elf/usart1-test 同樣,在反匯編文件中即可找到浮點計算代碼: 三、使用 ARM FPU 加速浮點計算
    發表于 11-19 06:51

    亞馬遜科技在中國區域推出Amazon Graviton4實例 以自研芯片驅動企業算力升級

    Graviton4處理器的Amazon Elastic Compute Cloud(Amazon EC2)C8g、M8g和R8g實例,針對客戶不同類型的工作負載進行優化。與Amazon Graviton3處理器
    的頭像 發表于 09-10 20:51 ?787次閱讀

    西門子 Veloce CS 助力 Arm Neoverse 計算子系統驗證與確認

    西門子數字化工業軟件近日宣布,Veloce Strato CS 與Veloce proFPGA CS 已被 Veloce 的長期合作伙伴 Arm 部署應用,作為Arm Neoverse 計算
    的頭像 發表于 08-06 09:26 ?2900次閱讀

    Arm Neoverse N2平臺實現DeepSeek-R1滿血版部署

    頗具優勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現 DeepSeek-R1 滿血版的部署,目前已可提供線上服務。
    的頭像 發表于 07-03 14:37 ?1240次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> N2平臺實現DeepSeek-R1滿血版部署

    Arm攜手微軟共筑計算和PC未來

    計算平臺并從中受益。無論是在 Microsoft Azure 的云端還是在 Windows on Arm PC 的邊緣側,開發者可以在任何地方加速其應用和工作負載。
    的頭像 發表于 05-28 14:08 ?943次閱讀

    解讀基于Arm Neoverse V2平臺的Google Axion處理器

    計算需求在人工智能 (AI) 時代的爆發式增長,推動了開發者尋求性能優化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm
    的頭像 發表于 04-21 13:47 ?1072次閱讀

    Arm助力開發者加速遷移至Arm架構平臺 Arm遷移資源分享

    隨著基于 Arm 架構的實例日益擴展,越來越多的用戶正從傳統平臺遷移至 Arm 平臺上。
    的頭像 發表于 04-09 18:23 ?1231次閱讀

    Arm Neoverse CMN S3 推動Compute Express Link (CXL) 存儲創新

    作者:Arm 物聯網事業部產品經理?John Xavier Lionel 一致性網狀網絡 (Coherent Mesh Network, CMN) 互連是一種前沿技術,旨在為現代計算和存儲架構提供
    發表于 04-09 18:19 ?1278次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CMN S3 推動Compute Express Link (CXL) 存儲<b class='flag-5'>創新</b>

    如何在基于Arm Neoverse平臺的CPU上構建分布式Kubernetes集群

    在本文中,我們將以 X(原 Twitter)為例,演示如何在基于 Arm Neoverse 平臺的 CPU 上構建分布式 Kubernetes 集群,以根據推文實時監控情緒變化。如此一來,你可以充分利用 Arm
    的頭像 發表于 03-25 15:58 ?836次閱讀
    如何在基于<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>平臺的CPU上構建分布式Kubernetes集群