国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用MLPerf 推理 1.1提升NVIDIA績效領導力

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-08 16:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能繼續推動跨行業的突破性創新,包括消費互聯網、醫療保健和生命科學、金融服務、零售、制造和超級計算。研究人員繼續推動快速發展的模型在規模、復雜度和多樣性方面的發展。此外,其中許多復雜的大規模模型需要為聊天機器人、數字助理和欺詐檢測等人工智能支持的服務提供實時結果。

考慮到人工智能推理的廣泛用途,評估性能對開發人員和基礎設施管理人員提出了許多挑戰。對于數據中心、 edge 和移動平臺上的 AI 推理, MLPerf 推理 1.1 是一個行業標準基準,用于衡量計算機視覺醫學成像、自然語言和推薦系統的性能。這些基準由人工智能行業領導者組成的聯盟制定,為人工智能培訓和推理提供了當今最全面的同行評審績效數據集。

要在這一基準測試中完成大量測試,需要一個具有強大生態系統支持的全堆棧平臺,無論是框架還是網絡。 NVIDIA 是唯一一家提交所有數據中心和邊緣測試并提供全面領先性能的公司。

這項工作的一個重要副產品是,這些優化中的許多已經進入了推理開發工具,如TensorRT和 NVIDIA Triton 。用于高性能深度學習推理的 TensorRT SDK 包括一個深度學習推理優化器和運行時,為深度學習推理應用程序提供低延遲和高吞吐量。

Triton 推理服務器軟件簡化了人工智能模型在大規模生產中的部署。這種開源推理服務軟件使團隊能夠在任何基于 GPUCPU 的基礎設施上從本地存儲或云平臺的任何框架部署經過培訓的人工智能模型。

按數字

在數據中心和邊緣兩大類中, NVIDIA 憑借 NVIDIA A100 張量核 GPU 和 NVIDIA A30 張量核 GPU 在性能測試中名列榜首。自從 MLPerf 推斷 0.7 的結果發布以來,在過去一年中, NVIDIA 僅通過軟件改進就提高了 50% 的性能。

在另一個行業中, NVIDIA 首次使用基于 GPU – 加速 ARM 的服務器提交數據中心類別,該服務器支持所有工作負載,并提供與類似配置的基于 x86 的服務器相同的結果。這些基于 ARM 的新提交為 GPU 加速 ARM 服務器創造了新的性能世界記錄。這標志著這些平臺的一個重要里程碑,因為它們現在已經在同行評審的行業標準基準中證明了自己,以提供市場領先的性能。它還展示了 NVIDIA ARM 軟件生態系統的性能、多功能性和就緒性,以應對數據中心的計算挑戰。

pYYBAGJP7FSAb4UmAABG9iwx2cg552.png

圖 1 。使用 Ampere Altra CPU s 的基于 ARM 的服務器提供的性能與類似配置的基于 x86 的服務器相當

MLPerf v1.1 推理關閉;每個加速器的性能源自使用數據中心脫機中報告的加速器計數的各個提交的最佳 MLPerf 結果。 x86 服務器: 1.1-034 、 ARM 服務器: 1.1-033 MLPerf 名稱和徽標是商標。

綜觀整體表現, NVIDIA 全面領先。圖 2 顯示了服務器場景的結果,其中使用泊松分布為測試中的系統生成推理工作,以更緊密地模擬真實世界的工作負載模式。

pYYBAGJP7FuAQr9CAACxiiMT8EI989.png

圖 2 。 NVIDIA 與 CPU 純服務器的性能比較

MLPerf v1.1 推理關閉;使用數據中心脫機和服務器中報告的加速器計數,從各個提交的最佳 MLPerf 結果中得出每個加速器的性能。高通 AI 100 : 1.1-057 和 1.1-058 ,英特爾至強 8380 : 1.1-023 和 1.1-024 , NVIDIA A30 : 1.1-43 , NVIDIA A100 ( ARM ): 1.1-033 , NVIDIA A100 ( x86 ): 1.1-047 。 MLPerf 名稱和徽標是商標。

NVIDIA 比 CPU 純服務器的性能全面提高了 104 倍。這種性能優勢轉化為對更大、更復雜的模型以及在對話 AI 、推薦系統和數字助理中實時作業中運行的多個模型進行推理的能力。

結果背后的優化

我們的工程團隊實施了一些優化,使這些偉大的結果成為可能。首先,基于 ARM 的服務器和基于 x86 的服務器的所有這些結果都是使用 TensorRT 8 生成的,現在普遍可用。特別令人感興趣的是雙內核的非冪函數的使用,這是為了加速工作負載而實現的,比如 BERT – 大型單流場景測試。

NVIDIA 提交利用添加到 NVIDIA Triton 推理服務器的新主機策略功能。您可以在配置 NVIDIA Triton 服務器時指定主機策略,以在服務器應用程序中啟用線程和內存固定。利用此功能, NVIDIA Triton 可以為系統中的每個 GPU 指定輸入的最佳位置。最佳位置可以基于系統的非統一內存體系結構( NUMA )配置,在這種情況下,每個 NUMA 節點上都有一個查詢樣本庫。

您還可以使用主機策略啟用“從設備啟動”配置設置,服務器將在選擇執行的 GPU 上拾取輸入。此設置還可以將網絡輸入直接輸入 GPU 內存,完全繞過 CPU 和系統內存副本。

推理能力三人組: TensorRT , NVIDIA Triton 和 NGC

NVIDIA 推理領導力來自于構建最優秀的人工智能加速器,用于培訓和推理。但同樣重要的是支持所有 AI 框架和 800 多個 HPC 應用程序的 NVIDIA 端到端、全棧軟件生態系統。

所有這些軟件都可以在NGC、 NVIDIA 集線器上獲得,該集線器帶有 GPU ——用于深度學習、機器學習和 HPC 的優化軟件。 NGC 負責所有管道,因此數據科學家、開發人員和研究人員可以專注于構建解決方案、收集 i NSight 并提供業務價值。

NGC 可通過您首選的云提供商的市場免費獲得。在那里,您可以找到 TensorRT 和 NVIDIA Triton 的最新版本,這兩個版本都有助于生成最新的 MLPerf 推斷 1.1 結果。

關于作者

Dave Salvator 是 NVIDIA 旗下 Tesla 集團的高級產品營銷經理,專注于超規模、深度學習和推理。

Jesus Corbal San Adrian 是 NVIDIA 計算架構組的杰出工程師,專注于深度學習推理 GPU 分析和優化。

Madhumitha Sridhara 是 TensorRT 團隊的高級軟件工程師,專注于使用 Triton 推理服務器的 NVIDIA MLPerf推理提交。她擁有卡內基梅隆大學計算機工程碩士學位和印度卡納塔克邦蘇拉特卡爾國家理工學院電子和通信工程學士學位。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265302
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136932
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124396
  • MLPerf
    +關注

    關注

    0

    文章

    37

    瀏覽量

    970
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DEKRA德凱榮獲2025社會責任與可持續增長領導力

    2025年11月19日,中國歐盟商會第12屆企業社會責任獎頒獎典禮在南京舉行,DEKRA德凱在本屆評選中榮獲“社會責任與可持續增長領導力獎”。受主辦方邀請,DEKRA德凱中國規劃發展副總裁周旋發表了主題演講,分享了公司在企業社會責任方面的長期實踐與階段性成果。
    的頭像 發表于 11-26 10:33 ?593次閱讀

    安波福榮獲2025年度最佳實踐獎之產品領導力大獎

    近日,全球領先的增長咨詢公司Frost & Sullivan在美國亞利桑那州舉辦2025年度最佳實踐獎頒獎典禮。安波福PULSE雷達視覺一體感知系統憑借在全球汽車輔助泊車領域的卓越表現,榮獲2025年度最佳實踐獎之產品領導力大獎。
    的頭像 發表于 10-30 15:02 ?1711次閱讀

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規模 LLM 推理打造的推理框架,核心目標是突破 NVIDIA 平臺上的推理性能瓶頸。為實
    的頭像 發表于 10-21 11:04 ?1166次閱讀

    利用NVIDIA DOCA GPUNetIO技術提升MoE模型推理性能

    在第三屆 NVIDIA DPU 中國黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
    的頭像 發表于 09-23 15:25 ?1024次閱讀

    使用NVIDIA NVLink Fusion技術提升AI推理性能

    本文詳細闡述了 NVIDIA NVLink Fusion 如何借助高效可擴展的 NVIDIA NVLink scale-up 架構技術,滿足日益復雜的 AI 模型不斷增長的需求。
    的頭像 發表于 09-23 14:45 ?919次閱讀
    使用<b class='flag-5'>NVIDIA</b> NVLink Fusion技術<b class='flag-5'>提升</b>AI<b class='flag-5'>推理</b>性能

    NVIDIA Nemotron Nano 2推理模型發布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發表于 08-27 12:45 ?1780次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型發布

    偉創榮獲制造業“奧斯卡”大獎 美國制造商協會頒發的“制造業領導力獎”

    數字供應鏈閃耀全球 ?制造業“奧斯卡”收入囊中 在制造業界, 有一項大獎被譽為“行業奧斯卡”, ?那就是由美國制造商協會頒發的 “制造業領導力獎” 。 而就在最近, 偉創憑借在 數字供應鏈領域
    的頭像 發表于 06-26 09:27 ?1096次閱讀
    偉創<b class='flag-5'>力</b>榮獲制造業“奧斯卡”大獎  美國制造商協會頒發的“制造業<b class='flag-5'>領導力</b>獎”

    偉創憑借在數字供應鏈領域的卓越成就,榮膺&quot;2025年制造業領導力獎&quot;

    上海?2025年6月25日?/美通社/ --?近日,偉創(納斯達克股票代碼:FLEX)宣布,公司憑借在數字供應鏈領域的杰出成就,榮獲"2025年制造業領導力獎"。該獎項由美國制造商協會主辦,旨在
    的頭像 發表于 06-25 15:59 ?503次閱讀
    偉創<b class='flag-5'>力</b>憑借在數字供應鏈領域的卓越成就,榮膺&quot;2025年制造業<b class='flag-5'>領導力</b>獎&quot;

    全球各大品牌利用NVIDIA AI技術提升運營效率

    歐萊雅、LVMH 集團和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產品設計、營銷及物流等方面的運營效率。
    的頭像 發表于 06-19 14:36 ?1201次閱讀

    中興通訊應邀出席2025年金磚國家女性領導力論壇

    近日,以“金磚織錦、巾幗添彩”為主題的2025年金磚國家女性領導力論壇在北京啟幕,來自金磚國家的數百名代表匯聚一堂,圍繞科技創新、人文交流等多個議題進行深入研討,共話女性領導力成長的成功經驗及最佳實踐。中興通訊董事長方榕應邀出席,并就“科技向善,共創綠色金磚可持續未來”這
    的頭像 發表于 05-09 09:38 ?1106次閱讀

    Cadence 利用 NVIDIA Grace Blackwell 加速AI驅動的工程設計和科學應用

    提升高達 80 倍 ●?基于全新 NVIDIA Llama Nemotron 推理模型,攜手開發面向工程設計和科學應用的全棧代理式 AI 解決方案 ●?率先采用面向 AI 工廠數字孿生的 NV
    的頭像 發表于 03-24 10:14 ?1415次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發表于 03-20 15:35 ?1548次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優化
    的頭像 發表于 03-20 15:03 ?1232次閱讀

    Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務首次實現集成,以幫助全球企業組織加速創建代理式 AI 應用。 ? 此次
    發表于 03-19 15:24 ?577次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業加速代理式 AI <b class='flag-5'>推理</b>

    吉方工控出席新領導力賦能大講堂暨網絡邊緣計算培訓會

    在全球經濟低速增長大環境下,人工智能引領新一輪科技革命和產業變革。在此背景下,由深圳市吉方工控有限公司、英特爾(中國)有限公司聯合主辦,深圳市零售智能信息化行業協會承辦的——“智馭邊緣,領袖未來” 新領導力賦能大講堂暨網絡邊緣計算培訓會,在深圳機場希爾頓逸林酒店隆重舉辦。
    的頭像 發表于 03-07 15:29 ?992次閱讀