国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MLPerf V2.0推理結果放榜,NVIDIA表現搶眼

荷葉塘 ? 來源:電子發燒友 ? 作者:程文智 ? 2022-04-15 22:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文/程文智)不久前,AI性能基準評測平臺MLPerf公布了2022年首次推理(Inference v2.0)測試成績,NVIDIA的AI平臺表現依然搶眼。

據MLPerf官方介紹,它是由來自學術界、研究實驗室和相關行業的 AI 領導者組成的聯盟,旨在“構建公平和有用的基準測試”,在規定的條件下,針對硬件、軟件和服務的訓練和推理性能提供公平的評估。每年組織AI推理和AI訓練測試各兩次,以對迅速增長的AI計算需求與性能進行及時的跟蹤測評。MLPerf比賽通常分為固定任務(Closed)和開放優化(Open)兩類任務,開放優化能力著重考察參測廠商的AI技術創新力,固定任務則因更公平地考察參測廠商的硬件系統和軟件優化的能力,成為更具參考價值的AI性能基準測試。因此,目前MLPerf被看作是AI領域的風向標,誰能夠在這個測試中取得更多的領先,誰的AI能力就越突出。


在最新一期的榜單中,浪潮、NVIDIA、英特爾高通、阿里巴巴、戴爾、Deci.ai、Azure、富士通、技嘉、聯想、寧暢、美超微、華碩、浙江實驗室、及新華三等廠商參與了競賽。評測以最新MLPerf Inference V2.0為基準,涵蓋了圖像分類、目標檢測、醫療圖像分割、自然語言處理、語音轉文字和推薦系統6類AI應用場景,分為數據中心和邊緣兩類處理場景,每類場景都包含固定任務(Closed)和開放優化(Open)兩類性能競賽。其中,在最新的V2.0規范中,在邊緣運算環境導入多資料流(Multi Stream)測試項目,測量邊緣運算設備在多攝影機、多傳感器場景的性能表現,以得到更貼近真實使用情況的數據。


據統計,本輪測試一共展示了超過3900 次性能測試和 2200 次功耗測試,分別是上一輪的2倍和6倍。根據公開的數據顯示,本次測試中除了戴爾科技、富士通、技嘉、浪潮、聯想、寧暢和美超微等外,華碩和新華三本次測試中首次使用了NVIDIA AI平臺提交MLPerf結果。

Jetson AGX Orin提升邊緣AI性能,取得不俗成績

值得一提的是基于NVIDIA Ampere架構的低功耗系統級芯片NVIDIA Orin首次參加MLPerf基準測試,就取得了不俗的成績。在邊緣AI領域,NVIDIA Orin預生產版本在六項性能測試中的五項處于領先地位,其運行速度比上一代Jetson AGX Xavier快了5倍,能效平均提高了2倍。


根據NVIDIA官網的介紹,Jetson AGX Orin 系列有32GB和64GB兩個版本,該系列具有高達275TOPS的AI性能,由 Ampere GPU深度學習加速器 (DLA) 提供支持。CPU配備了多達12個Arm Cortex A78AE內核。

Orin配備了其第三代Tensor Cores,可提高性能并支持稀疏矩陣。基于NVIDIA為 Xavier 所做的多處理器構建,它不僅具有 GPU 和CPU,還具有其他處理器,可以幫助從GPU和CPU卸載應用程序的某些部分。它包括一個專用于 AI 應用的深度學習加速器、一個用于計算機視覺應用和ISP的視覺加速器,以及一個視頻解碼和視頻編碼引擎。與 Xavier 相比,NVIDIA還為 Orin 帶來了 LPDDR5 以提高帶寬,傳輸速度可達204.8GB/s。 Orin 還具備豐富的IO連接,比如其具有多達22個PCIe4.0通道、4個千兆以太網、16個MIPI CSI通道,以及各種其他傳感器接口等。


根據測試,Jetson AGX Orin提供了8倍于Jetson AGX Xavier的性能,Jetson AGX Orin是能夠運行所有六項MLPerf基準測試的邊緣加速器。憑借JetPack SDK,Orin可以運行整個NVIDIA AI平臺,這個軟件堆棧已經在數據中心和云端得到了驗證,并且獲得了NVIDIA Jetson平臺100萬名開發者的支持。


在應用方面,目前,Orin主要關注三大領域,分別為:工業、自動駕駛和醫療。Orin現已加入到用于機器人和自動化系統的NVIDIA Jetson AGX Orin開發者套件。包括亞馬遜網絡服務、約翰迪爾、小松、美敦力和微軟Azure在內的6000多家客戶使用NVIDIA Jetson平臺進行AI推理或其他任務。

Orin也是NVIDIA Hyperion自動駕駛汽車平臺的關鍵組成部分。據NVIDIA介紹,Orin可處理在自動駕駛汽車和機器人中同時運行的大量應用和深度神經網絡,并且達到了ISO 26262 ASIL-D 等系統安全標準。而且,比亞迪近期已經宣布,他們將在其新一代自動駕駛電動汽車中使用內置Orin的DRIVE Hyperion架構。

Orin同樣也是NVIDIA Clara Holoscan醫療設備平臺的關鍵組成部分,且該平臺可供系統制造商和研究人員用來開發新一代AI儀器。

NVIDIA其他AI成果

除了Orin之外,本輪MLPerf,驗證了NVIDIA的多項成果,包括多實例GPU(MIG)、TensorRT等。比如MIG可提升每個 NVIDIA A100 Tensor 核心 GPU 的性能和價值。MIG可將 A100 GPU 劃分為多達七個實例,每個實例均與各自的高帶寬顯存、緩存和計算核心完全隔離。管理員可以支持從大到小的各項工作負載,為每項工作提供規模適當的 GPU,而且服務質量 (QoS) 穩定可靠,從而優化利用率,讓每位用戶都能享用加速計算資源。


而根據實際測試結果,在使用7個實例時的性能為僅用一個實例的98%,這也意味著MIG可以充分利用GPU,避免了算力的浪費。


軟件是性能提升的關鍵驅動因素,NVIDIA在AI推理方面的軟件包括了用于優化 AI 模型的 NVIDIA TensorRT 和用于有效部署它們的 NVIDIA Triton開源推理服務軟件。NVIDIA AI 推理和云高級產品經理David Salvator在媒體發布會上介紹了NVIDIA的Triton開源推理服務軟件。


目前TensorRT廣泛的優化GPU內核庫已支持Jetson Orin,MLPerf中使用的插件已全部移植到Orin并添加到 TensorRT 8.4。Triton則Kubernetes緊密集成,可以管理GPU以及x86和Arm CPU上的AI推理工作,NVIDIA宣布,Triton現在可以只在CPU上運行,而無需GPU。

而也正是因為NVIDIA的跨平臺管理能力,使A100在Arm和x86-64平臺上的性能幾乎相同。并且,通過NVIDIA的軟件優化,AI性能在過去一年中就增長了高達50%。

結語

這幾年,NVIDIA在AI領域一路狂奔,不僅僅在數據中心方面優勢明顯,在汽車、邊緣計算方面也正推出優勢產品,另外在他們還在準備推出工業級的AI產品,進入傳統工業領域。AI正在不斷滲透到人們生活的各個方面。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109722
  • AI
    AI
    +關注

    關注

    91

    文章

    39768

    瀏覽量

    301370
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265302
  • 推理
    +關注

    關注

    0

    文章

    9

    瀏覽量

    7421
  • MLPerf
    +關注

    關注

    0

    文章

    37

    瀏覽量

    970
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    智子科技發布數字營銷策略大模型智小虎V2.0

    11月28日,2025(第十三屆)數字營銷峰會暨CAAC數字營銷專業委員會十周年慶典及第17屆虎嘯獎啟動儀式在北京舉行。在本次大會上,由智子科技、南京大學、虎嘯獎三方聯合打造的“智小虎”V2.0正式發布。
    的頭像 發表于 12-05 16:54 ?1271次閱讀

    項目效率翻倍!迅為RK3568?V2.0硬件接口升級,開發流程再提速

    項目效率翻倍!迅為RK3568?V2.0硬件接口升級,開發流程再提速
    的頭像 發表于 10-29 10:53 ?458次閱讀
    項目效率翻倍!迅為RK3568?<b class='flag-5'>V2.0</b>硬件接口升級,開發流程再提速

    嵌入式入門必看!迅為RK3568?V2.0升級,新手也能輕松玩轉

    嵌入式入門必看!迅為RK3568?V2.0升級,新手也能輕松玩轉
    的頭像 發表于 10-28 13:26 ?433次閱讀
    嵌入式入門必看!迅為RK3568?<b class='flag-5'>V2.0</b>升級,新手也能輕松玩轉

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規模 LLM 推理打造的推理框架,核心目標是突破 NVIDIA 平臺上的推理性能瓶頸。為實
    的頭像 發表于 10-21 11:04 ?1166次閱讀

    華為推出人工智能氣象預報模型V2.0版本

    華為全聯接大會2025期間,在氣象海洋論壇上,華為聯合重慶市氣象局、云輯數科發布“天資·12h”人工智能氣象預報模型(V2.0),助力成渝地區氣象災害精準防御、城市安全運行與高質量發展。
    的頭像 發表于 09-20 14:34 ?1918次閱讀

    使用env v2.0執行scons --dist產生缺失依賴報錯怎么解決?

    使用env v2.0版本的工具到rt-thread &gt; v5.1.0版本的bsp中使用scons指令,會出現缺失packages依賴的報錯,并提示更新pkgs,但是更新也會產生
    發表于 09-11 08:28

    NVIDIA Nemotron Nano 2推理模型發布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發表于 08-27 12:45 ?1780次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型發布

    Robrain V2.0正式登場:落地人形機器人,引爆智能進化革命

    當AI機器人能精準捕捉指令意圖,靈活響應多種交互方式,甚至能區分不同音色,一場跨越“工具”與“伙伴”的革命性進化,正由移遠RobrainAI機器人解決方案V2.0版本拉開序幕。目前,該方案已在人形
    的頭像 發表于 08-25 19:03 ?1459次閱讀
    Robrain <b class='flag-5'>V2.0</b>正式登場:落地人形機器人,引爆智能進化革命

    請問是否可以將 Nu-Link2-Me V1.0 的固件升級到 V2.0

    可與 Crossworks for ARM IDE 配合使用。 以下是我在比較兩塊板以找出它不起作用的原因時發現的差異。NuMaker-M433 連接了 Nu-Link2-Me V2.0
    發表于 08-18 08:09

    登頂!華為OceanStor A系列存儲再登MLPerf全球性能之巔

    2025年8月5日,全球權威AI性能評測組織公布最新MLPerf? Storage v2.0基準測試結果,華為OceanStor A系列存儲聯合濟南超級計算技術研究院(簡稱“JNIST”)斬獲佳績
    的頭像 發表于 08-07 14:02 ?827次閱讀

    智嵌云V2.0獲軟件著作權登記,賦能行業數字化升級

    深圳智嵌物聯網電子技術有限公司,自主研發的智嵌云V2.0,成功斬獲國家版權局頒發的軟件著作權登記證書。這一成果不僅是該公司在技術創新與知識產權保護領域的重大突破,更為相關行業的數字化轉型注入了強勁動能,同時也標志著 “智嵌云” 從 V1.0 到
    的頭像 發表于 06-27 15:32 ?608次閱讀
    智嵌云<b class='flag-5'>V2.0</b>獲軟件著作權登記,賦能行業數字化升級

    使用MicroPython部署中的ocrrec_image.py推理得到的輸出結果很差,如何解決呢?

    使用在線平臺訓練OCR識別任務,測試結果表現很好。 期待結果和實際結果 實際的推理結果很差,
    發表于 04-29 06:54

    1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準測試結果,其中,英特爾??至強??6性能核處理器在
    的頭像 發表于 04-07 10:58 ?674次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發表于 03-20 15:35 ?1548次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優化
    的頭像 發表于 03-20 15:03 ?1232次閱讀