NVIDIA發布重磅最新軟件應用、硬件系統以及與寶馬集團合作
NVIDIA提出了下一代計算的愿景,該愿景將全球信息經濟的重心從服務器轉移到了新型的強大且靈活的數據中心。
NVIDIA創始人兼首席執行官黃仁勛在其加州住宅的廚房中錄制的六集同時發布的主題演講中,介紹了NVIDIA最近對Mellanox的收購,還有重盼所歸的基于NVIDIA Ampere GPU架構的新產品以及重要的最新軟件技術。
這場主題演講原計劃于3月底在圣何塞舉行的NVIDIA GPU技術大會上現場直播,但因冠狀病毒疫情而受到影響。
“我要感謝正前線抗擊COVID-19所有勇敢的戰士們。”黃仁勛在開場時說到,“NVIDIA正在與研究人員和科學家合作,使用GPU和AI計算來治療、緩解、控制和追蹤這種大規模傳染性疾病。”
NVIDIA也宣布了其NVIDIA Clara醫療平臺的更新,旨在對抗COVID-19新型冠狀病毒。
“研究人員和科學家們正在使用NVIDIA加速計算來挽救生命——這完美地詮釋了我們公司的宗旨:通過制造計算機,解決普通計算機不能解決的問題。”黃仁勛說。
演講主要圍繞作為現代全球信息經濟機房的數據中心如何變化,以及在上月完成交易的收購案雙方NVIDIA和Mellanox如何共同推動這些變化的愿景。
“數據中心是新的計算單元,NVIDIA正在加速從芯片到CPU和GPU的連接方式,再到整個軟件堆棧,以及最終跨整個數據中心的性能提升。”
數據中心規模計算的系統優化
首先,NVIDIA為這種新型的數據中心規模計算優化了新的GPU架構,集AI訓練和推理于一身,并實現了靈活且彈性的加速。
NVIDIA A100是第一個基于NVIDIA Ampere架構的GPU,提供了在NVIDIA八代GPU里最大的性能提升,它還可用于數據分析,科學計算和云圖形,并已全面投產并交付給全球客戶。
全球18家領先的服務提供商和系統構建商正在將NVIDIA A100整合到他們的服務和產品中,其中包括阿里云、AWS、百度云、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。
相比上一代,NVIDIA Ampere架構的A100將性能提升了20倍。A100的五大關鍵特性包括:
帶有TF32的第三代Tensor Core核心,這是一種新的數值格式,可加速開箱即用的單精度AI訓練。NVIDIA廣泛使用的Tensor Core現在更加靈活,快速,且更易于使用
結構稀疏性(Structural sparsity)加速,這是一種新的高效技術,可以利用AI數學固有的稀疏性來獲得更高的性能
多實例GPU(Multi-instance GPU或MIG),允許將一個A100分割為多達七個獨立的GPU,每個GPU都有自己的資源
第三代NVLink技術,使GPU之間的高速聯接能力加倍,從而可以使多個A100服務器充當一個巨型GPU
以上這些特性促成了A100性能的提升:與NVIDIA上一代的Volta架構相比,訓練性能提高了6倍,推理性能提高了7倍。
NVIDIA DGX A100具備5 Petaflops的性能
NVIDIA還將發售第三代NVIDIA DGX AI系統—基于NVIDIA A100的NVIDIA DGX A100—世界上第一臺5 petaflops服務器。每臺DGX A100可以分割為多達56個獨立運行的實例。
這使得單個服務器可以“縱向擴展”以完成諸如AI訓練之類的計算密集型任務,或者“橫向擴展”以進行AI部署或推理。
該系統的最初使用者是美國能源部的阿貢國家實驗室,該實驗室將利用該集群的AI和計算能力更好地理解和對抗COVID-19。此外,還有佛羅里達大學和德國人工智能研究中心。
美國能源部阿貢國家實驗室,將使用DGX A100賦能的AI和算力更好地了解并抗擊COVID-19
A100也將作為HGX A100提供給云合作伙伴和服務器制造商。
一套由五臺DGX A100系統提供動力的數據中心,其成本僅為100萬美元,功耗僅為28千瓦,但其性能足以媲美一套典型數據中心(由50臺用于AI訓練的DGX-1系統和600個總功耗高達630千瓦的CPU系統構成,成本超過1100萬美元)。
NVIDIA還宣布了下一代DGX SuperPOD。它由140臺DGX A100系統和Mellanox網絡技術搭建而成,可提供700 petaflops的AI性能,堪比全球20臺最快的計算機中的任何一臺。
新一代DGX SuperPOD實現了強達每秒70 petaflops的AI算力
NVIDIA正在用四個DGX SuperPOD來擴展自己的數據中心,為其內部超級計算機SATURNV,增加了2.8 exaflops的AI計算能力(總計4.6 exaflops),使其成為世界上最快的AI超級計算機。
NVIDIA同時也發布了NVIDIA EGX A100,將強大的實時云計算功能帶到了邊緣。其NVIDIA Ampere架構GPU提供了第三代Tensor Core和新的安全功能。得益于其NVIDIA Mellanox ConnectX-6 SmartNIC,它還具有安全且快速的聯網功能。
當今世界上最重要的應用軟件
NVIDIA GPU將為主要軟件應用程序提供動力,以加速三個關鍵用途:管理大數據,創建推薦系統和構建實時會話式AI。
隨著機器學習的有效性推動公司收集了越來越多的數據,這些新工具應運而生。積極的反饋使我們體驗到的數據收集量呈指數級增長。
為了幫助各類組織順應潮流,NVIDIA宣布在Spark 3.0上支持NVIDIA GPU加速,大數據分析將成為當今世界上最重要的應用程序之一。
基于RAPIDS的Spark 3.0,打破了提取,轉換和加載數據的性能基準。它已經幫助Adobe Intelligent Services將計算成本降低了90%。
關鍵的云分析平臺(包括Amazon SageMaker,Azure Machine Learning,Databricks,Google Cloud AI和Google Cloud Dataproc)都將借助NVIDIA加速。
黃仁勛還宣布推出了NVIDIA Merlin,這是一個用于構建下一代推薦系統的端到端框架,該系統正迅速成為更加個性化互聯網的引擎。Merlin將創建一個100 TB數據集推薦系統所需的時間從四天減少到20分鐘。
他還詳細介紹了NVIDIA Jarvis,這是一個新的端到端平臺,可以充分發揮NVIDIA AI平臺的強大功能,創建實時多模態對話式AI。
他通過一個演示來展示了與名為Misty的AI進行交互的過程,Misty可實時理解并回答一系列有關天氣的復雜問題。
自2018年在SIGGRAPH上發布NVIDIA RTX以來,NVIDIA在實時光線追蹤方面取得了迅猛發展,當時宣布的NVIDIA Omniverse可以讓位于不同地方使用不同工具的設計師,在同個設計的不同部分同時工作。現在已經可供搶先體驗客戶使用。
自動駕駛汽車
自動駕駛汽車是我們這個時代最大的計算挑戰之一,NVIDIA將持續通過NVIDIA DRIVE推動整個行業發展。
NVIDIA DRIVE將使用全新Orin SoC和NVIDIA Ampere GPU,以實現能效和性能,入門級ADAS系統開發所需功率僅需5瓦,并為L5級別robotaxi系統提供2,000 TOPS的性能。
現在,汽車制造商僅需單一計算架構和軟件堆棧,即可將AI集成到每一輛車中。汽車制造商可以利用一種架構來開發整個車隊,并利用整個車隊來進行軟件開發。
NVIDIA DRIVE生態系統現已覆蓋汽車、卡車、一級汽車供應商、下一代出行服務、初創公司、地圖服務和仿真。NVIDIA將在NVIDIA DRIVE技術套件中增加用于管理整個自動駕駛車隊的NVIDIA DRIVE RC。
機器人技術
NVIDIA還將繼續推進其NVIDIA Isaac軟件定義的機器人平臺,宣布寶馬集團已選擇NVIDIA Isaac機器人技術為其下一代工廠提供動力。
每56秒鐘,寶馬集團在全球的30家工廠就會生產一輛汽車:40種不同型號的汽車,每種都有數百種不同的選擇,3000萬個零件來自全球近2,000家供應商。
寶馬集團加入了一個龐大的NVIDIA機器人技術全球生態系統,該生態系統涵蓋配送、零售、自主移動機器人、農業、服務業、物流、制造和醫療保健。
未來,工廠實際上將成為巨大的機器人。“里面的所有運動部件都會由AI驅動。”黃仁勛說。“將來,每個批量生產的產品都將被逐一量身定制。”
-
NVIDIA
+關注
關注
14文章
5594瀏覽量
109730 -
gpu
+關注
關注
28文章
5194瀏覽量
135444 -
服務器
+關注
關注
14文章
10253瀏覽量
91487 -
數據中心
+關注
關注
18文章
5651瀏覽量
75017 -
Ampere
+關注
關注
1文章
81瀏覽量
4888
發布評論請先 登錄
NVIDIA RTX PRO 4000 Blackwell GPU性能測試
NVIDIA RTX PRO 5000 72GB Blackwell GPU現已全面上市
在Python中借助NVIDIA CUDA Tile簡化GPU編程
NVIDIA RTX PRO 2000 Blackwell GPU性能測試
NVIDIA推出NVQLink高速互連架構
使用NVIDIA NVLink Fusion技術提升AI推理性能
NVIDIA RTX PRO 4500 Blackwell GPU測試分析
NVIDIA介紹NVIDIA Ampere架構的NVIDIA A100 GPU技術
評論