(文章來源:鎂客網(wǎng))
英偉達(dá)發(fā)布了用于自動駕駛和機(jī)器人的軟件定義平臺——NVIDIA DRIVE AGX Orin。該平臺內(nèi)置全新Orin系統(tǒng)級芯片,Orin由170億個晶體管組成,集成了NVIDIA新一代GPU架構(gòu)和Arm Hercules CPU內(nèi)核以及全新深度學(xué)習(xí)和計算機(jī)視覺加速器,每秒可運行200萬億次計算,是上一代Xavier系統(tǒng)級芯片性能的7倍。
Orin可處理在自動駕駛汽車和機(jī)器人中同時運行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò),并且達(dá)到了ISO 26262 ASIL-D等系統(tǒng)安全標(biāo)準(zhǔn)。值得注意的是,Orin支持可編程,并且有豐富的工具和軟件庫支持,與之前的Xavier處理器兼容,支持從L2到L5級別的自動駕駛。而且由于Orin和Xavier均可通過開放的CUDA、TensorRT API及各類庫進(jìn)行編程,因此開發(fā)者能夠在一次性投資后使用跨多代的產(chǎn)品。
英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“打造安全的自動駕駛汽車,也許是當(dāng)今社會所面臨的最大計算挑戰(zhàn)。實現(xiàn)自動駕駛汽車所需的投入呈指數(shù)級增長,面對復(fù)雜的開發(fā)任務(wù),像Orin這樣的可擴(kuò)展、可編程、軟件定義的AI平臺不可或缺。”
硬件之外,英偉達(dá)還發(fā)布了一套使用主動學(xué)習(xí)、聯(lián)邦學(xué)習(xí)和遷移學(xué)習(xí)來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的工具。以聯(lián)邦學(xué)習(xí)為例,可以讓多個組織和公司在不移動或共享數(shù)據(jù)的情況下進(jìn)行合作,英偉達(dá)將訓(xùn)練模型發(fā)送給各個合作伙伴,每個合作伙伴在自己的數(shù)據(jù)上訓(xùn)練模型。
Isaac SDK包括Isaac Robotics Engine(提供應(yīng)用程序框架),Isaac GEM(預(yù)先構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)模型、算法、庫、驅(qū)動程序和API),用于室內(nèi)物流的參考應(yīng)用程序以及訓(xùn)練機(jī)器人Isaac Sim的第一個版本(提供導(dǎo)航功能)。
對象檢測——識別用于導(dǎo)航、交互或操控的對象;自由空間分割——檢測和分割外部世界,例如確定人行道在哪里,以及機(jī)器人可以在哪里行駛;3D姿態(tài)估計——了解目標(biāo)的位置和方向,從而實現(xiàn)諸如機(jī)械臂拾取物體的任務(wù);2D人體姿態(tài)估計——將姿態(tài)估計應(yīng)用于人,這對于與人互動的機(jī)器人(例如配送機(jī)器人)和協(xié)作機(jī)器人(專門設(shè)計用于與人合作)非常重要。
以新推出Isaac Sim機(jī)器人為例,它可以將所生成的軟件部署到在現(xiàn)實世界中運行的真實機(jī)器人中。通過仿真,開發(fā)人員可以在極端情況下(即困難或異常情況下)對機(jī)器人進(jìn)行測試,以進(jìn)一步加強(qiáng)對它的訓(xùn)練。這有望大大加快機(jī)器人的開發(fā)速度,從而實現(xiàn)綜合數(shù)據(jù)的訓(xùn)練。另外,Isaac SDK還支持多機(jī)器人仿真。這使開發(fā)人員可以將多個機(jī)器人放入仿真環(huán)境中進(jìn)行測試,以便它們學(xué)會彼此相關(guān)的工作。
英偉達(dá)在去年的GTC China上發(fā)布了支持自動低精度推理的TensorRT 5,今天英偉達(dá)發(fā)布了TensorRT 7,內(nèi)置新型深度學(xué)習(xí)編譯器,支持各種類型的RNN、CNN和Transformer,相較于TRT 5只支持30種變換,TRT 7可以支持1000多種不同的計算變換和優(yōu)化。TRT 7可為開發(fā)者設(shè)計的大量RNN配置自動生成代碼,逐點融合LSTM單元,甚至可跨多個時間步長進(jìn)行融合,并且盡可能做自動低精度推理。
借助TRT 7,全球各地的開發(fā)者都可以實現(xiàn)會話式AI應(yīng)用,大幅減少推理延遲。舉個例子,通常情況下,一套端到端的自然語言理解流程可能由幾十種模型構(gòu)成,比如RNN、CNN、自編碼器等等,TRT 7可對所有模型進(jìn)行編譯,使其在英偉達(dá)GPU上運行。基于英偉達(dá)T4的推理會話AI只需要0.3秒,而CPU的推理延遲卻高達(dá)3秒。
如今,英偉達(dá)已經(jīng)售出了15億塊GPU,在使用的每塊GPU都兼容CUDA。英偉達(dá)的CUDA平臺具有豐富的庫、工具和應(yīng)用程序。僅在去年,英偉達(dá)發(fā)布了500多個SDK和庫,通過優(yōu)化軟件棧,英偉達(dá)提高了GPU的性能,讓深度學(xué)習(xí)訓(xùn)練在三年內(nèi)提高了4倍,深度學(xué)習(xí)推理在一年內(nèi)提高了2倍。
HPC應(yīng)用方面,NASA在英偉達(dá)GPU上通過FUN3D軟件運行火星著陸情景模擬,產(chǎn)生高達(dá)150TB的數(shù)據(jù),英偉達(dá)借助DGX-2上運行的Magnum IO GPU Direct Storage技術(shù),可“實時”對這些數(shù)據(jù)進(jìn)行可視化處理。另外,由于GPU的訓(xùn)練成本只有傳統(tǒng)CPU的十分之一,并且可支持更大規(guī)模的模型訓(xùn)練,英偉達(dá)發(fā)布了深度推薦系統(tǒng),百度以及阿里均有采用。
CUDA方面,英偉達(dá)發(fā)布了由CUDA加速的Parabricks基因組分析工具包,可實現(xiàn)30到50倍的加速,目前華大基因已經(jīng)采用Parabricks來進(jìn)行基因變異檢測,除此之外,CUDA新增加了對5G vRAN應(yīng)用的支持。
(責(zé)任編輯:fqj)
-
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4076瀏覽量
98975 -
自動駕駛
+關(guān)注
關(guān)注
793文章
14845瀏覽量
179105
發(fā)布評論請先 登錄
廣汽埃安與滴滴自動駕駛新一代Robotaxi R2交付
黃仁勛:未來十年很多汽車是自動駕駛 英偉達(dá)發(fā)布Alpamayo汽車大模型平臺
NVIDIA與Uber合作推進(jìn)全球L4級自動駕駛移動出行網(wǎng)絡(luò)
不同等級的自動駕駛技術(shù)要求上有何不同?
騰訊發(fā)布全新一代智能駕駛地圖9.0
卡車、礦車的自動駕駛和乘用車的自動駕駛在技術(shù)要求上有何不同?
小鵬汽車在全球AI頂會展示下一代自動駕駛模型
英偉達(dá)Q3將發(fā)布新一代人工智能系統(tǒng)
從游戲到智能駕駛,英偉達(dá)有哪些技術(shù)升級?
英偉達(dá)發(fā)布新一代的自動駕駛芯片Orin
評論