国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于工業(yè)AI的Jetson AGX Xavier模塊

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Simon Holt ? 2022-06-08 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

工業(yè)物聯(lián)網(wǎng)架構(gòu)師花了數(shù)年時(shí)間才得出結(jié)論,邊緣需要數(shù)據(jù)中心級(jí)的性能,以實(shí)現(xiàn)高效分析、提高安全性和降低網(wǎng)絡(luò)成本。在人工智能機(jī)器學(xué)習(xí)領(lǐng)域,傳感器設(shè)備內(nèi)部或附近對(duì)高端處理能力的需求從一開始就很明顯。

考慮到即使是簡(jiǎn)單的自主機(jī)器(我知道這是矛盾的說法)也需要大量的計(jì)算能力來運(yùn)行神經(jīng)網(wǎng)絡(luò)來執(zhí)行障礙物檢測(cè)、識(shí)別和避免等功能。例如,京東和菜鳥等公司生產(chǎn)的自動(dòng)送貨車需要大約每秒 30 兆次運(yùn)算 (TOPS) 的處理性能,而雅馬哈正在開發(fā)的自動(dòng)駕駛檢查無人機(jī)需要大約 20 兆次運(yùn)算 (TOPS) 的處理性能。

當(dāng)然,這對(duì)嵌入式和工業(yè)工程師提出了一個(gè)經(jīng)典的設(shè)計(jì)挑戰(zhàn):平衡每瓦性能。性能太低,應(yīng)用程序失敗。功耗太大,自主機(jī)器必須連接到持續(xù)的電源

隨著NVIDIA 的 Jetson AGX Xavier 模塊的發(fā)布,這種情況正在改變。

服務(wù)器級(jí)性能,嵌入式功耗

Jetson AGX Xavier 核心的 Xavier SoC 包含大量異構(gòu)處理性能,適用于人工智能驅(qū)動(dòng)的機(jī)器人應(yīng)用程序,包括:

512 核 Volta GPU,帶有 64 個(gè) TensorCore

八核、64 位基于 Arm 的 Carmel CPU

雙 NVDLA(NVIDIA 深度學(xué)習(xí)加速器)引擎

雙 7 路 VLIW 視覺加速器引擎

這代表 Jetson AGX 模塊的性能高達(dá) 32 TOPS,尺寸為 87 mm x 100 mm。如上圖所示,該芯片還包括一個(gè) 256 位 LPDDR4X 接口,能夠以 137 GBps 的速度將數(shù)據(jù)傳輸?shù)侥K上的 16 GB DRAM,用于與 AI 工作負(fù)載相關(guān)的頻繁讀寫。

基本上,Jetson AGX Xavier 以嵌入式模塊形式提供服務(wù)器級(jí)性能。然而,同樣重要的是,該模塊的功耗僅為 10W,或與臺(tái)式風(fēng)扇差不多。用戶可將操作模式配置為 10W、15W 或 30W,NVIDIA 報(bào)告稱每瓦性能 (PPW) 的最佳點(diǎn)在 15W 左右。即使在那個(gè)水平(大約相當(dāng)于藍(lán)光播放器的功耗),Jetson AGX Xavier 在推理性能和能源效率方面也大大超過了其前身 Jetson TX2 和 Intel Core i7 + GTX 1070 顯卡。

pYYBAGKgQDeAcKYxAADtibAg8G4288.png

Jetson AGX Xavier:引擎蓋下

Jetson AGX Xavier 的多項(xiàng)功能可實(shí)現(xiàn)這種類型的每瓦性能,從基礎(chǔ)芯片架構(gòu)開始。雖然 SoC 上的每個(gè)內(nèi)核都有自己的內(nèi)存,但內(nèi)存是離散 SoC 模塊之間的零內(nèi)存復(fù)制。雖然 AGX Xavier 模塊確實(shí)通過外部 16 GB LPDDR4X DRAM 提供共享內(nèi)存,但片上數(shù)據(jù)只是通過管道傳遞到必要的處理核心。

架構(gòu)的異構(gòu)性也提高了效率,因?yàn)楣ぷ髫?fù)載可以在最適合任務(wù)的架構(gòu)上執(zhí)行。這方面的一個(gè)例子是片上加速引擎,它可以卸載 Volta GPU,以便它可以專注于更復(fù)雜或用戶定義的任務(wù)。例如,在以 8 位分辨率推斷固定功能卷積神經(jīng)網(wǎng)絡(luò) (CNN) 時(shí),NVDLA 引擎可提供高達(dá) 5 TOPS 的性能,以 16 位分辨率推斷 2.5 TFLOPS 時(shí),功耗在 0.5W 和 1.5W 之間。

poYBAGKgQECARpmYAAFR4BDwBMw371.png

同時(shí),Carmel CPU 內(nèi)核可以保留用于通用計(jì)算任務(wù)。

JetPack 簡(jiǎn)化了深度學(xué)習(xí)編程的復(fù)雜性

Jetson AGX 系列運(yùn)行 Linux,這在工業(yè)嵌入式系統(tǒng)中變得越來越普遍。許多希望利用 Jetson AGX Xavier 性能的工業(yè)和嵌入式開發(fā)人員可能不太熟悉的是對(duì) GPU 和/或深度學(xué)習(xí)加速器進(jìn)行編程。幸運(yùn)的是,NVIDIA JetPack 4.1.1 軟件開發(fā)套件 (SDK)在CUDA Toolkit中提供了一攬子 API、嵌入式庫以及與常用語言的集成,因此您無需了解如何編程 GPU對(duì) GPU 進(jìn)行編程。

最新JetPack版本中的一些軟件工具包括:

Linux For Tegra R31.0.1 (K4.9)

CUDA 工具包 10.0

cuDNN 7.3

張量RT 5.0 GA

OpenCV 3.3.1

OpenGL 4.6 / GLES 3.2

伏爾甘 1.1

多媒體 API R31.1

阿格斯 0.97 相機(jī) API

TensorRT 5.0 包中提供的 API 也簡(jiǎn)化了對(duì) DLA 進(jìn)行編程以執(zhí)行神經(jīng)網(wǎng)絡(luò)工作負(fù)載。例如,_setDeviceType() 和 setDefaultDeviceType() 命令可用于在 GPU 或任一 DLA 上執(zhí)行特定的神經(jīng)網(wǎng)絡(luò)層或?qū)樱?_allowGPUFallback() 這樣的命令可讓工作負(fù)載在 DLA 不支持的情況下恢復(fù)到 GPU 。

此外,DeepStream 3.0 SDK 支持 Jetson AGX Xavier,該 SDK 利用 TensorRT、CUDA、多媒體和成像 API 來加速視頻分析應(yīng)用程序的開發(fā)。

當(dāng)然,低級(jí) CUDA 編程是另一種選擇。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107754
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109722
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135433
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何在NVIDIA Jetson AGX Thor上部署1200億參數(shù)大模型

    上一期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務(wù),以及使用 Chatbox 作為前端調(diào)用 vLLM 運(yùn)行的模型(上期文章鏈接)。本期
    的頭像 發(fā)表于 12-26 17:06 ?4818次閱讀
    如何在NVIDIA <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor上部署1200億參數(shù)大模型

    NVIDIA Jetson系列開發(fā)者套件助力打造面向未來的智能機(jī)器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發(fā)者套件,助力打造面向未來的智能機(jī)器人。
    的頭像 發(fā)表于 12-13 10:20 ?3055次閱讀

    如何在NVIDIA Jetson AGX Thor上通過Docker高效部署vLLM推理服務(wù)

    繼系統(tǒng)安裝與環(huán)境配置后,本期我們將繼續(xù)帶大家深入 NVIDIA Jetson AGX Thor 的開發(fā)教程之旅,了解如何在 Jetson AGX Thor 上,通過 Docker 高效
    的頭像 發(fā)表于 11-13 14:08 ?4112次閱讀
    如何在NVIDIA <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor上通過Docker高效部署vLLM推理服務(wù)

    NVIDIA Jetson AGX Thor Developer Kit開發(fā)環(huán)境配置指南

    NVIDIA Jetson AGX Thor 專為物理 AI 打造,與上一代產(chǎn)品 NVIDIA Jetson AGX Orin 相比,生成式
    的頭像 發(fā)表于 11-08 09:55 ?7252次閱讀
    NVIDIA <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor Developer Kit開發(fā)環(huán)境配置指南

    通過NVIDIA Jetson AGX Thor實(shí)現(xiàn)7倍生成式AI性能

    Jetson Thor 平臺(tái)還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構(gòu)的新 NVFP4 格式,有助于進(jìn)一步優(yōu)化推理性能。該平臺(tái)同時(shí)支持推測(cè)解碼等新技術(shù),為在邊緣端加速生成式 AI 工作負(fù)載提供了新的途徑。
    的頭像 發(fā)表于 10-29 16:53 ?1423次閱讀

    BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    套件 (100x80 毫米) 占用空間相同,與現(xiàn)有外殼兼容 Jetson Nano 兼容性 為 Jetson Nano 提供 5 V 和 12 V 電源輸入 比較 8 GB ArmSoM RK3588 AI
    發(fā)表于 10-11 09:08

    NVIDIA Jetson AGX Thor開發(fā)者套件重磅發(fā)布

    開發(fā)者與未來創(chuàng)造者們,準(zhǔn)備好迎接邊緣AI的史詩級(jí)革新了嗎?NVIDIA以顛覆性技術(shù)再次突破極限,正式推出Jetson AGX Thor開發(fā)者套件!作為繼傳奇產(chǎn)品Jetson
    的頭像 發(fā)表于 08-28 14:31 ?1555次閱讀

    基于 NVIDIA Blackwell 的 Jetson Thor 現(xiàn)已發(fā)售,加速通用機(jī)器人時(shí)代的到來

    ·專為物理 AI 和機(jī)器人打造的機(jī)器人計(jì)算機(jī) NVIDIA Jetson AGX Thor 開發(fā)者套件和量產(chǎn)級(jí)模組,現(xiàn)已發(fā)售。 ·超過 200 萬開發(fā)者正在使用 NVIDIA 的機(jī)器人技術(shù)棧,聯(lián)影
    發(fā)表于 08-26 09:28 ?1299次閱讀
    基于 NVIDIA Blackwell 的 <b class='flag-5'>Jetson</b> Thor 現(xiàn)已發(fā)售,加速通用機(jī)器人時(shí)代的到來

    NVIDIA Jetson AGX Thor開發(fā)者套件概述

    TFLOPS 的 AI 計(jì)算性能,從而輕松運(yùn)行最新的生成式 AI模型,且功耗不超過 130 W。與 NVIDIA Jetson AGX Orin 相比,其
    的頭像 發(fā)表于 08-11 15:03 ?1902次閱讀

    NVIDIA Jetson + Isaac SDK 人形機(jī)器人方案全面解析

    Volta 6-core Carmel 21 10~15W 中性能服務(wù)型機(jī)器人 Jetson AGX Xavier 512-core
    的頭像 發(fā)表于 07-30 16:12 ?2180次閱讀

    Jetson平臺(tái)核心組件BOM清單概覽

    Jetson Xavier NX、Jetson AGX Orin)的核心BOM清單進(jìn)行梳理。需要注意的是,NVIDIA官方并
    的頭像 發(fā)表于 07-30 16:11 ?3132次閱讀

    NVIDIA Jetson + Isaac SDK 在人形機(jī)器人領(lǐng)域的方案詳解

    組件 描述 硬件平臺(tái)(Jetson系列) 面向邊緣AI和機(jī)器人開發(fā)的SoC模塊,搭載GPU + ARM CPU,支持多種傳感器和AI模型部署 軟件平臺(tái)(Isaac SDK / Isa
    的頭像 發(fā)表于 07-30 16:05 ?3613次閱讀

    Made with KiCad(126):Antmicro OV5640 雙攝像頭子板

    Jetson Nano、Jetson TX2 NX、Jetson Xavier NX 系統(tǒng)模塊Je
    發(fā)表于 05-12 18:13

    邊緣AI MPU深度盤點(diǎn):品牌、型號(hào)與技術(shù)特性全解析

    三個(gè)維度,結(jié)合典型應(yīng)用場(chǎng)景,對(duì)主流邊緣AI MPU進(jìn)行全面盤點(diǎn)。 一、國(guó)際品牌:技術(shù)領(lǐng)先,場(chǎng)景覆蓋全面 NVIDIA(英偉達(dá)) 代表型號(hào) :Jetson系列(Orin Nano/NX/AGX
    的頭像 發(fā)表于 04-30 17:27 ?4118次閱讀

    市場(chǎng)上主流的端側(cè)AI MPU 大全

    ? ? NVIDIA ? ? Jetson系列 ?:面向邊緣AI的高性能MPU Jetson Orin Nano/NX/AGX(基于Ampere架構(gòu),4-64 TOPS算力)
    的頭像 發(fā)表于 04-02 17:44 ?4314次閱讀