国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Jetson TK1輕松集成傳感器和支持高帶寬流媒體

星星科技指導員 ? 來源:NVIDIA ? 作者:Dustin ? 2022-04-18 14:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 的 Tegra K1 (TK1) 是首款集成 CUDA 的 Arm 片上系統 (SoC)。TK1 擁有 192 個 Kepler GPU 內核和 4 個 Arm Cortex-A15 內核,提供總計 327 GFLOPS 的計算性能,能夠使用 CUDA 處理大量數據,同時通常消耗不到 6W 的功率(包括 SoC 和 DRAM)。這為低于 10W 域中的低 SWaP(尺寸、重量和功率)和小型 (SFF) 應用程序帶來了改變游戲規則的性能,同時支持開發人員友好的 Ubuntu Linux 軟件環境,提供更像這樣的體驗臺式機而不是嵌入式 SoC。

Tegra K1 即插即用,可通過內置 USB 3.0 和 PCIe gen2 x4/x1 端口傳輸高帶寬外圍設備、傳感器和網絡接口。TK1 適用于傳感器處理,并提供與 CUDA 異步的附加硬件加速功能,例如 H.264 編碼和解碼引擎以及雙 MIPI CSI-2 攝像頭接口和圖像服務處理器 (ISP)。TK1 有許多令人興奮的嵌入式應用程序,它們利用其作為媒體處理器和低功耗平臺的自然能力來快速集成設備和傳感器。

由于 GPU 加速特別適合成像、信號處理、自治和機器學習等數據并行任務,Tegra K1 將這些功能擴展到 10W 以下的領域。現在,從 NVIDIA 的高端Tesla HPC 加速器以及GeForce和Quadro獨立 GPU 一直到低功耗 TK1,代碼可移植性得以保持。可用于 TK1的 CUDA 6工具包的完整版本,包括示例、數學庫,例如cuFFT、cuBLAS和NPP,以及 NVIDIA 的 NVCC 編譯器。開發人員可以在 TK1 上本地編譯 CUDA 代碼,也可以從 Linux 開發機器進行交叉編譯。CUDA 庫和開發工具的可用性確保了在離散 GPU 和 Tegra 上部署 CUDA 應用程序之間的無縫且輕松的可擴展性。還有可用的OpenCV4Tegra以及 NVIDIA 的VisionWorks 工具包.此外,Ubuntu 14.04 存儲庫包含豐富的用于 Arm 架構的預構建包,可最大限度地減少跟蹤和構建依賴項所花費的時間。在許多情況下,只要源代碼可用并且沒有顯式調用 x86 特定指令(如 SSE、AVX 或 x86-ASM),只需稍加修改即可為 Arm 重新編譯應用程序。NEON 是 Arm 針對 Cortex-A 系列 CPUSIMD 擴展版本。

借助 NVIDIA 的Jetson TK1 devkit,每個人都可以使用 TK1。Jetson TK1 支持相同的桌面式用戶環境,被用作部署堅固、擴展溫度 SFF 模塊的嵌入式應用程序的有效開發平臺。通過 PCIe x4 gen2,模塊可以與各種 I/O 夾層集成,為 Tegra 提供許多可能的接口。此外,還有用于流式聯網傳感器或互連多個 Tegra 的本機板載千兆以太網。讓我們考慮一個案例研究,該案例研究突出了 TK1 輕松集成傳感器和支持高帶寬流媒體的能力。

案例研究#1:機器人/無人駕駛車輛平臺

嵌入式應用程序通常需要視頻處理、數字信號處理 (DSP)、命令和控制等元素。在這個帶有 Tegra K1 的示例架構中,我們使用 CUDA 處理來自高清 GigEVision 千兆位相機的圖像,并同時在 180° 光探測和測距 (LIDAR) 掃描測距儀上執行世界地圖繪制和障礙物探測操作。此外,我們還集成了 GPS 接收器、慣性測量單元 (IMU)、電機控制器和其他傳感器等設備,以演示如何使用 TK1 對移動平臺(如機器人或無人機)進行自主導航和運動控制。通過將 Tegra 的硬件加速 H.264 壓縮應用于視頻和通過 WiFi、3G/4G、或衛星下行鏈路到遠程地面站或其他聯網機器人。該架構使用 TK1 作為系統的中央處理器和傳感器接口,為感知建模和無人駕駛提供了一個示例框架。

pYYBAGJdCOqAGkxFAAXJ3csTylI980.png

圖 2:使用 Tegra K1 實現的用于自主導航的傳感器處理管道。

我們使用的掃描激光雷達在 180 度范圍內每 0.5° 產生一次距離樣本,這些樣本被分組為集群檢測到運動時使用均值偏移和跟蹤。CUDA 用于同時處理所有范圍樣本,并與從以前的地理參考 LIDAR 掃描構建的八叉樹分區 3D 點云進行變化檢測,生成靜態和移動障礙物列表,實時刷新以進行碰撞檢測和避免。然后在 OpenGL 端渲染類似雷達的平面位置指示器 (PPI)。這個特殊的激光雷達通過 RS232 連接到 Jetson TK1 的串行端口;其他激光雷達也支持千兆以太網。我們使用開源 SICK Toolbox 庫連接到傳感器,該庫在 TK1 上編譯并開箱即用。輕松訪問 LIDAR 傳感器為 TK1 提供了亞毫米級精確讀數,可利用 CUDA 進行實時 3D 環境映射和并行路徑規劃。

poYBAGJdCOyAQZCxAACRKc54KtE405.jpg

圖 3:LIDAR 驅動的 PPI 顯示器可視化平臺環境中的靜態和移動障礙物。

在成像方面,Tegra K1 擁有多個接口用于流式傳輸高清視頻,例如 CSI-2、USB 3.0 和千兆以太網。適用于 HD-SDI、CameraLink、LVDS 等其他媒體的圖像采集卡可以通過其 PCIe gen2 x4 端口與 TK1 集成。在本案例研究中,我們使用來自 GigEVision 兼容供應商的多臺千兆以太網攝像機進行了測試,分辨率從 1920×1080 到 2448×2048 不等,發現每個千兆以太網端口都有一個單獨的 Arm CPU 內核,足以處理網絡協議和數據包使用套接字 API。使用 cudaMallocManaged()統一內存CUDA 6 的新功能,視頻流由 CPU 解包到與 GPU 共享的緩沖區中,需要零副本才能將視頻“放入 GPU 內存”(在 TK1 的情況下,它在物理上都是相同的內存)。

使用 OpenCV、NVIDIA NPP 和 VisionWorks 等免費提供的庫,用戶可以在旅途中運行無數 CUDA 加速的視頻過濾器,包括光流、SLAM、立體視差、穩健的特征提取和匹配、鑲嵌、和多個移動目標指示器(MMTI)。

可訓練的行人和車輛檢測器可以使用可用的方向梯度直方圖(HoG) 實現在 TK1 上實時運行。有許多現有的 CUDA 代碼可用,它們以前在離散 GPU 上運行,現在可以部署在 Tegra 上。

除了激光雷達設備和攝像頭,TK1 還支持 GPS 和 IMU 等導航傳感器,以提高自主性。這些通常以 USB 或串行設備的形式提供,并且可以輕松地與 TK1 集成。制作支持 GPS 的應用程序的一種快速方法是使用 libgps/gpsd,它為各種 NMEA 兼容設備提供通用軟件接口和 GPS 數據報。同時集成了 IMU 傳感器,以提供高達 100Hz 或更高刷新率的加速度計、陀螺儀和磁力計讀數。TK1 使用高質量卡爾曼濾波融合快速 IMU 和 GPS 數據,以提供 3 空間中的實時插值平臺位置,然后使用這些插值從光流中進一步細化視覺里程計。雖然比遵守 NMEA 的 GPS 單元標準化程度低,IMU 設備通常附帶供應商提供的 C/C++ 代碼,旨在與 libusb 鏈接,這是一個標準用戶空間驅動程序接口,用于在 Linux 上訪問 USB 設備。此類利用 libusb 的用戶空間驅動程序無需付出任何努力即可從 x86 遷移到 Arm,并使開發人員能夠快速將各種設備與 TK1 集成,例如用于驅動伺服器和執行器的 MOSFET 或 PWM 電機控制器、用于監控電池壽命的電壓和電流傳感器、氣體/大氣傳感器、 ADC / DAC 等等,具體取決于手頭的應用。Tegra K1 還具有六個用于驅動離散信號的 GPIO 端口,可用于連接開關、按鈕、繼電器和 LED。此類利用 libusb 的用戶空間驅動程序無需付出任何努力即可從 x86 遷移到 Arm,并使開發人員能夠快速將各種設備與 TK1 集成,例如用于驅動伺服器和執行器的 MOSFET 或 PWM 電機控制器、用于監控電池壽命的電壓和電流傳感器、氣體/大氣傳感器、 ADC / DAC 等等,具體取決于手頭的應用。Tegra K1 還具有六個用于驅動離散信號的 GPIO 端口,可用于連接開關、按鈕、繼電器和 LED。此類利用 libusb 的用戶空間驅動程序無需付出任何努力即可從 x86 遷移到 Arm,并使開發人員能夠快速將各種設備與 TK1 集成,例如用于驅動伺服器和執行器的 MOSFET 或 PWM 電機控制器、用于監控電池壽命的電壓和電流傳感器、氣體/大氣傳感器、 ADC / DAC 等等,具體取決于手頭的應用。Tegra K1 還具有六個用于驅動離散信號的 GPIO 端口,可用于連接開關、按鈕、繼電器和 LED。

本案例研究說明了機器人、機器視覺、遙感等常見的感官和計算方面。TK1 提供了一個對開發人員友好的環境,它消除了集成的繁瑣工作,使嵌入式 CUDA 應用程序的部署變得容易,同時提供了卓越的性能。

案例研究 #2:平鋪 Tegra

某些應用程序可能需要多個 Tegras 協同工作才能滿足其要求。Tegra K1 SoC 集群可以平鋪并與 PCIe 或以太網互連。從實施這種平鋪架構中獲得的尺寸、重量和功率優勢是巨大的,并將 TK1 的適用性擴展到數據中心和高性能計算 (HPC)。每塊板上平鋪 4、6、8 或更多 K1 SoC 的密集分布式拓撲是可能的,并提供有利于嵌入式應用程序和 HPC 等的可擴展性。考慮這個基于現有嵌入式系統的示例,采用六個 Tegra K1:

poYBAGJdCO6AInP9AACFwSkjfIg001.png

圖 5:SWaP 優化的平鋪架構,六個 Tegra K1 與非透明 PCIe 交換和 RDMA 互連。

六個 TK1 通過 PCIe gen2 x4 和一個具有非透明 (NT) 橋接和 DMA 卸載引擎的 32 通道 PCIe 交換機互連。這與輕量級用戶空間 RDMA 庫一起提供了 TK1 之間的低開銷處理器間通信。同時,傳感器接口由連接到每個 Tegra 的 PCIe gen2 x1 端口的千兆以太網 NIC/PHY 提供。PCIe 交換機還提供了一個備用 PCIe x8 擴展,用于與用戶確定的 I/O 接口的高達 4GB/s 的板外連接。

pYYBAGJdCQqAew_UAAAi0_Z1NEI852.png

像這樣的平鋪解決方案能夠在消耗不到 50W 的同時實現近 2 TFLOPS 的計算性能,并且與使用更高功率分立元件的架構相比,低功耗集群 SoC 的效率有了很大提高。功率的降低使我們能夠在板上放置和布線所有組件,從而實現無連接器的相互通信并提高信號完整性和堅固性。對于大數據分析、多通道視頻和信號處理以及機器學習,具有 TK1 的分布式架構為那些需要計算密度同時最小化 SWAP 的真正資源密集型應用程序提供了顯著的性能提升。

不可能的高級

Tegra K1 突破性的計算性能由 NVIDIA 的低功耗優化和集成 CUDA 的引入推動,引領新一代嵌入式設備和平臺利用 TK1 的 SWaP 密度來提供高級特性和功能。NVIDIA 和 GE 合作將由 TK1 驅動的堅固 SFF 模塊和系統帶入嵌入式領域。機器人、醫療和可穿戴設備、軟件無線電、安全、監控等領域的應用是使用 Tegra K1 進行加速的主要候選者。更重要的是,TK1 的易用性促進了可擴展、可移植的嵌入式系統,縮短了開發周期,而現在在 Tegra 上運行的大量現有 CUDA 庫和軟件進一步促進了這一點。您今天將使用 TK1 構建什么?

關于作者

Dustin 是 NVIDIA Jetson 團隊的一名開發人員推廣員。Dustin 擁有機器人技術和嵌入式系統方面的背景,喜歡在社區中提供幫助并與 Jetson 合作開展項目。您可以在NVIDIA 開發者論壇或GitHub 上找到他。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 嵌入式
    +關注

    關注

    5198

    文章

    20449

    瀏覽量

    334046
  • 機器人
    +關注

    關注

    213

    文章

    31079

    瀏覽量

    222236
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109731
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何在NVIDIA Jetson AGX Thor上部署1200億參數大模型

    上一期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務,以及使用 Chatbox 作為前端調用 vLLM 運行的模型(上期文章鏈接)。本期
    的頭像 發表于 12-26 17:06 ?4828次閱讀
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> AGX Thor上部署1200億參數大模型

    XENSIV? TCI 集成熱導率氣體傳感器:特性、應用與設計指南

    傳感器,了解其特性、潛在應用以及設計過程中的關鍵要點。 文件下載: Infineon Technologies XENSIV? TCI集成式氣體傳感器.pdf 一、傳感器特性亮點
    的頭像 發表于 12-18 15:00 ?328次閱讀

    NVIDIA Jetson系列開發者套件助力打造面向未來的智能機器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發者套件,助力打造面向未來的智能機器人。
    的頭像 發表于 12-13 10:20 ?3060次閱讀

    如何在NVIDIA Jetson AGX Thor上通過Docker高效部署vLLM推理服務

    繼系統安裝與環境配置后,本期我們將繼續帶大家深入 NVIDIA Jetson AGX Thor 的開發教程之旅,了解如何在 Jetson AGX Thor 上,通過 Docker 高效部署 vLLM 推理服務。
    的頭像 發表于 11-13 14:08 ?4116次閱讀
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> AGX Thor上通過Docker高效部署vLLM推理服務

    NVIDIA Jetson AGX Thor Developer Kit開發環境配置指南

    NVIDIA Jetson AGX Thor 專為物理 AI 打造,與上一代產品 NVIDIA Jetson AGX Orin 相比,生成式 AI 性能最高提升至 5 倍。通過發布后的
    的頭像 發表于 11-08 09:55 ?7255次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> AGX Thor Developer Kit開發環境配置指南

    BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態系統兼容的低功耗 AI 模塊

    軸機械臂 :硬實時控制(<1 μs 抖動)+ 視覺伺服 自動駕駛 :多傳感器融合(激光雷達+攝像頭+雷達) 優于 Jetson Nano RK3588 AI Module7 由
    發表于 10-11 09:08

    NVIDIA Jetson AGX Thor開發者套件重磅發布

    開發者與未來創造者們,準備好迎接邊緣AI的史詩級革新了嗎?NVIDIA以顛覆性技術再次突破極限,正式推出Jetson AGX Thor開發者套件!作為繼傳奇產品Jetson AGX Orin之后
    的頭像 發表于 08-28 14:31 ?1556次閱讀

    基于 NVIDIA Blackwell 的 Jetson Thor 現已發售,加速通用機器人時代的到來

    ·專為物理 AI 和機器人打造的機器人計算機 NVIDIA Jetson AGX Thor 開發者套件和量產級模組,現已發售。 ·超過 200 萬開發者正在使用 NVIDIA 的機器人技術棧,聯影
    發表于 08-26 09:28 ?1299次閱讀
    基于 <b class='flag-5'>NVIDIA</b> Blackwell 的 <b class='flag-5'>Jetson</b> Thor 現已發售,加速通用機器人時代的到來

    NVIDIA Jetson AGX Thor開發者套件概述

    NVIDIA Jetson AGX Thor 開發者套件為您提供出色的性能和可擴展性。它由 NVIDIA Blackwell GPU和128 GB 顯存提供動力支持,提供高達 2070
    的頭像 發表于 08-11 15:03 ?1903次閱讀

    NVIDIA Jetson + Isaac SDK 人形機器人方案全面解析

    NVIDIA Jetson + Isaac SDK 人形機器人方案全面解析 一、方案概述 Jetson 硬件平臺 :提供 AI + GPU 運算能力,配合多傳感器、視覺、傳動控制體系
    的頭像 發表于 07-30 16:12 ?2185次閱讀

    Jetson平臺核心組件BOM清單概覽

    Jetson平臺核心組件BOM清單概覽 NVIDIA Jetson系列作為業界領先的邊緣計算和人工智能(AI)平臺,其強大的性能背后是一系列精心挑選的核心芯片、電源管理集成電路(PMI
    的頭像 發表于 07-30 16:11 ?3135次閱讀

    NVIDIA Jetson + Isaac SDK 在人形機器人領域的方案詳解

    組件 描述 硬件平臺(Jetson系列) 面向邊緣AI和機器人開發的SoC模塊,搭載GPU + ARM CPU,支持多種傳感器和AI模型部署 軟件平臺(Isaac SDK / Isaac Sim) 用于
    的頭像 發表于 07-30 16:05 ?3616次閱讀

    LLSM流媒體傳輸模塊 動態圖像帶寬穩定技術突破

    慧視LLSM流媒體傳輸模塊,除了低延遲的特點外,還有一個很重要的特點就是低帶寬占用。模塊內部集成慧視光電自研的GS遠程可視化圖傳控制系統,具備在固定帶寬環境下同時控制傳輸多路無人設備,
    的頭像 發表于 05-27 17:58 ?1152次閱讀
    LLSM<b class='flag-5'>流媒體</b>傳輸模塊  <b class='flag-5'>高</b>動態圖像<b class='flag-5'>帶寬</b>穩定技術突破

    Made with KiCad(126):Antmicro OV5640 雙攝像頭子板

    統一的 50 引腳 FFC 接口 用于驅動圖像傳感器的板載時鐘發生 OV5640 雙攝像頭電路板與 Antmicro 開發的各種處理平臺電氣兼容。下面列出了其中幾種: 支持 NVIDIA
    發表于 05-12 18:13

    LLSM——基于RK3588的低延遲低帶寬流媒體傳輸模塊

    隨著物聯網和人工智能的快速發展,實時視頻傳輸在嵌入式系統中變得越來越重要。無論是智能攝像頭、無人機還是工業監控設備,都需要高效、低延遲的流媒體傳輸解決方案。慧視推出的LLSM低延遲低帶寬流媒體傳輸
    的頭像 發表于 04-30 18:36 ?2013次閱讀
    LLSM——基于RK3588的低延遲低<b class='flag-5'>帶寬</b><b class='flag-5'>流媒體</b>傳輸模塊