国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA TensorRT Edge-LLM在汽車與機器人行業的落地應用

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2026-01-14 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大語言模型(LLM)與多模態推理系統正迅速突破數據中心的局限。越來越多的汽車與機器人領域的開發者希望將對話式 AI 智能體、多模態感知系統和高級規劃功能直接部署在端側,因為在這些場景中,低延遲、高可靠性以及離線運行能力至關重要。

目前主流的 LLM 和視覺語言模型(VLM)推理框架主要圍繞數據中心需求設計,例如應對大量并發用戶請求并最大化其吞吐量,而嵌入式推理場景則需要一套專用的定制化解決方案。

本文介紹了 NVIDIA TensorRT Edge-LLM——一個用于 LLM 和 VLM 推理的新型開源 C++ 框架,旨在滿足日益增長的高性能邊緣端推理需求。該框架專為嵌入式汽車平臺 NVIDIA DRIVE AGX Thor 及機器人平臺 NVIDIA Jetson Thor 上的實時應用而打造。該框架已在 GitHub 上隨 NVIDIA JetPack 7.1 版本發布并開源。

TensorRT Edge-LLM 依賴項很少,專為實現量產級邊緣端應用部署而設計。其精簡輕量化的設計專注于嵌入式場景的特定功能,能夠顯著降低框架的資源占用。

此外,TensorRT Edge-LLM 所具備的先進功能——如 EAGLE-3 投機采樣、NVFP4 量化支持以及分塊預填充技術,能夠滿足高要求的實時應用場景所需的前沿的性能需求。

wKgZPGlm7TaAAlmYAABXzWc4uuI604.png

圖 1. 與主流 LLM 和 VLM 推理框架 vLLM 相比,TensorRT Edge-LLM 性能表現卓越。

面向實時邊緣端應用的 LLM 與 VLM 推理

邊緣端 LLM 推理任務和 VLM 推理任務具有以下特征:

請求來自少數或單一用戶

批處理規模較小,通常需跨多個攝像頭輸入

面向關鍵任務應用的量產級部署

支持離線運行且無需更新

因此,機器人和汽車領域的實時應用提出了以下特定要求:

延遲低且可預測

最小化磁盤、內存和計算資源的占用

符合量產標準

高魯棒性和高可靠性

TensorRT Edge-LLM 旨在滿足并優先處理這些嵌入式場景的特定需求,為嵌入式 LLM 和 VLM 的推理提供堅實基礎。

TensorRT Edge-LLM 在汽車行業的落地應用

合作伙伴已開始將 TensorRT Edge-LLM 作為其車用 AI 產品的基礎,其中博世、中科創達和 MediaTek 等企業在 CES 2026 上展示了其相關技術。

博世與 NVIDIA 及微軟共同開發新一代博世智能座艙,該座艙搭載的車載 AI 助手具備自然語音交互能力。該解決方案集成了嵌入式自動語音識別(ASR)與文本轉語音(TTS)AI 模型,并通過 TensorRT Edge-LLM 實現 LLM 推理,從而構建了一個強大的車載 AI 系統。同時,該系統還可通過精密協調器與云端的大型 AI 模型協同運作。

中科創達將 TensorRT Edge-LLM 集成至其即將推出的 AIBOX 平臺,該平臺基于 NVIDIA DRIVE AGX Orin 架構,旨在為車內提供響應迅速的車端 LLM 及多模態推理能力。通過整合中科創達的汽車軟件棧與 TensorRT Edge-LLM 的輕量級 C++ 運行時及優化解碼路徑,該 AIBOX 能在嚴苛的功耗和內存限制下,提供低延遲的語音交互與座艙輔助體驗。

MediaTek 在其 CX1 系統級芯片中基于 TensorRT Edge-LLM 進行開發,以支持先進的座艙 AI 與人機交互應用。TensorRT Edge-LLM 加速了 LLM 和 VLM 的推理過程,適用于多種應用場景,包括駕駛員和座艙活動監測。同時,MediaTek 通過開發新型嵌入式專用推理方法,持續反哺 TensorRT Edge-LLM 的技術演進。

隨著 TensorRT Edge-LLM 的發布,這些 LLM 和 VLM 的推理能力現已面向 NVIDIA Jetson 生態系統開放,可為機器人技術提供基礎支撐。

TensorRT Edge-LLM 技術解析

TensorRT Edge-LLM 旨在為 LLM 和 VLM 的推理提供一個端到端工作流。該流程涵蓋三個階段:

將 Hugging Face 模型導出為 ONNX 格式

針對目標硬件構建優化的 NVIDIA TensorRT 引擎

在目標硬件上運行推理任務

wKgZPGlm7TaAbiDzAABVRkKhNVU013.png

圖 2. TensorRT Edge-LLM 工作流及關鍵組件

Python 導出流程能夠將 Hugging Face 模型轉換為 ONNX 格式,并支持量化、LoRA 適配器和 EAGLE-3 投機采樣(圖 3)。

wKgZPGlm7TaATA-JAACOFurX8XY425.png

圖 3. TensorRT Edge-LLM Python導出流程階段與工具

引擎構建器負責構建專為嵌入式目標硬件優化的 TensorRT(圖 4)。

wKgZO2lm7TaAJAdNAABJhqZHf_U160.png

圖 4. TensorRT Edge-LLM 引擎構建器工作流

C++ 運行時負責在目標硬件上執行 LLM 和 VLM 的推理任務。它利用 TensorRT 引擎來實現自回歸模型解碼循環:即基于輸入和先前生成 token 進行迭代式的 token 生成。用戶應用程序通過與該運行時交互,來處理 LLM 和 VLM 的工作負載。

wKgZO2lm7TaAH7s7AABK9eC5zhU934.png

圖 5. TensorRT Edge-LLM C++ 運行時的預填充與解碼階段

如需了解上述各組件的更多說明,請參閱 TensorRT Edge-LLM 的完整文檔。

開始使用 TensorRT Edge-LLM

準備好在您的 Jetson AGX Thor 開發套件上開始 LLM 和 VLM 推理了嗎?

下載 JetPack 7.1 版本

克隆 NVIDIA/TensorRT-Edge-LLM GitHub 倉庫的 JetPack 7.1 發布分支:

git clone https://github.com/NVIDIA/TensorRT-Edge-LLM.git

查閱 TensorRT Edge-LLM 快速入門指南,了解如何從 Hugging Face 獲取開箱即用的支持模型、并將其轉換為 ONNX 格式、為 Jetson AGX Thor 平臺構建 TensorRT 引擎,以及最終通過 C++ 運行時進行運行的完整步驟。

參閱 TensorRT Edge-LLM 示例,了解更多特性和功能。

若需根據自身需求定制 TensorRT Edge-LLM,請參閱 TensorRT Edge-LLM 定制指南。

對于 NVIDIA DRIVE AGX Thor 用戶,TensorRT Edge-LLM 已作為 NVIDIA DriveOS 發行包的標準組件提供。后續 DriveOS 版本將通過 GitHub 倉庫進行發布。

隨著 LLM 和 VLM 快速向邊緣端遷移,TensorRT Edge-LLM 提供了一條清晰可靠的路徑,能夠將 Hugging Face 模型直接部署至 NVIDIA 汽車和機器人平臺,實現實時、量產級落地。

探索工作流,充分測試模型效果,并著手構建下一代智能端側應用。了解更多信息,請訪問 NVIDIA/TensorRT-Edge-LLM GitHub 倉庫。

致謝

感謝 Michael Ferry、Nicky Liu、Martin Chi、Ruo Cheng Jia、Charl Li、Maggie Hu、Krishna Sai Chemudupati、Frederik Kaster、XiangGuo、Yuan Yao、Vincent Wang、Levi Chen、Chen Fu、Le An、Josh Park、Xinru Zhu、Chengming Zhao、Sunny Gai、Ajinkya Rasani、Zhijia Liu、Ever Wong、Wenting Jiang、Jonas Li、Po-Han Huang、Brant Zhao、Yiheng張和 Ashwin Nanjappa,感謝你們對 TensorRT Edge-LLM 的貢獻和支持。

關于作者

Lin Chai 是 NVIDIA 的高級產品經理,負責領導 TensorRT 和 TensorRTEdge-LLM,這是 NVIDIA 跨數據中心和嵌入式平臺深度學習的 AI 推理平臺。憑借在自動駕駛和汽車原始設備制造商 (OEM) 方面的背景,她受到啟發,想要構建生產級推理系統,為數據中心、邊緣和物理 AI 應用中的深度學習工作負載提供一流的性能,使系統能夠在現實世界中感知、推理和行動。

Felix Friedmann 是 NVIDIA DRIVE 平臺的產品和工程主管,涵蓋 NVIDIA 嵌入式 AI 推理和 NVIDIA DriveWorks。他將嵌入式視覺語言模型等最新技術創新與汽車軟件平臺所需的可靠性和安全性相結合。自 NVIDIA DRIVE 平臺問世以來,Felix 一直在前一個職位上與之合作,當時他在奧迪將早期的深度學習模型引入嵌入式應用程序,并為 atVW 的 AID 智能汽車和后來的 Argo AI 設計了感知和系統架構。

Luxiao Zheng 是 NVIDIA 的高級系統軟件工程師。他是 TensorRT 一般性能團隊的成員,專門從事大語言模型推理工作流程。他從事 x86_64 和 aarch64 平臺的端到端 LLM 軟件開發、性能測量、分析和改進。陸曉持有理科碩士學位。計算機科學專業,理學學士學位。計算機科學和理學學士學位。華盛頓大學化學工程專業的博士學位。

Fan Shi 是 NVIDIA TensorRT 團隊的高級系統軟件工程師,專門負責在邊緣平臺上高效部署先進的 AI 模型。他的工作重點是優化深度學習推理的性能和可用性。風扇擁有 M.S。卡耐基梅隆大學計算數據科學博士學位和理學學士學位。來自伊利諾伊大學的統計學和計算機科學博士學位。

Amber Liu 是 NVIDIA 的高級系統軟件工程師,專注于邊緣 AI 和大語言模型應用。她與中國的客戶和合作伙伴密切合作,在自動駕駛、AI 駕駛艙和機器人領域實現 LLM 用例,幫助團隊構建生產就緒型邊緣 AI 系統。作為 TensorRT Edge? LLM 的核心貢獻者,她致力于開發高性能推理解決方案,將先進的大語言模型引入嵌入式平臺。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31075

    瀏覽量

    222191
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109721
  • AI
    AI
    +關注

    關注

    91

    文章

    39768

    瀏覽量

    301370

原文標題:CES 2026 | NVIDIA TensorRT Edge-LLM 加速汽車與機器人領域的 LLM 和 VLM 推理

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DeepSeek R1 MTPTensorRT-LLM中的實現與優化

    TensorRT-LLM NVIDIA Blackwell GPU 上創下了 DeepSeek-R1 推理性能的世界紀錄,Multi-Token Prediction (MTP) 實現了大幅提速
    的頭像 發表于 08-30 15:47 ?4447次閱讀
    DeepSeek R1 MTP<b class='flag-5'>在</b><b class='flag-5'>TensorRT-LLM</b>中的實現與優化

    使用NVIDIA Triton和TensorRT-LLM部署TTS應用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。單張
    的頭像 發表于 06-12 15:37 ?1871次閱讀
    使用<b class='flag-5'>NVIDIA</b> Triton和<b class='flag-5'>TensorRT-LLM</b>部署TTS應用的最佳實踐

    中國機器人行業的現狀——行業***

    以高端工業機器人為主,幾乎壟斷了汽車制造、焊接等高端領域,占比達96%,而國產機器人則以搬運和上下料機器人為主,處于行業***。
    發表于 02-13 15:46

    中國工業機器人行業發展和未來趨勢分析

    汽車制造業推廣到其他制造業,進而推廣到諸如采礦機器人、建筑業機器人以及水電系統維護維修機器人等各種非制造行業。 圖片來源:
    發表于 04-25 16:45

    2016年工業機器人行業前瞻

    行業,其中汽車整車及零部件制造一直是工業機器人的最重要應用領域。三、行業基本風險特征  宏觀經濟波動風險:工業機器人行業具有一定的周期性特
    發表于 12-28 17:32

    工業機器人行業分析

    自于汽車行業,并且主要用于焊接領域。隨著汽車行業市場的成熟,一般工業將逐漸成為各大工業機器人廠家競相角逐的新市場。因此,汽車工業是工業機器人
    發表于 10-19 15:25

    機器人行業周報-政策與園區

    無序競爭,規范行業的發展。此前工信部公布了一批符合《工業機器人行業規范條件》的企業名單,接下來,工信部將進一步實施行業的規范管理,引導政策資源集中集聚。同時利用中國機器人產業聯盟等
    發表于 05-08 17:41

    無線模塊機器人行業中需求量不斷增長

    中國,機器人制作技術已經逐漸走向成熟,用工難、用工成本高以及經濟結構轉型的需要進一步推動機器人的發展。制造業、物流、醫療、餐飲、電子商務等行業廣泛使用了
    發表于 08-14 09:52

    機器人行業,我從哪里入手

    各位大神們好,我是剛畢業的大學生。我想進入機器人行業,但不知道從什么地方入手。你們能不能給我指點一下
    發表于 12-12 18:12

    新松眼中的機器人行業是怎么樣的?

    ? 近日,新松發布《向特定對象發行股票并在創業板上市募集說明書》時,對中國機器人行業的發展現狀及趨勢做了詳細的分析與說明,下面我們來看下,新松機器人眼中的機器人行業是怎么樣的? ?
    的頭像 發表于 03-08 15:38 ?6547次閱讀

    現已公開發布!歡迎使用 NVIDIA TensorRT-LLM 優化大語言模型推理

    能。該開源程序庫現已作為 NVIDIA NeMo 框架的一部分, /NVIDIA/TensorRT-LLM GitHub 資源庫中免費提供。 大語言模型徹底改變了人工智能領域,并創造
    的頭像 發表于 10-27 20:05 ?2072次閱讀
    現已公開發布!歡迎使用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT-LLM</b> 優化大語言模型推理

    NVIDIA TensorRT-LLM Roadmap現已在GitHub上公開發布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現已在 GitHub 上公開發布!
    的頭像 發表于 11-28 10:43 ?1423次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT-LLM</b> Roadmap現已在GitHub上公開發布

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個專為優化大語言模型 (LLM) 推理而設計的庫。它提供了多種先進的優化技術,包括自定義 Attention Kernel、Inflight
    的頭像 發表于 12-17 17:47 ?1834次閱讀

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發并開源的一種新型推測解碼技術,該技術現在可與 NVIDIA TensorRT-LLM 一起使用。
    的頭像 發表于 12-25 17:31 ?1479次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT-LLM</b>中啟用ReDrafter的一些變化

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規模 LLM 推理打造的推理框架,核心目標是突破 NVIDIA 平臺上的推理性能瓶頸。為實
    的頭像 發表于 10-21 11:04 ?1166次閱讀