国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Triton系列文章:開發資源說明

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-11-09 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大部分要學習 Triton 推理服務器的入門者,都會被搜索引擎或網上文章引導至官方的https://developer.nvidia.com/nvidia-triton-inference-server處(如下截圖),然后從 “Get Started” 直接安裝服務器與用戶端軟件、創建基礎的模型倉、執行一些最基本的范例。

075dc9d0-5f58-11ed-8abf-dac502259ad0.png

這條路徑雖然能在很短時間內跑起 Triton 的應用,但在未掌握整個應用架構之前便貿然執行,反倒容易讓初學者陷入迷失的狀態,因此建議初學者最好先對 Triton 項目有比較更完整的了解之后,再執行前面的 “Get Started” 就會更容易掌握項目的精髓。

要獲得比較完整的 Triton 技術資料,就得到項目開源倉里去尋找。與 NVIDIA 其他放在 https://github.com/NVIDIA或https://github.com/NVIDIA-AI-IOT的項目不同,Triton 項目有獨立的開源倉,位置在https://github.com/triton-inference-server,進入開源倉后會看到如下截屏的內容:

0777b1f6-5f58-11ed-8abf-dac502259ad0.png

下面列出四大部分的技術資源:

1. Getting Start(新手上路):

這里提供三個鏈接,比較重要的是 “Quick Start(快速啟動)” 的部分,提供以下三個步驟就能輕松執行 Triton 的基礎示范:

(1) Create a Model Repository(創建模型倉)

(2) Launch Triton(啟動Triton服務器與用戶端)

(3) Send an Inference Request(提交推理要求)

2. Production Documentation(生產文件):

這里最重要的是 “server documents on GitHub” 鏈接,點進去后會進入整個 Triton 項目中最完整的技術文件中心(如下圖),除 Installation 與 Getting Started 屬于入門范疇,其余 User Guide、API Guide、Additional Resources 與 Customization Guide 等四個部分,都是 Triton 推理服務器非常重要的技術內容。

079daa00-5f58-11ed-8abf-dac502259ad0.png

因此這個部分可以算得上是學習 Triton 服務器的最重要資源。

例如點擊 “User Guide” 之后,就會看到以下所條例的執行步驟:

Creating a Model Repository

Writing a Model Configuration

Buillding a Model Pipeline

Managing Model Availablity

Collecting Server Metrics

Supporting Custom Ops/layers

Using the Client API

Analyzing Performance

Deploying on edge (Jetson)

3. Examples(范例):

這里的范例,比較重要的是指向https://github.com/NVIDIA/DeepLearningExamples鏈接,列出針對 NVIDIA Tensor Core 計算單元的深度學習模型列表,包括計算機視覺、NLP 自然語言處理、推薦系統、語音轉文字 / 文字轉語音、圖形神經網絡、時間序列等各種神經網絡模型細節,包括網絡結構與相關參數的內容。

對于未來要在 Triton 服務器上,對于所使用的網絡后端進行性能優化或者創建新的后端,會有很大的助益,但是對于初學者來說是相對艱澀的,因此現階段先不做深入的說明與示范。

4. Feedback(反饋):

這里會鏈接到https://github.com/triton-inference-server/server/issues問題中心,是 Triton 項目中最重要的技術問題解決資源之一,后面執行過程中所遇到的問題,都可以先到這里來查看是否有人已經提出?如果沒有的話,也可以在這里提交自己所遇到的問題,項目負責人會提供合適的回復。

以上第 2、4 兩項資源,對初學者來說會有最大的幫助。接著看一下項目里 “釘?。≒inned)” 的 6 個倉(如下圖),是比較重要的基礎部分,涵蓋了 Triton 架構圖中的主要板塊。

07cfb18a-5f58-11ed-8abf-dac502259ad0.png

主要內容如下:

1. server 倉:

這里集成整個項目的主要內容,包括幾部分:

(1)deploy(部署):提供在阿里巴巴、亞馬遜等云資源的部署方式,以及基于 NVIDIA Fleet 指令集、GKE(Google kubernets Engine)、k8s、Helm 等應用平臺的各種部署方法;

(2)docker(容器):修正一些創建容器腳本的錯誤;

(3)docs(使用說明):就是前面 “生產文件(Production Documentation)” 的內容,這里不重復贅述;

(4)qa(質量優化):由于 Triton 推理服務器有非常多優化的環節,在這個目錄下提供上百個不同狀況的優化測試腳本;

(5)src(源代碼):目錄下存放整個 Triton 推理服務器的開源代碼(.cc)、頭文件(.h)與編譯腳本(CMakeLists.txt);

(6)其他代碼與腳本

2. core 倉:

此存儲庫包含實現 Triton 核心功能的庫的源代碼和標頭。核心庫可以如下所述構建,并通過其 CAPI 直接使用。為了有用,核心庫必須與一個或多個后端配對。您可以在后端回購中了解有關后端的更多信息。

3. backend 倉:

提供創建 Triton 服務器后端(backend)的源代碼、腳本與工具。“后端” 是用來執行不同深度學習模型的管理模塊,以深度學習框架進行封裝,例如 PyTorch、Tensorflow、ONNX Runtime 與 TensorRT 等等,用戶也可以為了性能目的,自行定義 C / C++ 封裝方式。

4. client 倉:

提供 Triton 用戶端的 C++ / Python / Java 開發接口、能生成適用于不同編程語言的 GRPC 開發接口的 protoc 編譯器,以及對應的用戶端范例;

5. model_analyzer 倉:

深度學習模型(model)是 Triton 推理服務器的最基礎組成元件,因此對分析模型的計算與內存需求是服務器性能的一項關鍵功能。這個 model_analyzer 模型分析工具是一種 CLI 工具,這款新工具可以自動化地從數百種組合中為 AI 模型選擇最佳配置,以實現最優性能,同時確保應用程序所需的服務質量,能幫助開發人員更好地了解不同配置中的權衡,并選擇能夠最大化 Triton 的性能配置;

6. model_navigator 倉:

這個 model_navigator 模型導航器是一種能夠自動將模型從源移動到最佳格式和配置的工具,支持將模型從源導出為所有可能的格式,并應用 Triton 服務器的后端優化。使用模型分析器能找到最佳的模型配置,匹配提供的約束條件并優化性能。

以上是 Triton 開源項目里比較核心的 6 個倉,另外還有 20 多個代碼倉,其中大約 15 個是項目提供的后端(backend)擴充應用,例如 tensorrt_backend、fil_backend、square_backend 等等,以及一些額外的管理工具,并且不斷增加中。

本系列后面的內容都會基于這個 server 倉的 docs 目錄下的內容為主,按部就班地帶著讀者循序漸進創建與調試 Triton 推理服務器的運作環境。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109730
  • 服務器
    +關注

    關注

    14

    文章

    10253

    瀏覽量

    91486

原文標題:NVIDIA Triton 系列文章(3):開發資源說明

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優勢是允許開發者基于其構建自定義的 DS
    的頭像 發表于 02-10 10:31 ?243次閱讀

    NVIDIA 推出 Alpamayo 系列開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車開發

    新聞摘要 : l NVIDIA 率先發布為應對輔助駕駛長尾場景挑戰而設計的開源視覺-語言-動作推理模型(Reasoning VLA);NVIDIA Alpamayo 系列還包含賦能輔助駕駛汽車
    的頭像 發表于 01-06 09:40 ?381次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo <b class='flag-5'>系列</b>開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車<b class='flag-5'>開發</b>

    NVIDIA Jetson系列開發者套件助力打造面向未來的智能機器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發者套件,助力打造面向未來的智能機器人。
    的頭像 發表于 12-13 10:20 ?3060次閱讀

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發

    NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助 NVIDIA Omniverse 庫和 Cosmos,
    的頭像 發表于 12-01 09:25 ?1135次閱讀

    NVIDIA DRIVE AGX Thor開發者套件重磅發布

    這款由 NVIDIA DriveOS 7 驅動的開發者套件能夠幫助開發者們打造出更安全的智能汽車和交通解決方案。
    的頭像 發表于 09-04 11:20 ?1379次閱讀

    NVIDIA Omniverse Extension開發秘籍

    NVIDIA Omniverse 是一個模塊化平臺,使用高級 API 和微服務來構建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應用。OpenUSD 功能強大的 3D 框架與 NVIDIA RTX 用于視覺渲
    的頭像 發表于 08-22 15:52 ?3715次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension<b class='flag-5'>開發</b>秘籍

    芯科科技Arduino開發資源重大更新

    Silicon Labs (芯科科技)近期于在線技術社群中發布了面向Arduino Core和Matter庫的重大更新,帶來了兩個關鍵突破:全面支持Matter 1.4標準,以及人工智能和機器學習(AI/ML)無線共存(Wireless Coexistence),從而實現更強的連接能力、更廣泛的設備支持。
    的頭像 發表于 08-20 15:51 ?914次閱讀

    NVIDIA桌面GPU系列擴展新產品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell GPU,可提高工程、內容創作和 3D 可視化等應用的性能。
    的頭像 發表于 08-18 11:50 ?1412次閱讀

    使用NVIDIA Triton和TensorRT-LLM部署TTS應用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace
    的頭像 發表于 06-12 15:37 ?1881次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應用的最佳實踐

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機器人仿真參考應用 NVIDIA Isaac Sim 和機器人學習框架 NVIDIA Isaac Lab 的更新,以加速各種形態機器人的
    的頭像 發表于 05-28 10:06 ?2125次閱讀

    芯科科技助力藍牙Mesh設備開發

    藍牙Mesh 1.1是藍牙技術聯盟(Bluetooth SIG)發布的最新標準版本,Silicon Labs(芯科科技)作為開發和實施藍牙Mesh標準的主要貢獻者之一,特別制作了藍牙Mesh開發流程頁面,以幫助開發人員快速了解新
    的頭像 發表于 05-16 13:51 ?1262次閱讀
    芯科科技助力藍牙Mesh設備<b class='flag-5'>開發</b>

    Xilinx Ultrascale系列FPGA的時鐘資源與架構解析

    Ultrascale是賽靈思開發的支持包含步進功能的增強型FPGA架構,相比7系列的28nm工藝,Ultrascale采用20nm的工藝,主要有2個系列:Kintex和Virtex
    的頭像 發表于 04-24 11:29 ?2607次閱讀
    Xilinx Ultrascale<b class='flag-5'>系列</b>FPGA的時鐘<b class='flag-5'>資源</b>與架構解析

    【米爾-全志T536開發板試用體驗】開發資源關鍵要點

    (ENET1/2千兆,ENET3 USB轉百兆)。 六、資源獲取與支持 官方文檔:米爾提供原理圖、PCB源文件(Allegro格式)及預配置Docker開發環境。
    發表于 04-14 23:06

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發

    NVIDIA GTC 推出新一代專業級 GPU 和 AI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的 NVIDIA
    的頭像 發表于 03-28 09:59 ?1302次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發者和企業提供業務就緒型基礎,助力構建能夠獨立工作或以團隊形式完成復雜任務的高級 AI 智能體。
    發表于 03-19 09:31 ?390次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 AI 模型<b class='flag-5'>系列</b>,助力<b class='flag-5'>開發</b>者和企業構建代理式 AI 平臺