国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA RTX AI套件簡化AI驅動的應用開發

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-09-06 14:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 于近日發布NVIDIA RTX AI套件,這一工具和 SDK 集合能夠幫助 Windows 應用開發者定制、優化和部署適用于 Windows 應用的 AI 模型。該套件免費提供,不要求使用者具備 AI 框架和開發工具方面的經驗,并且可以為本地和云端部署提供絕佳的 AI 性能。

生成式預訓練轉換器(GPT)模型的普及為 Windows 開發者創造了將 AI 功能集成到應用中的絕佳機會。但要實現這些功能仍面臨著巨大的挑戰。首先,您需要根據應用的特定需求來定制模型。其次,需要優化模型,使其在適應各種硬件的同時,仍然能夠提供絕佳的性能。之后,需要一條同時適用于云端和本地 AI 的簡便部署路徑。

NVIDIA RTX AI 套件為 Windows 應用開發者提供了端到端工作流。您可以根據應用的特定要求,使用常用的微調技術對 Hugging Face 的預訓練模型進行定制,并將它們量化到適合消費類 PC 的規模。然后,可以對它們進行優化,使其能夠在整個NVIDIA GeForce RTX GPU系列以及云端 NVIDIA GPU 上發揮絕佳性能。

當需要部署時,無論您是選擇將經過優化的模型與應用捆綁在一起,還是在應用安裝/更新時下載模型,亦或是建立一個云微服務,RTX AI 套件都能提供多種途徑來滿足您的應用需求。該套件還包含NVIDIA AI 推理管理器(AIM)SDK,能夠根據用戶的系統配置或當前的工作負載讓應用在本地或云端運行 AI。

適用于各種應用的強大定制 AI

當今的生成式模型在龐大的數據集上訓練而成。整個訓練過程可能需要數周時間,并使用數百顆全球最強大的 GPU。雖然這些計算資源對大多數開發者來說遙不可及,但開源預訓練模型可以讓您獲得強大的 AI 功能。

開源預訓練基礎模型通常在通用數據集上訓練而成,因此在各種任務中都能夠提供不錯的結果。但應用往往需要專門的行為,例如游戲角色需要以特定的方式說話、科學寫作助手需要理解特定行業的術語等。

微調是一種可以根據應用需求,在額外的數據上對預訓練模型進行進一步訓練的技術,例如游戲角色的對話示例。

RTX AI 套件包含NVIDIA AI Workbench等支持微調的工具。今年早些時候發布的 AI Workbench 是一款用于在本地 RTX GPU 和云端中組織并運行模型訓練、調優與優化項目的工具。RTX AI 套件還包含使用 QLoRA 進行微調的 AI Workbench 項目,QLoRA 是當今最常用、效果最好的技術之一。

為了實現參數高效微調,該套件使用 Hugging Face Transformer 庫來充分發揮 QLoRA 的作用,在減少內存使用的同時實現了定制化,而且可以在搭載 RTX GPU 的客戶端設備上高效運行。

微調完成后的下一步是優化。

針對 PC 和云端進行優化

AI 模型優化需要解決兩大難題。首先,PC 用于運行 AI 模型的內存和計算資源有限。其次,PC 和云端之間存在各種具有不同功能的目標硬件。

RTX AI 套件包含以下用于優化 AI 模型并使其作好部署準備的工具。

NVIDIA TensorRT 模型優化器:即使較小的 LLM 也需要 14 GB 或以上的內存。適用于 Windows 的 NVIDIA TensorRT 模型優化器正式發布,它所提供的模型量化工具可在不顯著降低準確性的情況下,將模型規模最多縮小至原來的三分之一。其中的 INT4 AWQ 后訓練量化等方法便于在 RTX GPU 上運行最先進的 LLM。這樣一來,較小的模型不僅可以更加容易地適應典型系統上可用的 GPU 內存,還能通過減少內存帶寬瓶頸來提高性能。

NVIDIA TensorRT Cloud:為了在每個系統上都能獲得絕佳的性能,可以針對每個 GPU 專門優化模型。當前推出的NVIDIA TensorRT Cloud開發者預覽版是一項云服務,用于為 PC 中的 RTX GPU 以及云端中的 GPU 構建經過優化的模型引擎。它還為流行的生成式 AI 模型提供了預構建的減重引擎,這些引擎可與微調的權重合并成優化的引擎。與預訓練模型相比,使用 TensorRT Cloud 構建并使用 TensorRT 運行時運行的引擎可以實現高達 4 倍的性能提升。

優化微調模型后的下一步是部署。

開發一次即可實現隨處部署

如果您的應用能夠在本地或云端執行推理,就能為大多數用戶提供絕佳的體驗。將模型部署在設備上可以實現更低的延遲,并且不需要在運行時調用云,但對硬件有一定的要求。將模型部署在云端則可以支持在任何硬件上運行的應用,但服務提供商需要承擔持續的運營成本。在完成模型開發后,您就可以使用 RTX AI 套件將其部署到任意位置,且該套件中的工具既適用于設備端路徑,也適用于云端路徑,例如:

NVIDIA AI 推理管理器(AIM):當前推出的 AIM 搶先體驗版為 PC 開發者簡化了 AI 集成的復雜性,并且可以在 PC 端和云端無縫協調 AI 推理。NVIDIA AIM 利用必要的 AI 模型、引擎和依賴關系對 PC 環境進行預配置,并支持 GPU、NPU、CPU 等各種不同加速器的所有主要推理后端(TensorRT、ONNX Runtime、GGUF、Pytorch)。它還能執行運行時兼容性檢查,以此確定 PC 是否能在本地運行模型,或者根據開發者策略切換到云端。

借助 NVIDIA AIM,開發者既可以利用NVIDIA NIM在云端進行部署,也可以利用 TensorRT 等工具在本地設備上進行部署。

NVIDIA NIM:NVIDIA NIM 是一套易于使用的微服務,能夠加速云、數據中心和工作站中的生成式 AI 模型部署。NIM 屬于NVIDIA AI Enterprise軟件套裝的一部分。RTX AI 套件提供的工具可將經過優化的模型與其依賴關系打包并上傳至暫存服務器,然后啟動 NIM。這一步將調入經過優化的模型,并創建一個端點供應用調用。

您還可以使用 NVIDIA AI 推理管理器(AIM)插件在設備上部署模型,有助于管理本地和云推理的細節,減輕開發者的集成負擔。

NVIDIA TensorRT:NVIDIA TensorRT 10.0和TensorRT-LLM推理后端為配備張量核的 NVIDIA GPU 提供同類產品中的最佳性能。新發布的 TensorRT 10.0 簡化了將 AI 模型部署到 Windows 應用中的流程。減重引擎可壓縮 99% 以上的已編譯引擎大小,因此可直接在終端用戶設備上使用模型權重對其進行重新調整。此外,TensorRT 還為 AI 模型提供軟硬件前向兼容性,使其能與較新的運行時或硬件配合使用。TensorRT-LLM 加入了在 RTX GPU 上加速生成式 AI LLM 和 SLM 的專門優化措施,可進一步加速 LLM 推理。

?這些工具使開發者能夠在應用運行時準備好模型。

RTX AI 加速生態系統

包括 Adobe、Blackmagic Design、Topaz Labs 等在內的頂尖創意獨立軟件開發商(ISV)正在將 NVIDIA RTX AI 套件集成到他們的應用中,以提供在 RTX PC 上運行的 AI 加速應用,從而提升數百萬創作者的用戶體驗。

如果您想要在 RTX PC 上構建基于 RAG 和智能體的加速工作流,可以通過 LangChain 和 LlamaIndex 等開發者框架獲得 RTX AI 套件的功能和組件(如 TensorRT-LLM)。此外,常用的生態系統工具(如 Automatic1111、Comfy.UI、Jan.AI、OobaBooga 和 Sanctum.AI)也可通過 RTX AI 套件實現加速。通過這些集成,您可以輕松構建經過優化的 AI 加速應用,將其部署到設備和云端 GPU 上,并在應用中實現能夠在各種本地和云環境中運行推理的混合功能。

將強大的 AI

加入到 Windows 應用中

NVIDIA RTX AI 套件為 Windows 應用開發者提供了一套端到端工作流,使他們能夠充分利用預訓練模型,對這些模型進行定制和優化,并將它們部署到本地或云端運行。借助快速、強大的混合 AI,由 AI 驅動的應用既能夠快速擴展,又能在各個系統上提供絕佳的性能。RTX AI 套件使您能夠為更多用戶帶來更多由 AI 驅動的功能,讓用戶在游戲、生產、內容創建等所有活動中都能享受到 AI 所帶來的好處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109758
  • WINDOWS
    +關注

    關注

    4

    文章

    3702

    瀏覽量

    94057
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301454
  • 應用開發
    +關注

    關注

    0

    文章

    63

    瀏覽量

    9965

原文標題:借助適用于 Windows RTX PC 的 NVIDIA RTX AI 套件簡化 AI 驅動的應用開發

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI端側部署開發(SC171開發套件V2-FAS)

    AI端側部署開發(SC171開發套件V2-FAS) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉化指南 27分19秒 https
    發表于 02-11 11:44

    AI端側部署開發(SC171開發套件V3)2026版

    AI端側部署開發(SC171開發套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉化指南 27分19秒 http
    發表于 01-15 10:31

    生命科學領先企業采用 NVIDIA BioNeMo 平臺加速 AI 驅動的藥物研發

    —— NVIDIA 近日宣布對 NVIDIA BioNeMo? 進行重大擴展, 將通過一個開放式開發平臺支持實現實驗室閉環(lab-in-the-loop)工作流,以推動 AI
    的頭像 發表于 01-14 11:40 ?476次閱讀
    生命科學領先企業采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平臺加速 <b class='flag-5'>AI</b> <b class='flag-5'>驅動</b>的藥物研發

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發

    NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助 NVIDIA Omniverse 庫和 Co
    的頭像 發表于 12-01 09:25 ?1140次閱讀

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應用正在使用 AI 加速,而無論工作站的大小或形態如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新
    的頭像 發表于 11-28 09:39 ?6326次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> PRO 2000 Blackwell GPU性能測試

    MediaTek攜手NVIDIA開啟個人AI算力新紀元

    Spark 助力開發者能在本地端對大型 AI 模型進行原型設計(Prototype)、微調(Fine-tune)和推理(Inference)。NVIDIA DGX Spark 將于 10 月 15 日上市,將
    的頭像 發表于 10-16 11:26 ?772次閱讀

    NVIDIA DRIVE AGX Thor開發套件重磅發布

    這款由 NVIDIA DriveOS 7 驅動開發套件能夠幫助開發者們打造出更安全的智能汽車和交通解決方案。
    的頭像 發表于 09-04 11:20 ?1386次閱讀

    NVIDIA Jetson AGX Thor開發套件概述

    NVIDIA Jetson AGX Thor 開發套件為您提供出色的性能和可擴展性。它由 NVIDIA Blackwell GPU和128 GB 顯存提供動力支持,提供高達 2070
    的頭像 發表于 08-11 15:03 ?1906次閱讀

    NVIDIA RTX AI加速FLUX.1 Kontext現已開放下載

    NVIDIA RTXNVIDIA TensorRT 現已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現可借助 RTX
    的頭像 發表于 07-16 09:16 ?2055次閱讀

    制作團隊如何借助NVIDIA RTX AI讓創意成真

    藝術家和開發者已經在利用生成式 AI 簡化工作、突破創意邊界,無論是探索概念、設計虛擬世界還是構建智能應用。借助 RTX AI PC,用戶能
    的頭像 發表于 07-09 16:28 ?813次閱讀

    NVIDIA技術助力企業創建主權AI智能體

    AI Factory 的經驗證設計將加速基礎設施與軟件(包括全新 NVIDIA NIM 微服務和經擴展的 NVIDIA Blueprint)相結合,為各國和企業簡化了全棧式
    的頭像 發表于 06-16 14:28 ?1350次閱讀

    NVIDIA計劃打造全球首個工業AI云平臺

    NVIDIA 宣布,其正在為歐洲制造商構建全球首個工業 AI 云。這家總部位于德國的 AI 工廠將配備 1 萬個 GPU,包括通過 NVIDIA DGX B200 系統 和
    的頭像 發表于 06-16 14:17 ?1436次閱讀

    AI端側部署開發(SC171開發套件V3)

    AI端側部署開發(SC171開發套件V3) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉化指南------Docker Desk
    發表于 04-16 18:30

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    的自有模型移植,使首字詞生態速度比云端方案提升70%,賦能絕影多模態智能座艙強大的端側運行能力,讓汽車擁有“有趣的靈魂”。 不僅如此,天璣AI開發套件已經接入NVIDIA TAO生態圈,實現TAO
    發表于 04-13 19:52

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發

    NVIDIA GTC 推出新一代專業級 GPU 和 AI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX
    的頭像 發表于 03-28 09:59 ?1307次閱讀