国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Riva用于AI應用程序的GPU加速SDK

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-02 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語音人工智能用于各種應用,包括授權人工智能的呼叫中心、虛擬助理的語音接口以及視頻會議中的實時字幕。語音人工智能包括自動語音識別( ASR )和文本語音轉換( TTS )。 ASR 管道接收原始音頻并將其轉換為文本, TTS 管道接收文本并將其轉換為音頻。

開發和運行這些實時語音人工智能服務是一項復雜而艱巨的任務。構建語音 AI 應用程序需要數十萬小時的音頻數據、基于特定用例構建和自定義模型的工具,以及可擴展的部署支持。它還意味著實時運行,與用戶進行自然交互的時間遠低于 300 毫秒。 NVIDIA Riva 簡化了開發語音 AI 服務的端到端流程,并為類人交互提供實時性能。

Riva SDK

NVIDIA Riva 是用于開發語音 AI 應用程序的 GPU 加速 SDK 。 Riva 旨在幫助您輕松快速地訪問對話 AI 功能。只需幾個命令,您就可以通過 API 操作訪問高性能服務并嘗試演示。

Diagram shows workflow starting from pretrained models in NGC, TAO toolkit for retraining the models and Riva for optimized speech AI skills to generate high-performance inference.

圖 1 . Riva 構建語音應用程序的工作流

Riva SDK 包括 pretrained speech and language models 、 NVIDIA TAO Toolkit ,用于在自定義數據集上微調這些模型,以及用于語音識別、語言理解和語音合成的優化端到端技能。

使用 Riva ,您可以輕松地對數據上的最新模型進行微調,以更深入地了解其特定上下文。優化推理以提供運行時間為 150 毫秒( ms )的實時服務,而在 CPU 純平臺上需要 25 秒。

特定于任務的 AI 服務和 gRPC 端點提供現成的高性能 ASR 、 NLP 和 TTS 。所有這些人工智能服務都經過數千小時的公共和內部數據集培訓,以達到高精度。您可以開始使用預訓練的模型,或者使用自己的數據集對其進行微調,以進一步提高模型性能。

Riva 使用 NVIDIA Triton Inference Server 為多個模型提供服務,以實現高效、穩健的資源分配,并在高吞吐量、低延遲和高精度方面實現高性能。

Riva 技能概述

Riva 為實時轉錄和虛擬助理等用例提供高度優化的語音識別和語音合成服務。語音識別技能在各種真實世界、特定領域的數據集上進行培訓和評估。它包括來自電信、播客和醫療保健的詞匯,以在生產用例中提供世界級的準確性。

與 NVIDIA V100 GPU 上的 Tacotron 2 和 WaveGlow 模型相比, Riva 文本到語音或語音合成技能可生成類似人類的語音,并使用非自回歸模型在 NVIDIA A100 GPU 上提供 12 倍的性能。此外,該服務使您能夠為每個品牌和虛擬助理創建一個自然定制的聲音,每天 30 分鐘的演員數據。

Diagram shows capabilities in Riva Speech Recognition and Speech Synthesis services such as support for both batch and streaming mode, multiple sampling rates (8,16,22,32, 44, 48 kHz), and models such as Jasper, QuartzNet, CitriNet, Tacotron2, WaveGlow, Fastpitch, and HiFiGAN.

圖 2 . Riva 服務能力

為了充分利用 GPU 的計算能力, Riva 基于 NVIDIA Triton 推理服務器,為神經網絡和集成管道提供服務,以便與 NVIDIA TensorRT 高效運行。

Riva 服務通過 gRPC 端點可訪問的 API 操作公開,這些操作隱藏了所有復雜性。圖 3 顯示了系統的服務器端。 gRPC API 操作由運行在 Docker 容器中的 API 服務器公開。他們負責處理所有語音和 NLP 傳入和傳出數據。

Diagram shows the Riva client applications such as desktop, mobile, and laptop interactions with Riva speech recognition and speech synthesis pipelines.

圖 3 . Riva 服務管線

API 服務器向 NVIDIA Triton 發送推斷請求并接收結果。

NVIDIA Triton 是后端服務器,可同時處理多個 GPU 上的多個神經網絡或集成管道的多個推理請求。

對于會話 AI 應用程序,將延遲保持在給定閾值以下至關重要。這種延遲要求轉化為推斷請求一到達就執行。要使 GPU 飽和并提高性能,必須增加批大小并延遲推理執行,直到收到更多請求并形成更大的批。

NVIDIA Triton 還負責在一個請求和另一個請求之間切換網絡的上下文。

Riva 可以通過從 NGC 下載適當的模型和容器的簡單腳本直接安裝在裸機上,也可以通過 Helm chart 將其部署在 Kubernetes 上。

下面簡要介紹一下如何與 Python 交互。 Riva 接口通過簡單的 Python API 操作,使客戶端與 Riva 服務器的通信更加容易。例如,下面介紹如何通過三個步驟創建對現有 TTS Riva 服務的請求。

首先,導入 Riva API :

import src.riva_proto.riva_tts_pb2 as rtts
import src.riva_proto.riva_tts_pb2_grpc as rtts_srv
import src.riva_proto.riva_audio_pb2 as ri

接下來,創建到 Riva 端點的 gRPC 通道:

channel = grpc.insecure_channel('localhost:50051')
riva_tts = rtts_srv.RivaSpeechSynthesisStub(channel)

然后,創建一個 TTS 請求:

req = rtts.SynthesizeSpeechRequest()
req.text = "We know what we are, but not what we may be?"
req.language_code = "en-US" req.encoding = ri.AudioEncoding.LINEAR_PCM req.sample_rate_hz = 22050 req.voice_name = "ljspeech" resp = riva_tts.Synthesize(req)
audio_samples = np.frombuffer(resp.audio, dtype=np.float32)

使用數據自定義模型

使用 NVIDIA TAO Toolkit ,您可以在 Riva 中使用定制的訓練模型(圖 4 )。 NVIDIA TAO Toolkit 是一種無編碼工具,用于在特定于域的數據集上微調模型。

圖 4 。 NVIDIA TAO 工具包管道

例如,要進一步提高 ASR 轉錄文本的易讀性和準確性,請向 ASR 系統添加自定義標點符號和大小寫模型,以生成沒有這些特征的文本。

從預訓練的 BERT 模型開始,第一步是準備數據集。對于培訓數據集中的每個單詞,目標是預測以下內容:

單詞后面的標點符號。

這個詞是否應該大寫。

數據集準備就緒后,下一步是通過運行先前提供的腳本進行培訓。完成培訓并達到所需的最終精度后,使用附帶的腳本為 NVIDIA Triton 創建模型存儲庫。

NVIDIA Riva Speech Skills 文檔包含有關如何訓練或微調其他模型的更多詳細信息。這篇文章只展示了使用 TAO 工具包進行定制的眾多可能性中的一種。

在 Riva 中部署模型

Riva 是為大規模對話 AI 而設計的。為了幫助您在不同的服務器上高效、可靠地為模型提供服務, NVIDIA 使用 Helm 圖表提供了按鈕式模型部署(圖 5 )。

Diagram shows the workflow for deploying TAO model as a Riva skill and highlights the TensorRT optimizations and Triton Inference Server under the hood.

圖 5 。通過修改可用的舵圖,可以在 Riva 中部署模型

NGC catalog 中提供的舵圖配置可以針對自定義用例進行修改。您可以更改與要部署的模型、存儲它們的位置以及如何公開服務相關的設置。

結論

Riva 是 NVIDIA Developer Program 成員的公開測試版。對于您的實時轉錄、虛擬助理或自定義語音實現, Riva 將支持您的開發。如果您正在大規模部署, Riva Enterprise 將為您大規模部署,并包括 AI 專家的支持。

關于作者

Davide Onofrio 是 NVIDIA 的高級深度學習軟件技術營銷工程師。他在 NVIDIA 專注于深度學習技術開發人員關注內容的開發和演示。戴維德在生物特征識別、虛擬現實和汽車行業擔任計算機視覺機器學習工程師已有多年經驗。他的教育背景包括米蘭理工學院的信號處理博士學位。

Vinh Nguyen 是一位深度學習的工程師和數據科學家,發表了 50 多篇科學文章,引文超過 2500 篇。在 NVIDIA ,他的工作涉及廣泛的深度學習和人工智能應用,包括語音、語言和視覺處理以及推薦系統。

Siddharth Sharma 是NVIDIA 加速計算的高級技術營銷經理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產品營銷經理,與汽車和航空航天公司密切合作,采用基于模型的設計來創建控制軟件。

Alex Qi 是英偉達 AI 軟件集團的產品經理。她的重點是對話 AI 框架( Riva )和多媒體流 AI / ML ( Maxine )的 AI 軟件和應用程序。在加入 NVIDIA 之前,她在領導技術和工程組織中各種角色的具有挑戰性的技術項目方面擁有豐富的經驗,如數據科學家、計算建模和設計工程。 Alex 擁有麻省理工學院的雙學位碩士學位:麻省理工學院斯隆管理學院的 MBA 學位,以及工程機械工程學院的理學碩士學位,她在該學院主要研究機器人技術和人工智能。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5598

    瀏覽量

    109803
  • 服務器
    +關注

    關注

    14

    文章

    10261

    瀏覽量

    91526
  • 人工智能
    +關注

    關注

    1817

    文章

    50105

    瀏覽量

    265551
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產品,其各項核心指標均針對 GPU 加速工作流的
    的頭像 發表于 01-06 09:51 ?2424次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發

    NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助 NVID
    的頭像 發表于 12-01 09:25 ?1155次閱讀

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應用正在使用 AI 加速,而無論工作站的大小或形態如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新
    的頭像 發表于 11-28 09:39 ?6355次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA Isaac Lab多GPU多節點訓練指南

    NVIDIA Isaac Lab 是一個適用于機器人學習的開源統一框架,基于 NVIDIA Isaac Sim 開發,其模塊化高保真仿真適用于各種訓練環境,可提供各種物理
    的頭像 發表于 09-23 17:15 ?2422次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節點訓練指南

    NVIDIA桌面GPU系列擴展新產品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發表于 08-18 11:50 ?1433次閱讀

    NVIDIA Jetson + Isaac SDK 在人形機器人領域的方案詳解

    組件 描述 硬件平臺(Jetson系列) 面向邊緣AI和機器人開發的SoC模塊,搭載GPU + ARM CPU,支持多種傳感器和AI模型部署 軟件平臺(Isaac SDK / Isa
    的頭像 發表于 07-30 16:05 ?3634次閱讀

    NVIDIA全棧加速代理式AI應用落地

    在近期舉辦的 AWS 中國峰會上,NVIDIA 聚焦于“NVIDIA 全棧加速代理式 AI 應用落地”,深入探討了代理式 AI (Agent
    的頭像 發表于 07-14 11:41 ?1330次閱讀

    NVIDIA計劃打造全球首個工業AI云平臺

    NVIDIA 宣布,其正在為歐洲制造商構建全球首個工業 AI 云。這家總部位于德國的 AI 工廠將配備 1 萬個 GPU,包括通過 NVIDIA
    的頭像 發表于 06-16 14:17 ?1446次閱讀

    NVIDIA攜手諾和諾德借助AI加速藥物研發

    NVIDIA 宣布與諾和諾德開展合作,借助創新 AI 應用加速藥物研發。此次合作也將支持諾和諾德與丹麥 AI 創新中心 (DCAI) 關于使用 Gefion
    的頭像 發表于 06-12 15:49 ?1288次閱讀

    NVIDIA攜手微軟加速代理式AI發展

    代理式 AI 正在重新定義科學探索,推動各行各業的研究突破和創新發展。NVIDIA 和微軟正通過深化合作提供先進的技術,從云到 PC 加速代理式 AI 應用的發展。
    的頭像 發表于 05-27 14:03 ?1056次閱讀

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術可在虛擬桌面基礎設施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬化環境中的 AI 驅動工作負載提供
    的頭像 發表于 04-07 11:28 ?1444次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發

    NVIDIA GTC 推出新一代專業級 GPUAI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的
    的頭像 發表于 03-28 09:59 ?1312次閱讀

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業加速代理式AI推理

    Oracle 數據庫與 NVIDIA AI 相集成,使企業能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的頭像 發表于 03-21 12:01 ?1448次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b>推理

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    Triton 推理服務器的后續產品,NVIDIA Dynamo 是一款全新的 AI 推理服務軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協調并
    的頭像 發表于 03-20 15:03 ?1278次閱讀

    Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務首
    發表于 03-19 15:24 ?580次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理