国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力阿里巴巴天貓精靈大幅提升服務運行效率

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-07-14 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

天貓精靈智能引擎團隊、智能合成團隊與 NVIDIA 團隊合作,通過利用 NVIDIA TensorRT 加速流式語音合成(Text-to-Speech,以下簡稱 TTS)深度學習模型,并借助 NVIDIA Triton 推理服務器在 NVIDIA T4 GPU 上進行高效部署,幫助阿里巴巴天貓精靈流式 TTS 服務將吞吐提升 50%,首包延時降低 35%,大幅提升服務運行效率,提升資源利用率。

天貓精靈(Tmall Genie)是阿里巴巴消費者人工智能一級公司,于 2017 年 9 月發布第一代天貓精靈智能終端 X1。讓用戶以自然語言對話的交互方式,實現影音娛樂、購物、信息查詢、生活服務等功能操作,成為消費者的家庭助手。目前,天貓精靈已經服務超過 3000 萬中國家庭,在三方權威統計中不僅智能音箱產品出貨量排名中國前列,其產品并已可連接 3 億以上的家庭 AIoT 生態設備。

除了智能音箱終端產品外,天貓精靈推出 AliGenie 開放平臺,旨在構建基于 AI 的多模態交互及服務系統,為多種云應用提供跨系統服務能力,實現端云協同、跨平臺多終端快速接入。該開放平臺提供高性能且高質量的語音 AI 能力,包括多種不同音色的高度擬人、高度流暢的語音合成算法等。

此外,天貓精靈基于 AliGenie 開放平臺,還提供基于芯片/模組的硬件解決方案,以及通用的熱門行業解決方案。專注生活多個領域,提供一站式解決方案。

本案例中負責實施的是天貓精靈智能引擎團隊以及天貓精靈智能合成團隊。天貓精靈智能合成團隊負責語音合成等生成式算法的研究及開發;天貓精靈智能引擎團隊主要支撐天貓精靈業務線各項業務的工程化落地,如語音識別、語義理解、語音合成、圖像處理等 AI 核心場景。

流式 TTS 是天貓精靈工作流中最為重要的 AI 環節之一。在這一場景中,天貓精靈智能引擎團隊面臨著如下挑戰:

首先流式 TTS 對于首包延時有著嚴格要求,否則用戶將會因為較長的反饋遲滯而感到不適,這就要求 TTS 工作管線的每個模塊的推理能夠高效地執行。

另一方面,團隊希望 TTS 服務的吞吐能夠達到較高水平,這就需要在服務端對收到的多個流式合成請求進行 Batching 的處理。但流式 TTS 工作管線包含聲學模型和聲碼器等多個模塊,在 GPU 上進行 Batching 操作需要正確維護和切換每個合成請求所需的模型狀態,因此需要特別設計工作管線和調度邏輯。

最后,如何盡可能提升 GPU 資源利用率是降本增效的關鍵。最直接的思路便是在一張 GPU 上部署多個模型來提升利用率。因此,如何在同一張 GPU 上對多個模型進行高效的調度和管理也成為了一個挑戰。

基于以上挑戰,天貓精靈智能引擎團隊、智能合成團隊與 NVIDIA 解決方案架構團隊合作,采用NVIDIA TensorRT對模型進行推理加速,并利用NVIDIA Triton 推理服務器在 T4 GPU 上進行在線部署,形成了一套高效的流式 TTS 推理部署方案。在提升用戶體驗的同時,大幅降低了服務成本。

首先,該方案使用 TensorRT 對流式 TTS 工作管線中的每一個模型進行優化加速。我們將訓練好的聲學模型和聲碼器,導出為 ONNX 模型格式,再使用 TensorRT 將 ONNX 模型轉換為最優化的 TensorRT Engine。使用 TensorRT 加速的 TTS 模型,能顯著提升推理執行的速度,從而盡可能壓縮首包延時。

另一方面,天貓精靈智能引擎團隊與 NVIDIA 團隊合作設計并實現了一種基于 Triton 的流式 TTS 推理部署管線。在該方案中,我們使用 Triton Custom Backend 實現串聯 TTS 各個模型的調度管線。對于管線中的每一步推理處理,會調用部署在 Triton 上的 TTS TensorRT Engine。如此一來,Triton 便可將發送到服務端的 TTS 請求,有條不紊地調度到管線中的每個模塊進行推理執行。并且,在該管線中,我們實現了適用于 GPU 平臺的流式 TTS 高效調度機制,通過在服務端 Custom Backend 中維護每個合成請求的狀態,實時地將模型輸入和狀態動態聚合為對 GPU 友好的 Batch,交由管線中各個模塊的 TensorRT Engine 進行推理,從而大幅提升管線吞吐和 GPU 利用率,同時保證了對每個合成請求的快速響應。此外,流式 TTS 中一句話的合成請求會對應多個回包,每個回包承載一個音頻塊。針對這種一收多發的推理模式,我們利用 Triton 提供的 Decoupled Responses 機制,保證一個請求的多個回包能夠正確高效地發送給對應的客戶端,使用戶能聽到完整且流暢的音頻。

最后,為了進一步提升 GPU 資源利用率,該方案利用了 Triton 的 Concurrent Model Execution 特性。該特性將部署在 Triton 上的模型或模塊,以模型實例的方式管理:一個模型可以部署多個實例,不同模型的實例也可部署在同一GPU上。因此該方案開啟了 Concurrent Model Execution 后,同一個 T4 GPU 上可部署多個 TTS 發音模型,使得多個模型實例的推理在 GPU 算力資源充足時可以達到并行執行。如此一來,GPU 算力資源可以被多個模型的并行執行充分利用起來,達到降本增效的目的。

通過使用基于 NVIDIA TensorRT 和 Triton 推理服務器的流式 TTS 推理部署方案,天貓精靈 TTS 服務的吞吐提升約 50%,首包延時降低約 35% ,幫助天貓精靈節省了業務成本,提升了用戶體驗。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109715
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1647

    瀏覽量

    49190
  • TTS
    TTS
    +關注

    關注

    0

    文章

    62

    瀏覽量

    11546
  • 天貓精靈
    +關注

    關注

    5

    文章

    96

    瀏覽量

    12150

原文標題:NVIDIA TensorRT 和 Triton 助力阿里巴巴天貓精靈顯著提升流式語音合成服務運行效率

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    海外電商平臺阿里巴巴國際站獲取商品詳情的API接口

    ? 在跨境電商領域,阿里巴巴國際站(Alibaba.com)是一個領先的平臺,為企業提供全球貿易服務。其API接口允許開發者通過編程方式獲取商品詳情,便于構建自動化工具或集成到第三方系統。本文將
    的頭像 發表于 11-14 15:36 ?472次閱讀
    海外電商平臺<b class='flag-5'>阿里巴巴</b>國際站獲取商品詳情的API接口

    萬豪國際集團與阿里巴巴達成AI時代戰略合作 升級賓客旅行體驗

    杭州2025年11月11日 /美通社/ -- 萬豪國際集團日近日宣布與阿里巴巴集團達成AI時代戰略合作伙伴關系,雙方將在中國市場圍繞云基礎設施、AI應用創新等領域深度合作,為賓客創造個性化、高品質
    的頭像 發表于 11-11 22:47 ?224次閱讀
    萬豪國際集團與<b class='flag-5'>阿里巴巴</b>達成AI時代戰略合作 升級賓客旅行體驗

    【 藍牙模組】安信可模組TG-12F/TG-01M:AT指令入門教程 &amp;接入阿里飛燕/貓精靈平臺

    是小寫的MAC地址) 3.6數據上報下發 四、接入 貓精靈平臺 五、相關資料 01、產品介紹 TG-12F/TG-01M模塊采用貓精靈TG7100C芯片,TG7100C 是智能新一
    的頭像 發表于 10-23 10:15 ?807次閱讀
    【 藍牙模組】安信可模組TG-12F/TG-01M:AT指令入門教程 &amp;接入<b class='flag-5'>阿里</b>飛燕/<b class='flag-5'>天</b><b class='flag-5'>貓精靈</b>平臺

    阿里巴巴開放平臺關鍵字搜索商品接口實戰詳解:OAuth2.0 認證落地 + 檢索效率優化(附避坑代碼)

    在 B2B 電商數據對接中,阿里巴巴開放平臺的關鍵字搜索商品接口(alibaba.aliindex.search)是獲取批發商品、供應商數據的核心通道。但多數開發者會卡在OAuth2.0 認證斷連
    的頭像 發表于 09-16 16:26 ?941次閱讀

    博世與阿里巴巴集團深化戰略合作

    9月2日,全球領先的汽車技術與服務商博世與阿里巴巴集團宣布深化戰略合作伙伴關系,以先進的云計算與人工智能技術加速推動企業數字化轉型。雙方將重點聚焦云端驅動的企業運營、AI賦能的業務創新,以及電商領域的拓展。
    的頭像 發表于 09-02 16:09 ?679次閱讀

    中國電信與阿里簽署戰略合作協議 發力云和AI基礎設施

    煌妹代表雙方簽訂協議。 據悉,中國電信與阿里巴巴將在云和AI基礎設施、新型服務業電商、社會價值創新等領域展開深入合作。 ?
    的頭像 發表于 08-31 20:16 ?1242次閱讀

    探訪阿里巴巴展廳合作的無人超市:如何讓結賬速度提升300%

    在傳統超市里,排隊結賬往往是一場“耐力考驗”——高峰期平均等待時間超過15分鐘,收銀員掃碼失誤引發的糾紛屢見不鮮。但在阿里巴巴展廳合作的遠景達無人超市,這個數字被徹底改寫:消費者從選品到離店僅需15
    的頭像 發表于 07-13 00:00 ?851次閱讀
    探訪<b class='flag-5'>阿里巴巴</b>展廳合作的無人超市:如何讓結賬速度<b class='flag-5'>提升</b>300%

    阿里2025財年業績:凈利潤大漲77%,AI+云業務攬下千億收入

    。 ? 圖:阿里巴巴2025財年年報 ? 阿里巴巴的業務包括淘集團、阿里國際數字商業集團、云智能集團、菜鳥集團、本地生活集團、虎鯨文娛集團及其他相關業務。2025財年,電商、“AI+
    的頭像 發表于 06-28 00:10 ?8519次閱讀
    <b class='flag-5'>阿里</b>2025財年業績:凈利潤大漲77%,AI+云業務攬下千億收入

    全球各大品牌利用NVIDIA AI技術提升運營效率

    歐萊雅、LVMH 集團和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產品設計、營銷及物流等方面的運營效率
    的頭像 發表于 06-19 14:36 ?1200次閱讀

    壁仞科技完成阿里巴巴通義千問Qwen3全系列模型支持

    4月29日,阿里巴巴通義千問發布并開源8款新版Qwen3系列“混合推理模型”(簡稱“Qwen3”)。Qwen3發布后數小時內,壁仞科技完成全系列支持,并率先在壁仞科技開發者云平臺上線。 性能卓越
    的頭像 發表于 04-30 15:19 ?1582次閱讀

    普華基礎軟件蒞臨阿里巴巴達摩院調研交流

    近日, 普華基礎軟件股份有限公司(以下簡稱普華基礎軟件)董事、總經理劉宏倩一行前往阿里巴巴達摩院(杭州)科技有限公司(以下簡稱達摩院)調研交流,阿里巴巴集團高層及達摩院核心團隊參與了本次調研交流活動
    的頭像 發表于 04-08 10:10 ?1131次閱讀

    “RdbStore”上線開源鴻蒙社區 助力鴻蒙應用數據訪問效率大幅提升

    、品質調優、全鏈路運維等,能夠有效提升應用啟動和訪問速度,助力應用高效開發和性能提升。 性能強大:數據訪問和初始化耗時大幅優化 在應用開發過程中,數據訪問的
    的頭像 發表于 03-18 15:02 ?685次閱讀

    阿里云是什么?企業不可不知的云端架構服務

    阿里云是什么?中國高速連線阿里云 CDN 服務 阿里云為國內云端市場中市占有率第一的云平臺,由阿里巴巴集團自主研發,在國內使用的線路品質穩定
    的頭像 發表于 03-16 09:43 ?1643次閱讀

    阿里云爆發式的跨越

    表示,阿里巴巴與蘋果的合作,將不僅僅局限于手機服務領域,未來還將涉及更多的業務板塊。 當媒體都在驚嘆與討論蘋果為什么選擇阿里巴巴時,背后真正的主角還需要加上一個 “云” 字。 長期以來,相比淘寶、
    的頭像 發表于 03-12 16:54 ?787次閱讀
    <b class='flag-5'>阿里</b>云爆發式的跨越

    Arm與阿里巴巴合作加速端側多模態AI體驗

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)近日發布與阿里巴巴集團輕量級深度學習框架 MNN 的又一新合作。
    的頭像 發表于 03-10 09:07 ?1217次閱讀