伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力阿里巴巴天貓精靈大幅提升服務(wù)運(yùn)行效率

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-07-14 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

天貓精靈智能引擎團(tuán)隊(duì)、智能合成團(tuán)隊(duì)與 NVIDIA 團(tuán)隊(duì)合作,通過(guò)利用 NVIDIA TensorRT 加速流式語(yǔ)音合成(Text-to-Speech,以下簡(jiǎn)稱 TTS)深度學(xué)習(xí)模型,并借助 NVIDIA Triton 推理服務(wù)器在 NVIDIA T4 GPU 上進(jìn)行高效部署,幫助阿里巴巴天貓精靈流式 TTS 服務(wù)將吞吐提升 50%,首包延時(shí)降低 35%,大幅提升服務(wù)運(yùn)行效率,提升資源利用率。

天貓精靈(Tmall Genie)是阿里巴巴消費(fèi)者人工智能一級(jí)公司,于 2017 年 9 月發(fā)布第一代天貓精靈智能終端 X1。讓用戶以自然語(yǔ)言對(duì)話的交互方式,實(shí)現(xiàn)影音娛樂(lè)、購(gòu)物、信息查詢、生活服務(wù)等功能操作,成為消費(fèi)者的家庭助手。目前,天貓精靈已經(jīng)服務(wù)超過(guò) 3000 萬(wàn)中國(guó)家庭,在三方權(quán)威統(tǒng)計(jì)中不僅智能音箱產(chǎn)品出貨量排名中國(guó)前列,其產(chǎn)品并已可連接 3 億以上的家庭 AIoT 生態(tài)設(shè)備。

除了智能音箱終端產(chǎn)品外,天貓精靈推出 AliGenie 開(kāi)放平臺(tái),旨在構(gòu)建基于 AI 的多模態(tài)交互及服務(wù)系統(tǒng),為多種云應(yīng)用提供跨系統(tǒng)服務(wù)能力,實(shí)現(xiàn)端云協(xié)同、跨平臺(tái)多終端快速接入。該開(kāi)放平臺(tái)提供高性能且高質(zhì)量的語(yǔ)音 AI 能力,包括多種不同音色的高度擬人、高度流暢的語(yǔ)音合成算法等。

此外,天貓精靈基于 AliGenie 開(kāi)放平臺(tái),還提供基于芯片/模組的硬件解決方案,以及通用的熱門(mén)行業(yè)解決方案。專注生活多個(gè)領(lǐng)域,提供一站式解決方案。

本案例中負(fù)責(zé)實(shí)施的是天貓精靈智能引擎團(tuán)隊(duì)以及天貓精靈智能合成團(tuán)隊(duì)。天貓精靈智能合成團(tuán)隊(duì)負(fù)責(zé)語(yǔ)音合成等生成式算法的研究及開(kāi)發(fā);天貓精靈智能引擎團(tuán)隊(duì)主要支撐天貓精靈業(yè)務(wù)線各項(xiàng)業(yè)務(wù)的工程化落地,如語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成、圖像處理等 AI 核心場(chǎng)景。

流式 TTS 是天貓精靈工作流中最為重要的 AI 環(huán)節(jié)之一。在這一場(chǎng)景中,天貓精靈智能引擎團(tuán)隊(duì)面臨著如下挑戰(zhàn):

首先流式 TTS 對(duì)于首包延時(shí)有著嚴(yán)格要求,否則用戶將會(huì)因?yàn)檩^長(zhǎng)的反饋遲滯而感到不適,這就要求 TTS 工作管線的每個(gè)模塊的推理能夠高效地執(zhí)行。

另一方面,團(tuán)隊(duì)希望 TTS 服務(wù)的吞吐能夠達(dá)到較高水平,這就需要在服務(wù)端對(duì)收到的多個(gè)流式合成請(qǐng)求進(jìn)行 Batching 的處理。但流式 TTS 工作管線包含聲學(xué)模型和聲碼器等多個(gè)模塊,在 GPU 上進(jìn)行 Batching 操作需要正確維護(hù)和切換每個(gè)合成請(qǐng)求所需的模型狀態(tài),因此需要特別設(shè)計(jì)工作管線和調(diào)度邏輯。

最后,如何盡可能提升 GPU 資源利用率是降本增效的關(guān)鍵。最直接的思路便是在一張 GPU 上部署多個(gè)模型來(lái)提升利用率。因此,如何在同一張 GPU 上對(duì)多個(gè)模型進(jìn)行高效的調(diào)度和管理也成為了一個(gè)挑戰(zhàn)。

基于以上挑戰(zhàn),天貓精靈智能引擎團(tuán)隊(duì)、智能合成團(tuán)隊(duì)與 NVIDIA 解決方案架構(gòu)團(tuán)隊(duì)合作,采用NVIDIA TensorRT對(duì)模型進(jìn)行推理加速,并利用NVIDIA Triton 推理服務(wù)器在 T4 GPU 上進(jìn)行在線部署,形成了一套高效的流式 TTS 推理部署方案。在提升用戶體驗(yàn)的同時(shí),大幅降低了服務(wù)成本。

首先,該方案使用 TensorRT 對(duì)流式 TTS 工作管線中的每一個(gè)模型進(jìn)行優(yōu)化加速。我們將訓(xùn)練好的聲學(xué)模型和聲碼器,導(dǎo)出為 ONNX 模型格式,再使用 TensorRT 將 ONNX 模型轉(zhuǎn)換為最優(yōu)化的 TensorRT Engine。使用 TensorRT 加速的 TTS 模型,能顯著提升推理執(zhí)行的速度,從而盡可能壓縮首包延時(shí)。

另一方面,天貓精靈智能引擎團(tuán)隊(duì)與 NVIDIA 團(tuán)隊(duì)合作設(shè)計(jì)并實(shí)現(xiàn)了一種基于 Triton 的流式 TTS 推理部署管線。在該方案中,我們使用 Triton Custom Backend 實(shí)現(xiàn)串聯(lián) TTS 各個(gè)模型的調(diào)度管線。對(duì)于管線中的每一步推理處理,會(huì)調(diào)用部署在 Triton 上的 TTS TensorRT Engine。如此一來(lái),Triton 便可將發(fā)送到服務(wù)端的 TTS 請(qǐng)求,有條不紊地調(diào)度到管線中的每個(gè)模塊進(jìn)行推理執(zhí)行。并且,在該管線中,我們實(shí)現(xiàn)了適用于 GPU 平臺(tái)的流式 TTS 高效調(diào)度機(jī)制,通過(guò)在服務(wù)端 Custom Backend 中維護(hù)每個(gè)合成請(qǐng)求的狀態(tài),實(shí)時(shí)地將模型輸入和狀態(tài)動(dòng)態(tài)聚合為對(duì) GPU 友好的 Batch,交由管線中各個(gè)模塊的 TensorRT Engine 進(jìn)行推理,從而大幅提升管線吞吐和 GPU 利用率,同時(shí)保證了對(duì)每個(gè)合成請(qǐng)求的快速響應(yīng)。此外,流式 TTS 中一句話的合成請(qǐng)求會(huì)對(duì)應(yīng)多個(gè)回包,每個(gè)回包承載一個(gè)音頻塊。針對(duì)這種一收多發(fā)的推理模式,我們利用 Triton 提供的 Decoupled Responses 機(jī)制,保證一個(gè)請(qǐng)求的多個(gè)回包能夠正確高效地發(fā)送給對(duì)應(yīng)的客戶端,使用戶能聽(tīng)到完整且流暢的音頻。

最后,為了進(jìn)一步提升 GPU 資源利用率,該方案利用了 Triton 的 Concurrent Model Execution 特性。該特性將部署在 Triton 上的模型或模塊,以模型實(shí)例的方式管理:一個(gè)模型可以部署多個(gè)實(shí)例,不同模型的實(shí)例也可部署在同一GPU上。因此該方案開(kāi)啟了 Concurrent Model Execution 后,同一個(gè) T4 GPU 上可部署多個(gè) TTS 發(fā)音模型,使得多個(gè)模型實(shí)例的推理在 GPU 算力資源充足時(shí)可以達(dá)到并行執(zhí)行。如此一來(lái),GPU 算力資源可以被多個(gè)模型的并行執(zhí)行充分利用起來(lái),達(dá)到降本增效的目的。

通過(guò)使用基于 NVIDIA TensorRT 和 Triton 推理服務(wù)器的流式 TTS 推理部署方案,天貓精靈 TTS 服務(wù)的吞吐提升約 50%,首包延時(shí)降低約 35% ,幫助天貓精靈節(jié)省了業(yè)務(wù)成本,提升了用戶體驗(yàn)。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5674

    瀏覽量

    110026
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1648

    瀏覽量

    49285
  • TTS
    TTS
    +關(guān)注

    關(guān)注

    0

    文章

    65

    瀏覽量

    11572
  • 天貓精靈
    +關(guān)注

    關(guān)注

    5

    文章

    96

    瀏覽量

    12190

原文標(biāo)題:NVIDIA TensorRT 和 Triton 助力阿里巴巴天貓精靈顯著提升流式語(yǔ)音合成服務(wù)運(yùn)行效率

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    IAR榮獲阿里巴巴達(dá)摩院2026年度玄鐵優(yōu)選伙伴稱號(hào)

    3月24日,由阿里巴巴達(dá)摩院主辦的2026玄鐵RISC-V生態(tài)大會(huì)在上海盛大舉行。作為全球RISC-V生態(tài)領(lǐng)域最具影響力的行業(yè)盛會(huì)之一,本屆大會(huì)匯聚了全球數(shù)百家頂尖產(chǎn)學(xué)研機(jī)構(gòu)與技術(shù)領(lǐng)袖,共同圍繞RISC-V架構(gòu)創(chuàng)新、算力生態(tài)共建與產(chǎn)業(yè)落地突破展開(kāi)深入探討,見(jiàn)證國(guó)產(chǎn)開(kāi)源芯片生態(tài)邁向全新發(fā)展階段。
    的頭像 發(fā)表于 03-28 11:26 ?279次閱讀

    阿里巴巴達(dá)摩院發(fā)布新一代旗艦CPU產(chǎn)品玄鐵C950

    3月24日,阿里巴巴達(dá)摩院主辦的2026玄鐵RISC-V生態(tài)大會(huì)在上海舉行。
    的頭像 發(fā)表于 03-25 14:03 ?363次閱讀

    海外電商平臺(tái)阿里巴巴國(guó)際站獲取商品詳情的API接口

    ? 在跨境電商領(lǐng)域,阿里巴巴國(guó)際站(Alibaba.com)是一個(gè)領(lǐng)先的平臺(tái),為企業(yè)提供全球貿(mào)易服務(wù)。其API接口允許開(kāi)發(fā)者通過(guò)編程方式獲取商品詳情,便于構(gòu)建自動(dòng)化工具或集成到第三方系統(tǒng)。本文將
    的頭像 發(fā)表于 11-14 15:36 ?577次閱讀
    海外電商平臺(tái)<b class='flag-5'>阿里巴巴</b>國(guó)際站獲取商品詳情的API接口

    萬(wàn)豪國(guó)際集團(tuán)與阿里巴巴達(dá)成AI時(shí)代戰(zhàn)略合作 升級(jí)賓客旅行體驗(yàn)

    杭州2025年11月11日 /美通社/ -- 萬(wàn)豪國(guó)際集團(tuán)日近日宣布與阿里巴巴集團(tuán)達(dá)成AI時(shí)代戰(zhàn)略合作伙伴關(guān)系,雙方將在中國(guó)市場(chǎng)圍繞云基礎(chǔ)設(shè)施、AI應(yīng)用創(chuàng)新等領(lǐng)域深度合作,為賓客創(chuàng)造個(gè)性化、高品質(zhì)
    的頭像 發(fā)表于 11-11 22:47 ?281次閱讀
    萬(wàn)豪國(guó)際集團(tuán)與<b class='flag-5'>阿里巴巴</b>達(dá)成AI時(shí)代戰(zhàn)略合作 升級(jí)賓客旅行體驗(yàn)

    【 藍(lán)牙模組】安信可模組TG-12F/TG-01M:AT指令入門(mén)教程 &amp;接入阿里飛燕/貓精靈平臺(tái)

    是小寫(xiě)的MAC地址) 3.6數(shù)據(jù)上報(bào)下發(fā) 四、接入 貓精靈平臺(tái) 五、相關(guān)資料 01、產(chǎn)品介紹 TG-12F/TG-01M模塊采用貓精靈TG7100C芯片,TG7100C 是智能新一
    的頭像 發(fā)表于 10-23 10:15 ?972次閱讀
    【 藍(lán)牙模組】安信可模組TG-12F/TG-01M:AT指令入門(mén)教程 &amp;接入<b class='flag-5'>阿里</b>飛燕/<b class='flag-5'>天</b><b class='flag-5'>貓精靈</b>平臺(tái)

    阿里巴巴開(kāi)放平臺(tái)關(guān)鍵字搜索商品接口實(shí)戰(zhàn)詳解:OAuth2.0 認(rèn)證落地 + 檢索效率優(yōu)化(附避坑代碼)

    在 B2B 電商數(shù)據(jù)對(duì)接中,阿里巴巴開(kāi)放平臺(tái)的關(guān)鍵字搜索商品接口(alibaba.aliindex.search)是獲取批發(fā)商品、供應(yīng)商數(shù)據(jù)的核心通道。但多數(shù)開(kāi)發(fā)者會(huì)卡在OAuth2.0 認(rèn)證斷連
    的頭像 發(fā)表于 09-16 16:26 ?1047次閱讀

    博世與阿里巴巴集團(tuán)深化戰(zhàn)略合作

    9月2日,全球領(lǐng)先的汽車(chē)技術(shù)與服務(wù)商博世與阿里巴巴集團(tuán)宣布深化戰(zhàn)略合作伙伴關(guān)系,以先進(jìn)的云計(jì)算與人工智能技術(shù)加速推動(dòng)企業(yè)數(shù)字化轉(zhuǎn)型。雙方將重點(diǎn)聚焦云端驅(qū)動(dòng)的企業(yè)運(yùn)營(yíng)、AI賦能的業(yè)務(wù)創(chuàng)新,以及電商領(lǐng)域的拓展。
    的頭像 發(fā)表于 09-02 16:09 ?773次閱讀

    中國(guó)電信與阿里簽署戰(zhàn)略合作協(xié)議 發(fā)力云和AI基礎(chǔ)設(shè)施

    煌妹代表雙方簽訂協(xié)議。 據(jù)悉,中國(guó)電信與阿里巴巴將在云和AI基礎(chǔ)設(shè)施、新型服務(wù)業(yè)電商、社會(huì)價(jià)值創(chuàng)新等領(lǐng)域展開(kāi)深入合作。 ?
    的頭像 發(fā)表于 08-31 20:16 ?1323次閱讀

    阿里巴巴達(dá)摩院劉志偉:QEMU RISC-V 的進(jìn)展、特性與未來(lái)規(guī)劃

    2025 年 7 月 18 日,在第五屆(2025)RISC-V 中國(guó)峰會(huì)的軟件與生態(tài)系統(tǒng)分論壇上,阿里巴巴達(dá)摩院 RISC-V 及生態(tài)部技術(shù)專家劉志偉帶來(lái)了關(guān)于 QEMU RISC-V 的報(bào)告
    發(fā)表于 07-18 11:20 ?5806次閱讀
    <b class='flag-5'>阿里巴巴</b>達(dá)摩院劉志偉:QEMU RISC-V 的進(jìn)展、特性與未來(lái)規(guī)劃

    探訪阿里巴巴展廳合作的無(wú)人超市:如何讓結(jié)賬速度提升300%

    在傳統(tǒng)超市里,排隊(duì)結(jié)賬往往是一場(chǎng)“耐力考驗(yàn)”——高峰期平均等待時(shí)間超過(guò)15分鐘,收銀員掃碼失誤引發(fā)的糾紛屢見(jiàn)不鮮。但在阿里巴巴展廳合作的遠(yuǎn)景達(dá)無(wú)人超市,這個(gè)數(shù)字被徹底改寫(xiě):消費(fèi)者從選品到離店僅需15
    的頭像 發(fā)表于 07-13 00:00 ?981次閱讀
    探訪<b class='flag-5'>阿里巴巴</b>展廳合作的無(wú)人超市:如何讓結(jié)賬速度<b class='flag-5'>提升</b>300%

    阿里2025財(cái)年業(yè)績(jī):凈利潤(rùn)大漲77%,AI+云業(yè)務(wù)攬下千億收入

    。 ? 圖:阿里巴巴2025財(cái)年年報(bào) ? 阿里巴巴的業(yè)務(wù)包括淘集團(tuán)、阿里國(guó)際數(shù)字商業(yè)集團(tuán)、云智能集團(tuán)、菜鳥(niǎo)集團(tuán)、本地生活集團(tuán)、虎鯨文娛集團(tuán)及其他相關(guān)業(yè)務(wù)。2025財(cái)年,電商、“AI+
    的頭像 發(fā)表于 06-28 00:10 ?8889次閱讀
    <b class='flag-5'>阿里</b>2025財(cái)年業(yè)績(jī):凈利潤(rùn)大漲77%,AI+云業(yè)務(wù)攬下千億收入

    全球各大品牌利用NVIDIA AI技術(shù)提升運(yùn)營(yíng)效率

    歐萊雅、LVMH 集團(tuán)和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計(jì)、營(yíng)銷(xiāo)及物流等方面的運(yùn)營(yíng)效率
    的頭像 發(fā)表于 06-19 14:36 ?1294次閱讀

    壁仞科技完成阿里巴巴通義千問(wèn)Qwen3全系列模型支持

    4月29日,阿里巴巴通義千問(wèn)發(fā)布并開(kāi)源8款新版Qwen3系列“混合推理模型”(簡(jiǎn)稱“Qwen3”)。Qwen3發(fā)布后數(shù)小時(shí)內(nèi),壁仞科技完成全系列支持,并率先在壁仞科技開(kāi)發(fā)者云平臺(tái)上線。 性能卓越
    的頭像 發(fā)表于 04-30 15:19 ?1660次閱讀

    芯盾時(shí)代助力廣州銀行提升金融業(yè)務(wù)運(yùn)行效率

    芯盾時(shí)代中標(biāo)廣州銀行,推動(dòng)金融行業(yè)核心技術(shù)自主可控的進(jìn)程!芯盾時(shí)代針對(duì)鴻蒙生態(tài)特性,為廣州銀行定制開(kāi)發(fā)了適配多終端的安全解決方案,助力其平滑遷移鴻蒙系統(tǒng),打造安全、穩(wěn)定、高效的移動(dòng)端安全能力,顯著提升金融業(yè)務(wù)運(yùn)行
    的頭像 發(fā)表于 04-23 15:39 ?877次閱讀

    普華基礎(chǔ)軟件蒞臨阿里巴巴達(dá)摩院調(diào)研交流

    近日, 普華基礎(chǔ)軟件股份有限公司(以下簡(jiǎn)稱普華基礎(chǔ)軟件)董事、總經(jīng)理劉宏倩一行前往阿里巴巴達(dá)摩院(杭州)科技有限公司(以下簡(jiǎn)稱達(dá)摩院)調(diào)研交流,阿里巴巴集團(tuán)高層及達(dá)摩院核心團(tuán)隊(duì)參與了本次調(diào)研交流活動(dòng)
    的頭像 發(fā)表于 04-08 10:10 ?1228次閱讀