案例介紹
-
通過(guò)全面的 GPU 優(yōu)化,星瀾的端到端響應(yīng)時(shí)間少于 2 秒,實(shí)現(xiàn)了近實(shí)時(shí)交互。
-
在角色的口型表情上,結(jié)合 NVIDIA Audio2Face 能力與 TensorRT 框架的性能優(yōu)化,實(shí)現(xiàn)了毫秒級(jí)逼真地基于音頻的面部 Rig 參數(shù)合成
-
訓(xùn)練提速比一般狀況下提升了 2-3 倍
客戶簡(jiǎn)介
朝夕光年是一家面向全球用戶與開發(fā)者的游戲研發(fā)與發(fā)行公司。通過(guò)提供頂級(jí)游戲和打造玩家社群,朝夕光年致力于服務(wù)全球玩家,為每位玩家?guī)?lái)有趣和激勵(lì)人心的體驗(yàn)。
朝夕光年江南游戲工作室,成立于 2019 年 2 月。工作室主要聚焦中重度游戲和虛擬偶像研發(fā),面向全球市場(chǎng)。
使用 GPU 實(shí)現(xiàn)數(shù)字人實(shí)時(shí)交互
在《星球:重啟》游戲中,李星瀾是游戲中每位幸存者最好的伙伴。她將是新手玩家的“引導(dǎo)員”,亦是玩家在歷險(xiǎn)中的“好助手”,更是跌宕劇情中的“女主角”。她也將為了拯救世界,犧牲自己回到 21 世紀(jì)。這科幻色彩十足的游戲設(shè)定,賦予了李星瀾鮮活的人設(shè),讓她的“靈魂”得以誕生。
李星瀾不僅僅只是簡(jiǎn)單的游戲 NPC,她更是首位由江南游戲工作室所打造的真·元宇宙虛擬人,不僅在游戲中引導(dǎo)玩家,平時(shí)在游戲外,也會(huì)不定時(shí)在抖音上發(fā)布抖音直播、擔(dān)任代言人、主持人等角色,人氣爆棚的她也曾受邀領(lǐng)獎(jiǎng)。
李星瀾也不是傳統(tǒng)意義上的“數(shù)字人”(Digital Human),不僅外形更加仿真,更重要的是,驅(qū)動(dòng)她的內(nèi)核并非大家所認(rèn)知的中之人(操縱虛擬主播進(jìn)行直播的人),而是最新的 NVIDIA AI 技術(shù)。
朝夕光年江南游戲工作室提出建構(gòu)了一個(gè)由 NVIDIA GPU 驅(qū)動(dòng)的 AI 系統(tǒng),包括文本到語(yǔ)音、音頻到全身動(dòng)畫、視頻分析、渲染和聊天機(jī)器人,基于這些不同的應(yīng)用模塊,團(tuán)隊(duì)成功構(gòu)建出一個(gè)逼真的實(shí)時(shí)交互數(shù)字人。2023 年 7 月,李星瀾甚至與玩家們?cè)诙兑羝脚_(tái)上成功連線,完成了一場(chǎng)直播,其直播總曝光量共高達(dá) 1.5 千萬(wàn),互動(dòng)彈幕數(shù)量峰值 171 條/分鐘,為朝夕光年首次 AI 數(shù)字人實(shí)時(shí)互動(dòng)直播創(chuàng)造了亮眼佳績(jī)。
從模型搭建、訓(xùn)練、推理到部署,
解密數(shù)字人背后 AI 推手
江南游戲工作室與 NVIDIA 團(tuán)隊(duì)為數(shù)字虛擬人的互動(dòng)共同設(shè)計(jì)未來(lái)“AI 大腦”——一個(gè)可擴(kuò)展性的 AI 系統(tǒng)。這個(gè)系統(tǒng)能通過(guò) NVIDIA Omniverse 平臺(tái)連接李星瀾和后端負(fù)責(zé)生成聊天文本內(nèi)容,以及通過(guò)聊天文本內(nèi)容生成動(dòng)畫的深度定制神經(jīng)網(wǎng)絡(luò)。換言之,無(wú)論是她說(shuō)話的內(nèi)容、傳遞的表情、肢體的動(dòng)作,都是通過(guò)定制開發(fā)的神經(jīng)網(wǎng)絡(luò)來(lái)完成的。
為了加快在創(chuàng)造李星瀾中使用的深度學(xué)習(xí)模型的訓(xùn)練周期,江南游戲工作室使用了 NVIDIA Ampere 架構(gòu) GPU 執(zhí)行部署,并通過(guò)由 FasterTransformer 優(yōu)化的自動(dòng)語(yǔ)音識(shí)別(ASR)模塊,可以實(shí)時(shí)地將語(yǔ)音轉(zhuǎn)錄成文本。同時(shí)通過(guò)部署在 NVIDIA A30 Tensor Core GPU 上的動(dòng)畫生成模塊,其使用一系列深度學(xué)習(xí)模型,可根據(jù)語(yǔ)音及文本響應(yīng)生成逼真的面部表情和身體姿勢(shì)。除了通過(guò) NVIDIA 硬件的支持,李星瀾團(tuán)隊(duì)還利用了 FP16 混合精度訓(xùn)練和 Megatron-LM 風(fēng)格的模型并行方案,在不犧牲收斂質(zhì)量的情況下,進(jìn)一步提升訓(xùn)練吞吐量。目前該系統(tǒng)能夠在兩天內(nèi)完全訓(xùn)練 Audio2Motion 和 Text2Speech 模型,并在五天內(nèi)完全訓(xùn)練基于 Transformer 的 Chatbot 模型,超過(guò) 10TB 的訓(xùn)練數(shù)據(jù)。為了快速提升李星瀾的能力,所有模型均在 NVIDIA A100 Tensor Core 80GB GPU 上使用 DeepSpeed 訓(xùn)練,實(shí)現(xiàn)了高吞吐量的持續(xù)學(xué)習(xí),助力模型的快速演進(jìn)。NVIDIA AI 解決方案使李星瀾具備了參與自然的實(shí)時(shí)會(huì)話的能力并能夠進(jìn)行逼真的情緒表達(dá)。
在推理方面,團(tuán)隊(duì)利用了另一部署在 NVIDIA A100 GPU 上的回復(fù)生成模塊,使用類似 GPT 的自回歸結(jié)構(gòu)的大型語(yǔ)言模型(LLM)快速生成自然回復(fù),并通過(guò) FasterTransformer 加速,從而將推理延遲減半,使李星瀾能夠以高度響應(yīng)的方式與觀眾互動(dòng)。
部署在 NVIDIA A30 GPU 上的文本到語(yǔ)音(TTS)模塊,通過(guò) cuBLAS 和 CUTLASS 編寫的高性能自定義 kernels 來(lái)進(jìn)行加算,高效的將文本轉(zhuǎn)換成逼真的語(yǔ)音。
通過(guò) NVIDIA GPU 的算力支持,并結(jié)合 NVIDIA 團(tuán)隊(duì)量身定制的 AI 系統(tǒng)進(jìn)行優(yōu)化,江南游戲工作室在幾個(gè)月時(shí)間內(nèi)就完成了打造高質(zhì)量虛擬人的端到端迭代。
讓 AI 走進(jìn)生活,
為各行業(yè)打造多元的應(yīng)用場(chǎng)景
憑借其逼真的外觀和出色的會(huì)話能力,像李星瀾這樣的數(shù)字人為許多行業(yè)開辟了新的可能:
-
虛擬助手和聊天機(jī)器人:數(shù)字人可以在客戶服務(wù)等場(chǎng)景中作為互動(dòng)的 AI 助手提供幫助和服務(wù)。
-
數(shù)字內(nèi)容創(chuàng)作:逼真的視頻動(dòng)畫為電影、電視、AR/VR 內(nèi)容創(chuàng)作開辟了新的道路,可定制數(shù)字角色。
-
醫(yī)療保健:數(shù)字人可以模擬患者和醫(yī)生的互動(dòng)來(lái)訓(xùn)練醫(yī)療專業(yè)人員。
-
教育:數(shù)字人可以扮演虛擬導(dǎo)師或老師的角色,提供互動(dòng)課程。
-
社交聯(lián)系:對(duì)于護(hù)理院等隔離群體,數(shù)字人可以通過(guò)自然對(duì)話提供陪伴。
視頻 1. 星瀾情感交互產(chǎn)品概念-雷鳥合作視頻
視頻 2. 星瀾情感交互產(chǎn)品概念-老人篇
通過(guò)江南游戲工作室的 AI 技術(shù)演進(jìn)、NVIDIA 的底層算力支持,以及 NVIDIA Omniverse 平臺(tái),我們能夠充分利用這些快速發(fā)展的前沿技術(shù)。隨著李星瀾的能力不斷提升,更多的應(yīng)用將成為可能,從根本上改變?nèi)祟惻c AI 技術(shù)的互動(dòng)方式。在不久的將來(lái),李星瀾將給大家?guī)?lái)更多的驚喜。
江南游戲工作室產(chǎn)品經(jīng)理肉山(金昱含)表示:“基于 NVIDIA 軟硬件的支持,數(shù)字人 AI 產(chǎn)品的表現(xiàn)力將不斷突破原有上限。我們致力于在超寫實(shí)數(shù)字人和 AI 產(chǎn)品的探索上,不僅能越來(lái)越接近用戶訴求,也能真正實(shí)際應(yīng)用于各式場(chǎng)景中。”
*本文中的圖片與視頻均來(lái)源于江南游戲工作室,若您有任何疑問(wèn)或需要使用本文中的圖片與視頻,請(qǐng)聯(lián)系江南游戲工作室。
GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開放。點(diǎn)擊“閱讀原文”或掃描下方海報(bào)二維碼,關(guān)注更多會(huì)議及活動(dòng)信息。
原文標(biāo)題:星瀾再進(jìn)化:NVIDIA AI 助力江南游戲工作室實(shí)現(xiàn)數(shù)字人實(shí)時(shí)交互
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4086瀏覽量
99173
原文標(biāo)題:星瀾再進(jìn)化:NVIDIA AI 助力江南游戲工作室實(shí)現(xiàn)數(shù)字人實(shí)時(shí)交互
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
衷心感謝《瑞薩生態(tài)工作室》 ,授予我“優(yōu)秀評(píng)測(cè)獎(jiǎng)”!
商湯科技推出實(shí)時(shí)語(yǔ)音驅(qū)動(dòng)數(shù)字人技術(shù)SekoTalk
廣電計(jì)量?jī)纱髣?chuàng)新工作室喜獲佳績(jī)
三星攜手NVIDIA 以全新AI工廠引領(lǐng)全球智能制造轉(zhuǎn)型
NVIDIA IGX Thor 機(jī)器人處理器將實(shí)時(shí)物理 AI 引入工業(yè)和醫(yī)療邊緣場(chǎng)景
【啟揚(yáng)方案】基于啟揚(yáng)RK3588的移動(dòng)AI數(shù)字人,助力智能交互新體驗(yàn)
再掀語(yǔ)音交互革命,廣和通AI解決方案加速機(jī)器人聽覺進(jìn)化
安森美助力NVIDIA AI系統(tǒng)檢測(cè)實(shí)驗(yàn)室
無(wú)限穿墻技術(shù)西安品茶工作室南郊北郊教學(xué)簡(jiǎn)約網(wǎng)絡(luò)延遲
曙光AI解決方案助力江南農(nóng)村商業(yè)銀行數(shù)字化轉(zhuǎn)型
動(dòng)態(tài) IP 工作室:解鎖數(shù)字時(shí)代的網(wǎng)絡(luò)奧秘
五一留言有禮 | RA生態(tài)工作室新增免費(fèi)樣品申請(qǐng)渠道啦!
星瀾再進(jìn)化:NVIDIA AI 助力江南游戲工作室實(shí)現(xiàn)數(shù)字人實(shí)時(shí)交互
評(píng)論