電子發燒友網報道(文/李彎彎)虛擬數字人(DigitalHuman/MetaHuman),是運用數字技術創造出來的、與人類形象接近的數字化人物形象。虛擬數字人系統一般情況下由人物形象、語音生成、動畫生成、音視頻合成顯示、交互等5個模塊構成。
虛擬數字人核心技術
人物形象根據人物圖形資源的維度,可分為2D和3D兩大類,從外形上又可分為卡通、擬人、寫實、超寫實等風格。
語音生成模塊和動畫生成模塊可分別基于文本生成對應的人物語音以及與之相匹配的人物動畫,語音生成基于表達內容文本生成語音,應用智能語音TTS技術,動畫生成,基于表達內容文本生成動畫,核心技術為驅動與渲染。
音視頻合成顯示模塊將語音和動畫合成視頻,基于終端顯示技術,將數字人產品呈現于手機等智慧終端屏幕,顯示給用戶。
交互模塊使數字人具備交互功能,即通過語音語義識別等智能技術識別用戶的意圖,并根據用戶當前意圖決定數字人后續的語音和動作,驅動人物開啟下一輪交互。
其中計算驅動型交互對廠商的對話式AI能力要求高,往往由對話式AI廠商進行能力提供。對話式AI能力,包括基于語義理解、知識庫、知識圖譜給到信息回饋,基于語音識別、計算機視覺完成用戶信息輸入。
在虛擬數字人的制作流程,最為核心、最具挑戰的是建模、驅動、渲染三大流程。建模環節以真人為模型或設計人物,為虛擬數字人建立基本的3D模型,3D建模為構建虛擬人形象的基礎,重點在于實現細節的精細還原。
驅動環節,通過訓練驅動模型等形式確定虛擬數字人的基本動作;渲染環節,根據在設計環節中確定的虛擬人最終呈現效果和應用場景等外界要素,將模型與其運動進行渲染以呈現最佳效果。渲染技術用于提升虛擬人的逼真程度,實時互動亦需要實現實時渲染。
虛擬數字人產業鏈
當前虛擬數字人理論和技術日益成熟,應用范圍不斷擴大,產業正在逐步形成、不斷豐富,相應的商業模式也在持續演進和多元化。
從產業鏈來看,虛擬數字人從上到下可以分為基礎層、平臺層和應用層。基礎層為虛擬數字人提供基礎軟硬件支撐,硬件包括顯示設備、光學器件、傳感器、芯片等,基礎軟件包括建模軟件、渲染引擎。
顯示設備是數字人的載體,既包括手機、電視、投影、LED顯示等2D顯示設備,也包括裸眼立體、AR、VR等3D顯示設備。
光學器件用于視覺傳感器、用戶顯示器的制作;傳感器用于數字人原始數據及用戶數據的采集;芯片用于傳感器數據預處理和數字人模型渲染、AI計算。
建模軟件能夠對虛擬數字人的人體、衣物進行三維建模。渲染引擎能夠對燈光、毛發、衣物等進行渲染,主流引擎包括UnityTechnologies公司的Unity3D、EpicGames公司的UnrealEngine等。
平臺層包括軟硬件系統、生產技術服務平臺、AI能力平臺,為虛擬數字人的制作及開發提供技術能力。建模系統和動作捕捉系統通過產業鏈上游的傳感器、光學器件等硬件獲取真人/實物的各類信息,利用軟件算法實現對人物的建模、動作的重現。
渲染平臺用于模型的云端渲染。解決方案平臺基于自身技術能力為廣大客戶提供數字人解決方案。AI能力平臺提供計算機視覺、智能語音、自然語言處理技術能力。
平臺層匯聚的企業較多,包括AI相關的企業科大訊飛、追一科技、竹間智能、商湯科技等,以及互聯網廠商百度、阿里、華為、火山引擎、騰訊、京東、網易伏羲等。
小結
從目前的情況來看,近幾年虛擬數字人的熱度居高不下,互聯網廠商、人工智能廠商、CG廠商等各類玩家紛紛入局。然而當前虛擬數字人產業鏈存在割裂現象,生產環節分散在各個主體之間,難以達到高效協同。
而具備全棧集成能力的大型互聯網廠商正嘗試通過生態開放、平臺建設集成各環節資源,為客戶提供覆蓋全流程、低成本、短周期的虛擬數字人平臺,降低虛擬數字人產業的應用門檻,在這場虛擬數字人商業落地推進中占據優勢。
-
Ar
+關注
關注
25文章
5283瀏覽量
176283 -
AI
+關注
關注
91文章
39794瀏覽量
301456
發布評論請先 登錄
【「芯片設計基石——EDA產業全景與未來展望」閱讀體驗】+ 芯片“卡脖子”引發對EDA的重視
電抗器選不對,電費為何居高不下?
哪些磁性元器件產業鏈企業入圍500強榜單
2025中國(秋季)電機產業鏈交流會圓滿落幕!
極海半導體榮獲2025中國BLDC電機產業鏈品質供應商
進迭時空榮膺中移物聯網產業鏈 “鏈核企業”
2025‘第五屆中國BLDC電機產業鏈優秀企業年度評選啟動
芯盛智能亮相2025移動信息現代產業鏈共鏈大會
合創智行亮相2025移動信息現代產業鏈共鏈大會
2025第五屆中國BLDC電機產業鏈優秀企業年度評選
中國MEMS產業鏈領軍企業具體有哪些?2025最新權威名單發布
利潤增43.79%!這家磁性元件產業鏈企業咋做的
2025電機產業鏈交流會圓滿收官,技術分享與供需對接雙驅動
虛擬數字人熱度居高不下,產業鏈企業中誰更具優勢?
評論