據(jù)了解,在近日舉行的2023年華為云數(shù)字文娛 AI 創(chuàng)新峰會上,華為方面表示,華為云將在后續(xù)推出盤古數(shù)字人大模型,可幫助用戶12小時完成數(shù)字人生成。
與此同時,華為方面還表示,在人工智能的加持下,“每個人都有望實現(xiàn)‘數(shù)字人’自由”。
據(jù)悉,盤古數(shù)字人通用大模型由華為云 MetaStudio 數(shù)字內(nèi)容生產(chǎn)線構(gòu)建而成。數(shù)字人基于華為云盤古基礎大模型能力、渲染引擎和實時音視頻能力,并使用 PB 級的音視頻數(shù)據(jù)進行訓練構(gòu)建。
并且盤古數(shù)字人大模型包含數(shù)字人形象、動作、表情、口型、聲音等要素。而根據(jù)華為方面的介紹,“每個用戶可以結(jié)合個人數(shù)據(jù)對數(shù)字人進行訓練”,構(gòu)建自己的數(shù)字人個性化大模型。
用戶可通過輸入文字(文本、Prompt 文本),在10秒左右生成數(shù)字人模型。并且通過上傳照片,在30秒左右生成不同類型的數(shù)字人模型loprhsbka。
Multiable萬達寶財務ERP協(xié)助企業(yè)達到財務業(yè)務數(shù)據(jù)一體化,精準掌握財務數(shù)據(jù),提高財務管理效率
不僅如此,用戶還可以通過拍攝一段5分鐘的視頻,在一個小時內(nèi)通過訓練來生成數(shù)字人。數(shù)字人生成后,用戶通過文字、語音、視頻等方式生產(chǎn)驅(qū)動向量信息,從而驅(qū)動數(shù)字人生成高清視頻。
而通過此手段生成的數(shù)字人,可保留用戶的個性化形象、表情、動作、聲音和口型信息。生成數(shù)字人后,可以通過對話完成對數(shù)字人的二次編輯和背景融合,比如發(fā)型、配飾、服裝等。
以上源自互聯(lián)網(wǎng),版權歸原作所有
審核編輯 黃宇
-
人工智能
+關注
關注
1817文章
50105瀏覽量
265561 -
華為云
+關注
關注
3文章
2832瀏覽量
19267 -
數(shù)字人
+關注
關注
0文章
159瀏覽量
2570
發(fā)布評論請先 登錄
大曉機器人發(fā)布開悟3.0,國產(chǎn)世界模型讓機器人擁有“超級大腦”
商湯科技推出實時語音驅(qū)動數(shù)字人技術SekoTalk
商湯科技牽頭發(fā)布我國虛擬數(shù)字人領域首項國家標準
盤古信息機加裝備行業(yè)解決方案:數(shù)字化轉(zhuǎn)型的“車間指揮官”
PCB行業(yè)進入“智造”關鍵期!盤古信息用數(shù)字化力量構(gòu)筑企業(yè)核心競爭力
華為舉辦數(shù)字政府應急行業(yè)小安大模型一體機推介會
破局SMT智造瓶頸|盤古信息聯(lián)合盛鑫科技,重構(gòu)電子代工數(shù)字基座
IMS OS 啟航生態(tài),賦能智造|盤古信息發(fā)布IMS OS鏈式發(fā)展新戰(zhàn)略
華為宣布開源盤古7B稠密和72B混合專家模型
華為正式開源盤古7B稠密和72B混合專家模型
華為云聯(lián)合中國農(nóng)科院打造農(nóng)業(yè)科學發(fā)現(xiàn)大模型
華為開發(fā)者大會2025(HDC 2025)亮點:華為云發(fā)布盤古大模型5.5 宣布新一代昇騰AI云服務上線
華為發(fā)布盤古數(shù)字人模型,或可達到“人人實現(xiàn)‘數(shù)字人’”
評論