在近日播出的央視人工智能產業發展大型主題活動《2025中國·AI盛典》上,由商湯如影團隊傾力打造的三位歌唱家——石倚潔、張英席、蔡程昱的AI數字分身,與本尊同臺演繹經典歌劇曲目《今夜無人入眠》,并以七種語言獻唱。
此外,“人工智能之父”圖靈以AI數字人的形象,貫穿盛典始終。盛典節目播出后,相關視頻全網播放量突破1億次,網友們紛紛稱贊“AI國產之光”,這也是商湯如影連續兩年參與這場以AI為核心的國家級科技盛會。
一張圖片,一段音頻
即可生成分鐘級高質量視頻
此次亮相的AI數字分身,源自商湯自研的如影圖片數字人技術。
依托商湯日日新大模型的多模態能力,只需上傳一張人物照片,輸入文字腳本或音頻文件,AI 就能自動生成人物動態視頻,并支持多種語言,實現了與真人幾乎無差別的口型匹配、動作呼應和情緒表達。
與市面上多數停留在5-10秒短片段的圖生視頻工具不同,如影圖片數字人能夠穩定生成長達3分鐘以上的動態視頻,全程保持人物ID、背景風格的高度一致性。
如影圖片數字人還能通過提示詞如“揮手”,精準驅動人物肢體動作,甚至支持快速大幅度手部動作,解決“動作僵硬、與內容脫節” 問題。
風格形象多元,廣泛服務營銷、 教育、文旅、社交娛樂等多場景
在應用層面,如影圖片數字人展現了強大的靈活性和可控性,為創作者和企業提供了前所未有的表達空間,支持API調用和私有化部署,保障數據安全,滿足定制化需求。
真人照片、二次元動漫角色、3D虛擬形象,甚至動物玩偶,都可以作為驅動源,AI數字人不僅能實現Rap級別的口型對準,還能根據提示展現不同的情緒和肢體動作,同時可以支持多人場景,指定人物開口對話。
在商業營銷場景中,企業只需一張員工或模特照片,就能快速生成促銷視頻或多語種產品講解,大幅降低拍攝和翻譯成本;
在媒體傳播中,自媒體創作者可以用自己的照片生成口播短視頻,新聞機構也能借助3D人物圖實現多語種播報;
在教育和文化領域,名師照片可以“開口”講解知識點,博物館中的歷史人物復原圖也能為觀眾講述文物背后的故事;
在文旅行業,游客甚至可以通過一張照片生成屬于自己的“穿越短劇”,讓旅行體驗更具沉浸感和互動性。
這一突破,使其能夠真正服務于社交娛樂、營銷帶貨、教學課程、品牌故事、文化解說等場景,打破了行業長期以來的時長瓶頸。
從傳統依賴拍攝與建模,到如今“一張照片即可生成擬真視頻”,商湯正在用技術重塑數字人產業格局,讓大眾能夠以更低門檻、更高效率參與到創作中。
-
AI
+關注
關注
91文章
39756瀏覽量
301366 -
人工智能
+關注
關注
1817文章
50094瀏覽量
265300 -
商湯
+關注
關注
0文章
91瀏覽量
4356
原文標題:亮相央視,網友力贊國產之光!商湯如影圖片數字人再出圈
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
商湯如影圖片數字人技術閃耀央視舞臺
評論