近日,商湯科技在人工智能領域再次取得重大突破,正式發布了其首個面向消費者的“可控”人物視頻生成大模型——Vimi。這一創新技術的問世,標志著視頻內容創作進入了一個全新的互動與個性化時代。
Vimi大模型專為C端用戶設計,旨在通過先進的AI技術,讓每個人都能輕松享受到視頻創作的樂趣。它不僅支持聊天、唱歌、舞動等多種娛樂互動場景,還具備強大的視頻生成能力,能夠一鍵生成長達1分鐘、畫面流暢且質量穩定的單鏡頭人物視頻。這一特性確保了視頻內容的連續性和觀賞性,即使時間流逝,畫面效果也始終如一,不會因時間推移而劣化或失真。
尤為值得一提的是,Vimi的“可控”性體現在其強大的靈活性和適應性上。它基于商湯自研的日日新大模型構建,僅需一張任意風格的照片作為輸入,就能快速生成與目標動作相匹配的人物視頻。更令人興奮的是,Vimi還能通過已有人物視頻、動畫、聲音、文字等多種元素進行驅動,為用戶提供前所未有的視頻創作體驗。用戶可以根據自己的想象和需求,自由組合這些元素,創造出獨一無二的視頻內容。
商湯科技的這一創新成果,無疑為視頻內容創作領域注入了新的活力。隨著Vimi的推廣應用,我們有理由相信,未來將有更多富有創意和個性化的視頻作品涌現出來,為人們的生活增添更多樂趣和色彩。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
人工智能
+關注
關注
1817文章
50098瀏覽量
265361 -
商湯科技
+關注
關注
8文章
609瀏覽量
37557 -
大模型
+關注
關注
2文章
3650瀏覽量
5183
發布評論請先 登錄
相關推薦
熱點推薦
SeaVerse發布全球首個AI Native平臺,“All in AI Native”引領AI創作前瞻革命
2026年1月10日,SeaVerse宣布全球發布SeaVerse AI平臺。這是全球首個AI原生的創建和部署平臺,集合大語言模型、圖像生成、視頻生
商湯科技日日新Seko系列模型與寒武紀成功適配
12月15日,商湯科技基于在生成式AI與多模態交互領域的技術積累,正式發布Seko2.0——行業首個多劇集生成智能體。該智能體在多劇集
商湯科技聯合創始人王曉剛擔任大曉機器人董事長
大曉機器人將于12月18日正式亮相,重磅發布多項全球領先的技術與產品陣列,并將推出首個國內開源且實現商業應用的“開悟”世界模型3.0,與行業伙伴一同構建自主可控、開放共贏的產業體系。
商湯科技正式發布并開源全新多模態模型架構NEO
商湯科技正式發布并開源了與南洋理工大學S-Lab合作研發的全新多模態模型架構 —— NEO,為日日新SenseNova 多模態模型奠定了新一代架構的基石。
OpenAI Sora 2模型上線微軟Azure AI Foundry國際版
我們非常激動地宣布,OpenAI 的新一代多模態視頻生成模型 Sora 2 現已在 Azure AI Foundry(國際版)上線,進入公共預覽階段。
全球首個動漫專屬AI視頻生成平臺Animon,國內版"萌動AI"正式發布
Animon國內版——"萌動AI"首秀:AI動漫創作進入全民時代 北京2025年9月25日?/美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首個專注于動漫的AI視頻生成
商湯如影圖片數字人技術閃耀央視舞臺
依托商湯日日新大模型的多模態能力,只需上傳一張人物照片,輸入文字腳本或音頻文件,AI 就能自動生成人物動態視頻,并支持多種語言,實現了與真人
商湯科技發布悟能具身智能平臺
近日,由全國工商聯人工智能委員會傾力主辦,商湯科技承辦的“大愛無疆·模塑未來” WAIC 2025大模型論壇上,商湯科技正式發布「悟能」具身智能平臺,從開悟世界
百度重磅發布!全球首創中文音視頻模型
電子發燒友網綜合報道 2025年7月2日,百度在北京正式發布全球首個中文音視頻一體化生成模型——MuseSteamer,標志著其正式進軍圖生
一種基于擴散模型的視頻生成框架RoboTransfer
在機器人操作領域,模仿學習是推動具身智能發展的關鍵路徑,但高度依賴大規模、高質量的真實演示數據,面臨高昂采集成本與效率瓶頸。仿真器雖提供了低成本數據生成方案,但顯著的“模擬到現實”(Sim2Real)鴻溝,制約了仿真數據訓練策略的泛化能力與落地應用。
4K、多模態、長視頻:AI視頻生成的下一個戰場,誰在領跑?
電子發燒友網報道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節跳動最新視頻模型,支持文字與圖片輸入,可
AKOOL發布全球首款實時攝像頭
近日,硅谷新銳公司AKOOL發布全球首款實時攝像頭Akool Live Camera,集虛擬數字人、AI視頻翻譯、實時換臉、實時AI視頻生成四大功能于一身,重新定義了AI視頻生成的“實
商湯科技日日新大模型SenseNova上線聲網云市場
日前,商湯科技日日新大模型SenseNova即將正式上線聲網云市場,開發者和企業用戶可通過聲網的實時互動云服務進行調用,將商湯領先的模型能力集成到各類應用場景中,快速構建基于日日新大
商湯發布首個“可控”人物視頻生成大模型Vimi
評論