国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

除了刷屏的Sora,國內外還有哪些AI視頻生成工具

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2024-02-26 08:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群



電子發燒友網報道(文/李彎彎)近日,OpenAI發布的文生視頻模型Sora全網刷屏。相比之前的文生視頻模型,Sora無論是視頻時長,還是畫面精細度,細節完整性,或是多鏡頭拍攝,都更為突出。Sora的發布也讓AI生成視頻有了突破性進展。

過去一年多,全球科技公司都在發布各種大模型,然而AI生成內容更多集中在文本和圖片方面,AI視頻生成方面卻進展緩慢。從當前的形勢來看,AI視頻生成在今年或許會有一番新景象。那么目前國內外都有哪些AI視頻生成工具,效果如何呢?

Sora

OpenAI發布的新型視頻生成模型Sora,其核心能力是能夠生成長達一分鐘的高清視頻,這一時長遠超之前的生成模型。而且,Sora生成的視頻不僅畫質卓越,細節豐富,而且幀率高、連續性好,幾乎達到了無縫銜接的效果。

從OpenAI官網展示的一個視頻來看,輸入提示詞“一位時尚女士走在東京的街道上,街道上充滿了溫暖的霓虹燈和動畫城市標志。她穿著黑色皮夾克、紅色長裙和黑色靴子,拿著一個黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信而隨意。街道潮濕且反光,形成了五顏六色燈光的鏡面效果。許多行人四處走動。”

生成的視頻,無論是運鏡還是人物、地面、背景的細節,還有拉進鏡頭后人物面部上的皺紋、毛發、墨鏡上的反光,都幾乎可以以假亂真,畫面穩定不錯位。在長達60秒的視頻里,畫面隨鏡頭的大幅度運動并沒有出現錯位的情況,整體風格保持了驚人的一致性。

IDC中國預測,Sora將率先在短視頻、廣告、互動娛樂、影視制作和媒體等行業中得到應用。在這些領域,利用Sora的多模態大模型能力,可以輔助內容行業的工作者更高效地創作視頻,不僅加快了生產速度,還提高了產出數量,并為用戶帶來前所未有的視覺體驗。這將助力企業實現成本降低、效率提升,并進一步優化用戶體驗。

Pika 1.0

在OpenAI發布視頻生成模型Sora之前,去年11月29日,美國AI初創公司Pika labs發布的文生視頻產品Pika 1.0呈現的效果在當時也相當驚艷。Pika labs是一家成立于去年4月份的初創公司,創始人郭文景和聯合創始人兼CTO Chenlin Meng,都是斯坦福大學AI Lab博士生。一位專注于NLP(自然語言處理)和圖形學,另一位主攻計算機視覺方向。

據介紹,該公司推出的視頻生成模型Pika 1.0能夠生成和編輯3D動畫、動漫、卡通和電影。視頻生成方面,可以通過文字生成視頻,也可以圖片生成視頻。比如,只需輸入提示詞“馬斯克穿著太空服,3D動畫”,一個動畫版本、穿著太空服準備乘坐火箭上太空的馬斯克即可生成,外形、動作、背景等元素均十分逼真,可以媲美花大成本制作的3D動畫影像。

Pika 1.0還可以通過原有視頻生成更高質量的視頻。該公司當時展示了一個騎馬的黑白原視頻,通過Pika 1.0生成了物種不同風格的動畫,幾乎涵蓋現有電影和動畫大部分風格,看上去質量效果非常好。除了視頻生成,Pika 1.0還能夠進行視頻編輯,用戶只需要選定編輯區域,就能根據文本提示詞修改特定區域。

在當時來看,Pika 1.0的出現可以說效果好于之前的文生視頻模型。然而隨著現在Sora的出現,Pika或許會感覺到壓力。Pika公司創始人郭文景表示,“我們覺得這是一個很振奮人心的消息,我們已經在籌備升級中,將直接對標 Sora。”

Gen-2

相比于OpenAI和Pika,成立于2018年的AI初創公司Runway應該是最早探索視頻生成領域的企業。2022年2月,Runway發布了Gen-1,可以對原視頻進行風格化的編輯。3月該公司又發布了生成式AI視頻模型Gen-2,允許用戶輸入文本提示生成四秒長視頻,8月,Runway添加了一個選項,可以將 Gen-2 中人工智能生成的視頻延長至 18 秒。

在隨后的幾個月,Runway還對Gen-2 做了幾次更新。之后更是推出動態筆刷Motion Brush,它是Runway視頻生成工具Gen-2的一部分。Runway動態筆刷是一種利用人工智能技術讓靜止圖片中的物體動起來的功能,你只需要在圖片上用畫筆涂抹你想要動起來的部分,Runway就會自動識別物體的運動軌跡和特征,生成逼真的動態效果。該工具的發布引起業界不小的關注。

在Pika 1.0和Sora出現之前,Runway的Gen-2模型被認為是AI視頻制作的頂尖模型,它制作出來的視頻效果逼真、流暢、高清。隨著OpenAI Sora的發布,Runway接下來或許會有新動作,在Sora發布之后,Runway CEO第一時間在X上發推特稱“game on(競爭開始了)”。

Stable Video Diffusion

在圖片生成領域遙遙領先的Stability AI,去年11月發布了其最新的AI模型Stable Video Diffusion,這款模型能夠通過現有圖片生成視頻,是基于之前發布的Stable Diffusion文本轉圖片模型的延伸,不過當時,這款模型并不是對所有人開放的。

據介紹,Stable Video Diffusion當時還處于Stability AI所謂的“研究預覽”階段。想要使用這款模型的人必須同意一些使用條款,其中規定了Stable Video Diffusion的預期應用場景(例如教育或創意工具、設計和其他藝術過程等)和非預期的場景(例如對人或事件的事實或真實的表達)。

從網友對比反饋來看,Stable Video Diffusion生成視頻的效果可以與當時被看好的的Runway 和Pika Labs 的AI生成視頻相媲美。不過局限性在于,Stability AI的視頻生成模型,不能生成沒有運動或緩慢的攝像機平移的視頻,也不能通過文本進行控制,也不能渲染文字(至少不能清晰地渲染),也不能一致地“正確地”生成人臉和人物。

寫在最后

目前來看,在視頻生成方面,表現比較優秀的幾個模型就是上文提到的OpenAI發布的Sora,以及Pika labs、Runway、Stability AI發布的視頻模型。其中Sora無論是在時長,還是運鏡、畫面細節等方面都更為突出。Stability AI的模型目前還不能進行文本生成視頻。

除了這幾款視頻生成工具之外,還有一些企業在文生視頻方面也有動作,包括Adobe,該公司宣布已收購AI視頻生成創業公司Rephrase.ai;谷歌,其團隊已經發布發布了視頻生成模型VideoPoet。

國內的字節跳動、百度、阿里在這方面也有動作。字節跳動此前就推出了一款視頻模型Boximator,可以通過文本精準控制生成視頻中人物或物體的動作。不過近日,字節跳動對此回應稱,Boximator是視頻生成領域控制對象運動的技術方法研究項目,目前還無法作為完善的產品落地,距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。

另外值得關注的是,2月23日消息,谷歌資深科學家、VideoPoet項目負責人蔣路已加入字節跳動旗下短視頻社交平臺TikTok。字節跳動接下來在視頻生成方面的研究還是可以期待一下。

早前就傳出百度文心大模型視頻生成功能在內測中,不過目前還沒進展的消息。阿里在去年底也上線了Animate Anyone模型,通過一張圖片就能生成視頻,當時有網友用一張照片生成了一段跳舞視頻,每一個動作都十分自然,幾乎可以亂真,在網絡上引起大量傳播。

總的來說,目前國內外已經有不少企業在探索視頻生成領域,包括國內的字節跳動、百度、阿里,雖然已經逐漸有一些進展。不過相比OpenAI、Pika labs、Runway等的視頻模型,還存在差距。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • OpenAI
    +關注

    關注

    9

    文章

    1244

    瀏覽量

    9952
  • 大模型
    +關注

    關注

    2

    文章

    3621

    瀏覽量

    5125
  • Sora
    +關注

    關注

    0

    文章

    86

    瀏覽量

    794
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SeaVerse發布全球首個AI Native平臺,“All in AI Native”引領AI創作前瞻革命

    2026年1月10日,SeaVerse宣布全球發布SeaVerse AI平臺。這是全球首個AI原生的創建和部署平臺,集合大語言模型、圖像生成視頻生成、Agent等多方面的能力,通過全
    的頭像 發表于 01-14 17:41 ?1167次閱讀

    商湯科技日日新Seko系列模型與寒武紀成功適配

    12月15日,商湯科技基于在生成AI與多模態交互領域的技術積累,正式發布Seko2.0——行業首個多劇集生成智能體。該智能體在多劇集視頻生成的一致性方面展現出顯著優勢,其背后依托的是
    的頭像 發表于 12-17 14:06 ?387次閱讀

    國內哪些生成AI 工具最容易上手?企業真正看重的是“能馬上用起來”

    生成AI 工具國內越來越多,但企業真正關心的問題并不是“誰的模型更大”“誰的 API 更多”,而是一個更現實的問題: 到底哪類工具最容
    的頭像 發表于 12-08 10:55 ?340次閱讀

    OpenAI Sora 2模型上線微軟Azure AI Foundry國際版

    我們非常激動地宣布,OpenAI 的新一代多模態視頻生成模型 Sora 2 現已在 Azure AI Foundry(國際版)上線,進入公共預覽階段。
    的頭像 發表于 10-22 09:44 ?745次閱讀
    OpenAI <b class='flag-5'>Sora</b> 2模型上線微軟Azure <b class='flag-5'>AI</b> Foundry國際版

    看點:谷歌Veo 3.1迎來重大更新硬剛Sora 2 12英寸硅片國產龍頭西安奕材今日申購

    給大家帶來一些業界資訊: 谷歌Veo 3.1迎來重大更新硬剛Sora 2 據外媒報道,在10月16日,谷歌發布了AI視頻生成模型Veo 3.1,升級音頻集成與敘事控制能力;以及更逼真的質感還原。在
    的頭像 發表于 10-16 16:00 ?994次閱讀

    全球首個動漫專屬AI視頻生成平臺Animon,國內版&quot;萌動AI&quot;正式發布

    Animon國內版——"萌動AI"首秀:AI動漫創作進入全民時代 北京2025年9月25日?/美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首個專注于動漫的AI
    的頭像 發表于 09-25 12:33 ?888次閱讀

    直線模組品牌大起底:國內外優質品牌全解析

    全球范圍內,眾多品牌在直線電機模組領域不斷深耕,以先進技術和卓越品質塑造了良好口碑。接下來,為您詳細梳理國內外知名直線電機模組品牌。國外知名直線模組品牌美國派克(P
    的頭像 發表于 07-16 11:26 ?1090次閱讀
    直線模組品牌大起底:<b class='flag-5'>國內外</b>優質品牌全解析

    HarmonyOS AI輔助編程工具(CodeGenie)UI生成

    UI Generator基于BitFun Platform AI能力平臺,用于快速生成可編譯、可運行的HarmonyOS UI工程,支持基于已有UI布局文件(XML),快速生成
    發表于 07-10 11:51

    4K、多模態、長視頻AI視頻生成的下一個戰場,誰在領跑?

    電子發燒友網報道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節跳動最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P高品質
    的頭像 發表于 06-16 00:13 ?7219次閱讀

    AKOOL發布全球首款實時攝像頭

    近日,硅谷新銳公司AKOOL發布全球首款實時攝像頭Akool Live Camera,集虛擬數字人、AI視頻翻譯、實時換臉、實時AI視頻生成四大功能于一身,重新定義了
    的頭像 發表于 06-09 16:30 ?2177次閱讀

    國內外電機結構 工藝對比分析

    純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:國內外電機結構 工藝對比分析.pdf【免責聲明】本文系網絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,刪除內容!
    發表于 05-29 14:06

    生成式人工智能認證:重塑AI職業生態的底層邏輯

    在人工智能技術滲透至社會毛細血管的今天,生成式人工智能(Generative AI)的崛起正在改寫人類與技術的協作范式。從ChatGPT引爆的全球熱潮,到Sora模型推動的文生視頻革命
    的頭像 發表于 05-23 09:17 ?776次閱讀

    國內外半導體廠商涌現慕展,共話產業新風向! ——2025慕尼黑上海電子展官方視頻采訪集錦(下)

    2025年4月15日到17日,一年一度的行業盛會——慕尼黑上海電子展盛大舉行。電子發燒友網做為慕展的官方視頻采訪合作伙伴,邀請諸多國內外半導體廠商來到直播間進行了視頻采訪。以下是廠商代表們對產品精彩
    發表于 04-23 16:33 ?1355次閱讀
    <b class='flag-5'>國內外</b>半導體廠商涌現慕展,共話產業新風向! ——2025慕尼黑上海電子展官方<b class='flag-5'>視頻</b>采訪集錦(下)

    國內外半導體廠商涌現慕展,共話產業新風向! ——2025慕尼黑上海電子展官方視頻采訪集錦(上)

    2025年4月15日到17日,一年一度的行業盛會——慕尼黑上海電子展盛大舉行。電子發燒友網做為慕展的官方視頻采訪合作伙伴,邀請諸多國內外半導體廠商來到直播間進行了視頻采訪。以下是廠商代表們對產品精彩
    發表于 04-23 16:28 ?1483次閱讀
    <b class='flag-5'>國內外</b>半導體廠商涌現慕展,共話產業新風向! ——2025慕尼黑上海電子展官方<b class='flag-5'>視頻</b>采訪集錦(上)

    AI Agent 應用與項目實戰》----- 學習如何開發視頻應用

    開發一個視頻內容生成Agent。 訪問語聚AI平臺官網 ,進行注冊或登錄。 在平臺首頁,了解語聚AI的功能和應用場景,特別是其支持的視頻生成
    發表于 03-05 19:52