国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Sora之后,視頻生成模型的中國牌局

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-12-12 09:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgZO2dZq3uAABdRAAeFnl_r3bw480.jpg

Sora,自2月16日OpenAI發(fā)布后一直被吐槽是“技術期貨”,終于在12月10日,正式版Sora露面了,可以生成最高 1080p 分辨率、最長 20 秒的視頻。

wKgZPGdZq3yAI5W2AAM40FlGZ88511.jpg

OpenAI CEO奧特曼稱,Sora正式版是視頻生成領域的GPT-1時刻。

但國內(nèi)AI企業(yè),并沒有像跟進GPT時期一樣,在視頻生成領域也與OpenAI保持同步,而是呈現(xiàn)出更復雜的態(tài)度。

有人選擇跟進,比如Sora問世之后,互聯(lián)網(wǎng)公司如阿里、字節(jié)跳動、快手、騰訊等,AI公司如智譜AI、MiniMax、愛詩科技、生數(shù)科技等,都陸續(xù)發(fā)布了視頻生成模型,不少都表示達到或超越了預覽版Sora。

也有人選擇不跟進,包括互聯(lián)網(wǎng)公司中的百度,李彥宏曾明確表示,“無論Sora多么火爆百度都不去做”。AI公司如百川智能,也明確表示不會做類Sora模型,月之暗面、商湯科技、零一萬物雖然都有文生視頻模型,但都不作為重點。

視頻生成賽道,不再延續(xù)GPT時代的發(fā)展模式,即OpenAI打出一張王牌,國內(nèi)科技企業(yè)搶著要跟。Sora之后,國內(nèi)AI牌局開始有了自己的節(jié)奏,也呈現(xiàn)出更為復雜的局勢。

有能力做通用基礎大模型的國內(nèi)科技公司,在技術路線、商業(yè)前景等判斷上,開始出現(xiàn)明顯分野。我們就從國內(nèi)企業(yè)跟進Sora的選擇與否,聊聊視頻生成的中國牌局。

wKgZO2dZq3yAUJLRAAG0zyA1AVA160.jpg

首先我們要明確一下,國內(nèi)對標Sora模型的科技公司,到底在做什么?

簡單來說,Sora視頻生成模型的核心技術路線是Diffusion+Transformer相結(jié)合,通過文本(自然語言)、圖片、視頻作為提示詞prompts進行視頻生成。

對標Sora的模型,至少要具備幾個特點:

1.通用性,不針對某一類風格、行業(yè)、角色等,任意內(nèi)容的視頻都可以生成。

2.高質(zhì)量,畫質(zhì)精度高(達到1080p)、視頻時間長(最長達一分鐘)、畫面一致性強(理解物理規(guī)律)。

面對Sora,國內(nèi)科技企業(yè)不像ChatGPT推出時那樣毫無準備。但到底跟or不跟,卻不再像ChatGPT那樣高度一致,而是分化成了三類:

第一類,明確跟進。

互聯(lián)網(wǎng)公司陣營中,以視頻為核心業(yè)務的字節(jié)跳動、快手等,以及綜合科技公司騰訊,數(shù)字基建成熟,技術人才資源充沛,內(nèi)部有視頻產(chǎn)品基因,幾乎第一時間選擇了跟進。字節(jié)跳動推出了即夢Dreamnia,快手也發(fā)布了可靈大模型。騰訊以混元大模型作為核心,發(fā)布并開源了混元多模態(tài)生成模型,被認為是騰訊版Sora。

wKgZO2dZq32AGgW6AAMBu39pjss846.jpg

大模型初創(chuàng)企業(yè)中,智譜AI的行動最為敏捷,今年7月發(fā)布了AI視頻生成工具清影,支持用戶通過文本/圖片,生成10秒、4K、60幀視頻。MiniMax的海螺AI也在十月增加了視頻生成能力,支持文本提示詞生成6秒視頻片段。

第二類,堅決不跟。

與第一類企業(yè)的態(tài)度截然相反,互聯(lián)網(wǎng)公司和大模型創(chuàng)企中也有堅決不跟Sora的。比如Sora問世之后,百川智能的王小川就表示,團隊有人提出要做Sora,但他明確表態(tài)稱不會跟進這個方向。

同樣想法的還有百度李彥宏,盡管百度已經(jīng)在視頻生成領域取得了一定的成果,但他不做Sora的態(tài)度也非常堅決,原因是Sora的商業(yè)化可能要五年甚至十年,目前百度更聚焦在大語言模型、多模態(tài)大模型,沒有類Sora的產(chǎn)品化嘗試。

第三類,淺嘗輒止。

除此之外,還有大量國內(nèi)企業(yè)對于Sora,出于FOMO“恐懼錯過”心理有所布局,但并不重點投入,處于一種淺嘗輒止的狀態(tài)。

比如阿里系中的阿里媽媽團隊發(fā)布了tomoVideo,試水電商營銷的視頻生成場景;“大模型六小虎”中,月之暗面也推出了視頻生成模型,但仍聚焦在kimi產(chǎn)品上;零一萬物入局B端業(yè)務,而視頻生成模型面向的影視制作行業(yè)正處于調(diào)整期,類Sora產(chǎn)品也很難成為核心增長點。

總結(jié)一下,如果說全球大模型是一場“斗地主”,那么游戲規(guī)則不再是OpenAI打出一張王炸,國內(nèi)科技公司紛紛跟上,而是各自按照自己手里的牌面、業(yè)務重要性和優(yōu)先級,來確定Sora的出牌策略。

為什么到了Sora,大模型行業(yè)的游戲規(guī)則就變了?

wKgZPGdZq36ADSo2AAG9K0tAYY8620.jpg

國內(nèi)科技企業(yè)的表現(xiàn)說明,對于Sora存在非共識,整體還是比較混亂、規(guī)則模糊的階段。迷霧中的領域,游戲規(guī)則自然只能自行探索。

如今視頻生成領域的現(xiàn)狀,籠罩著三重迷霧。

技術迷霧:OpenAl認為Sora是世界模擬器、通往AGl的一條有前途的途徑,這一技術路線目前存在不少爭議。

比如李飛飛、lecun等人認為,Sora不能實現(xiàn)AGI。李飛飛提出,Sora仍是二維圖像,只有三維空間智能才能實現(xiàn)AGI。Sora預覽版展示的“日本女性走過霓虹閃爍東京街頭”的生成視頻,就無法把攝像機放在女子背后,說明Sora并沒有真的理解三維世界。學術大神Lecun也點名不看好Sora,說它根本不是真正的世界模型,并且仍會面臨GPT4的巨大瓶頸。

確實,即使是正式版Sora,生成的手部細節(jié)不準確,動態(tài)過程中的一致性等問題,依然存在。

而國內(nèi)公司堅定不跟進Sora的原因之一,也是對這一技術路線保留意見。比如百川智能的王小川就認為,Sora只是階段性產(chǎn)物,技術高度、突破性以及應用價值均不及GPT。總之,實現(xiàn)AGI、模擬物理世界的技術路線的開放性,決定了Sora并非唯一解。

商業(yè)迷霧:視頻生成模型的商用前景、投資回報比,在短期內(nèi)都不明朗,成為勸退國內(nèi)企業(yè)的另一重阻礙。

預覽版和正式版Sora,都延續(xù)了OpenAI的“暴力美學”,OpenAI 研究科學家 Noam Brown 表示,Sora是scale力量最直觀的展示,也就是通過堆算力、對數(shù)據(jù)、對參數(shù)量的方式,來嘗試讓大模型涌現(xiàn)出理解物理世界的能力。這種方法成本高、資源投入大。是否跟進Sora,就取決于各家對模型的商用預期和投資回報比。

如果視頻生成模型面向ToB收費,通過API或SaaS服務,都需要基礎模型廠商投入大量人力去優(yōu)化業(yè)務流程、開發(fā)交互頁面,而影視行業(yè)正處于調(diào)整周期,AI影視制作業(yè)務的增長有限。這就在無形中增加了AI企業(yè)的機會成本,因為同樣的人力、物力、算力,投入到金融AI、教育AI、大型政企等領域,顯然收效更大。所以,百度、零一萬物等公司,都將視頻生成領域作為邊緣業(yè)務,并不重點投入。

而ToC場景中,一方面?zhèn)€人付費意愿不高,視頻生成并不是大眾日常使用的高頻場景,而且生成成本和訂閱費一般都比文本模型高,加上Sora模型都沒能解決幻覺、一致性難題,未必能創(chuàng)造實際價值,所以C端付費規(guī)模十分有限。另一方面,模型完全免費,把視頻生成模型產(chǎn)品作為企業(yè)的流量入口,這一商業(yè)模式只適合將視頻作為核心業(yè)務的企業(yè)。

比如快手、字節(jié)跳動,本身就有核心的視頻業(yè)務,可以快速實現(xiàn)模型的規(guī)模化。面向C端用戶或B端生產(chǎn)力工具,這類企業(yè)能夠快速將視頻生成能力與現(xiàn)有產(chǎn)品進行集成與整合,模型研發(fā)的邊際成本是會隨著規(guī)模商用而下降的。

整體來看,對國內(nèi)絕大多數(shù)基礎模廠,視頻生成領域都是一個相對邊緣、投資回報比不高的業(yè)務。

第三重迷霧,就是市場格局的競爭迷霧。

雖然視頻生成模型現(xiàn)在商業(yè)前景不明,但有沒有可能以后會爆發(fā),企業(yè)悄悄投入然后驚艷所有人?這種押注邊緣賽道“撿大漏”的商業(yè)神話,在大模型身上恐怕很難發(fā)生。

當前,大模型的產(chǎn)品化、商業(yè)化前景普遍比較模糊,通用模型廠商都需要盡快從一大堆不甚明朗的產(chǎn)品中,選出一個更高成功概率和更大市場潛力的選項,重點投入。而在所有產(chǎn)品中,視頻生成模型是一個尤為沉重且具有挑戰(zhàn)性的項目。這種情況下,肯定要優(yōu)先考慮成功率更高的產(chǎn)品,降低視頻生成模型的業(yè)務優(yōu)先級。

換一個角度,即便企業(yè)將視頻生成模型的優(yōu)先級放到最高,恐怕也很難建立起競爭優(yōu)勢。因為當前大模型的市場競爭情況跟GPT時期不太一樣,如今各家在基礎訓練設施、核心架構(gòu)設計與技術儲備等方面都有了一定積累,復現(xiàn)Sora并上線類Sora應用的技術壁壘,其實沒有ChatGPT時期那么難了。這也意味著,即使企業(yè)先發(fā)布了視頻生成模型,也未必能長期保持競爭優(yōu)勢和市場壟斷地位,這種競爭態(tài)勢也削弱了Sora的商業(yè)想象空間。

技術迷霧、商業(yè)迷霧、競爭迷霧,仍然籠罩在視頻生成領域,導致Sora這一場牌局有著太多的不確定,和太多可能。哪種理解是對的,哪條路線是最終贏家,目前都言之過早,各家只能按照自己的游戲規(guī)則玩下去。

wKgZO2dZq4GAb8SYAAGsitZg7cQ964.jpg

大模型技術必須繼續(xù)發(fā)展下去,但從Sora開始,國內(nèi)科技企業(yè)不再緊跟著OpenAI亦步亦趨,開始有了自己的節(jié)奏感。

具體表現(xiàn)在,對于Sora這樣一鳴驚人的新東西,國內(nèi)企業(yè)在大模型產(chǎn)品化、商業(yè)化上都有了自己的理解與思考,開始自己定義玩法,跟進Sora展現(xiàn)的是實力,不跟進Sora展現(xiàn)的是心態(tài)與戰(zhàn)略定力。

此外,不一味跟進產(chǎn)品,但OpenAI的敘事能力仍然值得學習。

wKgZPGdZq4GAWF7MAAM_RyY40wg203.jpg

無論是2月用Sora搶走谷歌風頭,還是近期Sora正式上線,OpenAI總能一次次帶動節(jié)奏、設置議題、吸引關注,這對于資本密集型AI企業(yè)是非常重要的能力。

可以不跟進Sora,但不能遺漏關鍵技術。

以百度為例,雖然沒有推出Sora產(chǎn)品的計劃,但自身也沒有缺席關鍵技術,比如自研了多模態(tài)可控生圖技術,能夠在保持實體特征不變的情況下,實現(xiàn)圖像的高泛化生成,而可控性的提升,恰恰是視頻生成下一階段核心中的核心。此外,百度也沒有完全無視視頻生成領域,目前投資了視頻生成初創(chuàng)公司生數(shù)科技、AI視頻短劇公司井英科技等。

聚焦主賽道,以自身核心業(yè)務、商業(yè)優(yōu)先級等多元因素來確定追趕Sora的輕重緩急。大模型的牌局,國內(nèi)企業(yè)正在找到自己的節(jié)奏感。

wKgZPGdZq4KATSv4AAGy_4FMs5s928.jpg

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    90

    文章

    38413

    瀏覽量

    297688
  • Sora
    +關注

    關注

    0

    文章

    86

    瀏覽量

    761
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    商湯科技日日新Seko系列模型與寒武紀成功適配

    12月15日,商湯科技基于在生成式AI與多模態(tài)交互領域的技術積累,正式發(fā)布Seko2.0——行業(yè)首個多劇集生成智能體。該智能體在多劇集視頻生成的一致性方面展現(xiàn)出顯著優(yōu)勢,其背后依托的是商湯自研的日日新Seko系列
    的頭像 發(fā)表于 12-17 14:06 ?149次閱讀

    OpenAI Sora 2模型上線微軟Azure AI Foundry國際版

    我們非常激動地宣布,OpenAI 的新一代多模態(tài)視頻生成模型 Sora 2 現(xiàn)已在 Azure AI Foundry(國際版)上線,進入公共預覽階段。
    的頭像 發(fā)表于 10-22 09:44 ?503次閱讀
    OpenAI <b class='flag-5'>Sora</b> 2<b class='flag-5'>模型</b>上線微軟Azure AI Foundry國際版

    看點:谷歌Veo 3.1迎來重大更新硬剛Sora 2 12英寸硅片國產(chǎn)龍頭西安奕材今日申購

    給大家?guī)硪恍I(yè)界資訊: 谷歌Veo 3.1迎來重大更新硬剛Sora 2 據(jù)外媒報道,在10月16日,谷歌發(fā)布了AI視頻生成模型Veo 3.1,升級音頻集成與敘事控制能力;以及更逼真的質(zhì)感還原。在
    的頭像 發(fā)表于 10-16 16:00 ?867次閱讀

    別只盯著Sora中國AI視頻的實時交互已悄悄領先

    告別抽卡,國產(chǎn)圖生視頻模型已經(jīng)卷到next level
    的頭像 發(fā)表于 10-16 10:54 ?2586次閱讀
    別只盯著<b class='flag-5'>Sora</b>,<b class='flag-5'>中國</b>AI<b class='flag-5'>視頻</b>的實時交互已悄悄領先

    全球首個動漫專屬AI視頻生成平臺Animon,國內(nèi)版&quot;萌動AI&quot;正式發(fā)布

    Animon國內(nèi)版——"萌動AI"首秀:AI動漫創(chuàng)作進入全民時代 北京2025年9月25日?/美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首個專注于動漫的AI視頻生成
    的頭像 發(fā)表于 09-25 12:33 ?603次閱讀

    百度重磅發(fā)布!全球首創(chuàng)中文音視頻模型

    電子發(fā)燒友網(wǎng)綜合報道 2025年7月2日,百度在北京正式發(fā)布全球首個中文音視頻一體化生成模型——MuseSteamer,標志著其正式進軍圖生視頻領域。這款
    的頭像 發(fā)表于 07-11 09:18 ?4087次閱讀

    一種基于擴散模型視頻生成框架RoboTransfer

    在機器人操作領域,模仿學習是推動具身智能發(fā)展的關鍵路徑,但高度依賴大規(guī)模、高質(zhì)量的真實演示數(shù)據(jù),面臨高昂采集成本與效率瓶頸。仿真器雖提供了低成本數(shù)據(jù)生成方案,但顯著的“模擬到現(xiàn)實”(Sim2Real)鴻溝,制約了仿真數(shù)據(jù)訓練策略的泛化能力與落地應用。
    的頭像 發(fā)表于 07-09 14:02 ?663次閱讀
    一種基于擴散<b class='flag-5'>模型</b>的<b class='flag-5'>視頻生成</b>框架RoboTransfer

    4K、多模態(tài)、長視頻:AI視頻生成的下一個戰(zhàn)場,誰在領跑?

    電子發(fā)燒友網(wǎng)報道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動最新視頻模型,支持文字與圖片輸入,可
    的頭像 發(fā)表于 06-16 00:13 ?6979次閱讀

    《AI Agent 應用與項目實戰(zhàn)》----- 學習如何開發(fā)視頻應用

    開發(fā)一個視頻內(nèi)容生成Agent。 訪問語聚AI平臺官網(wǎng) ,進行注冊或登錄。 在平臺首頁,了解語聚AI的功能和應用場景,特別是其支持的視頻生成相關的AI模型和工具。 在語聚AI平臺
    發(fā)表于 03-05 19:52

    階躍星辰開源多模態(tài)模型,天數(shù)智芯迅速適配

    近日,頭部大模型創(chuàng)業(yè)公司階躍星辰在行業(yè)內(nèi)引起了軒然大波,宣布正式開源兩款Step系列多模態(tài)模型——Step-Video-T2V視頻生成模型和Step-Audio語音交互
    的頭像 發(fā)表于 02-19 14:30 ?854次閱讀

    字節(jié)跳動即將推出多模態(tài)視頻生成模型OmniHuman

    字節(jié)跳動旗下一站式AI創(chuàng)作平臺即夢AI即將迎來重大更新,全新多模態(tài)視頻生成模型OmniHuman即將上線。這款模型是字節(jié)跳動自研的閉源模型,其強大的功能令人矚目:僅需一張圖片與一段音頻
    的頭像 發(fā)表于 02-08 10:53 ?1168次閱讀

    阿里云通義萬相2.1視頻生成模型震撼發(fā)布

    近日,阿里云旗下的通義萬相迎來了重要升級,正式推出了全新的萬相2.1視頻生成模型。這一創(chuàng)新成果標志著阿里云在視頻生成技術領域的又一次重大突破。 據(jù)悉,萬相2.1視頻生成
    的頭像 發(fā)表于 01-13 10:00 ?1149次閱讀

    OpenAI攻克Sora視頻創(chuàng)建錯誤率高難題

    在人工智能與多媒體技術的交叉領域,OpenAI近期宣布了一項重要進展:成功解決了Sora視頻創(chuàng)建過程中錯誤率高的問題。這一突破不僅標志著OpenAI在視頻處理技術上取得了顯著進步,也為廣大用戶帶來
    的頭像 發(fā)表于 12-31 10:37 ?870次閱讀

    Google兩款先進生成式AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質(zhì)的圖像生成模型Imagen 3。近日,我們在 Google Cloud 上進一步
    的頭像 發(fā)表于 12-30 09:56 ?1008次閱讀

    華為云 Flexus 云服務器 X 實例 Windows 系統(tǒng)部署一鍵短視頻生成 AI 工具 moneyprinter

    在追求創(chuàng)新與效率并重的今天,我們公司迎難而上,決定自主搭建一款短視頻生成 AI 工具——MoneyPrinter,旨在為市場帶來前所未有的創(chuàng)意風暴。面對服務器選擇的難題,我們經(jīng)過深思熟慮與多方比較
    的頭像 發(fā)表于 12-30 09:10 ?987次閱讀
    華為云 Flexus 云服務器 X 實例 Windows 系統(tǒng)部署一鍵短<b class='flag-5'>視頻生成</b> AI 工具 moneyprinter