OpenAI的視頻生成模型Sora持續引發關注,而圍繞Sora到底懂不懂物理世界?這個討論越發火熱,甚至是在討論Sora 到底是不是物理引擎甚至世界模型?
當然Sora 目前看起來似乎還微有瑕疵,但是視頻效果已經足以震撼人心,而且OpenAI自己也認為確實還是有很多問題,比如Sora可能會混淆左右,比如Sora難以準確體現隨時間推移而發生的事件,但是這些問題似乎都不會是Sora改進的阻礙。
業界當然還有多種聲音,比如英偉達高級研究科學家Jim Fan 認為Sora 是一個數據驅動的物理引擎,是一個可學習的模擬器,或者可以說是一個世界模型。
還有圖靈獎得主Yann LeCun則認為僅僅根據 prompt 生成逼真視頻并不能代表一個模型理解了物理世界,生成視頻的過程與基于世界模型的因果預測完全不同。
還有觀點認為Sora可以說確實是已經嵌入了物理模型,但問題是這個物理模型是否已經就是準確的?邏輯能力依然不行。
不管大牛們怎么看,Sora的能力確實很強大,Sora 生成的視頻能夠展現出精細的場景,還有生動的角色表情和復雜的鏡頭動態。文本轉視頻模型似乎已經非常完美。
有網友評論稱“首個大型視頻生成模型”的名號肯定沒跑了,期待國產大模型反超。
當然未來Sora落地應用,克服算力需求也是一大問題。
這一次Sora 讓大家看到了AI的技術已經擴展到了視頻領域;Sora的強大令人震驚,業界多認為Sora展示了人工智能在理解真實世界場景并與之互動的能力,這被認為是朝著實現通用人工智能(AGI)的重要一步。未來Sora會將在更多領域得到推廣應用。
盡管目前Sora尚未對外開放公測,也未提供內部測試的申請途徑。還只是在內部測試,但是全球都充滿了期待。
-
OpenAI
+關注
關注
9文章
1245瀏覽量
10072 -
大模型
+關注
關注
2文章
3650瀏覽量
5183 -
Sora
+關注
關注
0文章
86瀏覽量
808
發布評論請先 登錄
一文讀懂:黃仁勛重點布局的“物理AI”(Physic AI)
物理AI之眼:當3D視覺與激光雷達成為硅基智能世界的“智瞳”
世界模型是讓自動駕駛汽車理解世界還是預測未來?
聲智科技提出物理信息約束的聲學世界模型
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發
ADI CodeFusion Studio 2.0助力實現物理智能
OpenAI Sora 2模型上線微軟Azure AI Foundry國際版
看點:谷歌Veo 3.1迎來重大更新硬剛Sora 2 12英寸硅片國產龍頭西安奕材今日申購
Sora2五天下載量破百萬!超越ChatGPT增長速度,App Store免費榜霸榜第一
聲智科技聲學模型賦予AI感知物理世界
NVIDIA通過全新 Omniverse庫、Cosmos物理AI模型及AI計算基礎設施,為機器人領域開啟新篇章
泰克科技解析AI服務器電源架構的技術演進
10BASE-T1S 以太網 —— 連接物理世界和數字世界
Sora到底懂不懂物理世界? Sora開啟更多可能
評論