華盛頓大學和臉譜網的研究人員使用深度學習將靜止圖像轉換成逼真的動畫循環視頻。
他們的方法 將在即將召開的計算機視覺和模式識別會議( CVPR )上發布的這項技術模擬了連續的流體運動,如流動的水、煙和云,將靜止圖像轉換成無縫循環的短視頻。
“我們的方法的特別之處在于它不需要任何用戶輸入或額外的信息,” Aleksander Ho?yński ,華盛頓大學計算機科學與工程博士生,項目負責人說。你只需要一張照片。它可以輸出一個高分辨率的無縫循環視頻,通常看起來像一個真實的視頻。”
團隊創建了一種稱為“對稱飛濺”的方法從靜止圖像預測過去和未來的運動,結合這些數據創建無縫動畫。
“當我們看到瀑布時,我們知道水應該如何運動。火或煙也是如此。這些類型的運動遵循同一套物理規律,圖像中通常有線索告訴我們物體應該如何運動? y ń斯奇說我們很樂意將我們的工作擴展到更廣泛的對象上,比如為一個人在風中吹拂的頭發設置動畫。我希望最終我們與朋友和家人分享的照片不會是靜態的。相反,它們都是動態動畫,就像我們的方法生成的動畫一樣。”
為了教他們的神經網絡估計運動,研究小組在 1000 多個流體運動的視頻(如瀑布、河流和海洋)上訓練了這個模型。如果只給出視頻的第一幀,系統將預測未來幀中應該發生的事情,并將其預測結果與原始視頻進行比較。這種比較有助于模型改進對圖像中每個像素是否應該移動以及如何移動的預測。
研究人員使用了 NVIDIA Pix2PixHD 用于運動估計網絡訓練的 GAN 模型,以及 FlowNet2 和 PWC-Net 。模型進行訓練和推理都采用 NVIDIA GPU。培訓數據包括 1196 個獨特的視頻, 1096 個用于培訓, 50 個用于驗證, 50 個用于測試。
關于作者
Clarissa Garza 是 NVIDIA 在 2021 夏天的企業傳播實習生,她在波士頓大學新聞專業的第四年。在 NVIDIA ,她在 NVIDIA 的公司和開發者博客以及 AI 播客上工作。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5594瀏覽量
109732 -
gpu
+關注
關注
28文章
5194瀏覽量
135450
發布評論請先 登錄
基于米爾RK3576的環視實時性方案解析
車載360環視平臺:米爾RK3576開發板支持12路低延遲推流
【艾為視角】保證大方向正確!利用人工智能解決一線實際問題
360環視硬件平臺為什么推薦使用米爾RK3576開發板?
人工智能行業如何使用for循環語句進行循環
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
米爾RK3576核心板,讓360環視技術開發更簡單
超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.
360環視技術推薦的硬件平臺:支持多攝像頭與三屏異顯的理想選擇
最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)
研究人員開發出基于NVIDIA技術的AI模型用于檢測瘧疾
支持實時物體識別的視覺人工智能微處理器RZ/V2MA數據手冊
人工智能研究人員利用靜止圖像創建循環視頻
評論