国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

蒙娜麗莎一鍵復活 三星AI一張圖片就能合成動畫

電子工程師 ? 來源:fqj ? 2019-05-27 17:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

還記得哈利?波特第一次來到霍格沃茨看到墻上那些既會動又會說話的掛畫是多么驚訝嗎?如果我們可以將掛畫 “復活”,和 500 多年前的蒙娜麗莎來場穿越時空的對話會怎樣呢?感謝 AI 技術,把畫 “復活” 不再是夢!

名畫《蒙娜麗莎的微笑》,會動了!

夢娜麗莎轉過頭,嘴里說著話,微微眨了眨眼,臉上帶著溫婉的微笑。

是的,《哈利·波特》世界中”會動的畫“魔法實現了!來自三星AI中心(Samsung AI Center)和莫斯科斯的Skolkovo 科學技術研究所的一組研究人員,開發了一個能將讓JPEG變GIF的AI系統。

《哈利·波特》中守衛格蘭芬多學院休息室的胖夫人畫像

更牛逼的是,該技術完全無需3D建模,僅需一張圖片就能訓練出惟妙惟肖的動畫。研究人員稱這種學習方式為“few-shot learning"。當然,如果有多幾張照片——8張或32張——創造出來動圖效果就更逼真了。比如:

愛因斯坦給你講物理:

瑪麗蓮夢露和你 flirt:

本周,三星AI實驗室的研究人員發表了一篇題為 “Few-Shot Adversarial Learning of Realistic Neural Talking Head Models” 的論文,概述了這種技術。該技術基于卷積神經網絡,其目標是獲得一個輸入源圖像,模擬目標輸出視頻中某個人的運動,從而將初始圖像轉換為人物正在說話的短視頻。

論文一發表馬上引起轟動,畢竟這項技術創造了巨大的想象空間!

類似這樣的項目有很多,所以這個想法并不特別新穎。但在這篇論文中,最有趣的是,該系統不需要大量的訓練示例,而且系統只需要看一次圖片就可以運行。這就是為什么它讓《蒙娜麗莎》活起來。

3個神經網絡,讓蒙娜麗莎活起來

這項技術采用“元學習”架構,如下圖所示:

圖2:“讓照片動起來”元學習架構

具體來說,涉及三個神經網絡:

首先,嵌入式網絡映射輸入圖像中的眼睛、鼻子、嘴巴大小等信息,并將其轉換為向量;

其次,生成式網絡通過繪制人像的面部地標(face landmarks)來復制人在視頻中的面部表情;

第三,鑒別器網絡將來自輸入圖像的嵌入向量粘貼到目標視頻的landmark上,使輸入圖像能夠模擬視頻中的運動。

最后,計算“真實性得分”。該分數用于檢查源圖像與目標視頻中的姿態的匹配程度。

元學習過程:只需1張輸入圖像

研究人員使用VoxCeleb2數據集對這個模型進行了預訓練,這是一個包含許多名人頭像的數據庫。在這個過程中,前面描述的過程是一樣的,但是這里的源圖像和目標圖像只是同一視頻的不同幀。

因此,這個系統不是讓一幅畫去模仿視頻中的另一個人,而是有一個可以與之比較的ground truth。通過持續訓練,直到生成的幀與訓練視頻中的真實幀十分相似為止。

預訓練階段允許模型在只有很少示例的輸入上工作。哪怕只有一張圖片可用時,結果也不會太糟,但當有更多圖片可用時,結果會更加真實。

實驗和結果

研究人員使用2個數據集分別進行定量和定性評估:VoxCeleb1數據集用于與基準模型進行比較,VoxCeleb2用于展示他們所提出方法的效果。

研究人員在三種不同的設置中將他們的模型與基準模型進行了比較,使用fine-tuning集中的1幀、8幀和32幀。

蒙娜麗莎一鍵復活 三星AI一張圖片就能合成動畫

表1:few-shot learning設置下不同方法的定量比較

結果如表1上半部分所示,基線模型在兩個相似性度量上始終優于我們的方法。

不過,這些指標不能完全代表人類的感知,因為這兩種方法都會產生恐怖谷偽影,從圖3的定性比較和用戶研究結果可以看出。

另一方面,余弦相似度與視覺質量有更好的相關性,但仍然傾向于模糊、不太真實的圖像,這也可以通過表1-Top與圖3中的比較結果看出。

圖3:使用1張、8張和32張訓練圖像時的三個示例。系統采用一個源圖像(第1列),并嘗試將該圖像映射到ground truth幀中的相同位置(第2列)。研究人員將他們的結果與X2Face、PixtopixHD模型進行了比較。

大規模的結果。

隨后,我們擴展可用的數據,并在更大的VoxCeleb2數據集中訓練我們的方法。

下面是2個變體模型的結果:

圖4:在VoxCeleb2數據集中的最佳模型的結果。

同樣,訓練幀的數量是T(左邊的數字),第1列是示例訓練幀。第2列是ground truth圖像,后3列分別是我們的FF feed-forward 模型及微調前后的結果。雖然 feed-forward變體的學習更快速,但fine-tuning 最終提供了更好的真實感和保真度。

最后,我們展示了的照片和繪畫的結果。

圖5:讓靜態照片“活”起來

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 三星電子
    +關注

    關注

    34

    文章

    15894

    瀏覽量

    183111
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301362

原文標題:蒙娜麗莎一鍵“復活”!三星AI Lab:只需一張圖片就能合成動畫

文章出處:【微信號:aicapital,微信公眾號:全球人工智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    三星電子正式發布Galaxy Z TriFold

    2025年12月2日,三星電子正式發布Galaxy Z TriFold,進步鞏固了三星在移動AI時代中針對形態創新的行業優勢。
    的頭像 發表于 12-03 17:46 ?1548次閱讀

    城市一張網,以數據之橋擎托未來

    以“城市一張網”為基石,打造可信數據空間,賦能全域數字化轉型
    的頭像 發表于 10-14 09:29 ?2029次閱讀
    城市<b class='flag-5'>一張</b>網,以數據之橋擎托未來

    一張圖搞懂LDO的硬件設計和應用

    存在誤解,這些誤解往往會導致設計失敗。? ” 我們先通過一張圖來概括 LDO 的應用: 線性穩壓電源與 LDO 先澄清個基礎的概念 : LDO 是線性穩壓電源的種 ,但不是所有線性穩壓電源都是 LDO。兩者都是 通過 反饋控
    的頭像 發表于 09-23 17:22 ?8650次閱讀
    <b class='flag-5'>一張</b>圖搞懂LDO的硬件設計和應用

    分享---儲能UI界面能量流動動畫實現方法

    工程,工程分辨率選中1024*600 設備型號選擇 HMT070ETA-D 創建工程后,新建個頁面PG0000 導入一張背景圖,并此圖片設置為PG0000頁面的背景圖 第2步:建立動畫
    發表于 09-02 18:22

    告別多設備!揭秘QM系列閃測儀如何一鍵搞定多元檢測

    QM 系列一鍵閃測儀作為方案核心,搭載雙視野雙遠心鏡頭與 2000 萬像素 CMOS 傳感器,測量精度可達 ±1μm。其內置的 AI 深度學習系統經過海量工業樣本訓練,能一鍵識別 5000 個測量
    的頭像 發表于 08-11 13:43 ?1031次閱讀
    告別多設備!揭秘QM系列閃測儀如何<b class='flag-5'>一鍵</b>搞定多元檢測

    HarmonyOS應用一鍵置灰指南

    一鍵置灰通常應用于如下場景 1. 重大悼念活動: 在國家發生重大災難、事故或舉行悼念日等特殊時期,為了表達對逝者的尊重和哀悼,許多 APP 會將界面置灰。例如,在些地震、空難等災難事件發生后,以及
    的頭像 發表于 06-27 00:08 ?585次閱讀

    回收三星S21指紋排線 適用于三星系列指紋模組

    深圳帝歐電子回收三星S21指紋排線,收購適用于三星S21指紋模組。回收三星指紋排線,收購三星指紋排線,全國高價回收三星指紋排線,專業求購指紋
    發表于 05-19 10:05

    電源一鍵多用:POWER_ON從開機到場景指揮官!

    按鍵,即開關機,在結構設計上可以實現 一鍵多用 ——既可以有效減少結構的按鍵設計,也可以使整機更加簡潔。 本文以Air8000核心板為例,分享POWER_ON按鍵功能及其硬件設計、軟件demo相關內容。 最新開發資料詳見: www.air8000.cn
    的頭像 發表于 05-15 14:10 ?4120次閱讀
    電源<b class='flag-5'>鍵</b>的<b class='flag-5'>一鍵</b>多用:POWER_ON從開機到場景指揮官!

    全新上線IPC精彩時刻!配套On-App AI視頻剪輯模板+全天候一鍵抓拍

    次走路、日出日落等),并一鍵生成帶特效的專屬Vlog。能夠滿足嬰兒/寵物看護、生活娛樂、風景旅行等全場景需求,幫助用戶輕松記錄生活中的高光時刻!針對有視頻處理需
    的頭像 發表于 05-08 19:06 ?1041次閱讀
    全新上線IPC精彩時刻!配套On-App <b class='flag-5'>AI</b>視頻剪輯模板+全天候<b class='flag-5'>一鍵</b>抓拍

    U盤一鍵制作

    在電腦維修中啟動盤很重要,靠譜的u盤一鍵啟動制作方法
    發表于 05-06 16:10 ?44次下載

    三星在4nm邏輯芯片上實現40%以上的測試良率

    三星電子在 HBM3 時期遭遇了重大挫折,將 70% 的 HBM 內存市場份額拱手送給主要競爭對手 SK 海力士,更是近年來首度讓出了第大 DRAM 原廠的寶座。這迫使三星在 HBM4 上采用
    發表于 04-18 10:52

    Profinet邂逅ModbusRTU:印刷廠有網關“一鍵打通”通信鏈路

    Profinet邂逅ModbusRTU:印刷廠有網關“一鍵打通”通信鏈路
    的頭像 發表于 04-08 17:11 ?575次閱讀
    Profinet邂逅ModbusRTU:印刷廠有網關“<b class='flag-5'>一鍵</b>打通”通信鏈路

    三星以生態之力,共筑AI未來

    在日前舉行的2025年博鰲亞洲論壇年會上,人工智能議題再度成為關注的熱點。在這場關乎未來競爭力的探討中,三星憑借科技實力,在人工智能領域前瞻布局,通過持續的技術創新,展現了其在推動AI發展方面的堅定
    的頭像 發表于 03-28 15:43 ?941次閱讀
    <b class='flag-5'>三星</b>以生態之力,共筑<b class='flag-5'>AI</b>未來

    是德科技與三星和NVIDIA合作展示AI-for-RAN技術

    是德科技(NYSE: KEYS )與三星和 NVIDIA 合作,訓練用于三星 5G-Advanced 和 6G 技術的人工智能(AI)模型。這使得三星能夠在其虛擬無線接入網絡(vRAN
    的頭像 發表于 03-06 14:28 ?1230次閱讀

    三星Galaxy S25系列:AI天團賦能,重塑旗艦新標桿

    為“智能伙伴”。與此同時,三星特別成立“三星AI天團”,邀請演員金晨擔任團長兼AI顏值官,李川擔任AI智慧管,孫越擔任
    的頭像 發表于 03-06 11:40 ?1610次閱讀