国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MIT提出語義分割技術,電影特效自動化生成

MqC7_CAAI_1981 ? 來源:未知 ? 作者:胡薇 ? 2018-08-23 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自 MIT CSAIL 的研究人員開發了一種精細程度遠超傳統語義分割方法的「語義軟分割」技術,連頭發都能清晰地在分割掩碼中呈現。在對比實驗中,他們的結果遠遠優于 PSPNet、Mask R-CNN、spectral matting 等基準。這項技術對于電影行業的 CGI 技術具有重大意義,精細的分割掩碼能很好地分離圖像中的前景和背景,只要鼠標一點,就能輕易地改變前景、背景的種類。也就是說,像《變形金剛》《復仇者聯盟》《奇幻森林》中的大部分電影特效將可以完全自動化地生成。

隨著電影越來越關注 CGI,電影制作人必須更加擅長「合成」,即將前景和背景圖像融合,比如將演員放在飛機或行星上,或者放在電影《黑豹》里瓦坎達這樣的虛構世界中。

讓這些圖像看起來真實并不容易。編輯必須捕捉前景和背景之間微妙的美學過渡,這對于頭發這種復雜精細的材料來說尤其困難,因為人們已經習慣了它的樣子。

麻省理工學院計算機科學與人工智能實驗室(MIT CSAIL)的訪問研究員 Yagiz Aksoy 說:「這些圖像的棘手之處在于,并非每個像素都只屬于一個物體。很多情況下,你很難確定哪些像素屬于背景,哪些屬于特定的人。」

除了那些經驗最豐富的編輯,對其他人來說要把這些細節都處理好是一件乏味、耗時且非常困難的事情。但是在一篇新論文中,Aksoy 和他在 MIT CSAIL 的同事展示了一種方法,使用機器學習來自動化照片編輯過程中的多個步驟,并且稱這種方法也可用于運動圖像。

該方法允許他們自動將輸入圖像分解成一組不同的層,這些層被層之間的一系列「軟過渡」分隔開。

該系統被稱為「語義軟分割」(semantic soft segmentation,SSS),它分析原始圖像的紋理和顏色,并將其與神經網絡收集的圖像中物體的實際信息相結合。

Aksoy 說,「一旦計算出這些軟分割,用戶就不必手動改變過渡或對圖像特定層的外觀進行單獨修改。」他上周在溫哥華的計算機圖形學會議 SIGGRAPH 上展示了這篇論文。「手動編輯任務,如替換背景和調整顏色,將會變得更加容易。」

不過要說明的一點是,SSS 目前專注于靜態圖像。但是該團隊表示,不久以后將它用于視頻也是可以的,這將推動其在電影制作中的應用。

Aksoy 表示,該方法不需要專業編輯花幾分鐘時間逐個幀、逐個像素地調整圖像,而是使處理過程更簡單、快速,以便非專業用戶也可以更容易地進行圖像編輯。他們期望,編輯只需點擊一下鼠標,就能組合圖像,創造那些成熟、真實的幻想世界。

他還表示,SSS 的目前版本可用于社交平臺,如 Instagram 和 Snapchat,以使其過濾器更加真實,特別是用于改變自拍背景或模擬特定類型的相機時。未來,研究人員計劃將計算圖像所需時間從幾分鐘縮短到幾秒鐘,并通過提高系統匹配顏色和處理光照、陰影等問題的能力使圖像變得更加逼真。

論文:Semantic Soft Segmentation

論文鏈接:http://cfg.mit.edu/sites/cfg.mit.edu/files/sss_3.pdf

摘要:對圖像區域之間的軟過渡進行準確表征對于高品質圖像編輯及合成至關重要。生成此類表征的現有技術很大程度上依賴于技術嫻熟的視覺藝術家,因為執行此類精確目標選擇是一項繁冗的任務。本研究介紹了語義軟分割——一組與圖像中語義有意義的區域相對應的層,它們在不同對象之間有準確的軟過渡。我們利用光譜分割角度來處理這個問題,并提出了一種圖結構,其包含圖像的紋理和顏色特征以及神經網絡生成的高級語義信息。軟分割是通過精心構建的拉普拉斯矩陣的特征分解完全自動生成的。使用我們的語義軟分割,原本復雜的圖像編輯任務可以毫不費力地完成。

圖 1:我們提出了一種方法,通過將高層次和低層次的圖像特征融合在一個圖結構中來自動生成軟分割,即表示語義上有意義的區域以及它們之間軟過渡的層。語義軟分割使用為每個分割部分分配純色的方法實現可視化,它們可用作目標圖像編輯任務的掩碼,所選圖層可在圖層顏色評估之后用于合成。原始圖像來自 [Lin et al. 2014](左上、右下)、Death to the Stock Photo(右上)、Y. Aksoy(左下)。

圖 2:對于輸入圖像,我們生成像素級的超維語義特征向量,并利用紋理和語義信息定義一張圖。構建該圖的目的是使對應的拉普拉斯矩陣及其特征向量能夠揭示語義對象和對象之間的軟過渡(soft transition)。我們使用特征向量創建初步的軟分割集,并結合它們獲取具備語義含義的分割。最后,我們細化軟分割,使之可用于目標圖像編輯任務。圖源:[Lin et al. 2014],編輯結果的背景來自 Flickr 用戶 rumpleteaser。

圖 9、10:我們展示了我們的結果以及 Zhao et al. [2017] (PSPNet)、He et al. [2017] (Mask R-CNN) 和光譜摳圖(spectral matting)[Levin et al. 2008b] 的結果。分割結果在灰度圖像上重疊展示,方便圍繞分割邊界進行更好的評估。注意:PSPNet 和 Mask R-CNN 在物體邊界方面不夠準確,而光譜摳圖的軟分割結果超出了對象邊界。圖源:[Lin et al. 2014]。

圖 11:利用輸入圖像(a)和特征向量(b),我們的方法生成了 matte,見(c)。我們展示了具備不同未知區域寬度的 trimap,它們通過 PSPNet [Zhao et al. 2017] (d) 或 Mask R-CNN [He et al. 2017] (e) 的語義分割方法生成,無法可靠地提供前景和背景區域,對使用信息流摳圖(information-flow matting)[Aksoy et al. 2017a] 生成的結果造成負面影響。在底部示例中,PSPNet trimap 是通過選擇與對象對應的單個類別(左)或所有類別而生成的。我們還提供利用結果(f)生成的 trimap 的摳圖結果,展示了在給出準確 trimap 的情況下摳圖算法的性能。圖源: [Lin et al. 2014]。

方法

我們的目標是從輸入圖像自動生成軟分割,也就是將場景中的目標分解成多個層進行表征,包括透明度和軟過渡。每個層的每個像素由一個不透明度α∈[0,1] 增強,α=0 表示全透明,α=1 表示完全不透明,中間值表示部分不透明的程度。和該領域的其它研究(如 [Aksoy et al. 2017b; Singaraju and Vidal 2011])一樣,我們使用了一個加性的圖像構造模型:

即我們將輸入的 RGB 像素表達為每個層 i 的像素之和,這些層由對應的α值加權。我們還把每個像素的多個α值的和限制為 1,以表示完整的不透明輸入圖像。

我們的方法使用了與光譜摳圖相同的形式,也就是將軟分割任務形式化為特征值估計問題 [Levin et al. 2008b]。該方法的核心是構建拉普拉斯矩陣 L 來表征圖像中每對像素屬于同一個分割的可能性。盡管光譜摳圖僅使用了低級局部顏色信息來構建矩陣,我們描述了如何通過非局部線索和高級語義信息來增強這一方法。原始的方法也描述了如何利用稀疏化來從 L 的特征值來創建層,我們的研究表明,該原始技術的放寬限制的版本可以獲得更佳的結果。圖 2 展示了我們的方法的概覽。

圖 5:輸入圖像(a)、語義特征(b),與對應本文提出的拉普拉斯矩陣(c,頂行)以及(光譜摳圖中使用的)摳圖拉普拉斯矩陣(d,底行)的最小特征值的幾個特征向量。綠色表示特征向量的正值,紅色表示負值。我們的拉普拉斯矩陣很清晰地揭示了特征向量中的語義邊界,而摳圖拉普拉斯矩陣的特征向量延伸到了語義邊界之外,如圖虛線框中所示。圖源:[Lin et al. 2014]。

圖 6:輸入圖像(a),像素級稀疏化之前的軟分割結果(b),像素級稀疏化之后的軟分割結果(c)。顏色編碼的分割部分使用單個阿爾法通道來展示,阿爾法通道對應前景物體。最后一步清理因特征向量表達能力有限而造成的雜亂阿爾法值,同時維持軟過渡。底部示例展示了使用常數 0.9 作為稀疏化參數 γ 的稀疏化結果(d),而我們使用空間變化的 γ_p 在過渡區域進行松弛的稀疏化操作。其效果見嵌套小圖,我們的結果(c)保持了頭發周圍的軟過渡,而常數變量(d)導致了過度稀疏的結果。圖源:[Lin et al. 2014]。

圖 7:輸入圖像和計算出的語義特征(左),具備很多層的初始估計軟分割(中),grouping 后的中間軟分割結果(右)。通過為每個分割部分指定一個純色來可視化軟分割結果。注意這些結果會隨著松弛的稀疏化(relaxed sparsification)進行進一步細化。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265276
  • MIT
    MIT
    +關注

    關注

    3

    文章

    254

    瀏覽量

    24996

原文標題:MIT提出精細到頭發絲的語義分割技術,打造效果驚艷的特效電影

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    ZN-S8模塊式柔性自動化生產線實訓系統有哪些技術指標

    ZN-S8模塊式柔性自動化生產線實訓系統由哪些部分組成?ZN-S8模塊式柔性自動化生產線實訓系統有哪些技術指標?
    發表于 09-26 09:08

    模塊式柔性自動化生產線實訓系統是什么

    模塊式柔性自動化生產線實訓系統是什么?模塊式柔性自動化生產線實訓系統有哪些技術參數?
    發表于 09-27 09:23

    含有析取語義循環的不變式生成改進方法

    抽象解釋為程序不變式的自動化生成提供了通用的框架,但是該框架下的大多數已有數值抽象域只能表達幾何上是凸的約束集.因此,對于包含(所對應的約束集是非凸的)析取語義的特殊程序結構,采用傳統數值抽象域會
    發表于 01-12 13:31 ?0次下載

    聚焦語義分割任務,如何用卷積神經網絡處理語義圖像分割

    CNN架構圖像語義分割 圖像分割是根據圖像內容對指定區域進行標記的計算機視覺任務,簡言之就是「這張圖片里有什么,其在圖片中的位置是什么?」本文聚焦于語義
    發表于 09-17 15:21 ?902次閱讀

    用圖卷積網絡解決語義分割問題

    為了避免上述問題,來自中科院自動化所、北京中醫藥大學的研究者們提出一個執行圖像語義分割任務的圖模型 Graph-FCN,該模型由全卷積網絡(FCN)進行初始化。
    的頭像 發表于 05-13 15:21 ?7869次閱讀

    語義分割算法系統介紹

    圖像語義分割是圖像處理和是機器視覺技術中關于圖像理解的重要任務。語義分割即是對圖像中每一個像素點進行分類,確定每個點的類別,從而進行區域劃分
    的頭像 發表于 11-05 10:34 ?7743次閱讀

    分析總結基于深度神經網絡的圖像語義分割方法

    隨著深度學習技術的快速發展及其在語義分割領域的廣泛應用,語義分割效果得到顯著提升。對基于深度神經網絡的圖像
    發表于 03-19 14:14 ?21次下載
    分析總結基于深度神經網絡的圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b>方法

    一種具有語義區域風格約束的圖像生成框架

    生成對抗網絡近年來發展迅速,其中語義區域分割生成模型的結合為圖像生成技術研究提供了新方向。在當
    發表于 04-13 15:47 ?5次下載
    一種具有<b class='flag-5'>語義</b>區域風格約束的圖像<b class='flag-5'>生成</b>框架

    基于圖像語義分割的毛筆筆觸實時生成技術

    和筆跡。使得現存書法筆跡生成軟件僅僅用于娛樂,而難以上升到數字化書法教育層面。文中從計算機視覺的角度出發,通過4個相機獲取毛筆的實時書寫圖像:針對 Deeplabv3+語義分割算法無法有效地
    發表于 06-07 15:10 ?2次下載

    普通視覺Transformer(ViT)用于語義分割的能力

    本文探討了普通視覺Transformer(ViT)用于語義分割的能力,并提出了SegViT。以前基于ViT的分割網絡通常從ViT的輸出中學習像素級表示。不同的是,本文利用基本的組件注意
    的頭像 發表于 10-31 09:57 ?6375次閱讀

    語義分割標注:從認知到實踐

    隨著人工智能技術的不斷發展,語義分割標注已經成為計算機視覺領域的一個熱門話題。語義分割是指將圖像中的每個像素分配給一個預定義的
    的頭像 發表于 04-30 21:20 ?1816次閱讀

    基于SAM設計的自動化遙感圖像實例分割方法

    RSPrompter的目標是學習如何為SAM生成prompt輸入,使其能夠自動獲取語義實例級掩碼。相比之下,原始的SAM需要額外手動制作prompt,并且是一種類別無關的分割方法。
    發表于 07-04 10:45 ?2391次閱讀
    基于SAM設計的<b class='flag-5'>自動化</b>遙感圖像實例<b class='flag-5'>分割</b>方法

    柔性自動化生產技術有哪些_柔性自動化生產線的工作原理

    柔性自動化生產技術是一種先進的生產技術,它以工藝設計為先導,以數控技術為核心,能夠自動化地完成企業多品種、多批量的加工、制造、裝配、檢測等過程。以下是柔性
    的頭像 發表于 06-22 11:05 ?3024次閱讀

    圖像分割語義分割中的CNN模型綜述

    圖像分割語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的一種核心模型,在圖像
    的頭像 發表于 07-09 11:51 ?3042次閱讀

    圖像語義分割的實用性是什么

    圖像語義分割是一種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用,如自動駕駛、醫學圖
    的頭像 發表于 07-17 09:56 ?1483次閱讀