国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

何愷明新作RCG:無自條件圖像生成新SOTA!與MIT首次合作!

CVer ? 來源:量子位 ? 2023-12-10 10:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大佬何愷明還未正式入職MIT,但和MIT的第一篇合作研究已經出來了:

他和MIT師生一起開發了一個自條件圖像生成框架,名叫RCG(代碼已開源)。

這個框架結構非常簡單但效果拔群,直接在ImageNet-1K數據集上實現了無條件圖像生成的新SOTA。

968392de-96ac-11ee-8b88-92fbcf53809c.png

它生成的圖像不需要任何人類注釋(也就是提示詞、類標簽什么的),就能做到既保真又具有多樣性。

968f3756-96ac-11ee-8b88-92fbcf53809c.png

這樣的它不僅顯著提高了無條件圖像生成的水平,還能跟當前最好的條件生成方法一較高下。

用何愷明團隊自己的話來說:

有條件和無條件生成任務之間長期存在的性能差距,終于在這一刻被彌補了。

那么,它究竟是如何做到的呢?

類似自監督學習的自條件生成

首先,所謂無條件生成,就是模型在沒有輸入信號幫助的情況下直接捕獲數據分布生成內容。

這種方式比較難以訓練,所以一直和條件生成有很大性能差距——就像無監督學習比不過監督學習一樣。

但就像自監督學習的出現,扭轉了這一局面一樣。

在無條件圖像生成領域,也有一個類似于自監督學習概念的自條件生成方法。

相比傳統的無條件生成簡單地將噪聲分布映射到圖像分布,這種方法主要將像素生成過程設置在從數據分布本身導出的表示分布上。

它有望超越條件圖像生成,并推動諸如分子設計或藥物發現這種不需要人類給注釋的應用往前發展(這也是為什么條件生成圖像發展得這么好,我們還要重視無條件生成)。

現在,基于這個自條件生成概念,何愷明團隊首先開發了一個表示擴散模型RDM。

它主要用于生成低維自監督圖像表示,方法是通過自監督圖像編碼器從圖像中截取:

969c8794-96ac-11ee-8b88-92fbcf53809c.png

它的核心架構如下:

首先是輸入層,它負責將表征投射到隱藏維度C,接著是N個全連接塊,最后是一個輸出層,負責把隱藏層的潛在特征重新投射(轉換)到原始表征維度。

其中每一層都包含一個LayerNorm層、一個SiLU層以及一個線性層。

96aaccaa-96ac-11ee-8b88-92fbcf53809c.png

這樣的RDM具有兩個優點:

一是多樣性強,二是計算開銷小。

接著,利用RDM,團隊就提出了今天的主角:表示條件圖像生成架構RCG。

它是一個簡單的自條件生成框架,由三個組件組成:

一個是SSL圖像編碼器,用于將圖像分布轉換為緊湊的表示分布。

一個是RDM,用于對該分布進行建模和采樣。

最后是一個像素生成器MAGE,用于根據表示來處理圖像像。

MAGE的工作方式主要是向token化的圖像中添加隨機掩碼,并要求網絡以從同一圖像中提取的表示為條件來重建丟失的token。

96b8b810-96ac-11ee-8b88-92fbcf53809c.png

最終,測試表明,這個自條件生成框架雖結構簡單但效果非凡:

在ImageNet 256×256上,RCG實現了3.56的FID和186.9的IS(Inception Score)得分。

相比之下,在它之前最厲害的無條件生成方法FID分數為7.04,IS得分為123.5。

96c3fdd8-96ac-11ee-8b88-92fbcf53809c.png

以及,相比條件生成,RCG也絲毫不遜色,可以達到相當甚至超過該領域基準模型的水平。

最后,在無分類器引導的情況下,RCG的成績還能進一步提高到3.31(FID)和253.4(IS)。

團隊表示:

這些結果表明,自條件圖像生成模型擁有巨大潛力,可能預示這一領域新時代的到來。

團隊介紹

本文一共三位作者:

96c8531a-96ac-11ee-8b88-92fbcf53809c.png

代碼:https://github.com/LTH14/rcg

論文:https://arxiv.org/abs/2312.03701

一作是MIT博士生黎天鴻,本科畢業于清華姚班,研究方向為跨模態集成傳感技術

他的主頁很有意思,還專門放了一個菜譜合集——做研究和做飯是他最熱愛的兩件事。

96d25b26-96ac-11ee-8b88-92fbcf53809c.png

另一位作者是MIT電氣工程與計算機科學系(EECS)教授、MIT無線網絡和移動計算中心主任Dina Katabi,她是今年斯隆獎的獲得者,并已當選美國國家科學院院士。

最后,通訊作者為何愷明,他將在明年正式回歸學界、離開Meta加入MIT電氣工程和計算機科學系,與Dina Katabi成為同事。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1096

    瀏覽量

    42326
  • MIT
    MIT
    +關注

    關注

    3

    文章

    254

    瀏覽量

    24996
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26190

原文標題:何愷明新作RCG:無自條件圖像生成新SOTA!與MIT首次合作!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    瀟湘電影集團與洲集團達成戰略合作

    12月10日,瀟湘電影集團與洲集團戰略合作簽約儀式圓滿舉行。此次合作雙方將在LED電影屏、光顯系統及國產電影拍攝器材等核心領域展開深度合作,共同推動影視產業與光顯科技的融合創新。
    的頭像 發表于 12-18 13:52 ?464次閱讀

    科技與沙特航空俱樂部穩步推進戰略合作關系

    11月25至29日,洲科技作為獨家數字合作伙伴,成功點亮沙特通用航空航展Sand & Fun 2025。
    的頭像 發表于 12-08 10:46 ?715次閱讀

    使用Firebase AI Logic生成圖像模型的兩種新功能

    為您的應用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其一是 Imagen 專屬編輯功能預覽版;其二
    的頭像 發表于 11-30 09:28 ?421次閱讀

    華為與毛里求斯電信深化智網絡戰略合作

    第28屆非洲通信展(AFRICA COM)期間,華為與毛里求斯電信(Mauritius Telecom)簽署了IP智網絡聯合創新合作備忘錄,雙方深化智網絡戰略合作,聚焦AN L4(
    的頭像 發表于 11-19 15:34 ?538次閱讀

    科技與中建西南院科技公司達成戰略合作

    近日,由中建西南院電氣專委會、科技公司主辦的“數字電氣學術論壇暨生態合作伙伴大會”在成都圓滿召開。大會期間,洲科技與中建西南院科技公司正式簽署戰略合作協議,攜手推動LED光顯領域的生態建設與創新發展。
    的頭像 發表于 10-11 10:14 ?601次閱讀

    科技與Dimension Studio簽署合作備忘錄

    近日,洲科技與Dimension Studio、Cambridge Picture Company及北京山慕影視文化傳媒有限公司正式簽署合作備忘錄。
    的頭像 發表于 09-28 18:20 ?1335次閱讀

    AURIX tc367通過 MCU SOTA 更新邏輯 IC 閃存是否可行?

    你好專家:我的用例是 MCU 通過 SPI 連接到邏輯 IC,邏輯 IC 連接到 8MB 閃存,但 MCU PFLASH 大小為 2MB,通過 MCU SOTA 更新邏輯 IC 閃存是否可行?
    發表于 08-11 06:36

    求助,關于TC387使能以及配置SOTA 中一些問題求解

    你好, 之前我拿到貴司給一個demo,里面有一些使能以及配置SWAP的代碼, 這里有些疑問 問題1. 判斷SOTA功能是否生效,demo中使用的是 SCU_STMEM1中的bit位, 代碼如下
    發表于 08-08 07:31

    福耀科技大學與洲科技達成戰略合作

    2025年8月5日,福建福耀科技大學與洲科技正式簽署校企戰略合作協議。
    的頭像 發表于 08-06 18:18 ?1552次閱讀

    數字文化科技與中山大學旅游學院達成戰略合作

    近日,洲集團旗下AI子公司——深圳市洲數字文化科技有限公司與中山大學旅游學院正式簽署戰略合作意向書。
    的頭像 發表于 06-23 15:46 ?980次閱讀

    利用NVIDIA 3D引導生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術突飛猛進,從早期模型會生成手指過多的人類圖像,到現在能創造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個挑戰:實現創意掌控。
    的頭像 發表于 06-05 09:24 ?891次閱讀

    Gemini API集成Google圖像生成模型Imagen 3

    開發者現在可以通過 Gemini API 訪問 Google 最先進的圖像生成模型 Imagen 3。該模型最初僅對付費用戶開放,不久后也將面向免費用戶推出。
    的頭像 發表于 05-14 16:53 ?1258次閱讀

    PanDao:實際約束條件下成像系統的初始結構的生成

    設計的自動生成。第一個案例引用文獻[6]的快速近紅外(NIR)鏡頭研究,作者從已知的六片式鏡頭結構出發,應用并比較了多種全局優化策略。該系統的規格與約束條件如下:前置光闌、100 mm焦距、f/1.5
    發表于 05-07 08:57

    科技與富士康云智匯科技深化合作

    近日,洲集團國內技術營銷總經理夏志凱一行赴富士康大學,展開戰略推廣與深度交流。這是繼今年2月洲與富士康云智匯科技戰略合作簽署后,雙方在智慧光顯領域的再一次協同升級。
    的頭像 發表于 04-29 15:45 ?940次閱讀

    如何使用離線工具od SPSDK生成完整圖像

    SDSDK)會生成一個缺少前 4KB 的文件。 這些將由 flashloader 直接在目標上填充,使用將要傳達給它的參數,對吧? 我需要離線工作。我需要生成一個 “完整圖像”,但無法訪問目標。 我該怎么做?
    發表于 03-28 06:51