国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

伯克利AI實驗室開源圖像編輯模型InstructPix2Pix,簡化生成圖像編輯并提供一致結果

jf_WZTOguxH ? 來源:AI前線 ? 2023-08-28 15:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自伯克利人工智能研究(BAIR)實驗室的研究人員開源深度學習模型 InstructPix2Pix,它可以遵循人類指令來編輯圖像。InstructPix2Pix 在合成數據上進行訓練,表現優于基線 AI 圖像編輯模型。

BAIR 團隊在最近舉行的 2023 年 IEEE/CVF 計算機視覺和模式識別(CVPR)大會上展示了他們的工作成果。他們先是生成了一個合成訓練數據集,其中的訓練樣本是成對的圖像以及用于將第一幅圖像轉換為第二幅圖像的編輯指令。該數據集用于訓練圖像生成擴散模型,該模型可以接受基于文本的指令來編輯圖像。例如,給定一張騎馬的人的圖片和提示詞“讓她變成騎龍”,它會輸出原始圖片,但原來的馬被替換了龍。BAIR 的研究人員的表示:

盡管模型完全是在合成樣本上進行訓練的,但它實現了對任意真實圖像和人類自然語言指令的零樣本泛化。我們的模型能夠進行直觀的圖像編輯,可以遵循人類指令執行多種編輯:替換對象、改變圖像風格、修改設置、藝術媒介等。

之前的 AI 圖像編輯能力通常是進行風格轉換,流行的文本到圖像生成模型(如 DALL-E 和 Stable Diffusion)也支持圖像到圖像風格轉換操作。然而,使用這些模型進行有針對性的編輯仍然具有挑戰性。最近,InfoQ 報道了微軟的 Visual ChatGPT,它可以調用外部工具來編輯圖像,前提是提供編輯操作的文本描述。

為了訓練 InstructPix2Pix,BAIR 首先創建了一個合成數據集。為此,團隊在一個由輸入文字說明、編輯指令和期望輸出文字說明組成的人類文本樣本的小數據集上對 GPT-3 進行了微調。然后,這個微調模型被給予一個大型的輸入圖像文字說明數據集,從中生成了超過 450k 次編輯和輸出文字說明。然后,團隊將輸入和輸出文字說明饋送到預訓練的 Prompt-to-Prompt 模型中,該模型根據文字說明生成成對的相似圖像。

d051acec-4564-11ee-a2ef-92fbcf53809c.jpg

InstructPix2Pix 的架構,圖片來源:https://arxiv.org/abs/2211.09800

研究人員鑒于這個數據集訓練了基于 Stable Diffusion 的 InstructPix2Pix。為了評估其性能,團隊將其輸出與基線模型 SDEdit 進行了比較。他們使用兩個指標之間的權衡:一致性(即輸入圖像和編輯后圖像的 CLIP 嵌入之間的余弦相似度)和方向相似性(即編輯后文字說明中的變化與編輯后圖像的變化在多大程度上保持一致)。在實驗中,對于給定的方向相似性值,InstructPix2Pix 產生的圖像比 SDEdit 具有更高的一致性。

人工智能研究員吳恩達在他的深度學習新聞郵件組“The Batch”中評價了 InstructPix2Pix:

這項工作簡化了生成和人造圖像的編輯操作,并提供了更一致的結果。巧妙地利用現有模型,模型作者能夠使用相對較少的人類標記樣本在新任務上訓練他們的模型。

InstructPix2Pix 的代碼可在 GitHub 上獲取,模型和基于 Web 的演示可在 Huggingface 上訪問。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Web
    Web
    +關注

    關注

    2

    文章

    1304

    瀏覽量

    74453
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265284
  • 模型
    +關注

    關注

    1

    文章

    3751

    瀏覽量

    52099
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26190

原文標題:伯克利 AI 實驗室開源圖像編輯模型 InstructPix2Pix,簡化生成圖像編輯并提供一致結果

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA 推出 Alpamayo 系列開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車開發

    的仿真工具和數據集。 l Alpamayo 1、AlpaSim 和物理 AI 開放數據集可為開發具備感知、推理與類人決策能力的車輛提供支持,使開發者能夠進行模型調優、蒸餾和測試,從而提升安全性、魯棒性
    的頭像 發表于 01-06 09:40 ?378次閱讀
    NVIDIA 推出 Alpamayo 系列<b class='flag-5'>開源</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>與工具,加速安全可靠的推理型輔助駕駛汽車開發

    釘釘正式開源HarmonyOS圖片編輯組件

    近日,由釘釘團隊自主研發的“HarmonyOS圖片編輯組件”正式上線OpenHarmony三方庫中心倉并開源。作為款填補鴻蒙社區圖像處理領域空白的重量級組件,該方案基于Harmony
    的頭像 發表于 01-05 09:58 ?494次閱讀

    江波龍與華曦達聯合創新實驗室揭牌,共建AI存儲創新生態

    切入點,旨在構建覆蓋端側AI設備與智能家庭場景的技術驗證體系。實驗室秉承開源協作理念,致力于解決存儲與AI終端適配中的關鍵痛點,形成從聯合調試、場景驗證到可靠性評估的全流程
    的頭像 發表于 12-05 13:36 ?1398次閱讀
    江波龍與華曦達聯合創新<b class='flag-5'>實驗室</b>揭牌,共建<b class='flag-5'>AI</b>存儲創新生態

    使用Firebase AI Logic生成圖像模型的兩種新功能

    為您的應用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其
    的頭像 發表于 11-30 09:28 ?421次閱讀

    基于開源鴻蒙的圖片編輯開發樣例(2

    本期內容介紹基于開源鴻蒙在RK3568上開發圖片編輯樣例的全流程,分為上篇和下篇,本篇為下篇,主要介紹標記、保存圖片功能。
    的頭像 發表于 10-31 09:19 ?3204次閱讀
    基于<b class='flag-5'>開源</b>鴻蒙的圖片<b class='flag-5'>編輯</b>開發樣例(<b class='flag-5'>2</b>)

    Solidigm 成立AI中央實驗室,配備高性能、大密度存儲測試集群

    實驗室匯聚AI與存儲專業技術,為Solidigm合作者提供研究和優化存儲對AI工作負載影響的平臺。 2025年10月9日,北京 ——企業數據存儲領域領導者 Solidigm正式揭幕其
    的頭像 發表于 10-10 17:03 ?779次閱讀

    代超大模型訓練引擎XTuner V1開源

    9月8日,上海人工智能實驗室(上海AI實驗室)開源書生大模型代訓練引擎XTuner V1。
    的頭像 發表于 09-10 10:55 ?1134次閱讀

    【Sipeed MaixCAM Pro開發板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統

    能夠有效捕捉AI生成圖像與真實手繪掃描圖像在紋理、筆觸、光影、全局一致性等方面的細微差異。 邊緣端部署:將
    發表于 08-21 13:59

    NVIDIA RTX AI加速FLUX.1 Kontext系列圖像模型

    Black Forest Labs,作為全球頂尖 AI 研究實驗室,為圖像生成領域帶來顛覆性變革。
    的頭像 發表于 08-05 16:27 ?1227次閱讀
    NVIDIA RTX <b class='flag-5'>AI</b>加速FLUX.1 Kontext系列<b class='flag-5'>圖像</b><b class='flag-5'>模型</b>

    Grameenphone參與愛立信與AWS Gen-AI實驗室項目

    愛立信×AWS 「Gen-AI實驗室」旨在推動運營商在OSS/BSS中的AI應用突破。通過結構化、結果導向的協作方式,實驗室將愛立信在OSS
    的頭像 發表于 07-16 10:49 ?1.6w次閱讀

    利用NVIDIA 3D引導生成AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術突飛猛進,從早期模型生成手指過多的人類圖像,到現在能創造出令人驚嘆的逼
    的頭像 發表于 06-05 09:24 ?890次閱讀

    中軟國際中標啟元實驗室生成平臺功能模塊建設開發項目

    近日,中軟國際成功中標“啟元實驗室生成平臺功能模塊建設開發項目”。該項目作為啟元實驗室智能化平臺體系的重要組成部分,主要實現生成平臺內外部子系統數據對接、模擬數據注入,并實現統
    的頭像 發表于 05-26 16:43 ?976次閱讀

    Gemini API集成Google圖像生成模型Imagen 3

    開發者現在可以通過 Gemini API 訪問 Google 最先進的圖像生成模型 Imagen 3。該模型最初僅對付費用戶開放,不久后也將面向免費用戶推出。
    的頭像 發表于 05-14 16:53 ?1258次閱讀

    實驗室安全管理成焦點,漢威科技賦能實驗室安全升級

    實驗室是國家科技創新體系的重要組成部分,是國家組織高水平基礎研究和應用基礎研究、聚集和培養優秀科學家、開展學術交流的重要基地。近年來,各高校、研究院所、科創園區、高新產業園區相關企業的實驗室呈現爆發
    的頭像 發表于 04-10 10:41 ?915次閱讀
    <b class='flag-5'>實驗室</b>安全管理成焦點,漢威科技賦能<b class='flag-5'>實驗室</b>安全升級

    簡化樹莓派文件操作:Picockpit 編輯器應用上手體驗

    我們激動地宣布推出全新的文件編輯器應用,讓您能夠在RaspberryPi上遠程創建和編輯文件和目錄!不僅如此,通過我們的文件編輯器應用,您還能獲得我們的AI系統——RaspiGPT的協
    的頭像 發表于 03-25 09:26 ?683次閱讀
    <b class='flag-5'>簡化</b>樹莓派文件操作:Picockpit <b class='flag-5'>編輯</b>器應用上手體驗