国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

放下你的PhotoShop!無限圖像編輯已開源!

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-12-10 10:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

0. 筆者個人體會

最近文本到圖像的工作很火,生成的圖像也非常真實。但還有個問題,現有工作效率比較低,往往只能接受一次text指令,再修改就要重新輸入text重新生成,可能會影響原本的語義信息,這樣導出的圖像和最初圖像可能差距甚遠。

今天筆者將為大家分享一項最新開源的工作LEDITS++,可以一次輸入無限多的編輯指令,一次性生成真實圖像!而且LEDITS++是無參數方案,不需要微調和優化。不得不感慨AI發展之迅速,距離人們真實生活也越來越近了。

下面一起來閱讀一下這項工作,文末附論文和代碼鏈接~

1. 效果展示

先看一下具體效果,輸入具體指令就可以直接產生對應效果。PS要想在幾十秒內達到同等效果應該是有點困難。

27892dc0-96ad-11ee-8b88-92fbcf53809c.png

LEDITS++很強調編輯前后的圖像一致性,也就是僅修改圖像的相關區域,保持原始圖像的語義信息。這里也推薦工坊推出的新課程《徹底搞懂視覺-慣性SLAM:VINS-Fusion原理精講與源碼剖析》。

27a9e4fc-96ad-11ee-8b88-92fbcf53809c.png

代碼已經開源了,官方主頁也開放了交互式demo,感興趣的讀者可以上傳自己的圖像和文本指令嘗鮮一下效果。

2. 具體原理是什么?

LEDITS++可以分為三個部分:(1)有效的圖像反轉;(3)多功能文本編輯;(3)圖像變化的語義基礎。

我們知道擴散模型生成圖像是通過反轉采樣來進行的,重點是識別噪聲。LEDITS++從DDPM反演中提取特征,并提出一種有效的反演方法,大大減少所需的步驟,同時降低重建誤差。當將反向擴散過程公式化為SDE時,DDPM可以被視為一階SDE解算器。使用高階微分方程解算器可以更有效地解算,因此作者推導出一種新的更快技術------DPM-solver++反演。

27cde406-96ad-11ee-8b88-92fbcf53809c.png

在創建重建序列之后,可以通過一組編輯指令操縱噪聲來編輯圖像。根據有條件和無條件估計,作者分別設計了一個專門的引導項,既反映了編輯的方向,又最大化了對所需編輯效果的細粒度控制。

27ef003c-96ad-11ee-8b88-92fbcf53809c.png

最后,LEDITS++還包括一個Mask項,由交叉注意層生成的Mask和噪聲估計導出的Mask取交集計算得到。Mask可以捕捉與編輯概念相關的圖像區域,對于多次編輯特別有效。這里也推薦工坊推出的新課程《徹底搞懂視覺-慣性SLAM:VINS-Fusion原理精講與源碼剖析》。

2815c21c-96ad-11ee-8b88-92fbcf53809c.png

3. 和其他SOTA方法對比如何?

不同編輯方法的指令對齊和圖像相似度權衡的比較,側重CLIP得分(越高越好)與LPIPS相似度(越低越好),也就是圖中越靠近左上角效果越好。

282ecd02-96ad-11ee-8b88-92fbcf53809c.png

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1096

    瀏覽量

    42330
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301428
  • 開源
    +關注

    關注

    3

    文章

    4207

    瀏覽量

    46144

原文標題:放下你的PhotoShop!無限圖像編輯已開源!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    釘釘正式開源HarmonyOS圖片編輯組件

    近日,由釘釘團隊自主研發的“HarmonyOS圖片編輯組件”正式上線OpenHarmony三方庫中心倉并開源。作為一款填補鴻蒙社區圖像處理領域空白的重量級組件,該方案基于HarmonyOS
    的頭像 發表于 01-05 09:58 ?501次閱讀

    C-小智開源版,可二次開發(WIN32)#小智AI #開源 #二次開發

    開源
    不太正經的攻城獅
    發布于 :2026年01月04日 19:31:14

    基于開源鴻蒙的圖片編輯開發樣例(2)

    本期內容介紹基于開源鴻蒙在RK3568上開發圖片編輯樣例的全流程,分為上篇和下篇,本篇為下篇,主要介紹標記、保存圖片功能。
    的頭像 發表于 10-31 09:19 ?3210次閱讀
    基于<b class='flag-5'>開源</b>鴻蒙的圖片<b class='flag-5'>編輯</b>開發樣例(2)

    基于開源鴻蒙的圖片編輯開發樣例(1)

    本期內容介紹基于開源鴻蒙在RK3568上開發圖片編輯樣例的全流程,分為上篇和下篇,本篇為上篇,主要介紹添加相冊圖片、編譯圖片功能。
    的頭像 發表于 10-31 09:16 ?3068次閱讀
    基于<b class='flag-5'>開源</b>鴻蒙的圖片<b class='flag-5'>編輯</b>開發樣例(1)

    開源鴻蒙在千行百業中的最佳實踐

    此前,7月23日-24日,開放原子開源生態大會在北京國家會議中心二期盛大舉辦。開源鴻蒙主題演講作為本次大會的核心分論壇之一,聚焦開源鴻蒙生態構建、技術創新與行業賦能等核心議題,深度剖析了開源
    的頭像 發表于 08-05 16:43 ?1282次閱讀

    開源鴻蒙主題演講分論壇順利召開

    深入探討,不僅集中展示開源鴻蒙生態力量,更重在深度解析開源鴻蒙在技術創新與產業落地等方面的典型案例與創新實踐,共同探索萬物智聯的無限潛能。
    的頭像 發表于 07-28 17:15 ?1083次閱讀

    迅龍軟件亮相2025開放原子開源生態大會,共繪AI+開源智能圖景

    7月23日,2025開放原子開源生態大會在北京舉行。大會由開放原子開源基金會主辦,以“開源賦能產業,生態共筑未來”為主題,旨在展示中國開源生態“創新發展+開放協作”的成果,匯聚全球
    的頭像 發表于 07-25 18:15 ?1224次閱讀
    迅龍軟件亮相2025開放原子<b class='flag-5'>開源</b>生態大會,共繪AI+<b class='flag-5'>開源</b>智能圖景

    開源交通行業應用實踐分論壇即將召開

    當前,全球開源生態蓬勃發展,賦予產業升級創新之力,開拓數字經濟時代的無限機遇。開源鴻蒙作為萬物智聯時代的全場景智能終端操作系統,在交通領域落地生根,正在打造更具影響力的“中國方案”與“中國標準”,為全球智慧交通發展注入創新動能。
    的頭像 發表于 07-23 09:53 ?909次閱讀

    NVIDIA RTX AI加速FLUX.1 Kontext現已開放下

    NVIDIA RTX 與 NVIDIA TensorRT 現已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現可借助 RTX 和 NVIDIA Jetson 加速運行。
    的頭像 發表于 07-16 09:16 ?2053次閱讀

    擁抱開源!一起來做FPGA開發板啦!

    ,發起“擁抱開源——一起來做FPGA開發板” 項目!無論是FPGA領域的資深開發者,渴望探索國產芯片的無限可能;還是初入茅廬的技術小白,想要在實踐中學習成長;亦或是對硬件開發充滿熱情的愛好者,希望親手
    發表于 06-06 14:05

    開源鴻蒙開發者大會2025·AI分論壇圓滿閉幕,探索開源鴻蒙AI無限可能

    5月24日,開源鴻蒙開發者大會2025·AI分論壇在深圳蛇口希爾頓南海酒店成功舉辦。活動特邀學術領袖、開源專家、行業先鋒和社區開發者,從終端操作系統、國產大模型、智能體、算力芯片、應用場景、機器人等
    的頭像 發表于 05-26 18:06 ?1665次閱讀
    <b class='flag-5'>開源</b>鴻蒙開發者大會2025·AI分論壇圓滿閉幕,探索<b class='flag-5'>開源</b>鴻蒙AI<b class='flag-5'>無限</b>可能

    從初學到進階:樹莓派上最適合的代碼編輯器推薦!

    之前,需要安裝一些必備工具,代碼編輯器便是其中之一。樹莓派系統自帶了一些代碼編輯器,它們功能良好,足以滿足基本需求。不過,如果需要更高級的功能,就必須探索其他
    的頭像 發表于 05-15 16:20 ?1187次閱讀
    從初學到進階:樹莓派上最適合<b class='flag-5'>你</b>的代碼<b class='flag-5'>編輯</b>器推薦!

    Vim編輯器的基本操作

    26個字母鍵為核心,用極簡的操作重構了代碼編輯的宇宙。今天,就讓我們一同走進Vim的世界,探索它如何以獨特的方式提升的編程效率。
    的頭像 發表于 05-06 13:41 ?1276次閱讀
    Vim<b class='flag-5'>編輯</b>器的基本操作

    Linux下Vim編輯器的使用技巧

    【Vim】常用總結? 簡介? image 什么是vim?? Linux下兩大編輯神器之一 vim ? Linux/Unix下使用最多的編輯器 ? vi的改進版 ? 可能是最難上手的編輯器之一
    的頭像 發表于 04-01 17:36 ?1435次閱讀
    Linux下Vim<b class='flag-5'>編輯</b>器的使用技巧