国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

杜克大學(xué)的研究團(tuán)隊(duì)研發(fā)了一個(gè)AI圖像生成模型PULSE

倩倩 ? 來(lái)源:雷鋒網(wǎng) ? 2020-07-16 11:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,杜克大學(xué)的研究團(tuán)隊(duì)研發(fā)了一個(gè)AI圖像生成模型PULSE。PULSE可以在5秒鐘內(nèi)將低分辨率的人像轉(zhuǎn)換成清晰、逼真的人像。要指出的是,PULSE所做的工作并不是把輸入的低分辨率人像變成一張高分辨率的人像,而是“一對(duì)多”地輸出許多張面部細(xì)節(jié)各不相同的高分辨率人像。比如,用戶輸入一張16*16分辨率的圖像,PULSE可輸出一組1024*1024分辨率的圖像。

這項(xiàng)研究于本月在計(jì)算機(jī)視覺與模式識(shí)別頂會(huì)CVPR 2020上發(fā)表,論文標(biāo)題為《PULSE:通過對(duì)生成模型的潛在空間探索實(shí)現(xiàn)自監(jiān)督照片上采樣(PULSE:Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models)》。

論文鏈接:https://drive.google.com/file/d/1fV7FsmunjDuRrsn4KYf2Efwp0FNBtcR4/view

PULSE項(xiàng)目官網(wǎng):http://pulse.cs.duke.edu/

GitHub:https://github.com/adamian98/pulse

一、PULSE:能為天文學(xué)/醫(yī)學(xué)提供參考

在好萊塢間諜電影中,肩負(fù)拯救世界重任的特工常常采用高科技手段、把一張模糊的兇犯照片還原成清晰的人臉照片。現(xiàn)實(shí)中,許多研究人員致力于用AI技術(shù)使電影中的炫酷場(chǎng)景成真。但是,現(xiàn)有AI模型的性能普遍較差,生成的人臉圖像往往與照片主人公的真實(shí)長(zhǎng)相并不相似。

杜克大學(xué)計(jì)算機(jī)科學(xué)專業(yè)教授Cynthia Rudin指出,這是因?yàn)榈拖袼貓D像中的信息較少,AI模型無(wú)法準(zhǔn)確地“補(bǔ)足”缺失信息、進(jìn)而還原出清晰人臉圖像。因此,用AI技術(shù)對(duì)模糊人像進(jìn)行面部識(shí)別十分困難。

Rudin團(tuán)隊(duì)認(rèn)為,雖然不能用于模糊人像的面部識(shí)別,但是這類AI模型可以作為一種分類和探索工具,用于天文學(xué)、醫(yī)學(xué)等難以獲得清晰圖像的領(lǐng)域。也就是說,基于模糊圖像中缺失信息的各種可能性,AI模型可以生成許多清晰的圖像,生成的多種圖像可以為天文學(xué)、醫(yī)學(xué)等領(lǐng)域研究人員提供參考。

基于這種設(shè)想,杜克大學(xué)研究人員研發(fā)了基于生成式對(duì)抗網(wǎng)絡(luò)(GAN)的圖像超分辨率模型PULSE。PULSE模型基于NVIDIA的StyleGAN算法進(jìn)行開發(fā)。

二、降尺度損失方法:用生成圖像“倒推”模糊圖,相似才能輸出

為了保證輸出圖像與輸入圖像的“對(duì)應(yīng)性”,研究人員在PULSE模型中應(yīng)用了一種“降尺度損失(downscaling loss)”方法。

當(dāng)PULSE模型的生成網(wǎng)絡(luò)提議以一張清晰圖像作為輸出時(shí),判別網(wǎng)絡(luò)會(huì)把這張清晰圖像的分辨率降低到與輸入圖像相等的水平。然后,判別網(wǎng)絡(luò)會(huì)對(duì)比降尺度損失圖像與輸入圖像之間的相似性。

只有在降尺度損失圖像與輸入圖像相似性較高時(shí),判別網(wǎng)絡(luò)才會(huì)判定生成網(wǎng)絡(luò)提議的清晰圖片可以作為輸出。

▲基于同一張模糊的圖像,PULSE可以生成面部細(xì)節(jié)不同的清晰圖像

三、40位評(píng)估者參與打分,PULSE模型MOS得分最高

研究人員用高分辨人臉數(shù)據(jù)集CelebA HQ評(píng)估PULSE的性能。為了進(jìn)行對(duì)比,研究人員利用CelebA HQ數(shù)據(jù)集訓(xùn)練了監(jiān)督模型BICBIC、FSRNET和FSRGAN。

所有模型均以16*16分辨率的圖像作為輸入,BICBIC、FSRNET和FSRGAN模型以128*128分辨率圖像作為輸出,PULSE模型以128*128分辨率圖像和1024*1024分辨率圖像作為輸出。

評(píng)估結(jié)果顯示,圖像質(zhì)量方面,PULSE模型在生成眼睛、嘴唇等圖像細(xì)節(jié)方面的能力優(yōu)于其他模型。

▲PULSE生成圖像的嘴唇、眼睛更加清晰

接下來(lái),研究人員用平均意見分?jǐn)?shù)(MOS)測(cè)試來(lái)定量評(píng)估模型的分辨率。研究人員應(yīng)用6個(gè)模型生成128*128分辨率的圖像,邀請(qǐng)40位評(píng)估者對(duì)6個(gè)模型的輸出結(jié)果進(jìn)行打分。

用于對(duì)比的模型分別是:HR、Nearest、Bicubic、FSRNet、FSRGAN。

結(jié)果顯示,PULSE的MOS分?jǐn)?shù)最高,為3.60,即評(píng)估者認(rèn)為PULSE模型生成的圖像分辨率最高。

結(jié)語(yǔ):代碼已在GitHub開源,用戶擔(dān)憂種族偏見

本項(xiàng)研究中,杜克大學(xué)研發(fā)的PULSE模型能夠基于一張模糊的人像,生成多張面部細(xì)節(jié)不同的清晰人像,為使用者提供一個(gè)可能的參考范圍。目前,研究團(tuán)隊(duì)已將模型代碼在GitHub開源,鼓勵(lì)其他開發(fā)者進(jìn)行實(shí)驗(yàn)。

研究人員稱,在未來(lái),PULSE或可被用于天文學(xué)、醫(yī)學(xué)等領(lǐng)域。比如,一位天文學(xué)研究人員可以輸入一張模糊的黑洞圖像,并獲得許多可能的天體照片。

同時(shí),也有人對(duì)PULSE的種族偏見問題表示擔(dān)憂。有Twitter用戶爆料稱,其在PULSE模型中輸入深膚色種族(比如奧巴馬的照片)的人臉照片后,PULSE輸出了白人的照片。研究人員稱,目前他們正嘗試通過引入更廣泛的數(shù)據(jù)集解決這一問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42344
  • 面部識(shí)別
    +關(guān)注

    關(guān)注

    1

    文章

    375

    瀏覽量

    27732
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1313

    瀏覽量

    25755
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    沐曦股份聯(lián)合清華大學(xué)發(fā)布磁性材料AI原子基座模型

    2月27日,沐曦股份聯(lián)合清華大學(xué)等多家研究機(jī)構(gòu)聯(lián)合發(fā)布了磁性材料AI原子基座模型。該模型是首個(gè)覆蓋寬溫壓域的磁性材料
    的頭像 發(fā)表于 03-03 15:25 ?388次閱讀
    沐曦股份聯(lián)合清華<b class='flag-5'>大學(xué)</b>發(fā)布磁性材料<b class='flag-5'>AI</b>原子基座<b class='flag-5'>模型</b>

    模型 ai coding 比較

    框架:llm-coding-bench v1.0 統(tǒng)代碼執(zhí)行超時(shí):10秒 統(tǒng)隨機(jī)種子:42 統(tǒng)裁判模型:DeepSeek-Chat(第三方交叉驗(yàn)證) ? 綜合評(píng)分公式: scss
    發(fā)表于 02-19 13:43

    使用NORDIC AI的好處

    提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負(fù)載。[Axon NPU 技術(shù)頁(yè)] 模型更小、更快、更省電 Neuton 模型相較 TensorFlow Lite:* 內(nèi)存
    發(fā)表于 01-31 23:16

    使用Firebase AI Logic生成圖像模型的兩種新功能

    為您的應(yīng)用添加自定義圖像,能夠顯著改善和個(gè)性化用戶體驗(yàn),有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其
    的頭像 發(fā)表于 11-30 09:28 ?434次閱讀

    沐曦聯(lián)合香港科技大學(xué)登上AI頂會(huì)

    近日,沐曦PDE-AI Solution團(tuán)隊(duì)與香港科技大學(xué)合作,在兩大人工智能頂級(jí)會(huì)議NeurIPS2025與EMNLP 2025上發(fā)表重要研究成果,涵蓋大語(yǔ)言
    的頭像 發(fā)表于 10-14 09:46 ?1502次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    和關(guān)聯(lián)性 AI驅(qū)動(dòng)科學(xué):研究和模擬人類思維和認(rèn)識(shí)過程。 本章節(jié)作者為我們講解了第五范式,介紹了科學(xué)發(fā)現(xiàn)的般方法和流程等。、科學(xué)發(fā)現(xiàn)的5個(gè)
    發(fā)表于 09-17 11:45

    智能體化AI生成AI的區(qū)別

    生成AI 的核心是“生成內(nèi)容” —— 比如用大模型寫報(bào)告,是對(duì)輸入指令的被動(dòng)響應(yīng)。而智能體化 AI(Agentic
    的頭像 發(fā)表于 08-25 17:24 ?1663次閱讀

    【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    1. 項(xiàng)目概述 本項(xiàng)目旨在開發(fā)并部署個(gè)高精度的深度學(xué)習(xí)模型,用于自動(dòng)鑒別張圖片是由AI生成
    發(fā)表于 08-21 13:59

    NVIDIA RTX AI加速FLUX.1 Kontext系列圖像模型

    Black Forest Labs,作為全球頂尖 AI 研究實(shí)驗(yàn)室之,為圖像生成領(lǐng)域帶來(lái)顛覆性變革。
    的頭像 發(fā)表于 08-05 16:27 ?1240次閱讀
    NVIDIA RTX <b class='flag-5'>AI</b>加速FLUX.1 Kontext系列<b class='flag-5'>圖像</b><b class='flag-5'>模型</b>

    Nordic收購(gòu) Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    Nordic Semiconductor 于 2025 年收購(gòu)了 Neuton.AI,這是家專注于超小型機(jī)器學(xué)習(xí)(TinyML)解決方案的公司。 Neuton 開發(fā)了種獨(dú)特的神經(jīng)網(wǎng)
    發(fā)表于 06-28 14:18

    谷歌新生成AI媒體模型登陸Vertex AI平臺(tái)

    我們?cè)?Vertex AI 上推出新生成AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?1120次閱讀

    利用NVIDIA 3D引導(dǎo)生成AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進(jìn),從早期模型會(huì)生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼
    的頭像 發(fā)表于 06-05 09:24 ?905次閱讀

    Gemini API集成Google圖像生成模型Imagen 3

    開發(fā)者現(xiàn)在可以通過 Gemini API 訪問 Google 最先進(jìn)的圖像生成模型 Imagen 3。該模型最初僅對(duì)付費(fèi)用戶開放,不久后也將面向免費(fèi)用戶推出。
    的頭像 發(fā)表于 05-14 16:53 ?1283次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    模型全鏈路分析功能,針對(duì)AI應(yīng)用開發(fā)的三大痛點(diǎn)逐個(gè)擊破。 當(dāng)前AI應(yīng)用開發(fā)者在使用開發(fā)工具時(shí)會(huì)面臨個(gè)很頭疼的問題,種類多、功能不聚合、過
    發(fā)表于 04-13 19:52