国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何改進和加速擴散模型采樣的方法1

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-05-07 14:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是一系列關于 NVIDIA 研究人員如何改進和加速擴散模型采樣的方法的一部分,擴散模型是一種新穎而強大的生成模型。 Part 2 介紹了克服擴散模型中緩慢采樣挑戰的三種新技術。

生成模型是一類機器學習方法,它可以學習所訓練數據的表示形式,并對數據本身進行建模。它們通常基于深層神經網絡。相比之下,判別模型通常預測給定數據的單獨數量。

生成模型允許您合成與真實數據不同但看起來同樣真實的新數據。設計師可以在汽車圖像上訓練生成性模型,然后讓生成性人工智能計算出具有不同外觀的新穎汽車,從而加速藝術原型制作過程。

深度生成學習已成為機器學習領域的一個重要研究領域,并有許多相關應用。生成模型廣泛用于圖像合成和各種圖像處理任務,如編輯、修復、著色、去模糊和超分辨率。

生成性模型有可能簡化攝影師和數字藝術家的工作流程,并實現新水平的創造力。類似地,它們可能允許內容創建者高效地為游戲、動畫電影或 metaverse 生成虛擬 3D 內容。

基于深度學習的語音和語言合成已經進入消費品領域。醫學和醫療保健等領域也可能受益于生成性模型,例如生成對抗疾病的分子候選藥物的方法。

當神經網絡被用于不同的生成性學習任務時,尤其是對于不同的生成性學習任務,神經網絡和神經網絡也可以被用于合成。

生成性學習三位一體

為了在實際應用中得到廣泛采用,生成模型在理想情況下應滿足以下關鍵要求:

High-quality sampling :許多應用程序,尤其是那些直接與用戶交互的應用程序,需要高生成質量。例如,在語音生成中,語音質量差是很難理解的。類似地,在圖像建模中,期望的輸出在視覺上與自然圖像無法區分。

模式覆蓋和樣本多樣性 :如果訓練數據包含復雜或大量的多樣性,一個好的生成模型應該在不犧牲生成質量的情況下成功捕獲這種多樣性。

快速且計算成本低廉的采樣 :許多交互式應用程序需要快速生成,例如實時圖像編輯。

雖然目前大多數深層生成性學習方法都注重高質量的生成,但第二和第三個要求也非常重要。

忠實地表示數據的多樣性對于避免數據分布中遺漏少數模式至關重要。這有助于減少學習模型中不希望出現的偏差。

另一方面,在許多應用程序中,數據分布的長尾巴特別有趣。例如,在交通建模中,人們感興趣的正是罕見的場景,即與危險駕駛或事故相對應的場景。

降低計算復雜度和采樣時間不僅可以實現交互式實時應用。它還通過降低發電所需的總功率使用量,減少了運行昂貴的深層神經網絡(發電模型的基礎)所造成的環境足跡。

在本文中,我們將這三個需求帶來的挑戰定義為 生成性學習三位一體 ,因為現有方法通常會做出權衡,無法同時滿足所有需求。

pYYBAGJ2ENyAeWg5AAEcsXtThOM930.png

圖 1 生成性學習三位一體

基于擴散模型的生成性學習

最近,擴散模型已經成為一種強大的生成性學習方法。這些模型,也被稱為去噪擴散模型或基于分數的生成模型,表現出驚人的高樣本質量,通常優于生成性對抗網絡。它們還具有強大的模式覆蓋和樣本多樣性。

擴散模型已經應用于各種生成任務,如圖像、語音、三維形狀和圖形合成。

擴散模型包括兩個過程:正向擴散和參數化反向擴散。

前向擴散過程通過逐漸擾動輸入數據將數據映射為噪聲。這是通過一個簡單的隨機過程正式實現的,該過程從數據樣本開始,使用簡單的高斯擴散核迭代生成噪聲較大的樣本。也就是說,在這個過程的每一步,高斯噪聲都會逐漸添加到數據中。

第二個過程是一個參數化的反向過程,取消正向擴散并執行迭代去噪。這個過程代表數據合成,并經過訓練,通過將隨機噪聲轉換為真實數據來生成數據。它也被正式定義為一個隨機過程,使用可訓練的深度神經網絡對輸入圖像進行迭代去噪。

正向和反向過程通常使用數千個步驟來逐步注入噪聲,并在生成過程中進行去噪。

poYBAGJ2EN2AMQOEAAEBEFupDWg453.png

圖 2 擴散模型處理數據和噪聲之間的移動

圖 2 顯示,在擴散模型中,固定前向過程以逐步方式逐漸擾動數據,使其接近完全隨機噪聲。學習一個參數化的反向過程來執行迭代去噪,并從噪聲中生成數據,如圖像。

在形式上,通過x0表示一個數據點,例如圖像,通過xt表示時間步長t的擴散版本,正向過程由以下公式定義:

雖然離散時間擴散模型和連續時間擴散模型看起來可能不同,但它們有一個幾乎相同的生成過程。事實上,很容易證明離散時間擴散模型是連續時間模型的特殊離散化。

在實踐中使用連續時間擴散模型基本上要容易得多:

它們更通用,可以通過簡單的時間離散化轉換為離散時間模型。

它們是用 SDE 描述的, SDE 在各個科學領域都得到了很好的研究。

生成性 SDE 可以使用現成的數值 SDE 解算器進行求解。

它們可以轉換為相關的常微分方程( ODE ),這些方程也得到了很好的研究,并且易于使用。

如前所述,擴散模型通過遵循反向擴散過程生成樣本,該過程將簡單的基本分布(通常為高斯分布)映射到復雜的數據分布。在生成 SDE 表示的連續時間擴散模型中,由于神經網絡逼近分數函數

latex.php?latex=%5Cnabla_%7Bx_%7Bt%7D%7D%5Clog+p_%7Bt%7D%28x_%7Bt%7D%29&bg=ffffff&fg=000&s=0&c=20201002

,這種映射通常很復雜。

用數值積分技術解決這個問題需要調用 1000 次深層神經網絡來生成樣本。正因為如此,擴散模型在生成樣本時通常很慢,需要幾分鐘甚至幾小時的計算時間。這與生成性對抗網絡( GANs )等競爭性技術形成了鮮明對比,后者只需對神經網絡進行一次調用即可生成樣本。

總結

盡管擴散模型實現了較高的樣本質量和多樣性,但不幸的是,它們在采樣速度方面存在不足。這限制了擴散模型在實際應用中的廣泛采用,并導致了從這些模型加速采樣的研究領域的活躍。在 Part 2 中,我們回顧了 NVIDIA 為克服擴散模型的主要局限性而開發的三種技術。

關于作者

Arash Vahdat 是 NVIDIA research 的首席研究科學家,專攻計算機視覺和機器學習。在加入 NVIDIA 之前,他是 D-Wave 系統公司的研究科學家,從事深度生成學習和弱監督學習。在 D-Wave 之前,阿拉什是西蒙·弗雷澤大學( Simon Fraser University , SFU )的一名研究人員,他領導了深度視頻分析的研究,并教授大數據機器學習的研究生課程。阿拉什在格雷格·莫里( Greg Mori )的指導下獲得了 SFU 的博士和理學碩士學位,致力于視覺分析的潛變量框架。他目前的研究領域包括深層生成學習、表征學習、高效神經網絡和概率深層學習。

Karsten Kreis 是 NVIDIA 多倫多人工智能實驗室的高級研究科學家。在加入 NVIDIA 之前,他在 D-Wave Systems 從事深度生成建模工作,并與他人共同創立了變分人工智能,這是一家利用生成模型進行藥物發現的初創公司??ㄋ闺隈R克斯·普朗克光科學研究所獲得量子信息理論理學碩士學位,并在馬克斯·普朗克聚合物研究所獲得計算和統計物理博士學位。目前,卡斯滕的研究重點是開發新的生成性學習方法,以及將深層生成模型應用于計算機視覺、圖形和數字藝術等領域的問題。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109720
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265298
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發

    NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助 NVIDIA Omniverse 庫和 Cosmos,開發者可以大規模生成基于物理學的合
    的頭像 發表于 12-01 09:25 ?1131次閱讀

    神經網絡加速器的雙線性插值上采樣

    了和這個浮點數最接近的象素的值,這種方法是很不科學的,雙線性插值法算是它的改進吧。 坐標: srcX=dstX* (srcWidth/dstWidth) , srcY =dstY
    發表于 10-29 06:36

    成都匯陽投資關于大模型白熱化,應用加速分化

    ? ? ? ?大模型加速多模態研發 ,閉源模型逐步逆襲開源 多模態技術路線尚未收斂 , 國內外大模型廠商持續刷新 SOAT。 圖片領域 ,GPT-4o 圖像生成功能引發熱潮后 ,谷
    的頭像 發表于 09-09 09:30 ?919次閱讀

    MSCMG無刷直流電機改進的I_f無位置起動方法

    針對磁懸浮控制力矩陀螺無刷直流電機電阻、電感值極小的特點和已有的無位置傳感器 I/f 起動算法加速階段換相精度不高且算法復雜的問題,通過分析電磁轉矩和換相時刻的關系,提出了一種改進的 I/f起動方法
    發表于 08-06 14:27

    MSCMG無刷直流電機改進的I_f無位置起動方法

    方法。該方法在電磁轉矩恒定的情況下,結合電機模型,精確計算出電機換相的具體時刻。為保證電磁轉矩恒定確保換相時刻的準確性,采用神經網絡法估計反電勢系數,并設計了基于三相繞組不對稱補償的改進
    發表于 07-23 13:19

    模型推理顯存和計算量估計方法研究

    、顯存估計方法 基于模型結構的顯存估計 根據深度學習模型的層次結構和參數數量,可以估算模型在推理過程中所需的顯存大小。具體方法如下: (
    發表于 07-03 19:43

    請問如何通過OpenVINO?加速啟用穩定的擴散 Web UI?

    無法運行具有OpenVINO?加速的穩定擴散 Web UI。
    發表于 06-24 06:48

    FA模型訪問Stage模型DataShareExtensionAbility說明

    。 DataShareHelper并沒有實現原DataAbilityHelper對外API接口的所有功能,因此有部分接口是無法兼容的,具體如表1所示。 表1 FA模型訪問stage模型
    發表于 06-04 07:53

    改進電壓模型的異步電機無速度傳感器矢量控制

    無速度傳感器矢量控制技術能夠有效提高交流傳動系統的可靠性,降低系統成本。該技術的核心問題是準確獲取電機轉子轉速,并將其反饋到速度閉環控制環節。介紹一種采用改進模型參考自適應轉速估計方法的異步電機矢量
    發表于 05-28 15:43

    Nordic下一代可穿戴設備和邊緣人工智能改進運動表現分析

    包括在不同比賽階段中,運動員在關鍵動作中的身體移動,或者球棒或球的位置、發射角、旋轉率和加速率。 對于田徑和自行車等個人運動,關鍵指標可能側重于生物力學效率和技術精度。對于包括足球在內的團隊運動,常用指標包括沖刺、加速、減速和運動強度。
    發表于 05-12 11:24

    晶圓擴散清洗方法

    晶圓擴散前的清洗是半導體制造中的關鍵步驟,旨在去除表面污染物(如顆粒、有機物、金屬離子等),確保擴散工藝的均勻性和器件性能。以下是晶圓擴散清洗的主要方法及工藝要點: 一、RCA清洗工藝
    的頭像 發表于 04-22 09:01 ?1657次閱讀

    電機控制系統低速區測速方法分析與改進

    純分享帖,需要者可點擊附件獲取完整資料~~~*附件:電機控制系統低速區測速方法分析與改進.pdf 【免責聲明】本文系網絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,刪除內容!
    發表于 04-17 22:32

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發
    的頭像 發表于 03-20 16:56 ?1710次閱讀

    DiffusionDrive首次在端到端自動駕駛中引入擴散模型

    多樣性是提升自動駕駛魯棒性和安全性的關鍵,但現有方法往往受限于單一軌跡回歸或固定錨點采樣,難以全面建模駕駛決策空間。 擴散模型 (Diffusion Model) 憑借強大的多模態建模
    的頭像 發表于 03-08 13:59 ?1793次閱讀
    DiffusionDrive首次在端到端自動駕駛中引入<b class='flag-5'>擴散</b><b class='flag-5'>模型</b>

    ASM330的速度隨機游走和加速度零偏不穩定性參數如何獲???

    我在手冊里只找到了陀螺儀的零偏不穩定性和角度隨機游走,沒有看見速度隨機游走和加速度零偏不穩定性,不知道如何獲取這個參數
    發表于 03-07 07:06