国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Stability AI開源圖像生成模型Stable Diffusion

倩倩 ? 來源:AI前線 ? 作者:Anthony Alford ? 2022-09-21 15:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Stability AI 對外發布了 Stable Diffusion 的預訓練模型權重,這是一個文本至圖像的 AI 模型。根據文本提示,Stable Diffusion 能夠生成逼真的 512x512 像素的圖像以描述提示中的場景。

在模型權重公開發布之前,它的代碼已經發布,模型權重也有限發布給了研究社區。在最新的版本中,任何用戶都可以在消費者級別的硬件中下載并運行 Stable Diffusion。除了文本至圖像的生成,該模型還支持圖像至圖像的風格轉換以及圖像質量提升。在發布該版本的同時,Stable AI 還發布了 beta 版本的 API 以及模型的 Web UI,名為 DreamStudio。Stable AI 這樣說到:

Stable Diffusion 是一個文本至圖像的模型,它能讓數十億人在幾秒鐘內創建出令人贊嘆的藝術品。在速度和質量方面,它都有所突破,這意味著它能在消費者級別的 GPU 上運行……這能夠讓研究人員和……公眾在各種條件下運行,使圖像生成技術走向大眾。我們期待圍繞該模型和其他模型出現一個開放的生態系統,以探索潛在空間的邊界。

Stable Diffusion 基于名為潛在擴散模型(latent diffusion models,LDMs)的圖像生成技術。與其他的流行的圖像合成方法不同,如生成對抗網絡(generative adversarial networks,GANs)和 DALL-E 使用的自動回歸技術,LDMs 通過在一個潛在表示空間中迭代“去噪”數據來生成圖像,然后將表示結果解碼為完整的圖像。LDM 是由 Ludwig Maximilian University of Munich 的機器視覺與學習(Machine Vision and Learning)研究組開發的,并在最近的 IEEE / CVF 計算機視覺和模式識別會議(Computer Vision and Pattern Recognition Conference)上發表的一篇論文中進行了闡述。在今年早些時候,InfoQ 曾經報道過谷歌的 Imagen 模型,它是另一個基于擴散的圖像生成 AI。

Stable Diffusion 模型支持多種操作。與 DALL-E 類似,它能夠根據所需圖像的文本描述,生成符合匹配該描述的高質量圖像。它還可以根據一個簡單的草圖再加上所需圖像的文本描述,生成一個看起來更逼真的圖像。Meta AI 最近發布了名為 Make-A-Scene 的模型,具有類似的圖像至圖像的功能。

Stable Diffusion 的很多用戶已經公開發布了生成圖像的樣例,Stability AI 的首席開發者 Katherine Crowson 在推特上分享了許多圖像。基于 AI 的圖像合成可能會對藝術家和藝術領域帶來一定的影響,有些評論者對此感到不安。就在 Stable Diffusion 發布的同一周,一幅由 AI 生成的藝術品在科羅拉多州博覽會的藝術比賽中獲得了一等獎。Django 框架的共同創建者 Simon Williamson 認為:

我見過一種說法,認為 AI 藝術沒有資格獲得版權保護,因為“它必須歸功于全人類”——如果基于文本生成的設計尚不足以說服公眾的話,那 [圖像至圖像] 技術可能會打破這種平衡。

Stable AI 的創始人 Emad Mostaque 在推特上回答了一些關于該模型的問題。在回答一位試圖估算訓練模型所需的計算資源和成本的用戶時,Mostaque 說到:

實際上,我們為這個模型使用了 256 個 A100 顯卡,總共 15 萬小時,所以按市場價格計算為 60 萬美元。

Mostaque 給出了 Reddit 上一篇文章的鏈接,其中給出了如何最好地使用該模型來生成圖像的技巧。

Stable Diffusion 的代碼可以在 GitHub 上找到。模型的權重以及 Colab notebook 和示例 Web UI 都可以在 HuggingFace 上找到。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301360
  • 模型
    +關注

    關注

    1

    文章

    3751

    瀏覽量

    52099
  • 圖像生成
    +關注

    關注

    0

    文章

    25

    瀏覽量

    7169

原文標題:Stability AI 開源圖像生成模型 Stable Diffusion

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    模型 ai coding 比較

    序 我主要用途是 ai coding,從各種渠道獲取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    發表于 02-19 13:43

    使用NORDIC AI的好處

    提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負載。[Axon NPU 技術頁] 模型更小、更快、更省電 Neuton 模型相較 TensorFlow Lite:* 內存
    發表于 01-31 23:16

    從炫技到量產,具身智能要突破哪些瓶頸?

    LingBot-VLA 開源,具身智能的 Stable Diffusion 來了?
    的頭像 發表于 01-28 17:12 ?8951次閱讀
    從炫技到量產,具身智能要突破哪些瓶頸?

    使用Firebase AI Logic生成圖像模型的兩種新功能

    為您的應用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其一是 Imagen 專屬編輯功
    的頭像 發表于 11-30 09:28 ?421次閱讀

    本地部署Stable Diffusion實現AI文字生成高質量矢量圖片應用于電子商務

    本地部署Stable Diffusion
    的頭像 發表于 11-28 07:19 ?738次閱讀

    openDACS 2025 開源EDA與芯片賽項 賽題七:基于大模型生成式原理圖設計

    (Large Language Models, LLMs)正逐步成為EDA工具變革的核心驅動力之一。近年來,以GPT、DeepSeek、通義千問等為代表的通用大模型在文本生成、語義理解、代碼生成
    發表于 11-13 11:49

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區
    發表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    AI的應用多種多樣。比如:DALL-E2、Midjourney、Stable Diffusion等,不僅包括對話功能,還包括生成圖像、視頻、
    發表于 09-12 16:07

    【Sipeed MaixCAM Pro開發板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統

    1. 項目概述 本項目旨在開發并部署一個高精度的深度學習模型,用于自動鑒別一張圖片是由AI生成(如Stable Diffusion, DAL
    發表于 08-21 13:59

    谷歌新一代生成AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI 上推出新一代生成AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發表于 06-18 09:56 ?1091次閱讀

    利用NVIDIA 3D引導生成AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術突飛猛進,從早期模型生成手指過多的人類圖像,到現在能創造出令人驚嘆的逼
    的頭像 發表于 06-05 09:24 ?890次閱讀

    Gemini API集成Google圖像生成模型Imagen 3

    開發者現在可以通過 Gemini API 訪問 Google 最先進的圖像生成模型 Imagen 3。該模型最初僅對付費用戶開放,不久后也將面向免費用戶推出。
    的頭像 發表于 05-14 16:53 ?1258次閱讀

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    模型庫的限制,聯發科還首發了開源彈性架構。區別于過往的開放接口,只能部署特定架構模型,開放彈性架構允許開發者直接調整平臺源代碼,無需等待芯片廠商的支持,即可完成目標或其他自研大模型輕松
    發表于 04-13 19:52

    ?Diffusion生成式動作引擎技術解析

    Diffusion生成式動作引擎 Diffusion生成式動作引擎是一種基于擴散模型Diffusion
    的頭像 發表于 03-17 15:14 ?3044次閱讀

    使用OpenVINO GenAI和LoRA適配器進行圖像生成

    借助生成AI 模型(如 Stable Diffusion 和 FLUX.1),用戶可以將平平無奇的文本提示詞轉換為令人驚艷的視覺效果。
    的頭像 發表于 03-12 13:49 ?1875次閱讀
    使用OpenVINO GenAI和LoRA適配器進行<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>