AI 賦能的圖像生成技術(shù)突飛猛進,從早期模型會生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個挑戰(zhàn):實現(xiàn)創(chuàng)意掌控。
使用文本創(chuàng)建場景變得更容易,不再需要復(fù)雜的描述,模型也改進了針對提示詞的一致性。但僅通過文字描述構(gòu)圖、拍攝角度、物體擺放這些精細細節(jié)已經(jīng)很不容易了,要修改調(diào)整更是難上加難。雖然使用 ControlNet(通過更好地控制輸出來增強圖像生成的工具)的高級工作流提供了解決方案,但其設(shè)置復(fù)雜,限制了更廣泛的使用。
為幫助克服這些挑戰(zhàn)并快速獲取先進的 AI 功能,NVIDIA 在年初的 CES 展會上發(fā)布了面向 RTX PC 的NVIDIA 3D 引導(dǎo)生成式 AI Blueprint。這個示例工作流包含了全套工具,讓你能從頭開始生成完全控制構(gòu)圖的圖像。用戶現(xiàn)在就可以體驗這個全新的 Blueprint。
利用 3D 控制 AI 生成的圖像
NVIDIA 的3D 引導(dǎo)生成式 AI Blueprint可控制圖像生成,它使用 Blender 中的 3D 場景草稿向圖像生成器(Black Forest Labs 的 FLUX.1-dev)提供深度圖,與用戶的提示詞一起生成所需的圖像。
深度圖幫助圖像模型理解物體應(yīng)該如何放置。這項技術(shù)的優(yōu)勢在于,它不需要高度細節(jié)化的物體或高質(zhì)量紋理,因為它們將被轉(zhuǎn)換為灰度。此外,由于場景是 3D 的,用戶可以輕松移動物體并更改相機角度。
Blueprint 的底層是 ComfyUI,這是一個功能強大的工具,允許創(chuàng)作者以有趣的方式鏈接生成式 AI 模型。例如,用戶可以通過 ComfyUI Node Editor Blender 插件將 Blender 連接到 ComfyUI。此外,用戶可以使用NVIDIA NIM 微服務(wù)在 GeForce RTX GPU 上部署 FLUX.1-dev 模型并以最佳性能運行,充分利用 NVIDIA TensorRT 軟件開發(fā)套件以及 FP4 和 FP8 等優(yōu)化的精度格式。3D 引導(dǎo)的生成式 AI Blueprint 需要 NVIDIA GeForce RTX 4080 及以上 GPU。
生成式 AI 工作流的預(yù)構(gòu)建基礎(chǔ)
3D 引導(dǎo)的生成式 AI Blueprint 包括開始使用高級圖像生成工作流所需的一切:Blender、ComfyUI、連接兩者的 Blender 插件、FLUX.1-dev NIM 微服務(wù)以及運行該微服務(wù)所需的 ComfyUI 節(jié)點。對于 AI 藝術(shù)家,還附帶了安裝程序和詳細的部署說明。
該 Blueprint 采用一種結(jié)構(gòu)化的方式來深入圖像生成,提供了可根據(jù)特定需求量身定制的工作流。這套方案包含了手把手教程、現(xiàn)成素材和開箱即用的環(huán)境配置,讓你創(chuàng)作更輕松,效果更驚艷。
對于 AI 開發(fā)者,該 Blueprint 可以作為構(gòu)建類似工作流或擴展現(xiàn)有工作流的基礎(chǔ)。它附帶源代碼、示例數(shù)據(jù)、文檔和入門工作示例。
RTX AI 提供支持的實時生成
AI Blueprint 在 NVIDIA RTX AI PC 和工作站上運行,充分利用了 NVIDIA Blackwell 架構(gòu)的最新性能突破。
3D 引導(dǎo)的生成式 AI Blueprint中包含的 FLUX.1-dev NIM 微服務(wù)經(jīng)過 TensorRT 優(yōu)化,并量化為 FP4 精度以適用于 Blackwell GPU,推理速度比原生 PyTorch FP16 提升了一倍以上。
對于使用 NVIDIA Ada Lovelace 架構(gòu) GPU 的用戶,F(xiàn)LUX.1-dev NIM 微服務(wù)附帶 FP8 精度,同樣由 TensorRT 加速。這些改進使高性能工作流更容易實現(xiàn),從而能夠進行快速迭代和實驗。量化還有助于減少模型運行所需的顯存。使用 FP4 量化時,模型體積直接比 FP16 小了一半還多。
使用 RTX AI 進行定制和創(chuàng)建
目前有 10 個 NIM 微服務(wù)可用于 RTX,支持從圖像和文本生成到語音 AI 和計算機視覺的用例,更多 Blueprint 和服務(wù)即將推出。
AI Blueprint 和 NIM 微服務(wù)現(xiàn)已推出,為準備在 RTX PC 和工作站上創(chuàng)建、定制和突破生成式 AI 界限的用戶提供了強大的基礎(chǔ)。
-
3D
+關(guān)注
關(guān)注
9文章
3011瀏覽量
115015 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5592瀏覽量
109716 -
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301358
原文標題:借助 NVIDIA 的 3D 引導(dǎo)生成式 AI Blueprint 控制 AI 圖像的構(gòu)圖
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
通過NVIDIA Jetson AGX Thor實現(xiàn)7倍生成式AI性能
使用NVIDIA AI Blueprint打造3D世界
索尼與VAST達成3D業(yè)務(wù)合作
智能體化AI和生成式AI的區(qū)別
【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)
生成式 AI 重塑自動駕駛仿真:4D 場景生成技術(shù)的突破與實踐
英倫科技10.1英寸裸眼3D數(shù)碼相框升級了,玩轉(zhuǎn)AI文生圖太cool了!
邊緣生成式AI面臨哪些工程挑戰(zhàn)?
谷歌新一代生成式AI媒體模型登陸Vertex AI平臺
NVIDIA推出全新智慧城市AI Blueprint
使用NVIDIA Earth-2生成式AI基礎(chǔ)模型革新氣候建模
NVIDIA助力影眸科技3D生成工具Rodin升級
英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理
利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成
評論