国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用Firebase AI Logic生成圖像模型的兩種新功能

谷歌開發者 ? 來源:谷歌開發者 ? 2025-11-30 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者 / 高級開發者關系工程師 Thomas Ezan 和開發者關系工程師 Mozart Louis

為您的應用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其一是 Imagen 專屬編輯功能預覽版;其二是 Gemini 2.5 Flash Image (又名 Nano Banana) 正式版,后者的專長就是在情境或對話中生成圖像。

借助 Firebase AI Logic 生成圖像以提高用戶參與度

圖像生成模型可用于創建自定義用戶個人資料頭像,或將個性化視覺素材直接集成到應用關鍵流程中。

例如,Imagen 提供了尚處于開發者預覽版的全新編輯功能。現在,您可以繪制遮罩并利用圖像內繪制 (inpainting) 在遮罩區域內生成像素。此外,還提供了圖像擴展 (outpainting) 功能,可用于生成遮罩區域外的像素。

另一方面,Gemini 2.5 Flash Image (又名 Nano Banana) 可以使用 Gemini 模型淵博的世界知識和推理能力來生成與上下文相關的圖像,這非常適合用于創建與用戶當前應用內體驗契合的動態插圖。

△ 使用 Gemini 2.5 Flash Image 創建與您的應用上下文相關的動態插圖

最后,借助對話和迭代編輯圖像的功能,用戶可以使用自然語言編輯圖像。

在著手將 AI 集成到您的應用中時,了解 AI 安全性非常重要。尤其關鍵的是,您需要評估應用的安全風險、斟酌調整以降低安全風險、執行適合您用例的安全測試,以及征求用戶反饋并監控內容。

Imagen 或 Gemini 任您選擇

Gemini 2.5 Flash Image (Nano Banana) 和 Imagen 之間的區別在于各自獨特的側重點和高級功能。Gemini 2.5 Flash Image 作為廣泛的 Gemini 系列中的圖像模型,擅長對話式圖像編輯,能在多次迭代中保持上下文和主體一致性,并利用 "世界知識和推理" 來創建與上下文相關的視覺內容,或在長文本序列中嵌入準確的視覺內容。

Imagen 是 Google 的專業圖像生成模型,專為更好地發揮創意和掌控作品而設計,擅長于高度真實的輸出、藝術細節、特定風格,并提供明確的控制選項,來指定生成圖像的寬高比或格式。

Gemini 2.5 Flash Image
(Nano Banana )
Imagen
具備世界知識和推理能力,生成與上下文更相關的圖像
在保持與上下文關聯性的同時,通過對話編輯圖像
在長文本序列中嵌入準確的視覺內容
指定生成圖像的寬高比或格式
支持基于遮罩的編輯,實現圖像內繪制和圖像擴展
更好地控制生成圖像的細節 (質量、藝術細節和特定風格)

一起來了解如何在您的應用中使用上述功能。

使用 Imagen 進行圖像內繪制

幾個月前,我們發布了 Imagen 新的編輯功能。雖然 Imagen 的圖像生成功能已可正式用于生產環境,但編輯功能仍處于開發者預覽版階段。

Imagen 編輯功能包括圖像內繪制和圖像擴展,二者均為基于遮罩的圖像編輯功能。這項新功能允許用戶修改圖像的特定區域,而無需重新生成整個圖像。這意味著您可以保留圖像中您最滿意的部分,只更改您想要調整的內容。

做出這些更改時,原始圖像的核心元素和圖像整體完整性不受影響,您可以僅調整遮罩區域。

要使用 Imagen 的圖像內繪制功能,請先初始化 imagen-3.0-capability-001,這是支持編輯功能的特定 Imagen 模型:

// Copyright2025Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
    Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
     "imagen-3.0-capability-001",
      generationConfig =ImagenGenerationConfig(
        numberOfImages =1,
        aspectRatio = ImagenAspectRatio.SQUARE_1x1,
        imageFormat = ImagenImageFormat.jpeg(compressionQuality =75),
      ),
    )

然后,定義圖像內繪制函數:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
valprompt ="remove the pancakes and make it an omelet instead"
suspendfuninpaintImageWithMask(sourceImage:Bitmap, maskImage:Bitmap, prompt:String, editSteps:Int=50): Bitmap {
   valimageResponse = editingModel.editImage(
      referenceImages = listOf(
        ImagenRawImage(sourceImage.toImagenInlineImage()),
        ImagenRawMask(maskImage.toImagenInlineImage()),
      ),
      prompt = prompt,
      config = ImagenEditingConfig(
        editMode = ImagenEditMode.INPAINT_INSERTION,
        editSteps = editSteps,
      ),
    )
   returnimageResponse.images.first().asBitmap()
  }

您需要提供一張原始圖像、一張遮罩圖像、用于編輯的提示詞以及需要執行的編輯步驟數量。

您可以在 Android AI 示例庫的 Imagen Editing Sample 中,查看其實際運行效果!

Imagen 還支持圖像擴展,該功能使您能讓模型在遮罩外的區域生成像素。您還可以使用 Imagen 的圖像自定義功能來更改圖像風格或更新圖像中的一個主體。有關詳細信息,請參閱 Android 開發者文檔。

使用 Gemini 2.5 Flash Image 通過對話生成圖像

要使用 Gemini 2.5 Flash Image 編輯圖像,一種方法是通過該模型的多輪聊天功能進行編輯。

首先,初始化模型:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
valmodel=Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
  modelName ="gemini-2.5-flash-image",
 // Configure the model to respond with text and images (required)
  generationConfig = generationConfig {
    responseModalities = listOf(ResponseModality.TEXT,
    ResponseModality.IMAGE)
  }
)

為了實現與上述基于遮罩的 Imagen 方法類似的結果,我們可以利用chatAPI,啟動與 Gemini 2.5 Flash Image 的對話。

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
// Initialize the chat
valchat=model.startChat()
// Load a bitmap
valsource=ImageDecoder.createSource(context.contentResolver, uri)
valbitmap=ImageDecoder.decodeBitmap(source)
// Create the initial prompt instructing the model to edit the image
valprompt=content {
  image(bitmap)
  text("remove the pancakes and add an omelet")
}
// To generate an initial response, send a user message with the image and text prompt
varresponse=chat.sendMessage(prompt)
// Inspect the returned image
vargeneratedImageAsBitmap=response
  .candidates.first().content.parts.filterIsInstance().firstOrNull()?.image
// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response  .candidates.first().content.parts.filterIsInstance().firstOrNull()?.image

您可以在 Android AI 示例庫的 Gemini Image Chat Sample 查看該功能的實際運作,也可參閱 Android 技術文檔以了解更多相關信息。

結論

Imagen 和 Gemini 2.5 Flash Image 都提供了強大的功能,允許您根據具體用例選擇理想的圖像生成模型,從而讓您的應用更加個性化,并提高用戶參與度。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Gemini
    +關注

    關注

    0

    文章

    74

    瀏覽量

    8146
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301358
  • 模型
    +關注

    關注

    1

    文章

    3751

    瀏覽量

    52099

原文標題:一文詳解 | 從了解到集成,輕松為您的應用選擇理想的圖像生成模型

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于擴散模型圖像生成過程

    近年來,擴散模型在文本到圖像生成方面取得了巨大的成功,實現了更高圖像生成質量,提高了推理性能,也可以激發擴展創作靈感。 不過僅憑文本來控制
    的頭像 發表于 07-17 11:00 ?4294次閱讀
    基于擴散<b class='flag-5'>模型</b>的<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>過程

    【Sipeed MaixCAM Pro開發板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統

    能夠有效捕捉AI生成圖像與真實手繪掃描圖像在紋理、筆觸、光影、全局一致性等方面的細微差異。 邊緣端部署:將模型量化、編譯,最終高效運行在算力
    發表于 08-21 13:59

    機器人運動控制的兩種模型

    以六自由度模塊化機器人為對象,利用D-H坐標變換方法進行運動學分析,計算出各桿之間的齊次坐標變換矩陣,建立求解機器人逆運動學問題的兩種模型。并根據兩種模型應用vc++
    發表于 08-05 11:34 ?14次下載

    機器人運動控制的兩種模型

    以六自由度模塊化機器人為對象,利用D-H坐標變換方法進行運動學分析,計算出各桿之間的齊次坐標變換矩陣,建立求解機器人逆運動學問題的兩種模型。并根據兩種模型應用vc++程
    發表于 07-20 15:33 ?24次下載

    兩種空間矢量脈寬調制生成方法的分析與比較

    兩種空間矢量脈寬調制生成方法的分析與比較
    發表于 03-30 18:24 ?11次下載

    iOS10.3beta3推送 修復bug增加兩種新功能

    今天凌晨蘋果正式向開發者推送了iOS 10.3 beta 3的開發者預覽版固件。本次更新仍然主要以bug修復和性能提升為主,另外還加入了新的功能:應用兼容性、查找AirPods兩種新功能,同時也調整了關于APP store的一些
    發表于 02-22 08:41 ?1663次閱讀

    基于改進的DCGAN生成SAR圖像的方法

    針對SAR圖像識別軟件,通過改進 DCGAN模型生成器與單判別器對抗的結構,采用多生成器與單判別器進行對抗,設計了控制各生成
    發表于 04-23 11:01 ?21次下載
    一<b class='flag-5'>種</b>基于改進的DCGAN<b class='flag-5'>生成</b>SAR<b class='flag-5'>圖像</b>的方法

    基于生成式對抗網絡的圖像補全方法

    圖像補全是數字圖像處理領域的重要研究方向,具有廣闊的應用前景。提出了一基于生成式對抗網絡(GAN)的圖像補全方法。
    發表于 05-19 14:38 ?14次下載

    Stability AI開源圖像生成模型Stable Diffusion

    Stable Diffusion 的很多用戶已經公開發布了生成圖像的樣例,Stability AI 的首席開發者 Katherine Crowson 在推特上分享了許多圖像。基于
    的頭像 發表于 09-21 15:37 ?3745次閱讀

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業界領先的前身Stable Diffusion更快、更強大,而Stable Diffusion是許多其他文
    的頭像 發表于 02-19 16:03 ?1777次閱讀
    Stability <b class='flag-5'>AI</b>試圖通過新的<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>人工智能<b class='flag-5'>模型</b>保持領先地位

    谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

    谷歌DeepMind的首席執行官德米斯·哈薩比斯在2月26日透露,公司計劃在接下來的幾周內重新發布其備受關注的Gemini AI模型人像生成功能。此前,由于在某些歷史圖像
    的頭像 發表于 02-28 10:17 ?1208次閱讀

    快手自研文生圖大模型“可圖”開放,支持AI圖像創作及定制

    5月30日最新動態,快手于近日向公眾推出其自主研發的文生圖大模型命名為“可圖”。該模型具備文生圖及圖生圖兩種功能,適用于AI
    的頭像 發表于 05-31 10:32 ?1451次閱讀

    如何用C++創建簡單的生成AI模型

    生成AI(Generative AI)是一人工智能技術,它通過機器學習模型和深度學習技術,從大量歷史數據中學習對象的特征和規律,從而能夠
    的頭像 發表于 07-05 17:53 ?3138次閱讀

    Google款先進生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質的圖像生成
    的頭像 發表于 12-30 09:56 ?1151次閱讀

    借助谷歌Gemini和Imagen模型生成高質量圖像

    在快速發展的生成AI 領域,結合不同模型的優勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創意的提示,然后使用 Imagen 3
    的頭像 發表于 01-03 10:38 ?1556次閱讀
    借助谷歌Gemini和Imagen<b class='flag-5'>模型</b><b class='flag-5'>生成</b>高質量<b class='flag-5'>圖像</b>