作者 / 產品經理 Ivan Solovyev
開發者現在可以通過 Gemini API 訪問 Google 最先進的圖像生成模型 Imagen 3。該模型最初僅對付費用戶開放,不久后也將面向免費用戶推出。
Imagen 3 擅長生成具有視覺吸引力、無偽影且風格多樣的圖像,從超現實主義圖像到印象派風景,從抽象構圖到動漫角色等應有盡有。改進后的提示遵循能力使其能夠輕松地將絕佳創意轉化為高質量圖像。總體而言,Imagen 3 在各種基準測試中展現出了最先進的性能。通過 Gemini API 使用 Imagen 3 的價格為每張圖像 0.03 美元,并且用戶可以控制寬高比、生成選項數量等更多參數。
為了幫助遏制錯誤信息和錯誤歸因,所有由 Imagen 3 生成的圖像都包含一個不可見的數字SynthID水印,用于識別它們為 AI 生成的圖像。
了解 Imagen 3 的實際效果
下方圖庫展示了Imagen 3在多種風格圖像上的卓越表現。
開始使用 Gemini API 中的 Imagen 3
此 Python 代碼段展示了如何使用 Gemini API 和 Imagen 3 生成圖像。
fromgoogleimportgenai fromgoogle.genaiimporttypes fromPILimportImage fromioimportBytesIO client = genai.Client(api_key='GEMINI_API_KEY') response = client.models.generate_images( model='imagen-3.0-generate-002', prompt='a portrait of a sheepadoodle wearing cape', config=types.GenerateImagesConfig( number_of_images=1, ) ) forgenerated_imageinresponse.generated_images: image = Image.open(BytesIO(generated_image.image.image_bytes)) image.show()圖像已生成
您可以在 Gemini API 開發者文檔中探索更多關于提示技巧和圖像風格的內容,有關評分、方法論及性能提升的更多詳情,請參閱我們更新后的技術報告附錄 D。
我們非常高興能夠邁出第一步,將我們的生成式媒體模型擴展至 Gemini API。我們還計劃在不久的將來推出更多模型,以便開發者能夠將生成式媒體與語言模型結合起來使用。
-
Google
+關注
關注
5文章
1811瀏覽量
60603 -
Gemini
+關注
關注
0文章
74瀏覽量
8166 -
圖像生成
+關注
關注
0文章
25瀏覽量
7177
原文標題:Gemini API 集成 Imagen 3,帶來更強大的圖像生成功能
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Gemini CLI 中轉站配置使用教程
谷歌正式推出Gemini 3 Flash模型
生成式 AI 的競爭進入“API 時代”:中國企業為何更關注可集成能力,AWS 正成為主流選擇
使用Firebase AI Logic生成圖像模型的兩種新功能
谷歌Gemini 3模型開啟智能新紀元
小紅書:通過商品標簽API自動生成內容標簽,優化社區推薦算法
【Sipeed MaixCAM Pro開發板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統
Firebase Studio現已集成Gemini 2.5
谷歌新一代生成式AI媒體模型登陸Vertex AI平臺
利用NVIDIA 3D引導生成式AI Blueprint控制圖像生成
谷歌Gemini 2.5模型系列更新
AlphaEvolve:一款基于Gemini的編程Agent,用于設計高級算法
Gemini API集成Google圖像生成模型Imagen 3
評論