5月30日最新動態,快手于近日向公眾推出其自主研發的文生圖大模型命名為“可圖”。該模型具備文生圖及圖生圖兩種功能,適用于AI圖像創作及AI形象定制。
用戶可以通過微信小程序或網頁版訪問“可圖”。據界面新聞報道,這是快手首次公開其自研大模型。據悉,“可圖”大模型參數規模高達十億級別,數據來源包括開源社區、快手內部構建及自研AI技術合成,涵蓋了千萬級別的中文實體概念。
此外,該模型采用強化學習和獎勵模型技術(RLHF),有效解決了長文本和復雜語義文本輸入下的效果問題。
快手內部今年確定了大模型應用策略,主要聚焦于理解、互動和生成三個方向,具體應用場景包括全域大模型內容理解、AI互動、商業場景的數字人和AIGC等。
實際測試結果顯示,“可圖”提供的功能包括“文生圖”,以及多款動漫主題、寫實人像風格,如上世紀流行的“紅鉆貴族”、近年熱門的“粘土世界”風格,以及多種繪畫樣式。用戶每次最多可生成4張圖片。
早前報道,快手創始人兼CEO程一笑在今年3月表示,有信心在未來半年內,使大模型的綜合性能達到GPT4.0的水平。同時,他還透露,快手文生圖大模型“可圖”的綜合性能已經超越Midjourney V5。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
圖像
+關注
關注
2文章
1096瀏覽量
42326 -
AI
+關注
關注
91文章
39755瀏覽量
301364 -
大模型
+關注
關注
2文章
3648瀏覽量
5179
發布評論請先 登錄
相關推薦
熱點推薦
定制AI智能眼鏡_帶攝像頭翻譯導航大模型的ai眼鏡硬件方案
AI眼鏡硬件方案能滿足高性能、低功耗、全場景交互需求,采用聯發科(MTK)專屬智能穿戴芯片方案作為核心算力支撐,整合1600萬高清攝像頭與2/3/5通道可定制麥克風陣列,搭載自
使用NORDIC AI的好處
提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負載。[Axon NPU 技術頁]
模型更小、更快、更省電
Neuton 模型相較 TensorFlow Lite:* 內存
發表于 01-31 23:16
AI功能(SC171開發套件V3)2026版
/28530.html
*附件:文檔:圖像超分辨率(real esrgan x4plus)案例_V2.0.pdf
見文檔說明
4
語音識別案例----基于廣和通自研語音識別模型
10分
發表于 01-15 11:18
SeaVerse發布全球首個AI Native平臺,“All in AI Native”引領AI創作前瞻革命
2026年1月10日,SeaVerse宣布全球發布SeaVerse AI平臺。這是全球首個AI原生的創建和部署平臺,集合大語言模型、圖像生成、視頻生成、Agent等多方面的能力,通過全
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發
NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助 NVIDIA Omniverse 庫和 Co
【Sipeed MaixCAM Pro開發板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統
能夠有效捕捉AI生成圖像與真實手繪掃描圖像在紋理、筆觸、光影、全局一致性等方面的細微差異。
邊緣端部署:將模型量化、編譯,最終高效運行在算力有限的MaixCAM-Pro開發板上。
實時
發表于 08-21 13:59
4K、多模態、長視頻:AI視頻生成的下一個戰場,誰在領跑?
電子發燒友網報道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節跳動最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無縫切換的1080
DevEco Studio AI輔助開發工具兩大升級功能 鴻蒙應用開發效率再提升
) 模型微調(Fine-tuning):針對特定領域優化生成模型的表現。RAG支持實時更新官方數據源,避免傳統微調模型因數據滯后產生的幻象。
圖
發表于 04-18 14:43
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
模型庫的限制,聯發科還首發了開源彈性架構。區別于過往的開放接口,只能部署特定架構模型,開放彈性架構允許開發者直接調整平臺源代碼,無需等待芯片廠商的支
發表于 04-13 19:52
Apple Intelligence全球開放 支持簡體中文
的一個大招是Apple Intelligence全球開放。并正式支持包括簡體中文、法語、德語、意大利語、葡萄牙語等多種語言;提供AI輔助能力,比如文本創作、
AI看點:可靈AI累計營收超1億元 李書福用“黑科技”脫稿演講 蘿卜快跑獲新加坡副總理點贊
給大家帶來一些AI相關資訊: 可靈AI累計營收超1億元 可靈AI是一款視頻生成大模型應用,輸入文
英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數據工具的重大更新
、Figure AI、Skild AI 是最早采用該技術的公司。 NVIDIA 宣布推出全新 NVIDIA Cosmos 世界基礎模型 (WFM) 的重大更新,該模型引入了
在 MAC mini4 上安裝與使用 ComfyUI 文生圖軟件完整指南
作者:算力魔方創始人/英特爾創新大使劉力 一,前言 ComfyUI 是一款功能強大的文生圖軟件,它利用先進的 AI 技術,能夠將用戶輸入的文本內容快速轉化為高質量的圖像。無論是創意設計
快手自研文生圖大模型“可圖”開放,支持AI圖像創作及定制
評論