5月28日,北京智源人工智能研究院在2023年中關村論壇并行論壇之一的人工智能大規模模型發展論壇上發布了通用分割模型seggpt (segment everything in contex)。這是一種利用prompt(視覺提示)完成任意分割工作的通用視覺模型。
seggpt是一個基于支持通用視覺模型painter的模型,它優化了所有物體的分割。seggpt具有上下文推理功能,即使沒有細微的調整,只要提供示例,就可以自動進行推理和相應的分割工作。示例包括示例、類、部件、輪廓、文本、面部、醫療圖像等。它靈活的推論能力足以提供許多視覺線索。自動視頻分割和追蹤功能:seggpt以第一個框架的圖片和對象屏蔽為上下文單位,可以自動分割下一個視頻框架,并使用屏蔽顏色作為對象id自動追蹤。
seggpt與推出ai圖像分割基礎模型sam的meta不同,sam使用的是通過一個點或邊框相互提示預測圖像,識別分割畫面上的特定物體的“one touch touch”方式。seggpt通過提示一個或多個示例圖像和意圖面具來掌握用戶的意圖,并根據意圖進行分割等操作。只要用戶在畫面上表示識別一種物體,無論是現在的畫面還是其他畫面,都可以定量地識別和分割同類物體。
“一觸即通”或“一通百通”意味著視覺模型理解了形象結構。sam的精細腳注功能與seggpt的通用分割腳注功能相結合,可以在像素排列中分析任何圖像,以像生物視覺一樣理解任何場景。
-
AI
+關注
關注
91文章
39889瀏覽量
301537 -
視覺模型
+關注
關注
0文章
8瀏覽量
7050 -
GPT
+關注
關注
0文章
368瀏覽量
16883
發布評論請先 登錄
GPT-5震撼發布:AI領域的重大飛躍
意法半導體STM32 AI模型庫助力邊緣AI落地應用
今日看點|黃仁勛:物理AI的ChatGPT時刻已然到來;波士頓動力發布Atlas人形機器人量產版本
更理想的AI視覺芯,飛凌嵌入式RV1126B系列核心板怎么樣?
瑞芯微SOC智能視覺AI處理器
重磅合作!Quintauris 聯手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地
GPT-5.1發布 OpenAI開始拼情商
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力
如何用Arduino Nano/UNO R3開發板給另一個Arduino IDE不能下載的Arduino Nano/UNO R3開發板重新燒錄引導程序bootlaoder
最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)
一文講透 AI 歷史上的 10 個關鍵時刻
AI另一個重大領域視覺的GPT時刻何時到來?
評論