近日,國際計算機視覺大會(ICCV 2025)舉辦了第七屆大型視頻目標分割挑戰賽(LSVOS Challenge),傳音TEX AI團隊憑借自主研發的創新技術方案,在復雜視頻目標分割和語言指引視頻目標分割兩個賽道中均榮獲全球第二名,擊敗眾多國內外強隊,充分展示了團隊在復雜視頻理解與多模態視頻目標分割領域的深厚積累與世界級競爭力。
ICCV是由IEEE(電氣與電子工程師協會)每兩年舉辦一次的研究大會,與計算機視覺模式識別會議(CVPR)和歐洲計算機視覺會議(ECCV)并稱為計算機視覺領域的三大頂級會議。LSVOS Challenge 作為國際計算機視覺領域的重要賽事之一,旨在推動視頻目標分割技術的創新與落地應用,為多模態視頻理解、視頻編輯等方向的發展提供重要的學術研究與產業落地參考。本次賽事吸引了來自清華大學、牛津大學、上海交通大學、上海人工智能實驗室、漢陽大學、南京理工大學、香港中文大學(深圳)、武漢大學、加利福尼亞大學默塞德分校、南洋理工大學、德國亞琛工業大學、荷蘭埃因霍溫理工大學、網易等國內外知名機構團隊參賽。
復雜視頻目標分割任務旨在在跨越數百至數千幀的長時復雜視頻中,持續追蹤并精確分割特定目標,即使在目標多次消失重現、外觀劇烈變化、小尺寸目標、重度遮擋等困難場景下仍需保持時序一致性;語言指引視頻目標分割則需根據自然語言描述在視頻中定位并分割目標,既要理解外觀信息,還需對動作、時序和多模態語義進行匹配。兩個任務均具有高度不確定性與挑戰性,考驗算法在真實場景中的魯棒性、泛化能力及跨模態理解水平。本屆比賽分別使用 MOSE(長視頻+復雜場景分割)與 MeViS(動作描述驅動的目標分割)等高難度數據集進行評測,對參賽方案的整體表現提出了極高要求。
在 VOS 賽道中,傳音TEX AI團隊在SAM2Long 框架基礎上引入偽標簽增強的領域自適應訓練策略(如圖所示),先采用 SAM2Long(基礎模型來自 SAM2)生成 MOSE 測試集的高質量偽標簽,再與訓練集融合重新微調 SAM2 以此縮小域差異。推理階段并行使用概念驅動的Segment Concept(SeC)模型,并通過級聯決策機制動態融合兩路預測結果,兼顧長時穩定性與外觀變化適應性,最終在 MOSE 測試集上取得J&F 0.8616的成績,距離冠軍僅差 0.0021 分。

圖. 傳音TEX AI團隊在VOS任務上提出的算法技術方案示意圖
在 RVOS 賽道中,團隊在Sa2VA框架基礎上進行了深度優化,提出Video-Language Checker(VLC)利用視覺多模態大語言模型 Qwen2.5-VL 驗證視頻語義與語言描述的一致性,將測試集進行分類;并設計Key-Frame Sampler(KFS)將首段連續采樣與全局均勻采樣結合,提升捕捉目標和保持時序上下文的能力;最終由強化的 SEG token 驅動 SAM2 對關鍵幀進行分割,并將結果傳播至全視頻,實現時序一致的分割輸出。在未進行額外微調或偽標簽訓練的前提下,該方案在 MeViS 測試集獲得J&F 0.6465,位列第二 。

圖. 傳音TEX AI團隊在RVOS任務上提出的算法技術方案示意圖
未來,團隊將進一步將視頻目標分割技術應用到視頻與動圖(live Photos)的目標消除,通過算法智能填補缺失區域、去除干擾物、恢復復雜場景內容,實現更加自然流暢的視覺呈現。該能力可賦能視頻編輯、老影片修復、運動場景遮擋消除及創意特效制作等多樣化應用場景,傳音TEX AI 團隊將持續在視頻理解與目標分割技術領域攻堅突破,推動全球行業技術發展。
-
計算機
+關注
關注
19文章
7806瀏覽量
93189 -
AI
+關注
關注
91文章
39755瀏覽量
301359 -
傳音控股
+關注
關注
1文章
127瀏覽量
8500
原文標題:傳音TEX AI團隊斬獲ICCV 2025大型視頻目標分割挑戰賽雙料亞軍
文章出處:【微信號:TranssionHoldings,微信公眾號:傳音控股】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
思必馳斬獲Interspeech 2026音頻推理挑戰賽智能體賽道亞軍
芯導科技榮獲傳音控股2025年度鼎立支持獎
“芯”年來襲 | 瑞薩邊緣AI線上技術月暨挑戰賽
摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建挑戰賽銀獎
2025 全國人工智能應用場景創新挑戰賽AI Agent全球專項賽線下半決賽新聞發布會在深圳召開
東風睿立達斬獲NEVC 2025中國新能源商用車挑戰賽六項大獎
傳音攜手Google Cloud打造下一代AI智能生態
2025 EDA精英挑戰賽華大九天賽題發布
2025 EDA精英挑戰賽紫光同創賽題發布
地平線H-RDT模型斬獲CVPR 2025大賽冠軍
傳音斬獲WMT 2025國際機器翻譯大賽四項冠軍
傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰賽冠亞軍,推動視頻畫質升級
傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰賽冠亞軍
傳音TEX AI團隊斬獲ICCV 2025大型視頻目標分割挑戰賽雙料亞軍
評論