導讀近日,全球三大計算機視覺頂級會議之一CVPR如期舉行,深蘭科技DeepBlueAI團隊斬獲TinyAction Challenge(低分辨率視頻行為識別挑戰賽)的冠軍。
TinyAction Challenge是第六屆動作識別國際挑戰賽系列競賽之一,該系列競賽由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主辦,旨在推動視頻理解的進一步發展。
冠軍方案解讀
賽題介紹
TinyAction Challenge使用TinyVirat-v2[1]數據集,旨在提高低分辨率高噪聲等真實監控場景下的視頻行為識別能力。比賽提供大量真實場景視頻片段及標注,每個視頻片段中可能含有多個動作,本質是一個多標簽的行為識別任務,比賽結果采用precision、recall、F1-score等多個指標來評測。
賽題難點
視頻分辨率很低,最小只有10x10像素尺度;
視頻尺度多樣,從10x10到128x128不等;
視頻質量較差,含有大量噪聲;
視頻場景多樣,行為多樣,每個視頻可能含有多個行為。
解決方案
在算法選擇上,團隊廣泛嘗試了TSM[2]、TPN-Slowonly[3]等經典算法,最終采用交互移除的CSN[4](ir-CSN)模型,在保證性能的前提下適當減少計算量,同時減輕對數據的過擬合。
數據增強方面,訓練時團隊首先隨機調整尺度裁剪,再統一調整尺度到128x128,最后再隨機翻轉。而在測試時,通過Tencrop,即對視頻幀及其水平翻轉在中心與四角區域分別裁剪求平均,有效提高了inference時單模型性能。
測試階段團隊進一步使用了五折交叉驗證的模型融合方法。另外由于觀察到在比賽數據集的26類行為中有些類別是互斥的,因而對最終的結果添加了后處理規則,使得F1指標進一步提高0.6個點。通過一步步優化,DeepBlueAI團隊單模型的F1指標即超過了第二名達到0.4447,并最終達到0.4782,實現大幅度領先。
總結
在本次比賽中,團隊對任務及數據做了仔細的分析,合理地選擇了模型算法,進行了精細的模型訓練,同時在數據的后處理上做了大量的優化,有效實現了低分辨率高噪聲視頻中行為識別,并最終獲得冠軍。相信隨著計算機視覺及多模態技術的深入發展,行為識別等視頻理解問題能夠得到更好的解決,并獲得越來越廣泛的實際應用。
參考文獻:
[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR)。 IEEE, 2021: 7387-7394
[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.
[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV)。 IEEE, 2019.
[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.
編輯:jq
-
計算機視覺
+關注
關注
9文章
1715瀏覽量
47628 -
高噪聲率
+關注
關注
0文章
2瀏覽量
6086 -
數據集
+關注
關注
4文章
1236瀏覽量
26194 -
CSN
+關注
關注
0文章
2瀏覽量
9008 -
深蘭科技
+關注
關注
1文章
106瀏覽量
6576
原文標題:賽道 | CVPR2021深蘭冠軍方案解讀- TinyAction Challenge低分辨率視頻行為識別挑戰賽
文章出處:【微信號:kmdian,微信公眾號:深蘭科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
思必馳斬獲Interspeech 2026音頻推理挑戰賽智能體賽道亞軍
摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建挑戰賽銀獎
第三屆ICPC與華為挑戰賽冠軍杯圓滿結束
電能質量在線監測裝置的暫態記錄分辨率如何影響故障類型識別?
德州市政府領導蒞臨深蘭科技考察調研
廊坊市政府領導蒞臨深蘭科技調研考察
傳音TEX AI團隊斬獲ICCV 2025大型視頻目標分割挑戰賽雙料亞軍
山東大學與濟南市科技局領導蒞臨深蘭科技調研考察
深蘭科技發布AI法務大模型產品
分辨率對于模擬到數字轉換器有什么重要性
如何構建帶有VGA輸出的低分辨率熱成像
傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰賽冠亞軍,推動視頻畫質升級
傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰賽冠亞軍
分辨率 vs 噪聲 —— ADC的挑戰
深蘭科技DeepBlueAI團隊斬獲低分辨率視頻行為識別挑戰賽的冠軍
評論