国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一個通用的時空預測學習框架

CVer ? 來源:CVer ? 2023-06-19 10:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文介紹CVPR2023的中稿論文:Temporal Attention Unit: Towards Efficient Spatiotemporal Predictive Learning。這篇論文介紹了一種用于高效時空預測的時間注意力單元(Temporal Attention Unit,TAU)。該方法改進了現有框架,對時間和空間上的依賴關系分別學習,提出了時間維度上的可并行化時序注意力單元,實現了高效的視頻預測。

引言

時空預測學習是一種通過學習歷史幀來預測未來幀的自監督學習范式,可以利用海量的無標注視頻數據學習豐富的視覺信息,在氣象預測、交通流量預測、人體姿勢變化估計等領域有著廣泛的應用場景。時空預測學習需要考慮視頻中的空間相關性和時間演變規律,這是一項具有挑戰性的任務。傳統的方法主要基于循環神經網絡來建模時間依賴關系,但是RNN有著計算效率低、難以捕捉長期依賴、容易出現梯度消失或爆炸等缺點。因此,如何設計一個高效、準確、穩定的時空預測學習模型,是一個亟待解決的問題。為了解決這個問題,我們首先研究現有的方法,并提出時空預測學習的通用框架,如下圖所示。

2d2d77a2-0df2-11ee-962d-dac502259ad0.png

TAU

如下圖所示,TAU模型不使用循環神經網絡,而是使用注意力機制來并行化地處理時間演變。TAU模型將時空注意力分解為兩個部分:幀內靜態注意力和幀間動態注意力。幀內靜態注意力使用小核心深度卷積和擴張卷積來實現大感受野,從而捕捉幀內的長距離依賴關系。幀間動態注意力使用通道間注意力的方式來學習不同幀之間的通道權重,從而捕捉幀間的變化趨勢。

2d380db6-0df2-11ee-962d-dac502259ad0.png

TAU模塊將時間注意力分為兩部分:幀內靜態注意力和幀間動態注意力。前者通過獲得的大感受野捕捉幀內的長期依賴關系;而后者以擠壓和激發的方式學習通道的注意力權重,以捕捉時間線上的時序演變。最后的注意力是動態注意力和靜態注意力結合的產物。受ViTs和大核卷積的啟發,研究者使用了深度卷積(DW Conv)、深度擴張卷積(DW-D Conv)和1x1通道卷積來建模大核卷積。

2d430680-0df2-11ee-962d-dac502259ad0.png 此外,我們還提出了一種新穎的差分散度正則化方法,用于優化時空預測學習的損失函數。該方法同時考慮了幀內誤差和幀間變化量。通過將預測幀和真實幀之間的差分轉換為概率分布,并計算它們之間的KL散度,來強制模型學習到視頻中固有的變化規律。差分散度正則化(differential divergence regularization)是預測幀與其對應的真實幀之間的Kullback-Leibler(KL)散度。具體而言,它是預測幀差分和真實幀差分之間的KL散度。 2d5d6afc-0df2-11ee-962d-dac502259ad0.png

τ 代表溫度參數,經驗性地將其設置為0.1以增強概率分布的差異。直觀來說,均方誤差損失(MSE)僅考慮幀內誤差,而差分散度正則化克服了這一缺點,迫使模型學習連續幀之間的差異并意識到固有的變化,以改善模型的預測。

因此目標損失函數:

2d7bb44e-0df2-11ee-962d-dac502259ad0.png

實驗

Moving MNIST

下圖是在Moving MNIST上測試的兩個實例,對于隨機運動的數字,預測與目標的絕對差異很細微,說明TAU能很好地處理時空預測:

2d87e066-0df2-11ee-962d-dac502259ad0.jpg

相對于SOTA的循環模型,TAU的性能增益是較大的,在三個度量指標下,TAU的表現都超越了其他方法:

2d8d0ed8-0df2-11ee-962d-dac502259ad0.jpg

TaxiBJ

在真實復雜環境的交通流量數據集上,TAU具有良好的表現:

2d9b603c-0df2-11ee-962d-dac502259ad0.png

不同數據的泛化

為了檢驗模型的泛化能力,我們先在KITTI原始數據上進行訓練,接著使用Caltech dataset進行評估,評估時輸入前十幀預測下一幀。

2daaf4f2-0df2-11ee-962d-dac502259ad0.png

靈活長度的預測

我們的模型可以通過模仿RNN,將預測的幀作為輸入并遞歸產生預測來處理靈活長度的預測。對于KTH數據集,人體運動預測任務的難點不僅在于預測幀的靈活長度,還在于涉及人類意識隨機性的復雜動力學,這增加了任務的困難程度。TAU可以從給定的10幀中預測接下來的20或40幀,也有出色的表現。

2dba6c16-0df2-11ee-962d-dac502259ad0.jpg

運行效率

此外,我們的模型不僅可以提高視頻生成質量,還可以提高計算效率和訓練速度。如下圖所示,收斂速度極快,50輪訓練即可達到MSE 35.0的水準。在相同實驗環境下,TAU模型在基準數據集上每個周期只需要2.5分鐘,而此前的SOTA方法需要7到30分鐘不等。

2dd42110-0df2-11ee-962d-dac502259ad0.jpg

總結

本文提出了一個通用的時空預測學習框架,使用基于靜態和動態結合的時間注意力模塊替代循環單元,還引入了差分散度正則化方法來解決僅考慮幀內誤差的MSE損失的問題,為高效的時空預測學習提供了新的范式。
責任編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107751
  • 數據
    +關注

    關注

    8

    文章

    7335

    瀏覽量

    94755
  • 框架
    +關注

    關注

    0

    文章

    404

    瀏覽量

    18421
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    開源深度學習框架對比研究的三主要維度學習

    本節對5開源深度學習框架進行對比研究,主要側重于3維度研究:硬件支持率、速度和準確率、社區活躍性。他們分別是:TensorFlow、Caffe、Keras、Torch、DL4j 。
    發表于 11-15 12:04 ?4802次閱讀
    開源深度<b class='flag-5'>學習</b><b class='flag-5'>框架</b>對比研究的三<b class='flag-5'>個</b>主要維度<b class='flag-5'>學習</b>

    深度學習發展的5主力框架

    在這篇文章中,我想向大家介紹推動深度學習發展的5主力框架。這些框架使數據科學家和工程師更容易為復雜問題構建深度學習解決方案,并執行更復雜的
    發表于 05-04 10:30 ?4421次閱讀
    深度<b class='flag-5'>學習</b>發展的5<b class='flag-5'>個</b>主力<b class='flag-5'>框架</b>

    PLASTER:與深度學習性能有關的框架

    PLASTER 是與深度學習有關的框架,為致力于開發和部署基于 AI 的服務的人士提供了全方位指導。本文介紹了每個框架元素的測量方式,以
    的頭像 發表于 06-22 15:07 ?4332次閱讀

    谷歌發布機器學習框架名叫NSL的神經結構學習框架

    神經結構學習框架(NSL)的作用很大,它可以制作計算機視覺模型、執行自然語言處理(NLP)、從醫療記錄或知識圖等圖形數據集中運行預測,還可以與 TensorFlow 機器學習平臺配合使
    的頭像 發表于 09-20 14:30 ?4045次閱讀

    跳出人類思維框架的人工智能抗生素預測平臺

    他們開發了跳出人類思維框架的人工智能抗生素預測平臺,這個平臺不需要知道藥物的作用機制,甚至不需要科學家標注化學基團,它能
    的頭像 發表于 03-10 11:51 ?2462次閱讀

    全新的深度學習框架——計圖

    清華大學計算機系胡事民教授研究團隊提出了全新的深度學習框架——計圖(Jittor)。Jittor是
    的頭像 發表于 03-26 15:50 ?7624次閱讀

    種用于交通流預測的深度學習框架

    交通流預測作為智能交通系統的關鍵問題,是國內外交通領域的硏究熱點。交通流預測的主要挑戰在于交通流數據本身具有復雜的時空關聯,且易受各種社
    發表于 04-14 15:54 ?3次下載
    <b class='flag-5'>一</b>種用于交通流<b class='flag-5'>預測</b>的深度<b class='flag-5'>學習</b><b class='flag-5'>框架</b>

    基于預測分析的時空眾包在線任務分配算法

    基于預測分析的時空眾包在線任務分配算法
    發表于 06-27 16:12 ?6次下載

    基于參數更新的遷移學習的統框架

    它提出基于參數更新的遷移學習的統框架,建立多種參數優化方法之間的聯系,從而方便理解不同方法背后的關鍵設計,進而設計出只更新更少參數同時
    的頭像 發表于 09-26 10:29 ?2163次閱讀

    時空圖神經網絡預測學習應用解析

    在第四節中,我們介紹了STGNN的基本神經架構,增強了對STGNN中時空學習泛化范式的理解。然而,近年來出現了許多前沿方法來改進時空依賴關系的學習。
    發表于 05-11 15:00 ?4728次閱讀
    <b class='flag-5'>時空</b>圖神經網絡<b class='flag-5'>預測學習</b>應用解析

    通用時空預測學習框架實現高效視頻預測案例

    TAU模型將時空注意力分解為兩部分:幀內靜態注意力和幀間動態注意力。幀內靜態注意力使用小核心深度卷積和擴張卷積來實現大感受野,從而捕捉幀內的長距離依賴關系。
    發表于 06-19 10:25 ?1375次閱讀
    <b class='flag-5'>通用</b>的<b class='flag-5'>時空</b><b class='flag-5'>預測學習</b><b class='flag-5'>框架</b>實現高效視頻<b class='flag-5'>預測</b>案例

    深度學習框架是什么?深度學習框架有哪些?

    深度學習框架是什么?深度學習框架有哪些?? 深度學習框架
    的頭像 發表于 08-17 16:03 ?4024次閱讀

    深度學習框架區分訓練還是推理嗎

    深度學習框架區分訓練還是推理嗎 深度學習框架非常重要的技術,它們能夠加速深度
    的頭像 發表于 08-17 16:03 ?2325次閱讀

    深度學習框架連接技術

    深度學習框架連接技術 深度學習框架能夠幫助機器學習
    的頭像 發表于 08-17 16:11 ?1484次閱讀

    深度學習框架和深度學習算法教程

    深度學習框架和深度學習算法教程 深度學習是機器學習領域中的
    的頭像 發表于 08-17 16:11 ?1961次閱讀