久久久婷婷五月亚洲97色,天天射天天透天天干,302黄大片一区二区三区

摘要：”當研究問題或數據集包括多個這樣的模態時，其特征在于多模態。

【導讀】人工智能領域最頂級國際期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEETPAMI,影響因子為 9.455)，2019年1月最新一期發表了關于多模態機器學習綜述論文。我們周圍的世界涉及多種形式 - 我們看到物體，聽到聲音，感覺質地，聞到異味等等。一般而言，模態指的是事物發生或經歷的方式。大多數人將形態與感覺方式聯系起來，這些感覺方式代表了我們主要的交流和感覺渠道，例如視覺或觸覺。

因此，當研究問題或數據集包括多個這樣的模態時，其特征在于多模態。本文主要關注但不僅僅關注三種形式：自然語言既可以是書面的，也可以是口頭的; 視覺信號，通常用圖像或視頻表示; 和聲音信號，編碼聲音和口頭信息，如韻律和聲音表達。

我們對世界的體驗是多模式的 - 我們看到物體，聽到聲音，感覺質地，聞到異味和味道。情態是指某種事物發生或經歷的方式，并且當研究問題包括多種這樣的形式時，研究問題被描述為多模式。為了使人工智能在理解我們周圍的世界方面取得進展，它需要能夠將這種多模態信號一起解釋。多模式機器學習旨在構建可以處理和關聯來自多種模態的信息的模型。這是一個充滿活力的多學科領域，具有越來越重要的意義和非凡的潛力。本文不是關注特定的多模態應用，而是研究多模態機器學習本身的最新進展。我們超越了典型的早期和晚期融合分類，并確定了多模式機器學習所面臨的更廣泛的挑戰，即：表示，翻譯，對齊，融合和共同學習。這種新的分類法將使研究人員能夠更好地了解該領域的狀況，并確定未來研究的方向。

論文地址：

http://www.zhuanzhi.ai/paper/2236c08ef0cd1bc87cae0f14cfbb9915

https://ieeexplore.ieee.org/document/8269806