国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

設計非對稱式互信息估計器減少音頻向視頻模態表達的不確定性

牽手一起夢 ? 來源:中科院自動化 ? 作者:佚名 ? 2020-05-09 14:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著近年來音視頻生成技術的不斷發展,“虛擬主播”逐漸走入人們視野,并以其在虛擬客服、遠程會議、電影剪輯等現實應用場景中的重要作用而獲得了社會各界的廣泛關注。該技術旨在對輸入的音頻預測相應口型,從而生成指定或任意人物的自然而準確的面部說話視頻。近日,中科院自動化所智能感知與計算研究中心為此提出了一種新穎的音視頻協同計算方法,并重點解決了此前難以達成的任意人物協同生成問題。

該方法一方面實現了利用語音驅動任意對象的高清視頻生成,另一方面在正臉、側臉等多種場景下均顯著提升了生成視頻質量。目前,該成果已被IJCAI 2020大會接收。

由于音視頻模態之間差異性等問題,這項技術目前仍然存在著眾多挑戰。以往的研究方法往往將重點放在了模態內之間,如只關注了視頻幀之間的損失約束,卻忽略了音視頻模態間最重要的問題之一:如何將音頻信息高效充分地表達入視頻模態?同時由于人物與人物之間的個體差異,將同一模型應用于任意人物視頻生成也存在較大的挑戰。

為解決上述問題,團隊精心設計了一個非對稱式互信息估計器(Asymmetric Mutual Information Estimator, AMIE),以構建音視頻模態間的約束。如圖1示,輸入一對音頻與人臉圖像數據,互信息估計器輸出預測的互信息值。在這里,該方法使用Jensen-Shannon表示形式來改善互信息計算方式,使其更好地應用于神經網絡。通過這樣的互信息估計方式,該方法最大化音頻與視頻模態之間的互信息,減少音頻向視頻模態表達的不確定性,并以此獲得音頻和視頻信息之間的跨模態一致性,使得生成視頻中人物的口型更加準確自然。

設計非對稱式互信息估計器減少音頻向視頻模態表達的不確定性

該方法在LRW和GRID基礎數據集上進行了實驗驗證。圖2中的結果表明該方法生成的口型準確度高,且能夠有效適應不同膚色與嘴唇形狀差異。表1的量化結果顯示該方法在常用的對比指標上的優越性能。

該方法有能力對不存在于數據集中的任意人物進行視頻合成,并能夠有效處理如姿態表情、性別差異等變化因素(見圖3)。例如,輸入一段女性語音(圖中第二行),該方法分別生成了現實場景的同性別人臉視頻(圖中第一行),和跨性別人臉視頻(圖中第三行)。

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 音頻
    +關注

    關注

    31

    文章

    3188

    瀏覽量

    85582
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107799
  • 視頻
    +關注

    關注

    6

    文章

    2005

    瀏覽量

    74964
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    功率放大器在膠滴氣泡質量與一致性分析研究中的應用

    膠粘劑微量分配技術是大規模集成電路封裝的關鍵工藝,但傳統方法受多源不確定性因素制約性能提升。撞針壓電噴射技術雖具高頻高精度優勢,卻因膠粘劑流變特性時變不確定性導致分配機理復雜。現有研究缺乏
    的頭像 發表于 03-06 11:18 ?39次閱讀
    功率放大器在膠滴氣泡質量與一致性分析研究中的應用

    戴爾PowerScale文件存儲系統專為數據生命周期靈活性而設計

    2026年,幾乎所有企業的IT架構都在經歷一個繞不開的現實:成本不確定性正在快速上升。
    的頭像 發表于 02-05 15:04 ?385次閱讀

    盤點國內半導體行業中那些在2025年被終止的并購

    終止潮背后:IPO重啟、估值體系錯位、不確定性的三重博弈
    的頭像 發表于 01-07 11:00 ?1142次閱讀

    DP83826:確定性、低延遲、低功耗工業以太網PHY的卓越之選

    DP83826:確定性、低延遲、低功耗工業以太網PHY的卓越之選 在工業以太網領域,對于高性能、高可靠性物理層收發的需求日益增長。DP83826作為一款符合IEEE 802.3 10BASE
    的頭像 發表于 12-17 16:15 ?333次閱讀

    DP83826Ax工業以太網PHY:確定性、低延遲與低功耗的完美融合

    DP83826Ax工業以太網PHY:確定性、低延遲與低功耗的完美融合 在工業以太網領域,對于高性能、高可靠性物理層收發的需求與日俱增。DP83826Ax作為一款單端口10/100Mbps以太網
    的頭像 發表于 12-15 15:20 ?429次閱讀

    DP83826Ax:確定性、低延遲工業以太網PHY的深度解析

    DP83826Ax:確定性、低延遲工業以太網PHY的深度解析 在工業以太網領域,對于物理層收發的性能要求愈發嚴苛,尤其是在實時性、低延遲和低功耗等方面。DP83826Ax作為一款符合
    的頭像 發表于 12-15 15:20 ?411次閱讀

    渦輪部件多源不確定性機理與分類體系研究:從幾何變異到認知局限的系統解析

    渦輪部件作為航空發動機和燃氣輪機的核心組成部分,其性能直接決定了整個動力系統的效率、可靠性與壽命。在實際運行環境中,渦輪部件的氣動與換熱性能往往與設計預期存在顯著差異,這種差異主要源于全壽命周期中存在的多源不確定性因素。
    的頭像 發表于 11-12 14:29 ?640次閱讀
    渦輪部件多源<b class='flag-5'>不確定性</b>機理與分類體系研究:從幾何變異到認知局限的系統解析

    4種神經網絡不確定性估計方法對比與代碼實現

    患者血壓,假設輸出是120/80這樣的正常值,表面看沒問題。但如果模型其實對這個預測很不確定呢?這時候光看數值就不夠了。神經網絡有幾種方法可以在給出預測的同時估計
    的頭像 發表于 11-10 10:41 ?493次閱讀
    4種神經網絡<b class='flag-5'>不確定性</b><b class='flag-5'>估計</b>方法對比與代碼實現

    尋跡智行AMR融合RFID識別技術,為柔性搬運注入“確定性&quot;

    在智能物流與制造業不斷追求高效與柔性的今天,自主移動機器人(AMR)已成為革新場內物流的核心力量。其“柔性”特質——靈活部署、智能調度、自主避障——完美應對了現代生產中的不確定性
    的頭像 發表于 10-27 14:34 ?321次閱讀
    尋跡智行AMR融合RFID識別技術,為柔性搬運注入“<b class='flag-5'>確定性</b>&quot;

    自動駕駛端到端大模型為什么會有不確定性

    。為了能讓自動駕駛汽車做出正確、安全且符合邏輯的行駛動作,端到端大模型被提了出來。 端到端大模型把從傳感輸入到控制輸出的任務盡可能用一個大網絡來完成,其優點是能夠直接學習復雜映射,省去繁瑣的中間模塊,但代價是系統的
    的頭像 發表于 09-28 09:20 ?876次閱讀
    自動駕駛端到端大模型為什么會有<b class='flag-5'>不確定性</b>?

    非對稱密鑰生成和轉換規格詳解

    生成 以字符串參數生成RSA密鑰,具體的“字符串參數”由“RSA密鑰類型”和“素數個數”使用符號“|”拼接而成,用于在創建非對稱密鑰生成器時,指定密鑰規格。 說明:生成RSA非對稱密鑰時,默認素數為2
    發表于 09-01 07:50

    虹科干貨 | 拆解TSN四大支柱:從「盡力而為」到工業實踐的確定性網絡

    ,基于CSMA/CD機制的傳統以太網暴露出致命缺陷——不確定性的延遲和抖動。正是在這樣的背景下,時間敏感網絡(TSN)應運而生。*不想逐字讀長文?點擊收聽本文播客TSN并非全
    的頭像 發表于 08-27 17:33 ?1888次閱讀
    虹科干貨 | 拆解TSN四大支柱:從「盡力而為」到工業實踐的<b class='flag-5'>確定性</b>網絡

    康謀分享 | 基于多傳感數據的自動駕駛仿真確定性驗證

    自動駕駛仿真測試中,游戲引擎的底層架構可能會帶來非確定性的問題,侵蝕測試可信度。如何通過專業仿真平臺,在多傳感配置與極端天氣場景中實現測試數據零差異?確定性驗證方案已成為自動駕駛研發的關鍵突破口!
    的頭像 發表于 07-02 13:17 ?4254次閱讀
    康謀分享 | 基于多傳感<b class='flag-5'>器</b>數據的自動駕駛仿真<b class='flag-5'>確定性</b>驗證

    應用分享 | 精準生成和時序控制!AWG在確定性三量子比特糾纏光子源中的應用

    丹麥哥本哈根大學最新研究利用任意波形發生(AWG),成功構建保真度56%的確定性三量子比特GHZ態!AWG憑借精準的信號生成和時序控制能力,充分展現了其在量子態操控中的強大能力。
    的頭像 發表于 06-06 14:06 ?1244次閱讀
    應用分享 | 精準生成和時序控制!AWG在<b class='flag-5'>確定性</b>三量子比特糾纏光子源中的應用

    從科幻到現實:智能家居如何重塑我們的生活方式?

    隨著城市化和經濟不確定性加劇,智能家居市場快速增長,預計未來幾年將改變。
    的頭像 發表于 05-28 09:36 ?589次閱讀
    從科幻到現實:智能家居如何重塑我們的生活方式?