国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

智能語音對抗攻擊面臨的四大挑戰

中科院半導體所 ? 來源:YXQ ? 2019-07-28 10:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能技術的快速發展,語音成為一種新型的人機交流方式,如我們手機上的語音助手Apple Siri、Google Assistant和Microsoft Cortana等,智能音箱Google Home、Amazon Echo、阿里巴巴的天貓精靈和小米的小愛同學等等。它們方便了人類與機器交互的同時,不僅連接了Twitter、Facebook這樣的社交網絡,也將汽車、智能門鎖和智能電視等物聯網設備連接起來。

由此可見,語音交互越來越多地關系著人們的生命和財產安全,因此,智能語音的安全性也成為工業界和學術界的研究重點。

圖1 智能語音的應用

傳統攻擊通過安裝惡意應用和傳播病毒等途徑入侵到系統中,但是如何實現智能化的攻擊方式還未知。既然聲音成為人機交互的新型方式,那么利用聲音欺騙人工智能系統成為一種攻擊方法,同時能夠突破傳統方式需要接觸設備的局限性。為了在人耳無法覺察的情況下讓智能語音設備識別出里面的指令,加州伯克利分校和浙江大學的研究學者分別將語音信息嵌入到了噪聲和超聲波之中,從而控制智能語音助手和音箱[1][2]

結合日常生活中大家喜歡聽音樂的習慣,中國科學院信息工程研究所陳愷研究員和波士頓大學Shengzhi Zhang教授等人實現了利用音樂為載體攻擊語音識別系統的研究[3],這種特殊修改過的音樂被稱為是“惡魔音樂”。試想,如果我們在開車或者家中聽的廣播是攻擊者精心制作的“惡魔音樂”,人耳聽起來并不能覺察出什么異常,但是智能語音系統卻能識別出其中“開門”的控制命令,那么將對我們的安全構成難以控制的威脅。

圖2 “惡魔音樂”在人們享受音樂的時候與智能語音系統對話

對抗攻擊:類似于生活中人類感觀誤識別的問題,智能系統也有一定的誤判。因此,研究者想到通過對一個正常樣本做微小的修改,然后在人們感觀覺察不出來有什么差異的情況下對智能系統造成對抗攻擊,這種欺騙人工智能系統的特殊樣本被稱為是“對抗樣本”。從2013年開始大家特別關注對抗攻擊,利用梯度下降算法自動化地在原始樣本上加微小擾動形成對抗樣本,在人類無法覺察的同時讓機器識別錯誤,從而造成逃逸攻擊。

圖3 對抗樣本攻擊

針對智能語音的對抗攻擊:如果把語音識別系統看成一個API接口音頻以wav格式為代表,那么音頻wav有兩種途徑傳輸給語音識別系統API(1)直接輸入(2)播放音樂并通過實際應用環境中的物理設備采集之后再輸入給API。因此,對抗樣本攻擊分別可以視為“Wav-to-API(WTA)攻擊”和“Wav-air-API(WAA)攻擊”。

圖4 “惡魔音樂”直接上傳給語音識別API的WTA攻擊

圖5 “惡魔音樂”在實際環境中播放再由智能設備采集識別的

WAA攻擊

智能語音對抗攻擊存在下面四個挑戰:

自動化:需要找到合適的目標函數,利用梯度下降方法在原始樣本上添加擾動逼近目標函數,使最終生成的對抗樣本可以被識別為特殊的文本結果。

物理攻擊:實際應用中播放、錄音設備以及周圍環境噪聲會對樣本的特征造成干擾,難以實現物理攻擊。

隱蔽性:在保證成功率的前提下盡可能小地修改原始樣本,逃過人耳的覺察。

遷移性:在一個平臺上攻擊成功的對抗樣本同樣可能攻擊其他平臺,但是由于平臺之間的差異性,樣本的遷移性通常比較低。

語音識別原理

傳統語音識別包括特征提取、聲學模型和語言模型三個模塊。其中特征提取是對時域信號分幀并計算每幀的頻域特征,通過一系列的變換最終得到模擬人耳的聽覺特征。聲學模型描述的是特征的統計特性和實際發聲的音素對應關系,音素是組成單詞的最小單元,這一模型由神經網絡訓練得到。由于語言有一定的語法、詞法規則,人們訓練出語言模型表示音素、字、詞、句之間的關聯關系,語言模型由加權有限狀態轉換器表示。具體來看這個語音識別過程:首先提取音頻的特征向量,然后計算觀察狀態的統計特性,對應出這些狀態代表音素的可能性概率值,進而計算音素上下文關聯的狀態轉換關系,最后計算出特征向量對應音素序列概率最大的路徑,這個路徑對應的句子就是識別(解碼)結果。

圖6 語音識別原理

音頻直接上傳給系統的WTA攻擊

語音識別不同于圖像識別的是:聲學模型需要結合后面的語言模型共同決定識別結果,而且由于發音的延續性,語音識別受一定的上下文關系影響。由于語言模型結構復雜,攻擊者可以首先逆向分析出什么樣的聲學模型輸出結果(神經網絡的計算結果)一定會被解碼成目標文本,然后以這樣的輸出結果作為目標函數修改原始音頻,直到生成的對抗樣本達到或者非常接近這個目標,那么這個對抗樣本就能夠被識別為想要的文本。確定目標函數后,進一步用梯度下降算法修改x(t)逼近這個目標函數,從而生成修改幅度較小的對抗樣本x‘(t)=x(t)+δ(t),即直接將音頻上傳給語音識別系統API的WTA攻擊已經成功。

圖7 WTA攻擊原理圖

物理世界的WAA攻擊

考慮到實際生活應用中,音樂通常是被播放出來再被語音識別系統錄音接收的,這里播放和錄音設備的電子噪聲以及環境的背景噪聲均會對嵌入音頻的特征進行破壞,直接的辦法是在對抗樣本生成過程中引入“噪聲模型”模擬這種影響。即在對抗樣本生成過程中加入模擬的噪聲,保證這樣之后仍然能夠被系統識別為目標指令,那么嵌入到音樂中的音頻特征就足夠強到可以抵抗實際噪聲的破壞。但是由于對實際應用中噪聲建模需要大量工作,可以采用“隨機噪聲”代替,從而很大程度上簡化噪聲模型的構建過程,同時由于隨機噪聲不拘泥于模擬特殊的設備和環境影響,這種方式生成的對抗樣本具有更強的適應能力,可以很好地實現多種設備及多種環境下的物理攻擊。

圖8 WAA攻擊原理圖

智能語音安全問題越來越多地受人們重視,本文介紹了一種針對傳統語音識別的對抗攻擊方法。通過逆向分析語音識別算法,挖掘深度神經網絡的脆弱性,然后采用梯度下降算法自動化地修改音樂生成對抗樣本,即生成“惡魔音樂”在人們無法覺察的情況下攻擊語音識別系統。進一步通過引入噪聲模型模擬實際應用場景中設備和環境噪聲的影響,提升對抗樣本的魯棒性,從而能夠在實際應用中攻擊商業化平臺(如科大訊飛的訊飛輸入法),而且這種攻擊通過網絡或者無線信號傳播之后攻擊仍然有效。

對抗樣本是人工智能安全應用的一個重要威脅,挖掘深度學習算法的脆弱性,研究深度學習的對抗攻防技術對于人工智能落地具有重要意義。目前來看,提高對抗樣本的隱蔽性、遷移性和物理攻擊成功率還有很遠的路要走。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    39

    文章

    1812

    瀏覽量

    116058
  • 智能語音
    +關注

    關注

    11

    文章

    826

    瀏覽量

    50272

原文標題:CommanderSong:“惡魔音樂”攻擊智能語音識別系統

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導體所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    破冰傳統交互:唯創電子四大語音芯片方案,重塑電動車儀表智能體驗

    ,藍牙音樂無縫流轉。這些體驗的背后,是廣州唯創電子針對電動車儀表市場推出的四大差異化語音芯片方案。它們如同位各有所長的“智能聲卡”,將電動車從沉默的代步工具,轉
    的頭像 發表于 12-23 09:07 ?512次閱讀
    破冰傳統交互:唯創電子<b class='flag-5'>四大</b><b class='flag-5'>語音</b>芯片方案,重塑電動車儀表<b class='flag-5'>智能</b>體驗

    后摩智能六篇論文入選四大國際頂會

    2025年以來,后摩智能在多項前沿研究領域取得突破性進展,近期在NeurIPS、ICCV、AAAI、ACMMM四大國際頂會上有 6 篇論文入選。致力于大模型的推理優化、微調、部署等關鍵技術難題,為大模型的性能優化與跨場景應用提供了系統化解決方案。
    的頭像 發表于 11-24 16:42 ?1244次閱讀
    后摩<b class='flag-5'>智能</b>六篇論文入選<b class='flag-5'>四大</b>國際頂會

    廣州唯創WT2606A-4G語音芯片:重新定義智能血壓計開發模式

    。然而,對于大多數醫療設備廠商而言,開發集成4G通信、語音識別和云服務功能的智能血壓計面臨諸多技術挑戰:復雜的網絡協議棧開發、語音算法優化、
    的頭像 發表于 11-18 09:21 ?657次閱讀
    廣州唯創WT2606A-4G<b class='flag-5'>語音</b>芯片:重新定義<b class='flag-5'>智能</b>血壓計開發模式

    和而泰發布四大自研核心技術平臺

    智能家電到工業機器人,從新能源汽車到低空經濟,和而泰的四大技術平臺正在重新定義智能設備的"生命系統"。
    的頭像 發表于 10-13 16:08 ?1202次閱讀

    廣州唯創電子WTN6系列語音芯片:維控制模式重塑智能設備交互體驗

    智能化設備普及的今天,靈活高效的控制方式成為產品差異化競爭的關鍵。廣州唯創電子WTN6系列語音芯片以其獨特的種控制模式,為智能設備提供了前所未有的設計靈活性。隨著物聯網技術的快速發
    的頭像 發表于 10-09 08:45 ?441次閱讀
    廣州唯創電子WTN6系列<b class='flag-5'>語音</b>芯片:<b class='flag-5'>四</b>維控制模式重塑<b class='flag-5'>智能</b>設備交互體驗

    匯川技術四大架構重磅發布

    2025 匯川技術爆品發布會上,FA、運控、傳動、機器人四大 IPMT 主任攜覆蓋 “設計 - 制造 - 傳動 - 執行” 的全棧架構登場,為中國制造業智能化轉型破局。這不是簡單產品升級,而是重構智能制造底層邏輯的革命。
    的頭像 發表于 09-02 15:54 ?4723次閱讀
    匯川技術<b class='flag-5'>四大</b>架構重磅發布

    FOPLP工藝面臨挑戰

    FOPLP 技術目前仍面臨諸多挑戰,包括:芯片偏移、面板翹曲、RDL工藝能力、配套設備和材料、市場應用等方面。
    的頭像 發表于 07-21 10:19 ?1547次閱讀
    FOPLP工藝<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰</b>

    四大核心要素驅動汽車智能化創新與相關芯片競爭格局

    智能汽車時代的加速到來,使車載智能系統面臨前所未有的算力需求。隨著越來越多車型引入電子電氣架構轉向中心化、智能駕駛的多傳感器融合、智能座艙的
    的頭像 發表于 07-02 08:32 ?1351次閱讀
    <b class='flag-5'>四大</b>核心要素驅動汽車<b class='flag-5'>智能</b>化創新與相關芯片競爭格局

    四大核心要素驅動汽車智能化創新與相關芯片競爭格局

    當下,功能安全、高效高靈活性的算力、產品生命周期,以及軟件生態兼容性這“四大核心要素”,已成為衡量智能汽車AI芯片創新力和市場競爭力的核心標準。
    的頭像 發表于 07-01 14:49 ?685次閱讀

    Cohesity與Nutanix提供由AI驅動的數據安全和管理

    在日益復雜的環境中,企業面臨整合、保護和確保數據安全的重大挑戰。 傳統解決方案導致數據分布在各個孤島和位置。這為網絡犯罪分子創建了更大的攻擊面。 近年來,勒索軟件攻擊的風險日益增加,其
    的頭像 發表于 06-24 16:46 ?403次閱讀

    大模型時代的新燃料:大規模擬真多風格語音合成數據集

    大模型充分學習到語音的發音規律、語義特征、語境等信息,從而提升語音識別、語音合成等關鍵能力,提供更加準確、自然、智能語音交互體驗。
    的頭像 發表于 04-30 16:17 ?684次閱讀

    智能血壓計WT2801芯片方案-BLE 5.0無線傳輸/高保真語音交互/LED顯示驅動/低功耗待機-四大技術賦能

    WT2801的硬核實力——BLE5.0無線傳輸、高保真語音交互、LED顯示驅動、低功耗待機,四大技術賦能,為血壓計注入“智慧靈魂”!產品框架對比WAYTRONIC技術解
    的頭像 發表于 04-08 17:35 ?1136次閱讀
    <b class='flag-5'>智能</b>血壓計WT2801芯片方案-BLE 5.0無線傳輸/高保真<b class='flag-5'>語音</b>交互/LED顯示驅動/低功耗待機-<b class='flag-5'>四大</b>技術賦能

    向新而行,智啟未來 ——村田中國將攜四大領域創新產品亮相2025慕尼黑上海電子展

    元器件如何成為數智社會進化的強大“引擎”。? ? 【參展亮點前瞻】? ? 聚焦“通信及計算、車載、工業及環境、健康”四大核心領域 ? 通信及計算 : 隨著人工智能技術的快速發展,通信與計算領域正經
    發表于 04-07 13:37 ?398次閱讀
    向新而行,智啟未來 ——村田中國將攜<b class='flag-5'>四大</b>領域創新產品亮相2025慕尼黑上海電子展

    智慧路燈的推廣面臨哪些挑戰

    引言 在智慧城市建設的宏偉藍圖中,叁仟智慧路燈的推廣面臨哪些挑戰?叁仟智慧路燈作為重要的基礎設施,承載著提升城市照明智能化水平、實現多功能集成服務的使命。然而,盡管叁仟智慧路燈前景廣闊,在推廣過程中
    的頭像 發表于 03-27 17:02 ?711次閱讀

    WT3000T8-32N語音合成TTS芯片:小體積、強性能,重塑智能語音交互體驗

    領域帶來顛覆性創新。這款芯片不僅是傳統語音模塊的升級替代者,更是開啟下一代智能設備語音交互的鑰匙。一、四大核心優勢,定義行業新標桿1.軍工級性能:32位處理器賦能
    的頭像 發表于 03-21 09:20 ?1042次閱讀
    WT3000T8-32N<b class='flag-5'>語音</b>合成TTS芯片:小體積、強性能,重塑<b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互體驗