国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

美國公司構建新型機器學習模型,可從音頻中捕捉到重大安全事故的信息

如意 ? 來源:讀芯術微信公眾號 ? 作者:讀芯術微信公眾號 ? 2020-09-04 11:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在美國各大主要城市,市民一天24小時會切到數千個公共第一響應者無線電波,這些信息用于給500多萬用戶提供火災、搶劫和失蹤等突發事件的實時安全警報。每天人們收聽音頻的總時長會超過1000小時,這給需要開發新城市的公司帶來了挑戰。

因此,我們構建了一個機器學習模型,它可以從音頻中捕捉到重大安全事故的信息。

定制的軟件適用無線電(SDR)會捕捉大范圍內的無線電頻率(RF),將優化后的音頻片段發送到ML模型進行標記。標記后的片段會被發送至操作分析員,他們將在app中記錄事件,最后通知事故地點附近的用戶。

美國公司構建新型機器學習模型,可從音頻中捕捉到重大安全事故的信息

安全警報工作流程(圖自作者)

為適應問題領域,調整一個公共語音轉文本引擎

美國公司構建新型機器學習模型,可從音頻中捕捉到重大安全事故的信息

運用公共語音轉文本引擎的剪輯分類器 (圖自作者)

依據單詞錯誤率(WER),我們將從一個性能最好的語音轉文本引擎著手。很多警察使用的特殊代碼都不是白話,例如,紐約警察局官員會發送“信號13”來請求后備部隊。

我們使用語音上下文定制詞匯表。為適應領域,我們還擴充了一些詞匯,例如,“assault”并不通俗,但常見于領域中,模型應檢測出“assault”而不是“a salt”。

調整參數之后,我們能夠在一些城市獲得相對準確的轉錄。接下來,我們要使用音頻片段的轉錄數據,找出哪些與市民相關。

基于轉錄和音頻特征的二值分類器

我們建立了一個二進制分類問題的模型,其中轉錄作為輸入,置信水平作為輸出,XGBoost算法為數據集提供了最好的性能。

我們從一位前執法部門工作人員處了解到,在重大事件的無線電廣播之前,一些城市會發出特殊警報音以引起當地警方的注意。這個“額外”的特征使我們的模型更加可靠,尤其是在轉錄出錯的情況下。其他一些有用的特征是警察頻道和傳輸ID。

我們在操作流程中對ML模型進行了測試。運行了幾天后,我們注意到在事件中,那些只使用帶了模型標記的片段的分析員未出差錯。

我們在幾個城市推出了這種模式。現在一個分析師可以同時處理多個城市的音頻,這在以前是不可能的。隨著投入運營的閑置產能增多,我們得以開發新的城市。

超越公共語音轉文本引擎

這個模型并不是解決所有問題的靈丹妙藥,我們只能在少數幾個音質好的城市使用它。公共語音轉文本引擎是按照聲學剖面不同于收音機的音素模型訓練的,因此,轉錄的質量有時是不可靠的。對于那些非常嘈雜的老式模擬系統來說,轉錄是完全不可用的。

我們嘗試了多個來源的多個模型,但沒有一個是按照與數據集相似的聲學剖面訓練的,全都無法處理嘈雜的音頻。

我們試著用在保證管道其他部分不變的情況下由數據訓練出的語音轉文本引擎,替換原語音轉文本引擎。然而,為了音頻,我們需要幾百小時的轉錄數據,而生成這些數據耗時耗財。

我們還有個優化過程的選擇,就是只抄寫詞匯表中定義為“重要”的單詞,并為不相關的單詞添加空格,但這仍然只是在逐步減少工作量而已。最后,我們決定為問題領域建立一個定制的語音處理管道。

用于關鍵詞識別的卷積神經網絡

因為我們只關心關鍵字,所以并不需要知道單詞正確的順序,由此可簡化問題為關鍵字識別。這就簡單多了,我們決定使用在數據集上訓練的卷積神經網絡(CNN)。

在循環神經網絡(RNNs)或長短期記憶(LSTM)模型之上使用卷積神經網絡(CNN)意味著我們可以更快地訓練和重復。我們評估了Transformer模型,其大致相同,但需要大量硬件才能運行。

由于我們只在音頻段之間尋找短期的依賴關系來檢測單詞,計算簡單的CNN似乎優于Transformer模型,同時它能騰出硬件空間,從而可以通過超參數調整更加靈活。

美國公司構建新型機器學習模型,可從音頻中捕捉到重大安全事故的信息

用于識別關鍵字并運用了卷積神經網絡的剪輯標記模型(圖自作者)

音頻片段會被分成固定時長的子片段。如果詞匯表中的一個單詞出現了,該子片段會被加上一個正標簽。然后,如果在某個片段中發現任何這樣的子片段,該音頻片段會被標記為有用。

在訓練過程中,我們嘗試改變子片段的時長以判斷其如何影響融合性能。長的片段讓模型更難確定片段的哪個部分會有用,也讓模型更難調試。短片段意味著部分單詞會出現在多個剪輯中,這使得模型更難識別出它們。調整這個超參數并找到一個合理的時長是能做到的。

對于每個子片段,我們將音頻轉換成梅爾倒譜系數(MFCC),并添加一階和二階導數,特征以25ms的幀大小和10ms的步幅生成。然后,通過Tensorflow后端輸入到基于Keras序列模型的神經網絡中。

第一層是高斯噪聲,這使得模型耐得住不同無線信道之間的噪聲差異。我們嘗試了另一種方法,人為地將真實的噪音疊加到片段上,但這大大放緩了訓練,卻沒有顯著的性能提升。

然后,我們添加了Conv1D、BatchNormalization和MaxPooling1D三個后續層。批處理規范化有助于模型收斂,最大池化有助于使模型耐得住語音和信道噪聲的細微變化。另外,我們試著增加了脫落層,但這些脫落層并未有效改進模型。

最后,添加一個密集連接的神經網絡層,將其注入到一個有著sigmoid函數激活的單一輸出密集層。

生成標記數據

音頻剪輯的標記過程(圖自作者)

為了標記訓練數據,我們把問題領域的關鍵字列給了注釋者,并要求他們如果有詞匯表里的單詞出現,必須為片段標記好開始和結束位置和單詞標簽。

為了確保注釋的可靠性,我們在注釋器之間有10%的重疊,并計算了它們在重疊片段上的表現。一旦有了大約50小時的標記數據就會啟動訓練,我們會在重復訓練的過程中不斷收集數據。

由于詞匯表中的一些單詞比另一些單詞更為常見,模型針對于普通單詞來說表現正常,但是對于僅有較少示例的單詞卻遇到了困難。

我們試圖將單字發音覆蓋在其他片段中,借以人為制造示例。然而,性能的提升與這些單詞的實際標記量不相稱。最終,模型對于常用詞等會更加敏感,我們在未被標記的音頻片段上運行該模型,并消除掉那些含有已習得單詞的片段,這有助于減少未來標記時多余的詞語。

模型的發行

經過幾次重復的數據收集和超參數調整,我們已能訓練出一個對詞匯表里的詞語具有高查全率和精準捕捉能力的模型。高查全率對于捕捉關鍵的安全警報非常重要。標記的片段會在發送警報之前被收聽,因此誤報不是一個大問題。

我們在紐約市的一些區對這個模型進行了測試,該模型能夠將音頻音量降低50–75%(取決于頻道),它明顯超越了我們在公共語音轉文本引擎上訓練的模型,因為紐約由于模擬系統有非常嘈雜的音頻。

令人驚訝的是,盡管模型是根據紐約市的數據訓練的,但它也可以很好地切換到芝加哥的音頻。在收集了幾個小時的芝加哥片段之后,從紐約市模型中學到的東西轉移到芝加哥,該模型也表現良好。

語音處理管道與定制的深度神經網絡廣泛適用于來自美國主要城市的警察音頻。它從音頻中發現了重大的安全事故,使全國范圍的市民能夠迅速向城市廣播,履行保護社區安全的使命。

在RNN、LSTM或Transformer中選擇計算簡單的CNN架構,以及簡化標記過程,這些都是重大的突破,使我們能在限時限材的情況下超越公共語音轉文本模型。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 音頻
    +關注

    關注

    31

    文章

    3193

    瀏覽量

    85610
  • RF
    RF
    +關注

    關注

    66

    文章

    3201

    瀏覽量

    171845
  • 機器學習
    +關注

    關注

    66

    文章

    8554

    瀏覽量

    136996
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    靜電電流能用示波器電流探頭捕捉嗎?真相一文說清

    在電子測量實操,不少工程師會遇到這樣的疑問:日常用來檢測電流的示波器電流探頭,能不能捕捉到靜電電流?其實答案很明確——常規示波器電流探頭無法直接捕捉靜電電流,核心問題出在靜電電流的獨特特性,與常規
    的頭像 發表于 02-28 08:58 ?302次閱讀

    無線傾角傳感器在房屋監測的應用:捕捉事故前的沉默信號

    直川科技無線傾角傳感器精度達±0.005°,可連續捕捉房屋事故前的微小傾角變化。在江蘇昆山紫竹公寓項目中,成功識別無外觀異常的持續傾斜趨勢,實現早期干預。設備支持3–5年免維護運行,為房屋安全提供基于數據的趨勢預警能力。
    的頭像 發表于 01-21 10:56 ?650次閱讀
    無線傾角傳感器在房屋監測<b class='flag-5'>中</b>的應用:<b class='flag-5'>捕捉</b><b class='flag-5'>事故</b>前的沉默信號

    才茂通信輸電線路在線監測系統助力電網智慧運維

    隨著城市建設的快速推進,輸電線路通道環境日趨復雜,施工外破、地質災害、極端天氣、鳥類破壞等人為與自然因素,持續威脅著電網的安全穩定運行,輕則導致線路故障,重則引發短路、倒塔等重大安全事故。
    的頭像 發表于 01-07 15:46 ?311次閱讀

    華為亮相2025城市大安全AI產業發展峰會

    11月5日,由宜興市大數據發展有限公司與華為技術有限公司聯合主辦的一場聚焦人工智能與城市安全深度融合的行業盛會:“共聚AI泛生態 智啟產業新未來——城市大安全AI產業發展峰會暨華為中國
    的頭像 發表于 11-10 14:38 ?845次閱讀

    美國公司變為中國公司,中國最大傳感器企業的往事秘辛(創始人首次披露)

    ? 編輯按:本文作者為陳大同,作為業界知名人物,陳大同深度參與了我國半導體產業的多個重大事件,本文,陳大同講述了其風投往事,并首次披露了當前中國最大的傳感器公司——豪威集團,如何從一家美國企業變成
    的頭像 發表于 09-04 18:15 ?4169次閱讀

    什么是“電壓暫降”?CET電技術供配電異常信息捕捉及故障診斷分析裝置

    為解決這一難點,CET電技術研發的供配電異常信息捕捉及故障診斷分析裝置,具有2MHz/s高速瞬態捕捉和波形記錄功能,可捕捉0.5us±4k
    的頭像 發表于 08-28 14:49 ?869次閱讀
    什么是“電壓暫降”?CET<b class='flag-5'>中</b>電技術供配電異常<b class='flag-5'>信息</b><b class='flag-5'>捕捉</b>及故障診斷分析裝置

    超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最
    發表于 07-31 11:38

    FPGA在機器學習的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2908次閱讀

    NVIDIA RTX Blackwell GPU為專業級視頻剪輯提供加速

    42 攝像機正在消費級市場日益普及,它能夠捕捉到比大多數標準攝像機高一倍的顏色信息。與此同時,生成式 AI 視頻模型的功能與質量均在迅速提升,使全新工具和工作流成為可能。
    的頭像 發表于 07-04 15:00 ?1129次閱讀

    超聲波氣泡換能器:工業生產的“隱形衛士”

    在工業生產的復雜海洋,氣泡的出現常常是潛在危機的信號。無論是液體輸送、化學反應,還是食品加工,氣泡的生成和存在都可能引發一系列問題:管道堵塞、反應效率降低、產品質量下降,甚至設備損壞和安全事故。而
    發表于 06-27 09:08

    超聲波氣泡換能器:工業生產的“隱形衛士”

    在工業生產的復雜海洋,氣泡的出現常常是潛在危機的信號。無論是液體輸送、化學反應,還是食品加工,氣泡的生成和存在都可能引發一系列問題:管道堵塞、反應效率降低、產品質量下降,甚至設備損壞和安全事故。而
    的頭像 發表于 06-27 09:05 ?686次閱讀
    超聲波氣泡換能器:工業生產的“隱形衛士”

    邊緣計算機器學習:基于 Linux 系統的實時推理模型部署與工業集成!

    你好,旅行者!歡迎來到Medium的這一角落。在本文中,我們將把一個機器學習模型(神經網絡)部署到邊緣設備上,利用從ModbusTCP寄存器獲取的實時數據來預測一臺復古音頻放大器的當前
    的頭像 發表于 06-11 17:22 ?1010次閱讀
    邊緣計算<b class='flag-5'>中</b>的<b class='flag-5'>機器</b><b class='flag-5'>學習</b>:基于 Linux 系統的實時推理<b class='flag-5'>模型</b>部署與工業集成!

    國產地物光譜儀在“高光譜-機器學習模型構建中的表現

    和可推廣性。 近年來,國產地物光譜儀在性能、穩定性和數據一致性等方面取得了顯著進步,不僅打破了對進口設備的長期依賴,也逐步展現出在“高光譜-機器學習模型構建中的實力。 一、國產儀器的
    的頭像 發表于 04-18 16:15 ?752次閱讀
    國產地物光譜儀在“高光譜-<b class='flag-5'>機器</b><b class='flag-5'>學習</b>”<b class='flag-5'>模型</b><b class='flag-5'>構建</b>中的表現

    云酷人員定位歷史軌跡功能:事故追溯的關鍵利器與安全管理革命

    定位歷史軌跡功能作為數字化安全管理的核心技術,正在事故追溯展現出不可替代的價值。本文將深入探討這一功能如何重構事故調查邏輯,為企業安全管理
    的頭像 發表于 04-02 15:57 ?582次閱讀
    云酷人員定位歷史軌跡功能:<b class='flag-5'>事故</b>追溯<b class='flag-5'>中</b>的關鍵利器與<b class='flag-5'>安全</b>管理革命

    Raspberry Pi Pico 2 上實現:實時機器學習(ML)音頻噪音抑制功能

    Arm公司的首席軟件工程師SandeepMistry為我們展示了一種全新的巧妙方法:在RaspberryPiPico2上如何將音頻噪音抑制應用于麥克風輸入。機器學習(ML)技術徹底改變
    的頭像 發表于 03-25 09:46 ?1230次閱讀
    Raspberry Pi Pico 2 上實現:實時<b class='flag-5'>機器</b><b class='flag-5'>學習</b>(ML)<b class='flag-5'>音頻</b>噪音抑制功能