加州大學伯克利分校的研究人員已經開發出一種能夠檢測“無聲語音”的AI模型。該模型基于數字語音預測單詞并生成合成語音。肌電圖(EMG)的電極位于臉部和喉嚨,用于檢測無聲語音。
研究人員斷言,該模型可以為無法發出可聽語音的人們啟用許多應用程序,并可以幫助AI工具和其他響應語音命令的設備進行語音檢測。
該小組指出,以數字方式為無聲語音發聲具有廣泛的應用。例如,它可以生成類似于藍牙耳機的工具,該工具可以使個人繼續通話,而不會打擾周圍的人。當環境聲音太大而無法捕獲可聽見的語音或必須保持安靜時,這種設備將非常有用。
口頭閱讀AI是可以從靜音語音中捕獲單詞的AI的另一個示例。它可以為監視設備供電,并支持聾人的用例。
研究人員使用了一種方法,其中將所需語句的音頻輸出目標從發聲錄音轉換為無聲錄音。然后,使用WaveNet解碼器生成音頻語音預測。
通過比較發聲的EMG數據和基線訓練的數據,發現發聲的EMG方法在從書中轉錄句子時,單詞錯誤率降低了64%至4%,而基線降低了95%。研究人員開源了約20小時的面部EMG數據集,以鼓勵對該領域進行進一步研究。
在其他工作中,中國的研究人員建立了諷刺檢測模型,該模型在多模式Twitter數據集上提供SOTA性能。Masakhane開放源代碼非洲語言翻譯項目的成員已發布了 有關低資源機器翻譯的 案例研究。
責任編輯:lq
-
解碼器
+關注
關注
9文章
1219瀏覽量
43446 -
藍牙耳機
+關注
關注
21文章
5695瀏覽量
65997 -
AI
+關注
關注
91文章
39866瀏覽量
301509
發布評論請先 登錄
AI功能(SC171開發套件V3)2026版
研究人員復興針孔相機技術以推動下一代紅外成像發展
【內測活動同步開啟】這么小?這么強?新一代大模型MCP開發板來啦!
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創新方法與架構
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽
任正非說 AI已經確定是第四次工業革命 那么如何從容地加入進來呢?
無刷直流電機雙閉環串級控制系統仿真研究
最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)
Nordic收購 Neuton.AI 關于產品技術的分析
芯知識|語音芯片“無聲之謎”:當DACL波形正常,功放開啟卻無聲音時……
研究人員已經開發出一種能夠檢測“無聲語音”的AI模型
評論