国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

語音UI的基本原則

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Paul Beckmann ? 2022-10-25 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Amazon Echo和Google Home中的語音用戶界面(語音UI)功能吸引了消費者的注意。語音識別系統的效率很大程度上取決于麥克風陣列和算法集合,這些算法允許陣列聚焦于用戶的語音并拒絕不需要的噪聲。下面解釋這些算法的基本功能。

觸發/喚醒詞

語音 UI 系統使用分配的觸發詞(如“Alexa”或“確定谷歌”)來激活語音 UI 設備。設備必須使用自己的算法立即進行識別,因為使用互聯網資源會產生太多的延遲。

觸發詞必須產生一個獨特的波形,該波形可以使算法與正常語音區分開來,否則成功識別的百分比可能低得令人無法接受。通常,使用三到五個音節的觸發詞是最好的。

小觸發詞算法占用較少的內存和處理,但犯更多的錯誤,而大的算法需要更多的資源,但犯的錯誤更少。模型也是可調的 - 它們可以更嚴格(更少的誤報,但更難觸發)或更寬松(更多的誤報,但更容易觸發)。大多數產品設計師選擇更嚴格的調整,因為客戶對錯誤觸發沒有同情心。

圖 1 比較了不同調諧點的三觸發模型的性能。在測試條件下,每小時實現少于兩個錯誤觸發器是一個合理的目標。小模型只能通過圖形最左側的兩個最嚴格的調諧來實現這一點。中型和大型型號在更寬的工作范圍內實現了這一目標。

pYYBAGNXm7eAXMiVAAFTjAUgeAU218.png

圖 1. 每小時使用小型、中型和大型算法模型測試誤報,左側調整更嚴格,右側調整更寬松。

到達目的地(到達方向)

一旦觸發詞被識別出來,下一步就是確定用戶語音的到達方向(DOA)。一旦確定了方向,DOA算法就會告訴波束成形算法它應該聚焦在哪個方向。

DOA算法的核心功能是檢查來自陣列中不同麥克風的信號的相位關系,并使用此信息來確定哪個麥克風首先接收聲音。但是,由于來自墻壁,地板,天花板和房間內其他物體的反射,用戶的聲音也將從其他方向傳來。為此,DOA算法包括優先邏輯,它將更響亮的初始到達與更安靜的反射分開。

DOA 算法的操作通過自動調整環境噪聲水平得到增強。該算法測量房間內的平均噪聲水平,并且僅當輸入信號至少比環境噪聲水平高出一定數量的分貝時,才會重新計算用戶嘴巴的位置。

回聲消除器

為了更好地關注用戶的聲音,語音 UI 設備必須從其麥克風拾取的聲音中減去自己的揚聲器產生的聲音。這似乎很簡單,就像將節目材料的相位反轉版本混合到來自麥克風的信號中一樣簡單。然而,該過程不足以處理揚聲器對波形的改變、數字信號處理(DSP)均衡、麥克風和聲學反射。

AEC算法中的第一步是將麥克風的輸出與原始(前DSP)輸入信號進行比較,并計算校正曲線,以從語音命令的波形中減去揚聲器的直接聲音。

第二步是減去聲學回聲。該算法必須在一定的誤差范圍內“尋找”與節目材料匹配的聲音(以補償由聲學引起的波形變化),以及對應于預期混響時間的已定義時間窗口內的聲音。由于每個麥克風接收的回聲集略有不同,并且來自揚聲器的直接聲音也不同,因此要實現最佳性能,需要對每個麥克風進行單獨的 AEC 處理。

AEC 查找反射的時間段稱為“回波尾部長度”。回聲尾部長度越長,可以消除的反射越多,算法的性能就越好。然而,較長的尾巴需要更多的內存和更多的處理。圖2顯示了回聲消除器在逐漸增加混響的房間中的表現。對更長的回聲尾部的需求是顯而易見的。

poYBAGNXm8KACjm8AAFJhHlrwKk343.png

圖 2. 回聲消除器在四個房間中表現,混響時間增加。較大的房間受益于使用長回聲尾部的算法。

波束成形

波束成形允許麥克風陣列聚焦于來自特定方向的聲音。它提高了信噪比(SNR),因為它有助于隔離用戶的聲音,同時抑制來自其他方向的聲音。

例如,如果用戶位于麥克風陣列的一側,而空調位于另一側,則來自空調的聲音首先到達用戶對面的麥克風,然后在幾分之一秒后到達離用戶最近的麥克風。波束成形算法使用這些時差來消除空調聲音,同時保留用戶的聲音。

具有兩個麥克風的陣列取消聲音的能力有限,但具有三個或更多麥克風的陣列可以消除來自更多方向的聲音。麥克風越少,性能就越會隨著視角(用戶的聲音與語音 UI 產品前軸之間的角度)的變化而變化。

雖然麥克風陣列系統使用定向拾音模式來濾除噪聲,但某些噪聲可以通過識別將噪聲與所需信號分離的特性,然后消除噪聲的算法進行衰減。降噪算法可以幫助觸發單詞識別,并在所有其他算法完成其工作后提高語音UI性能。

語音命令是瞬時事件。可以檢測到始終存在或重復的任何聲音,并將其從來自麥克風陣列的信號中刪除。示例包括汽車中的道路噪聲,以及家庭中的洗碗機和HVAC系統噪聲。高于或低于人聲頻譜的聲音也可以從信號中濾除。

手機中使用的常見降噪算法傾向于突出顯示對人類理解最關鍵的頻譜,而不是對電子系統隔離和理解語音命令最關鍵的頻譜。大多數此類算法實際上會降低語音 UI 性能。簡單地說,人類聽的東西與語音UI系統不同。

圖3顯示了在有和沒有降噪的情況下觸發字檢測的功效。降噪算法將整體語音識別提高了2 dB -考慮到用戶的聲音通常僅比周圍噪聲大幾dB,這是一個很大的差異。

pYYBAGNXm86AEU3SAAFj-NKmSMQ786.png

圖 3. 降噪算法對觸發字檢測的影響。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • dsp
    dsp
    +關注

    關注

    561

    文章

    8244

    瀏覽量

    366643
  • 觸發器
    +關注

    關注

    14

    文章

    2056

    瀏覽量

    63406
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    電氣接線規范詳解

    電氣接線是電力系統、工業設備及民用建筑中不可或缺的基礎環節,其規范性和安全性直接關系到設備運行穩定性和人身財產安全。以下從基本原則、常見類型、操作規范及安全注意事項四個方面,系統闡述電氣接線的核心
    的頭像 發表于 01-18 07:41 ?444次閱讀

    直供微電網設計中,設備選型的基本原則是什么?

    、運行模式靈活”的特性,需圍繞“安全優先、適配場景、經濟高效、可靠可控、綠色兼容”五大核心導向,建立科學的設備選型原則體系。以下將從五大核心原則出發,詳細拆解直供微電網設備選型的關鍵邏輯與實踐要求。
    的頭像 發表于 01-16 10:12 ?232次閱讀
    直供微電網設計中,設備選型的<b class='flag-5'>基本原則</b>是什么?

    基于i.MX RT106V跨界MCU的智能語音UI邊緣就緒解決方案

    基于i.MX RT106V跨界MCU的智能語音UI邊緣就緒解決方案 在當今智能化的時代,智能語音交互技術在工業和物聯網領域的應用越來越廣泛。NXP推出的基于i.MX RT106V跨界MCU的智能
    的頭像 發表于 12-24 17:15 ?649次閱讀

    RUI Builder 圖形化UI設計工具

    RUI Builder 圖形化UI設計工具 該軟件為圖形化UI設計軟件,搭配瑞佑圖形處理器,輕松設計UI界面!主要特色功能: 在PC上直接設計界面,再生成UI渲染源碼(.c),程序中
    發表于 12-12 20:14

    RESTful API設計原則: 構建易用、可擴展的API接口。

    一、理解REST架構的核心約束 1.1 RESTful API的六大基本原則 Roy Fielding博士在其博士論文中定義了REST架構的六大核心約束: 統一接口(Uniform
    的頭像 發表于 10-24 10:45 ?489次閱讀

    RESTful API設計原則: 構建易用、可擴展的API接口

    基本原則 Roy Fielding博士在其博士論文中定義了REST架構的六大核心約束: 統一接口(Uniform Interface):確保API使用標準化的交互
    的頭像 發表于 10-20 13:45 ?801次閱讀

    電氣設計線號標記規則

    在電氣工程設計中,線號標記是保證系統可維護性和安全性的基礎工作。一套科學、規范的線號標記規則不僅能提高施工效率,還能為后續的檢修、改造提供清晰指引。本文將系統介紹電氣設計中線號標記的基本原則、常用
    的頭像 發表于 08-23 23:12 ?4455次閱讀
    電氣設計線號標記規則

    零知開源——STM32F4實現ILI9486顯示屏UI界面系列教程(四):相冊預覽和大圖功能

    支持、動畫過渡等,并總結了開發注意事項和UI設計建議。該設計符合現代UI原則,在低端硬件上也能保持流暢交互。
    的頭像 發表于 06-27 12:01 ?896次閱讀
    零知開源——STM32F4實現ILI9486顯示屏<b class='flag-5'>UI</b>界面系列教程(四):相冊預覽和大圖功能

    請問如何通過OpenVINO?加速啟用穩定的擴散 Web UI

    無法運行具有OpenVINO?加速的穩定擴散 Web UI
    發表于 06-24 06:48

    UI開發概述

    基于ArkTS的聲明式開發范式的方舟開發框架是一套開發極簡、高性能、支持跨設備的UI開發框架,提供了構建應用UI所必需的能力,主要包括: ArkTS ArkTS是優選的主力應用開發語言,圍繞
    發表于 06-24 06:36

    使用 ai cude 里面自帶的案例訓練UI顯示異常的原因?怎么解決?

    案例的配置是默認的,顯示訓練ui更改顯示異常
    發表于 06-23 06:21

    高速PCB布局/布線的原則

    目錄:一、布線的一般原則1、PCB板知識2、5-5原則3、20H原則4、3W/4W/10W原則(W:Width)5、重疊電源與地線層規則6、1/4波長規則7、芯片引腳布線二、信號走線下
    的頭像 發表于 05-28 19:34 ?2328次閱讀
    高速PCB布局/布線的<b class='flag-5'>原則</b>

    知識點積累——什么是3W原則和20H原則

    在繪制高速板卡時,經常會聽到工程師們提到3W原則和20H原則,今天來和大伙簡單的聊一下這兩個原則! 3W原則3W原則概念:相鄰信號線的中心
    發表于 04-16 11:18

    RV1126 實現簡單的UI開發示例

    在RV1126上實現簡單的UI開發實例
    的頭像 發表于 04-09 16:08 ?1121次閱讀
    RV1126 實現簡單的<b class='flag-5'>UI</b>開發示例

    電子產品設計與調試

    1. ?電子設計的性質與任務 2. ?設計的要求 3. ?電子產品研制的一般過程 4. ?電子設計與電子產品研制的差異 5. ?電子設計報告 6. ?電子電路系統設計的基本原則和內容 7. ?電路設計的一般過程 8. ?元器件選擇 9. ?電路組裝與調試 等相關資料
    發表于 03-10 18:01 ?0次下載