由于硬件和軟件的進(jìn)化突破,語音用戶界面或各種尺寸和價格點(diǎn)的支持 VUI 的產(chǎn)品現(xiàn)在都可以推向市場。與直到今天定義語音控制體驗(yàn)的“對著麥克風(fēng)說話并等待”模型不同,新系統(tǒng)現(xiàn)在可以以最終用戶謹(jǐn)慎甚至不可見的方式嵌入到產(chǎn)品中,并具有即時響應(yīng)時間,而不是“ t 體驗(yàn)云延遲。
在評估智能揚(yáng)聲器和云的語音控制替代方案時,產(chǎn)品開發(fā)人員面臨著新的機(jī)遇和挑戰(zhàn)。開發(fā)人員必須考慮尺寸和位置,因?yàn)楦叨任⑿突脑O(shè)備被嵌入到家具和電器中。將語音應(yīng)用程序與邊緣機(jī)器學(xué)習(xí)相結(jié)合對于讓產(chǎn)品隨著時間的推移變得更加智能是必要的。同時,設(shè)備也越來越依賴電池供電,需要開發(fā)人員進(jìn)行工程設(shè)計(jì)以實(shí)現(xiàn)最佳能源管理。最后,開發(fā)人員必須考慮用戶對功能的期望。對于消費(fèi)者來說,精心設(shè)計(jì)的語音控制感覺無處不在,能夠聽到角落和穿墻的聲音。所有這些以及更多內(nèi)容匯集了在構(gòu)建支持 VUI 的產(chǎn)品時必須考慮的幾個設(shè)計(jì)元素。
語音控制 2.0 更自由的方面之一是可以自由地說出語音命令,而無需附近的智能揚(yáng)聲器。集成在智能家居設(shè)備中的語音可以使整個家庭成為一個可聽區(qū)域,在識別喚醒詞或其他可定義的聲音時隨時可用。專門的硬件和軟件用于產(chǎn)生準(zhǔn)確的遠(yuǎn)場音頻捕獲。
設(shè)計(jì)技巧
為了在遠(yuǎn)場環(huán)境中有效地捕捉聲音,一些設(shè)計(jì)技術(shù)開始發(fā)揮作用,包括:端口方向:聲學(xué)端口是可以在沒有物理障礙的情況下接受音頻信號的地方。端口的位置(頂部或底部)由單個設(shè)備的外形尺寸決定。為了簡化設(shè)計(jì),聲學(xué)端口通常位于麥克風(fēng)附近,如下所示。但是,端口孔應(yīng)與揚(yáng)聲器和其他聲學(xué)噪聲源(例如電機(jī)和放大器)足夠遠(yuǎn),以最大限度地減少麥克風(fēng)輸入處的不需要的信號。


圖 1. 頂部和底部加載聲學(xué)端口配置的橫截面(來源:Knowles)
麥克風(fēng)陣列和波束成形:使用多個麥克風(fēng)稱為“陣列”。在任何給定時刻,麥克風(fēng)陣列都會同時聽到來自各個方向的聲音。除了口頭命令外,他們還會聽到家中的其他聲音和動作。通過一種稱為波束成形的技術(shù),可以對麥克風(fēng)陣列進(jìn)行編程,以選擇性地捕獲來自一個方向的聲音,同時拒絕來自其他方向的聲音。波束成形算法的最終結(jié)果是選擇性地調(diào)諧出來自所需方向的信號以外的信號。波束成形是數(shù)字信號處理鏈中的第一步。
數(shù)字信號處理 (DSP) 算法:DSP 是任何語音控制系統(tǒng)的基石。這就是想要的音頻信息的意義——捕捉它、聚焦它、凈化它、放大它——這樣音素就可以發(fā)出文字、命令和噪音,而不會破壞這個過程。DSP 幾乎用于語音交互的所有階段,從音頻捕獲和語音增強(qiáng)到語音處理。


圖 2. 遠(yuǎn)場語音拾取(來源:Jerry Lu)
以便利為設(shè)計(jì)理念
除了針對功能進(jìn)行設(shè)計(jì)之外,支持 VUI 的設(shè)備還需要針對便利性和可用性進(jìn)行設(shè)計(jì)。喚醒詞的兩個主要設(shè)計(jì)考慮圍繞能源管理和處理能力。由于 VUI 必須始終處于“偵聽”模式以等待喚醒詞,因此電池供電的 VUI 和 VCD 必須設(shè)計(jì)用于極低的能量消耗以及立即喚醒。此外,設(shè)備在過濾掉不需要的聲音的同時區(qū)分想要的語音命令的能力需要不可忽視的處理能力,這需要準(zhǔn)確性和即時性。包含強(qiáng)大音頻邊緣處理器的產(chǎn)品現(xiàn)在可以提供計(jì)算能力和低功耗、低延遲操作,從而實(shí)現(xiàn)即時用戶體驗(yàn)。
即使在今天的早期階段,語音控制的爆炸式增長也充分證明了智能家居中語音控制的市場機(jī)會。智能家居的支柱任務(wù),包括安全、能源管理、娛樂和高級安全,都通過語音控制變得更簡單、更容易訪問。語音最終可以作為整個智能家居的統(tǒng)一控制器,從房子的任何房間發(fā)出命令……如果它們的設(shè)計(jì)考慮到用戶并利用語音控制技術(shù)的重大進(jìn)步。
審核編輯 黃昊宇
-
設(shè)計(jì)方法
+關(guān)注
關(guān)注
0文章
12瀏覽量
9228 -
語音控制
+關(guān)注
關(guān)注
5文章
512瀏覽量
29671
發(fā)布評論請先 登錄
三防漆和 PCB 板 “疏離、起皮、脫層”,90% 不是漆本身差,而是界面張力 / 表面能不匹配。
語音識別IC分類,語音識別芯片的工作原理
在工業(yè)現(xiàn)場,接口多不是缺點(diǎn),而是一種生存能力
智能語音識別控制器是什么?圖形中文編程,多路設(shè)備控制
樓宇自控系統(tǒng)語音控制集成,操作更便捷智能
開源不是削弱競爭力,而是新護(hù)城河的開始
廣州唯創(chuàng)電子WT2003HX語音芯片:內(nèi)置IIC控制器與紅外解碼器,打造全能語音解決方案 | 語音IC廠家
如何使用語音指令控制串口輸出
增加語音控制功能關(guān)注這幾顆芯片輕松搞定
網(wǎng)絡(luò)語音控制器 智能自控語音播報(bào)
茶吧機(jī)語音控制方案設(shè)計(jì)2025新版
AI語音控制模塊能做些什么
語音控制模塊工作原理
藍(lán)牙語音遙控器:智能家居的智慧控制核心
你失去工作不是因?yàn)锳I,而是因?yàn)槭褂肁I的人
語音控制不是魔術(shù),而是設(shè)計(jì)
評論