首先我們簡單聊聊什么是麥克風(fēng)陣列。
麥克風(fēng)陣列 ≠一堆麥克風(fēng)
風(fēng)吹麥浪,高山流水,蛙聲蟲鳴......人類能聽到的聲音大約有40多萬種,頻率在20至20000赫茲之間。而在嘈雜的環(huán)境下,機器想要聽懂聲音,它必須能夠聽的更遠更清晰,人類可以帶上助聽器,機器需要什么呢?麥克風(fēng)陣列就充當了助聽器這樣的角色。
麥克風(fēng)陣列就是由一定數(shù)目的聲學(xué)傳感器(一般是麥克風(fēng))組成,用來對聲場的空間特性進行采樣并處理的系統(tǒng)。早在20世紀70、80年代,麥克風(fēng)陣列已經(jīng)被應(yīng)用于語音信號處理的研究中,進入90年代以來,基于麥克風(fēng)陣列的語音信號處理算法逐漸成為一個新的研究熱點。而到了“聲控時代”,這項技術(shù)的重要性顯得尤為突出。
如果把語音識別看成一個接收信息、解析信息、做出反饋過程的話,麥克風(fēng)陣列解決的是聽不聽得到、多遠距離屬于合理范圍、不受噪音影響的問題。
單麥克 vs麥克風(fēng)陣列
單麥克風(fēng)系統(tǒng)可以在低噪聲、無混響、距離聲源很近的情況下獲得符合語音識別需求的聲音信號。但如果聲源距離麥克風(fēng)距離較遠,并且存在大量的噪聲、多徑反射和混響,導(dǎo)致拾取信號的質(zhì)量下降,這會嚴重影響語音識別率。而且,單麥克風(fēng)接收的信號,是由多個聲源和環(huán)境噪聲疊加的,很難實現(xiàn)各個聲源的分離。這樣就無法實現(xiàn)聲源定位和分離,因為還有一類聲音的疊加并非噪聲,但是在語音識別中也要抑制,就是人聲的干擾,語音識別顯然不能同時識別兩個以上的聲音。
為了解決單麥克風(fēng)的這些局限性,利用麥克風(fēng)陣列進行語音處理的方法應(yīng)時而生。麥克風(fēng)陣列由一組按一定幾何結(jié)構(gòu)(常用線形、環(huán)形)擺放的麥克風(fēng)組成,對采集的不同空間方向的聲音信號進行空時處理,實現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能,進而提高語音信號處理質(zhì)量,以提高真實環(huán)境下的語音識別率。
一個麥克風(fēng)不足以接收全部信息,但麥克風(fēng)陣列卻可以實現(xiàn)聲源定位、信號拾取、信號分離、去除噪音影響等。
麥克風(fēng)結(jié)構(gòu)和麥克風(fēng)數(shù)量
在麥克風(fēng)陣列里,麥克風(fēng)的數(shù)量,從2個到上千個不等。復(fù)雜的麥克風(fēng)陣列主要應(yīng)用于工業(yè)和國防領(lǐng)域,而消費級領(lǐng)域的麥克風(fēng)數(shù)量通常較少,一般有2、4、5、6、8等幾種形式。通常,這組麥克風(fēng)會按照一定幾何結(jié)構(gòu)擺放,比如線形、環(huán)形、球形等,比如訊飛開放平臺就研發(fā)出二麥線性陣列、四麥線性陣列和六四麥線性陣列。
適用場景解析
可別小看這些結(jié)構(gòu)和數(shù)量,不同的組合都對硬件產(chǎn)品來說有著千差萬別的效果。比如雙麥克風(fēng)陣列的結(jié)構(gòu)簡單,成本低、容易實施、功耗低等特點讓它更容易在家電產(chǎn)品中實現(xiàn)落地。目前國內(nèi)主流家電廠商應(yīng)用語音交互技術(shù)的產(chǎn)品中,海信電視、美的空調(diào)等選擇的大都是雙麥克方案。
不過在機器人領(lǐng)域里,對聲源定位、降噪、識別率的要求比較高,一般都會使用環(huán)形多麥克方案。比如新松機器人使用的是訊飛四麥克風(fēng)陣列,穿山甲機器人則選用六麥克風(fēng)陣列。(ps:六麥是環(huán)形360拾音,需要水平放置,一般安置在機器人頭頂?shù)奈恢茫柠準?80度正面的拾音,豎直放置,一般安置在機器人的胸前)。那么車載、智能音箱等領(lǐng)域又如何選擇這些方案呢?自己的產(chǎn)品究竟更適合哪種呢?
5月25日,AI公開課第四期我們就將為大家具體介紹。另外麥克風(fēng)陣列的關(guān)鍵技術(shù)(噪聲抑制、混響消除、聲源定位等)也會在本期公開課展開詳細解讀。
-
傳感器
+關(guān)注
關(guān)注
2576文章
55041瀏覽量
791347 -
機器人
+關(guān)注
關(guān)注
213文章
31079瀏覽量
222270 -
語音識別
+關(guān)注
關(guān)注
39文章
1812瀏覽量
116055
發(fā)布評論請先 登錄
探索LMV1091:高性能麥克風(fēng)陣列放大器的卓越之選
探索MAX9814:帶AGC和低噪聲麥克風(fēng)偏置的麥克風(fēng)放大器
為什么你的藍牙耳機通話清晰?MEMS麥克風(fēng)是關(guān)鍵
探究 InvenSense ICS - 40214 模擬 MEMS 麥克風(fēng):性能與應(yīng)用全解析
TDK InvenSense ICS - 40800麥克風(fēng):性能、設(shè)計與應(yīng)用全解析
探索英飛凌XENSIV? MEMS麥克風(fēng)柔性評估套件
探索英飛凌XENSIV? MEMS麥克風(fēng)柔性評估套件
測量麥克風(fēng)接口指南類型、區(qū)別與應(yīng)用解析你都知道嗎?
藍牙耳機降噪核心技術(shù)解析:MEMS硅麥克風(fēng)如何重塑聽覺體驗?
?基于STEVAL-STWINMA2麥克風(fēng)陣列擴展板的工業(yè)音頻傳感技術(shù)解析
MEMS麥克風(fēng)設(shè)計注意事項和應(yīng)用指南
麥克風(fēng)CE認證要求
數(shù)字麥克風(fēng)的0dBFS對應(yīng)的信號電平峰值是多少?
芯知識|語音識別芯片麥克風(fēng)配置指南:單麥與雙麥方案的技術(shù)選擇
關(guān)于對麥克風(fēng)陣列的分析和介紹
評論