語音識別技術(shù)原理
語音識別系統(tǒng)提示客戶在新的場合使用新的口令密碼,這樣使用者不需要記住固定的口令,系統(tǒng)也不會被錄音欺騙。文本相關(guān)的聲音識別方法可以分為動態(tài)時間伸縮或隱馬爾可夫模型方法。文本無關(guān)聲音識別已經(jīng)被研究很長時間了,不一致環(huán)境造成的性能下降是應(yīng)用中的一個很大的障礙。
其工作原理:
動態(tài)時間伸縮方法使用瞬間的、變動倒頻。1963年Bogertetal出版了《回聲的時序倒頻分析》。通過交換字母順序,他們用一個含義廣泛的詞匯定義了一個新的信號處理技術(shù),倒頻譜的計算通常使用快速傅立葉變換。
從1975年起,隱馬爾可夫模型變得很流行。運用隱馬爾可夫模型的方法,頻譜特征的統(tǒng)計變差得以測量。文本無關(guān)語音識別方法的例子有平均頻譜法、矢量量化法和多變量自回歸法。
平均頻譜法使用有利的倒頻距離,語音頻譜中的音位影響被平均頻譜去除。使用矢量量化法,語者的一套短期訓(xùn)練的特征向量可以直接用來描繪語者的本質(zhì)特征。但是,當(dāng)訓(xùn)練向量的數(shù)量很大時,這種直接的描繪是不切實際的,因為存儲和計算的量變得離奇的大。所以嘗試用矢量量化法去尋找有效的方法來壓縮訓(xùn)練數(shù)據(jù)。Montacieetal在倒頻向量的時序中應(yīng)用多變量自回歸模式來確定語者特征,取得了很好的效果。
想騙過語音識別系統(tǒng)要有高質(zhì)量的錄音機,那不是很容易買到的。一般的錄音機不能記錄聲音的完整頻譜,錄音系統(tǒng)的質(zhì)量損失也必須是非常低的。對于大多數(shù)的語音識別系統(tǒng),模仿的聲音都不會成功。用語音識別來辨認身份是非常復(fù)雜的,所以語音識別系統(tǒng)會結(jié)合個人身份號碼識別或芯片卡。
語音識別系統(tǒng)得益于廉價的硬件設(shè)備,大多數(shù)的計算機都有聲卡和麥克風(fēng),也很容易使用。但語音識別還是有一些缺點的。語音隨時間而變化,所以必須使用生物識別模板。語音也會由于傷風(fēng)、嗓音沙啞、情緒壓力或是青春期而變化。語音識別系統(tǒng)比指紋識別系統(tǒng)有著較高的誤識率,因為人們的聲音不像指紋那樣獨特和唯一。對快速傅立葉變換計算來說,系統(tǒng)需要協(xié)同處理器和比指紋系統(tǒng)更多的效能。目前語音識別系統(tǒng)不適合移動應(yīng)用或以電池為電源的系統(tǒng)。
更多精彩閱讀:
語音識別的兩個方法_語音識別的應(yīng)用有哪些
語音識別的優(yōu)缺點_語音識別功能介紹
語音識別算法有哪些_語音識別特征提取方法
怎么實現(xiàn)語音識別_手機語音識別怎么設(shè)置
語音識別設(shè)置能刪除嗎_語音識別系統(tǒng)工作流程
-
語音識別技術(shù)
+關(guān)注
關(guān)注
0文章
55瀏覽量
13291
發(fā)布評論請先 登錄
智能語音識別控制器是什么?圖形中文編程,多路設(shè)備控制
高性能的AT700系列語音芯片方案分享
廣州唯創(chuàng)電子WTK6900H-32N語音識別芯片:AI降噪算法助力抽油煙機精準語音控制 | 語音IC廠家
語音識別系統(tǒng)的技術(shù)核心:從聲音到文字的智能轉(zhuǎn)換
智能語音交互升級,九芯語音識別芯片來助力
語音識別---大家怎么看呢?
從“聽得見”到“聽得懂”:語音識別芯片的AI進化
芯資訊|廣州唯創(chuàng)電子語音識別芯片:全場景覆蓋與長效品質(zhì)
芯知識|廣州唯創(chuàng)電子語音識別芯片技術(shù)解析:藍牙功能與應(yīng)用場景選擇
普強信息入選2024語音識別技術(shù)公司TOP30榜單
智能語音交互方案在客服領(lǐng)域的應(yīng)用
人民網(wǎng)發(fā)布首款智能硬件AI之眼
芯資訊|WTK6900系列語音識別芯片IC自學(xué)習(xí)功能解析
語音識別技術(shù)原理
評論