“因?yàn)樯蹲硬豢梢赞k銀行卡?”
——語(yǔ)音識(shí)別結(jié)果:“為啥不能辦理銀行卡?”
隨著科技的發(fā)展,語(yǔ)音識(shí)別技術(shù)不斷迭代,逐漸由普通話識(shí)別向多語(yǔ)種、方言以及混合語(yǔ)言識(shí)別的方向發(fā)展,語(yǔ)音識(shí)別效果顯著提升,滿足了多樣化的場(chǎng)景需求。
目前業(yè)界普遍采用的語(yǔ)音識(shí)別系統(tǒng)的核心主要由聲學(xué)模型、語(yǔ)言模型、解碼器三部分構(gòu)成。語(yǔ)音識(shí)別的效果,離不開語(yǔ)音廠商對(duì)聲學(xué)模型、語(yǔ)言模型的不斷更新優(yōu)化。
“千語(yǔ)千訓(xùn)”是一套融合算法技術(shù)與工程服務(wù)創(chuàng)新的語(yǔ)音識(shí)別自動(dòng)優(yōu)化系統(tǒng),可以將原本由算法工程師承擔(dān)的工作以自動(dòng)化執(zhí)行的方式完成,一方面可以將算法人員從重復(fù)性的工作中解放出來,另一方面,可提高語(yǔ)音識(shí)別效果、降低模型更新周期和成本。
思必馳依托于“千語(yǔ)千訓(xùn)”系統(tǒng),可以實(shí)現(xiàn)算法人員0人工介入,自動(dòng)更新模型,實(shí)現(xiàn)語(yǔ)音識(shí)別系統(tǒng)更新頻率從周級(jí)到天級(jí)的提升。
自動(dòng)化更新,三大法寶助力語(yǔ)音識(shí)別技術(shù)升級(jí)
影響語(yǔ)音識(shí)別效果的外部因素主要為說話人、周圍環(huán)境和收音設(shè)備,內(nèi)在因素則是前端的信號(hào)處理、特征提取、聲學(xué)模型、語(yǔ)言模型,語(yǔ)音識(shí)別探索之路上,離不開對(duì)聲音模型、語(yǔ)言模型等模塊的訓(xùn)練優(yōu)化。
1)主動(dòng)學(xué)習(xí)技術(shù),有效篩選數(shù)據(jù)
目前,語(yǔ)音識(shí)別建模的主流方法是基于深度學(xué)習(xí)的有監(jiān)督數(shù)據(jù)建模,這需要大量帶標(biāo)注的數(shù)據(jù)供模型進(jìn)行學(xué)習(xí)。
隨著海量訓(xùn)練數(shù)據(jù)的應(yīng)用,語(yǔ)音識(shí)別系統(tǒng)已經(jīng)能夠較準(zhǔn)確的識(shí)別常見語(yǔ)音。但對(duì)于“元宇宙”“數(shù)字藏品”“栓Q”等新興領(lǐng)域以及復(fù)雜環(huán)境下的語(yǔ)音,準(zhǔn)確率尚待進(jìn)一步提高。目前,業(yè)內(nèi)常用的優(yōu)化方法是及時(shí)將這類識(shí)別準(zhǔn)確率不高的語(yǔ)音進(jìn)行標(biāo)注用以訓(xùn)練模型,那么,該如何在海量的線上數(shù)據(jù)中尋找此類具有訓(xùn)練價(jià)值的數(shù)據(jù)呢?
思必馳采用基于主動(dòng)學(xué)習(xí)數(shù)據(jù)篩選的方法來解決上述問題。通過自監(jiān)督學(xué)習(xí)、置信度和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)等技術(shù)結(jié)合的方法,快速定位更具價(jià)值的數(shù)據(jù),經(jīng)專家標(biāo)注后用于模型的優(yōu)化迭代。這種方法既減少了優(yōu)化模型所需的數(shù)據(jù)量,降低了成本,又提升了語(yǔ)音識(shí)別效果。
2)混合監(jiān)督語(yǔ)音識(shí)別模型,低成本、高效益
語(yǔ)音識(shí)別模型準(zhǔn)確率的提高,需要大量的有監(jiān)督數(shù)據(jù)對(duì)模型進(jìn)行優(yōu)化訓(xùn)練,但獲取此類有準(zhǔn)確標(biāo)注結(jié)果的數(shù)據(jù)費(fèi)用較高,周期較長(zhǎng),一定程度上提高了優(yōu)化語(yǔ)音識(shí)別系統(tǒng)的成本。
近年來,半監(jiān)督訓(xùn)練、自監(jiān)督訓(xùn)練等技術(shù)取得了良好的研究和應(yīng)用成果,特別是在低資源識(shí)別場(chǎng)景中,能夠較為明顯的提升語(yǔ)音識(shí)別優(yōu)化效果。思必馳融合了有監(jiān)督、半監(jiān)督、自監(jiān)督等方法,提出混合監(jiān)督優(yōu)化方案,充分挖掘數(shù)據(jù)價(jià)值,持續(xù)優(yōu)化語(yǔ)音識(shí)別模型,獲得更好的語(yǔ)音識(shí)別效果。
3)一站式自動(dòng)化,語(yǔ)音識(shí)別系統(tǒng)高頻迭代
傳統(tǒng)上,語(yǔ)音識(shí)別系統(tǒng)中只有熱詞和定制語(yǔ)言模型部分可以通過自動(dòng)化手段以較高頻率進(jìn)行優(yōu)化,而聲學(xué)模型等其它系統(tǒng)關(guān)鍵模塊則因?yàn)樾枰惴▽<医槿?難以高頻更新。
思必馳最新推出的“千語(yǔ)千訓(xùn)”自動(dòng)優(yōu)化系統(tǒng),是一款融合了基于主動(dòng)學(xué)習(xí)的數(shù)據(jù)篩選、自動(dòng)送標(biāo)、混合監(jiān)督聲學(xué)和語(yǔ)言模型訓(xùn)練、自動(dòng)化測(cè)試和上線發(fā)布等功能模塊的集成自動(dòng)化方案。
“千語(yǔ)千訓(xùn)”自動(dòng)優(yōu)化系統(tǒng),全流程只有部分?jǐn)?shù)據(jù)標(biāo)注環(huán)節(jié)需要人員參與,其余流程均可以自動(dòng)化完成,實(shí)現(xiàn)語(yǔ)音識(shí)別模型更新頻率從周級(jí)到天級(jí)的提升,及時(shí)優(yōu)化時(shí)效熱點(diǎn)話術(shù)和難點(diǎn)場(chǎng)景,保證模型與時(shí)俱進(jìn)。
穩(wěn)扎穩(wěn)打,語(yǔ)音識(shí)別技術(shù)碩果累累
在語(yǔ)音識(shí)別技術(shù)上,思必馳獲得業(yè)內(nèi)多項(xiàng)肯定。

錢彥旻團(tuán)隊(duì)的成果“魯棒語(yǔ)音信號(hào)模式分析與識(shí)別的深度結(jié)構(gòu)化建模理論與方法”摘得吳文俊人工智能自然科學(xué)獎(jiǎng)一等獎(jiǎng);思必馳-上海交大聯(lián)合團(tuán)隊(duì)榮獲IWSLT 2022英中同聲傳譯冠軍;思必馳語(yǔ)音識(shí)別準(zhǔn)確率高達(dá)98%(中國(guó)信息通信研究院檢測(cè),報(bào)告編號(hào):V21Y000005),并具有反饋速度快、快速定制、強(qiáng)魯棒性等優(yōu)勢(shì)。
目前,思必馳語(yǔ)音識(shí)別技術(shù)除可以支持中文普通話外,還可以支持川、粵等十余種方言,以及英語(yǔ)等多種外語(yǔ),廣泛落地于車載、家居、金融、辦公等領(lǐng)域。此外,思必馳推出DUI標(biāo)注訓(xùn)練一體化平臺(tái),賦能客戶自主優(yōu)化應(yīng)用場(chǎng)景中的識(shí)別體驗(yàn)。
時(shí)間的書頁(yè)不斷被掀開,AI發(fā)展日新月異。思必馳語(yǔ)音識(shí)別技術(shù)不斷邁向更準(zhǔn)確、更豐富、更智能的道路。未來,思必馳將不斷優(yōu)化語(yǔ)音識(shí)別鏈路策略,進(jìn)一步縮短通用語(yǔ)音識(shí)別模型更新周期,滿足不斷發(fā)展的業(yè)務(wù)需要,支持更多場(chǎng)景領(lǐng)域。
審核編輯 黃昊宇
-
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
39文章
1812瀏覽量
116067 -
思必馳
+關(guān)注
關(guān)注
4文章
397瀏覽量
15991
發(fā)布評(píng)論請(qǐng)先 登錄
從"替代人力"到"智能協(xié)同":履帶式巡檢機(jī)器人的產(chǎn)業(yè)躍遷
選EtherCAT模塊,別只看價(jià)格,先看"體檢報(bào)告"
L3試點(diǎn)落地,和芯星通如何成為車企突圍的"隱形守護(hù)者"?
Axiometrix Solutions 一站式方案引領(lǐng)汽車測(cè)試新變革
思必馳一鳴智能客服大模型通過生成式人工智能服務(wù)備案
智慧路燈的"智慧"從何而來?一文讀懂單燈控制器工作原理
全屋WiFi強(qiáng)電款WiFi6 86面板一站式測(cè)試解決方案
芯圣電子重磅推出一站式HC AI玩具盒子服務(wù)方案
芯圣電子重磅推出一站式HC AI玩具盒子服務(wù)方案
思必馳空調(diào)大模型解決方案
為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的"黃金搭檔"?
人形機(jī)器人為什么要定制? ——揭秘工業(yè)場(chǎng)景的"千面需求"
一文解析一站式代工代料服務(wù)
電纜局部放電在線監(jiān)測(cè):守護(hù)電網(wǎng)安全的"黑科技"
一站式自動(dòng)優(yōu)化,思必馳"千語(yǔ)千訓(xùn)"系統(tǒng)高效迭代語(yǔ)音識(shí)別模型
評(píng)論