電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)智能語(yǔ)音是智能時(shí)代人機(jī)交互的關(guān)鍵接口,近幾年隨著各行業(yè)場(chǎng)景需求爆發(fā)式增長(zhǎng),技術(shù)突破和應(yīng)用落地不斷深入。從全球范圍來(lái)看,2022年全球智能語(yǔ)音產(chǎn)業(yè)規(guī)模將達(dá)351.2億美元,保持33.1%的高速增長(zhǎng)。
根據(jù)德勤統(tǒng)計(jì)數(shù)據(jù),2022年我國(guó)智能語(yǔ)音市場(chǎng)將達(dá)341億元,同比增長(zhǎng)13.4%。我國(guó)智能語(yǔ)音產(chǎn)業(yè)整體發(fā)展環(huán)境積極向好。工信部信息技術(shù)發(fā)展司副司長(zhǎng)王威偉表示,智能語(yǔ)音產(chǎn)業(yè)作為新一代信息技術(shù)和人工智能產(chǎn)業(yè)的重要組成部分,必將迎來(lái)更大的發(fā)展機(jī)遇。
智能語(yǔ)音技術(shù),是實(shí)現(xiàn)人機(jī)語(yǔ)言的通信,包括語(yǔ)音識(shí)別技術(shù)(ASR)和語(yǔ)音合成技術(shù)(TTS)。智能語(yǔ)音技術(shù)的研究以語(yǔ)音識(shí)別技術(shù)為開(kāi)端,可以追溯到20世紀(jì)50年代。隨著信息技術(shù)的發(fā)展,智能語(yǔ)音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。
從當(dāng)前的發(fā)展情況來(lái)看,語(yǔ)音合成技術(shù)發(fā)展最早,應(yīng)用已較為普遍,除了合成音仍偏機(jī)械之外,基本不存在太大技術(shù)問(wèn)題;語(yǔ)音識(shí)別在2012年卷積神經(jīng)網(wǎng)絡(luò)(CNN)應(yīng)用之后,準(zhǔn)確率大幅提升,已經(jīng)在C端、B端得到廣泛應(yīng)用,但效果和體驗(yàn)仍有待提高。
比如語(yǔ)音識(shí)別魯棒性問(wèn)題顯著,語(yǔ)音識(shí)別整個(gè)過(guò)程包含語(yǔ)音信號(hào)處理、靜音切除、聲學(xué)特征提取、模式匹配等多個(gè)環(huán)節(jié)。由于語(yǔ)音信號(hào)的多樣性和復(fù)雜性,系統(tǒng)只能在一定限制條件下才能獲得滿意效果。在真實(shí)使用場(chǎng)景中,考慮到遠(yuǎn)場(chǎng)、方言、噪音等問(wèn)題,準(zhǔn)確率就會(huì)打折。
為了解決語(yǔ)音識(shí)別魯棒性問(wèn)題,企業(yè)從多方面進(jìn)行優(yōu)化,一是在語(yǔ)音增強(qiáng)、麥克風(fēng)陣列以及說(shuō)話人分離等技術(shù)領(lǐng)域投入,并結(jié)合后端語(yǔ)義,促進(jìn)對(duì)上下文的理解,從而提升識(shí)別效果;另一方面是從產(chǎn)品設(shè)計(jì)上進(jìn)行優(yōu)化,比如通過(guò)進(jìn)一步交互,使語(yǔ)音識(shí)別變得更為準(zhǔn)確。
在語(yǔ)音識(shí)別方面,視聽(tīng)融合的多模態(tài)交互技術(shù)是技術(shù)演進(jìn)的主要方向。據(jù)介紹,科大訊飛多模語(yǔ)音增強(qiáng)技術(shù)融合語(yǔ)音與視覺(jué)的多模感知,讓高噪音場(chǎng)景下的語(yǔ)音交互跨過(guò)實(shí)用門檻,率先在車載、會(huì)議、地鐵購(gòu)票和醫(yī)療掛號(hào)等場(chǎng)景落地。此外,針對(duì)低資源語(yǔ)音識(shí)別難題,海天瑞聲和科大訊飛分別從語(yǔ)音數(shù)據(jù)和算法層面推動(dòng)技術(shù)進(jìn)步。
當(dāng)前智能語(yǔ)音應(yīng)用場(chǎng)景正在迅速鋪開(kāi)。據(jù)德勤統(tǒng)計(jì)數(shù)據(jù),預(yù)計(jì)到2030年,智能語(yǔ)音消費(fèi)級(jí)和企業(yè)級(jí)應(yīng)用市場(chǎng)將分別超過(guò)700億元和千億元的規(guī)模。
在汽車領(lǐng)域,智能語(yǔ)音已成人機(jī)交互關(guān)鍵環(huán)節(jié),并從車內(nèi)交互衍生車外交互,從單模交互走向多模交互,從被動(dòng)交互發(fā)展為主動(dòng)交互,為車企提供全棧技術(shù)賦能。思必馳此前表示,在中高端車型的車載設(shè)備中,具備語(yǔ)音交互能力的中控大屏能為車主帶來(lái)高清且流暢的智能體驗(yàn)。
另外相對(duì)更平民化的傳統(tǒng)車型而言,智能網(wǎng)聯(lián)化成本高,中控大屏的智能化程度有限。針對(duì)更多車型智能化改造,思必馳推出了針對(duì)前裝市場(chǎng)的車載“智能收放機(jī)”軟硬一體化方案(聯(lián)網(wǎng)版、藍(lán)牙版),打造無(wú)屏版智能中控,圍繞“云+管+端+手”四個(gè)維度,分別為整車賦予智能化的改造,這將有利于擴(kuò)大智能語(yǔ)音在汽車領(lǐng)域的應(yīng)用。
智能語(yǔ)音在教育和醫(yī)療領(lǐng)域也已經(jīng)取得較大規(guī)模的應(yīng)用,比如,在教育領(lǐng)域,科大訊飛全球中文學(xué)習(xí)平臺(tái)已覆蓋全球183個(gè)國(guó)家,吸引300多萬(wàn)海外中文學(xué)習(xí)愛(ài)好者使用;在醫(yī)療領(lǐng)域,2022年疫情期間,科大訊飛電話機(jī)器人助力全國(guó)31個(gè)省112個(gè)地市疫情排查,累計(jì)服務(wù)超1.1億人次;智能外呼和智醫(yī)助理可用于獨(dú)居老人、留守兒童的日常關(guān)愛(ài)和兜底保障。
除此之外,智能語(yǔ)音在城市和工業(yè)領(lǐng)域也有很好的應(yīng)用前景。姚建銓院士此前指出,智能語(yǔ)音與建設(shè)智慧城市的要求吻合,可以實(shí)現(xiàn)各種語(yǔ)音高效轉(zhuǎn)換和智能處理,為智慧城市進(jìn)一步建設(shè)帶來(lái)新的機(jī)遇。在工業(yè)領(lǐng)域,我國(guó)打造了包括國(guó)家智能語(yǔ)音創(chuàng)新中心在內(nèi)的一批語(yǔ)音技術(shù)創(chuàng)新國(guó)家隊(duì), 開(kāi)展工業(yè)聲學(xué)、多語(yǔ)種、AI語(yǔ)音芯片等關(guān)鍵共性技術(shù)研究工作。
可想而知,隨著智能語(yǔ)音關(guān)鍵技術(shù)的不斷突破,以及各企業(yè)、研究團(tuán)隊(duì)在各行業(yè)各領(lǐng)域的應(yīng)用探索,未來(lái)智能語(yǔ)音的將會(huì)在更多場(chǎng)景中實(shí)現(xiàn)規(guī)模化應(yīng)用,市場(chǎng)規(guī)模也將隨之增長(zhǎng)。
根據(jù)德勤統(tǒng)計(jì)數(shù)據(jù),2022年我國(guó)智能語(yǔ)音市場(chǎng)將達(dá)341億元,同比增長(zhǎng)13.4%。我國(guó)智能語(yǔ)音產(chǎn)業(yè)整體發(fā)展環(huán)境積極向好。工信部信息技術(shù)發(fā)展司副司長(zhǎng)王威偉表示,智能語(yǔ)音產(chǎn)業(yè)作為新一代信息技術(shù)和人工智能產(chǎn)業(yè)的重要組成部分,必將迎來(lái)更大的發(fā)展機(jī)遇。
智能語(yǔ)音技術(shù),是實(shí)現(xiàn)人機(jī)語(yǔ)言的通信,包括語(yǔ)音識(shí)別技術(shù)(ASR)和語(yǔ)音合成技術(shù)(TTS)。智能語(yǔ)音技術(shù)的研究以語(yǔ)音識(shí)別技術(shù)為開(kāi)端,可以追溯到20世紀(jì)50年代。隨著信息技術(shù)的發(fā)展,智能語(yǔ)音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。
從當(dāng)前的發(fā)展情況來(lái)看,語(yǔ)音合成技術(shù)發(fā)展最早,應(yīng)用已較為普遍,除了合成音仍偏機(jī)械之外,基本不存在太大技術(shù)問(wèn)題;語(yǔ)音識(shí)別在2012年卷積神經(jīng)網(wǎng)絡(luò)(CNN)應(yīng)用之后,準(zhǔn)確率大幅提升,已經(jīng)在C端、B端得到廣泛應(yīng)用,但效果和體驗(yàn)仍有待提高。
比如語(yǔ)音識(shí)別魯棒性問(wèn)題顯著,語(yǔ)音識(shí)別整個(gè)過(guò)程包含語(yǔ)音信號(hào)處理、靜音切除、聲學(xué)特征提取、模式匹配等多個(gè)環(huán)節(jié)。由于語(yǔ)音信號(hào)的多樣性和復(fù)雜性,系統(tǒng)只能在一定限制條件下才能獲得滿意效果。在真實(shí)使用場(chǎng)景中,考慮到遠(yuǎn)場(chǎng)、方言、噪音等問(wèn)題,準(zhǔn)確率就會(huì)打折。
為了解決語(yǔ)音識(shí)別魯棒性問(wèn)題,企業(yè)從多方面進(jìn)行優(yōu)化,一是在語(yǔ)音增強(qiáng)、麥克風(fēng)陣列以及說(shuō)話人分離等技術(shù)領(lǐng)域投入,并結(jié)合后端語(yǔ)義,促進(jìn)對(duì)上下文的理解,從而提升識(shí)別效果;另一方面是從產(chǎn)品設(shè)計(jì)上進(jìn)行優(yōu)化,比如通過(guò)進(jìn)一步交互,使語(yǔ)音識(shí)別變得更為準(zhǔn)確。
在語(yǔ)音識(shí)別方面,視聽(tīng)融合的多模態(tài)交互技術(shù)是技術(shù)演進(jìn)的主要方向。據(jù)介紹,科大訊飛多模語(yǔ)音增強(qiáng)技術(shù)融合語(yǔ)音與視覺(jué)的多模感知,讓高噪音場(chǎng)景下的語(yǔ)音交互跨過(guò)實(shí)用門檻,率先在車載、會(huì)議、地鐵購(gòu)票和醫(yī)療掛號(hào)等場(chǎng)景落地。此外,針對(duì)低資源語(yǔ)音識(shí)別難題,海天瑞聲和科大訊飛分別從語(yǔ)音數(shù)據(jù)和算法層面推動(dòng)技術(shù)進(jìn)步。
當(dāng)前智能語(yǔ)音應(yīng)用場(chǎng)景正在迅速鋪開(kāi)。據(jù)德勤統(tǒng)計(jì)數(shù)據(jù),預(yù)計(jì)到2030年,智能語(yǔ)音消費(fèi)級(jí)和企業(yè)級(jí)應(yīng)用市場(chǎng)將分別超過(guò)700億元和千億元的規(guī)模。
在汽車領(lǐng)域,智能語(yǔ)音已成人機(jī)交互關(guān)鍵環(huán)節(jié),并從車內(nèi)交互衍生車外交互,從單模交互走向多模交互,從被動(dòng)交互發(fā)展為主動(dòng)交互,為車企提供全棧技術(shù)賦能。思必馳此前表示,在中高端車型的車載設(shè)備中,具備語(yǔ)音交互能力的中控大屏能為車主帶來(lái)高清且流暢的智能體驗(yàn)。
另外相對(duì)更平民化的傳統(tǒng)車型而言,智能網(wǎng)聯(lián)化成本高,中控大屏的智能化程度有限。針對(duì)更多車型智能化改造,思必馳推出了針對(duì)前裝市場(chǎng)的車載“智能收放機(jī)”軟硬一體化方案(聯(lián)網(wǎng)版、藍(lán)牙版),打造無(wú)屏版智能中控,圍繞“云+管+端+手”四個(gè)維度,分別為整車賦予智能化的改造,這將有利于擴(kuò)大智能語(yǔ)音在汽車領(lǐng)域的應(yīng)用。
智能語(yǔ)音在教育和醫(yī)療領(lǐng)域也已經(jīng)取得較大規(guī)模的應(yīng)用,比如,在教育領(lǐng)域,科大訊飛全球中文學(xué)習(xí)平臺(tái)已覆蓋全球183個(gè)國(guó)家,吸引300多萬(wàn)海外中文學(xué)習(xí)愛(ài)好者使用;在醫(yī)療領(lǐng)域,2022年疫情期間,科大訊飛電話機(jī)器人助力全國(guó)31個(gè)省112個(gè)地市疫情排查,累計(jì)服務(wù)超1.1億人次;智能外呼和智醫(yī)助理可用于獨(dú)居老人、留守兒童的日常關(guān)愛(ài)和兜底保障。
除此之外,智能語(yǔ)音在城市和工業(yè)領(lǐng)域也有很好的應(yīng)用前景。姚建銓院士此前指出,智能語(yǔ)音與建設(shè)智慧城市的要求吻合,可以實(shí)現(xiàn)各種語(yǔ)音高效轉(zhuǎn)換和智能處理,為智慧城市進(jìn)一步建設(shè)帶來(lái)新的機(jī)遇。在工業(yè)領(lǐng)域,我國(guó)打造了包括國(guó)家智能語(yǔ)音創(chuàng)新中心在內(nèi)的一批語(yǔ)音技術(shù)創(chuàng)新國(guó)家隊(duì), 開(kāi)展工業(yè)聲學(xué)、多語(yǔ)種、AI語(yǔ)音芯片等關(guān)鍵共性技術(shù)研究工作。
可想而知,隨著智能語(yǔ)音關(guān)鍵技術(shù)的不斷突破,以及各企業(yè)、研究團(tuán)隊(duì)在各行業(yè)各領(lǐng)域的應(yīng)用探索,未來(lái)智能語(yǔ)音的將會(huì)在更多場(chǎng)景中實(shí)現(xiàn)規(guī)模化應(yīng)用,市場(chǎng)規(guī)模也將隨之增長(zhǎng)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
智能語(yǔ)音
+關(guān)注
關(guān)注
11文章
826瀏覽量
50269
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
Neway微波產(chǎn)品國(guó)產(chǎn)化替代電源模塊的市場(chǎng)前景如何
/6G通信建設(shè):隨著5G向6G演進(jìn),高頻化需求激增,預(yù)計(jì)2025年毫米波器件市場(chǎng)規(guī)模突破40億元,為Neway電源模塊提供了廣闊的市場(chǎng)空間。汽車電子化趨勢(shì):L3級(jí)自動(dòng)駕駛滲透率提升帶動(dòng)77GHz毫米波
發(fā)表于 02-27 09:55
歐菲光推出人形機(jī)器人視覺(jué)感知產(chǎn)品架構(gòu)組合方案
作為未來(lái)產(chǎn)業(yè)的前沿領(lǐng)域,人形機(jī)器人已成為全球科技和產(chǎn)業(yè)競(jìng)爭(zhēng)的新賽道,有望成為千億美元級(jí)別的藍(lán)海市場(chǎng)。據(jù)GGII預(yù)測(cè),2030年全球市場(chǎng)規(guī)模將突破
2025年市場(chǎng)規(guī)模將達(dá)290億!AI 玩具成行業(yè)新風(fēng)口
工信部最新發(fā)布會(huì)釋放重磅信號(hào):2024 年我國(guó) AI 玩具市場(chǎng)規(guī)模達(dá) 246 億元,2025 年預(yù)計(jì)飆升至 290 億元!
2024年中國(guó)大陸大尺寸顯示面板電源管理芯片市場(chǎng)規(guī)模近25億元
“受益于高世代產(chǎn)線擴(kuò)產(chǎn)及OLED技術(shù)突破,推動(dòng)中大尺寸顯示需求增長(zhǎng),大尺寸顯示面板電源管理芯片市場(chǎng)規(guī)模穩(wěn)步擴(kuò)大。根據(jù)CINNO ? IC Research數(shù)據(jù)顯示,2024年中國(guó)大陸大尺寸顯示面板
2025嵌入式行業(yè)現(xiàn)狀如何?
車規(guī)級(jí)操作系統(tǒng)市場(chǎng)規(guī)模突破50億元,新能源汽車滲透率超35%。 1.2 中國(guó)市場(chǎng)細(xì)分 總體規(guī)模:中國(guó)嵌入式操作系統(tǒng)
發(fā)表于 08-25 11:34
Cat.1蜂窩模組正成為兩輪車智能化的關(guān)鍵技術(shù)支撐
北斗定位能力,Cat.1蜂窩模組的應(yīng)用將迎來(lái)爆發(fā)式增長(zhǎng)。根據(jù)預(yù)測(cè),新國(guó)標(biāo)將帶動(dòng)Cat.1蜂窩模組需求超5000萬(wàn)片,滲透率有望突破96% 。這一預(yù)測(cè)基于2025年上半年電動(dòng)兩輪車銷量達(dá)3232.5萬(wàn)臺(tái),同比增長(zhǎng)29.5%的數(shù)據(jù)
《人民日?qǐng)?bào):智能制造裝備亮眼表現(xiàn)因何來(lái)》:今年上半年中國(guó)傳感器市場(chǎng)規(guī)模突破2000億
近日,《人民日?qǐng)?bào)》刊發(fā)《智能制造裝備亮眼表現(xiàn)因何來(lái)》,內(nèi)容中提及我國(guó)傳感器產(chǎn)業(yè)的幾項(xiàng)關(guān)鍵數(shù)據(jù): 今年上半年,中國(guó)傳感器市場(chǎng)規(guī)模突破2000億元,智能
中國(guó)汽車線束行業(yè):高壓、智能、輕量化三重變革下的千億市場(chǎng)重構(gòu)
轉(zhuǎn)載自:線束世界市場(chǎng)爆發(fā)結(jié)構(gòu)變革:新能源驅(qū)動(dòng)規(guī)模躍升市場(chǎng)規(guī)模突破千億,新能源貢獻(xiàn)核心增量2023年中國(guó)汽車線束
中國(guó)傳感器市場(chǎng)規(guī)模突破4000億!工信部產(chǎn)業(yè)研究院最新數(shù)據(jù)出爐
市場(chǎng)規(guī)模首次超過(guò)4000億元——達(dá)4061.2億元,同比增長(zhǎng)11.4%。賽迪顧問(wèn)預(yù)計(jì),到2027年,中國(guó)傳感器市場(chǎng)規(guī)模有望達(dá)到5793.4億元。 ? 具體到各傳感器細(xì)分領(lǐng)域,在2024年中國(guó)傳感器市場(chǎng)細(xì)分份額中,壓力傳感器以71
端側(cè)AI+低成本模組,中國(guó)廠商將改寫(xiě)全球玩具市場(chǎng)規(guī)則
。 ? 市場(chǎng)爆發(fā)與技術(shù)重構(gòu)的雙重機(jī)遇 ? 全球AI玩具市場(chǎng)規(guī)模預(yù)計(jì)在2033年突破600億美元,中國(guó)作為核心增長(zhǎng)極,2025年市場(chǎng)規(guī)模預(yù)計(jì)
淺談 IPv6 行業(yè)市場(chǎng)規(guī)模與增長(zhǎng)趨勢(shì)
年,IPv6市場(chǎng)規(guī)模將突破300億美元。全球IPv6市場(chǎng)規(guī)模及增長(zhǎng)預(yù)測(cè)從區(qū)域市場(chǎng)來(lái)看,亞太地區(qū)將成為全球IPv6
視頻監(jiān)控設(shè)備市場(chǎng)規(guī)模猛漲,高清網(wǎng)絡(luò)監(jiān)控?cái)z像頭帶來(lái)創(chuàng)新
我國(guó)視頻監(jiān)控設(shè)備需求和市場(chǎng)發(fā)展迅速。據(jù)統(tǒng)計(jì),2015年中國(guó)視頻監(jiān)控設(shè)備市場(chǎng)規(guī)模為553.5億元,到2020年已增長(zhǎng)到982.8億元。疫情后,無(wú)人化智能安防技術(shù)和應(yīng)用場(chǎng)景進(jìn)一步拓寬,預(yù)計(jì)
軟件定義音頻的關(guān)鍵優(yōu)勢(shì)
當(dāng)前,新能源汽車的市場(chǎng)滲透率持續(xù)上升,智能化水平不斷深化。作為智能座艙體驗(yàn)的重要組成部分,車載聲學(xué)展現(xiàn)出巨大的增長(zhǎng)潛力。預(yù)計(jì)到2025年,全球車載聲學(xué)系統(tǒng)
智能語(yǔ)音交互的突破與應(yīng)用,啟明云端AI大模型方案應(yīng)用
根據(jù)Statista的預(yù)測(cè),到2025年,全球人工智能市場(chǎng)規(guī)模有望突破6400億美元,年復(fù)合增長(zhǎng)率高達(dá)30.8%。其中,AI大模型作為核心驅(qū)動(dòng)力,正重塑各個(gè)行業(yè)的發(fā)展格局。從ChatGPT掀起全球
智能語(yǔ)音關(guān)鍵技術(shù)不斷突破,市場(chǎng)規(guī)模將超千億!
評(píng)論