語音聽寫,是指將短音頻(≤60秒)精準(zhǔn)識(shí)別成文字,實(shí)時(shí)返回結(jié)果,達(dá)到邊說邊返回的效果。
除了要考慮本身語音聽寫模型或算法的識(shí)別準(zhǔn)確率之外,一些智能硬件的產(chǎn)品還需要額外考慮降噪、回聲消除、去混響等因素,這些都是保證最后識(shí)別效果的重要因素。因?yàn)樯婕败浻布瑢?duì)能力交付方的項(xiàng)目經(jīng)驗(yàn)提出了較高的要求。
目前,國內(nèi)提供語音聽寫技術(shù)的廠商主要有:
1、科大訊飛
成立于1999年,2008年,公司在深圳證券交易所掛牌上市(股票代碼:002230)。一直深耕在人工智能領(lǐng)域,技術(shù)很全也很綜合,多次在語音識(shí)別、語音合成、機(jī)器翻譯、圖文識(shí)別、圖像理解、閱讀理解、機(jī)器推理等各項(xiàng)國際評(píng)測中取得佳績。
在語音聽寫上,除中文普通話和英文外,支持51個(gè)語種、24種方言和1個(gè)民族語言,可提供公有云接口及私有化部署方案。采用行業(yè)先進(jìn)的語音識(shí)別技術(shù),識(shí)別率可達(dá)98% 。目前廣泛應(yīng)用于語音搜索、聊天輸入、游戲娛樂、人機(jī)交互等場景。
2、百度
該技術(shù)主要由百度智能云提供,可適用于手機(jī)語音輸入、智能語音交互、語音指令、語音搜索等短語音交互場景。近場中文普通話識(shí)別準(zhǔn)確率達(dá)98%,在語言支持上覆蓋主流的普通話、口音普通話、粵語、四川話、英語。
3、云知聲
2012年6月創(chuàng)立于北京,是國內(nèi)頭部人工智能獨(dú)角獸企業(yè)。語音聽寫主要應(yīng)用于語音搜索、語音輸入、語音控制等場景。準(zhǔn)確率可達(dá)實(shí)用標(biāo)準(zhǔn),支持普通話、四川話、粵語、英語的識(shí)別。
4、思必馳
07年創(chuàng)立于英國劍橋,08年回國落戶蘇州,12年完成A輪融資,是國內(nèi)專業(yè)的對(duì)話式人工智能平臺(tái)公司,擁有全鏈路的智能語音語言技術(shù)。語音識(shí)別提供基于云+端混合引擎的連續(xù)語音識(shí)別,覆蓋中文、英文、葡萄牙語等語種,粵、川、滬等方言,以及帶方言的普通話。云端連續(xù)實(shí)時(shí)語音識(shí)別率>97%,可提供公有云接口及私有化部署方案。
審核編輯:符乾江
-
語音識(shí)別
+關(guān)注
關(guān)注
39文章
1812瀏覽量
116043 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265275
發(fā)布評(píng)論請(qǐng)先 登錄
請(qǐng)問單片機(jī)開發(fā)的程序設(shè)計(jì)語言主要有哪幾種?
廣州唯創(chuàng)電子WTK6900H-24SS語音識(shí)別芯片:智能語音控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | 語音IC廠家
廣州唯創(chuàng)電子語音芯片的工作原理與應(yīng)用解析
36氪 | 從無到有的“聲”意經(jīng):智能語音芯片十年“平民化”演進(jìn)
國內(nèi)有哪些廠家能支持高光譜相機(jī)定制?需要提供什么技術(shù)參數(shù)?
語音識(shí)別---大家怎么看呢?
水晶頭主要有哪幾種型號(hào)
普強(qiáng)智能語音技術(shù)重新定義車載交互邊界
如何判斷晶振是否起振
測量相位差的方法主要有哪些?
運(yùn)算放大器的噪聲主要有哪些
玩具電動(dòng)車平臺(tái)自定義999段語音方案——NV512H芯片選型推薦
廠家芯資訊|廣州唯創(chuàng)電子語音識(shí)別芯片技術(shù)解析
芯知識(shí)|廣州唯創(chuàng)電子語音識(shí)別芯片IC技術(shù)解析與應(yīng)用指南
國內(nèi)提供語音聽寫技術(shù)的廠商主要有哪些
評(píng)論