国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺析語音識別技術的發(fā)展歷程

汽車玩家 ? 來源:旺龍ITLONG、eepw、個人圖書 ? 作者:旺龍ITLONG、eepw、個 ? 2022-02-07 10:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語音識別,通常稱為自動語音識別,主要是將人類語音中的詞匯內容轉換為計算機可讀的輸入,也有可能是按鍵、二進制編碼或者字符序列。但是,我們一般理解的語音識別其實都是狹義的語音轉文字的過程,簡稱語音轉文本識別,主要是識別和確認發(fā)出語音的人而非其中所包含的內容。

語音識別的目的就是讓機器聽懂人類口述的語言,包括了兩方面的含義:一是逐字逐句聽懂而不是轉化成書面的語言文字;二是對口述語言中所包含的命令或請求加以領會,做出正確回應,而不僅僅只是拘泥于所有詞匯的正確轉換。

語音識別系統(tǒng)根據(jù)對輸入語音的限制分類,可以將識別系統(tǒng)分為三類:

①特定人語音識別系統(tǒng),僅考慮對于專人的話音進行識別。

②非特定人語音系統(tǒng),識別的語音與人無關,通常要用大量不同人的語音數(shù)據(jù)庫對識別系統(tǒng)進行學習。

③多人的識別系統(tǒng),通常能識別一組人的語音,或者成為特定組語音識別系統(tǒng),該系統(tǒng)僅要求對要識別的那組人的語音進行訓練。

根據(jù)從說話的方式考慮,也可以將識別系統(tǒng)分為三類:

①孤立詞語音識別系統(tǒng),孤立詞識別系統(tǒng)要求輸入每個詞后要停頓。

②連接詞語音識別系統(tǒng),連接詞輸入系統(tǒng)要求對每個詞都清楚發(fā)音,一些連音現(xiàn)象開始出現(xiàn)。

③連續(xù)語音識別系統(tǒng),連續(xù)語音輸入是自然流利的連續(xù)語音輸入,大量連音和變音會出現(xiàn)。

在過去5-10年,隨著技術快速迭代,語音識別市場在我國得到飛快發(fā)展,目前處于深度神經網絡階段。如今,語音識別主流廠商主要使用端到端的算法,在實驗環(huán)境準確率可高達99%以上,為推動新基建發(fā)展,5G人工智能云計算等作為輔助核心基礎設施的核心技術得到進一步加速發(fā)展,帶動語音識別迎來迎來了更加廣闊的發(fā)展空間,智能家居智能音箱、智能車載和智能硬件等等都得到很好的廣泛應用。

語音識別主要趨于遠場化和融合化的方向發(fā)展,但在遠場可靠性還有很多難點沒有突破,比如多輪交互、多人噪雜等場景還有待突破,還有需求較為迫切的人聲分離等技術。新的技術應該徹底解決這些問題,讓機器聽覺遠超人類的感知能力。這不能僅僅只是算法的進步,需要整個產業(yè)鏈的共同技術升級,包括更為先進的傳感器和算力更強的芯片。

單從遠場語音識別技術來看,仍然存在很多挑戰(zhàn),包括:

回聲消除技術。由于喇叭非線性失真的存在,單純依靠信號處理手段很難將回聲消除干凈,這也阻礙了語音交互系統(tǒng)的推廣,現(xiàn)有的基于深度學習的回聲消除技術都沒有考慮相位信息,直接求取的是各個頻帶上的增益,能否利用深度學習將非線性失真進行擬合,同時結合信號處理手段可能是一個好的方向。

噪聲下的語音識別仍有待突破。信號處理擅長處理線性問題,深度學習擅長處理非線性問題,而實際問題一定是線性和非線性的疊加,因此一定是兩者融合才有可能更好地解決噪聲下的語音識別問題。

語音識別的目的是讓機器可以理解人類,因此轉換成文字并不是最終的目的,如何將語音識別和語義理解結合起來可能是未來更為重要的一個方向。語音識別里的LSTM已經考慮了語音的歷史時刻信息,但語義理解需要更多的歷史信息才能有幫助,因此如何將更多上下文會話信息傳遞給語音識別引擎是一個難題。

讓機器聽懂人類語言,僅靠聲音信息還不夠,“聲光電熱力磁”這些物理傳感手段,下一步必然都要融合在一起,只有這樣機器才能感知世界的真實信息,這是機器能夠學習人類知識的前提條件;而且,機器必然要超越人類的五官,能夠看到人類看不到的世界,聽到人類聽不到的世界。

未來,相信在國家政策的強力扶持下,能夠加速在垂直行業(yè)的滲透和布局,也相信在供應商和開發(fā)者共同努力下,語音識別技術能夠更好地與其他語音交互技術及軟件功能融合,為消費者提供更優(yōu)質的體驗。

文章整合自:旺龍ITLONG、eepw、個人圖書館

審核編輯:鄢孟繁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    39

    文章

    1812

    瀏覽量

    116055
  • 機器
    +關注

    關注

    0

    文章

    798

    瀏覽量

    41875
  • 二進制編碼
    +關注

    關注

    0

    文章

    8

    瀏覽量

    3388
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,也叫語音識別集成電路,是一種集聲音存儲、播放、錄音及語音識別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?243次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識別</b>IC分類,<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片的工作原理

    國產32位MCU語音識別方案

    在智能家居、工業(yè)控制及便攜設備領域,語音交互正成為人機界面的重要發(fā)展方向。針對離線語音識別需求,基于國產32位MCU的解決方案日益成熟,其中以CH32V307等為代表的32位MCU芯片
    的頭像 發(fā)表于 12-04 15:11 ?544次閱讀

    語音識別芯片有哪些(語音識別芯片AT680系列)

    在人工智能技術飛速發(fā)展的今天,語音識別芯片作為人機交互的重要橋梁,正逐漸成為各類智能設備不可或缺的核心部件。與傳統(tǒng)的語音芯片不同,
    的頭像 發(fā)表于 11-14 17:11 ?1372次閱讀

    廣州唯創(chuàng)電子WTK6900H-24SS語音識別芯片:智能語音控制賦能臺燈創(chuàng)新應用 | 語音IC廠家

    在智能家居快速發(fā)展的今天,語音交互技術正在深刻改變人們與家居設備的互動方式。臺燈作為日常生活中不可或缺的照明工具,其智能化升級已成為行業(yè)發(fā)展的重要趨勢。廣州唯創(chuàng)電子作為國內領先的
    的頭像 發(fā)表于 11-05 09:20 ?781次閱讀
    廣州唯創(chuàng)電子WTK6900H-24SS<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片:智能<b class='flag-5'>語音</b>控制賦能臺燈創(chuàng)新應用 | <b class='flag-5'>語音</b>IC廠家

    什么是離線語音識別芯片(離線語音識別芯片有哪些優(yōu)點)

    離線語音識別芯片,是一種集成了語音信號采集、前端處理和本地識別功能的專用集成電路,無須聯(lián)網也可以進行語音控制。它內設先進的數(shù)字信號處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?511次閱讀

    如何選擇合適的語音識別芯片型號

    語音識別芯片(又稱語音識別IC)是現(xiàn)代智能設備的核心組件,與傳統(tǒng)語音芯片相比,其最大特點是能夠主動識別
    的頭像 發(fā)表于 10-30 16:32 ?615次閱讀

    廣州唯創(chuàng)電子WTK6900H-32N語音識別芯片:AI降噪算法助力抽油煙機精準語音控制 | 語音IC廠家

    在現(xiàn)代智能家居快速發(fā)展的大背景下,廚房作為家庭生活的重要場景,其智能化程度卻一直受到環(huán)境噪音的制約。抽油煙機作為廚房核心電器,其運行產生的噪音往往使得傳統(tǒng)語音識別技術難以發(fā)揮效用。廣州
    的頭像 發(fā)表于 10-30 09:17 ?383次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片:AI降噪算法助力抽油煙機精準<b class='flag-5'>語音</b>控制 | <b class='flag-5'>語音</b>IC廠家

    語音識別系統(tǒng)的技術核心:從聲音到文字的智能轉換

    ? ? ? 語音識別技術,也稱為自動語音識別(ASR),其核心目標是將人類語音信號轉換為對應的文
    的頭像 發(fā)表于 09-05 14:04 ?839次閱讀

    瑞芯微RK3576語音識別算法

    1.語音識別簡介語音識別技術,也被稱為自動語音識別
    的頭像 發(fā)表于 08-15 15:13 ?2193次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b><b class='flag-5'>識別</b>算法

    語音識別---大家怎么看呢?

    語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,
    發(fā)表于 08-09 10:54

    語音識別芯片選型有哪些技術參數(shù)要注意

    語音識別芯片的使用場景越來越多涉及的范圍也越來越廣!那么語音芯片的選型就很重要了,選型不對直接影響產品的使用體驗,下面小編從不同的維度來給大家介紹語音
    的頭像 發(fā)表于 06-23 17:31 ?876次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片選型有哪些<b class='flag-5'>技術</b>參數(shù)要注意

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    源的開發(fā)資料為開發(fā)者提供了深入研究和定制語音機器人功能的基礎,開發(fā)者可以根據(jù)不同的應用需求,對語音識別算法、語音合成引擎等進行優(yōu)化和改進。一對一的
    發(fā)表于 05-28 11:36

    普強信息入選2024語音識別技術公司TOP30榜單

    普強憑借在語音識別領域多年的技術積淀與持續(xù)的創(chuàng)新突破,成功入選“2024語音識別技術公司TOP3
    的頭像 發(fā)表于 04-18 17:25 ?1212次閱讀

    廠家芯資訊|廣州唯創(chuàng)電子語音識別芯片技術解析

    ?一、公司及產品概述作為國內領先的語音芯片研發(fā)企業(yè),深耕語音技術領域25年,其產品以高穩(wěn)定性、低功耗和多場景適應性著稱。公司推出的語音識別
    的頭像 發(fā)表于 03-19 08:46 ?805次閱讀
    廠家芯資訊|廣州唯創(chuàng)電子<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片<b class='flag-5'>技術</b>解析

    集成電路和光子集成技術發(fā)展歷程

    本文介紹了集成電路和光子集成技術發(fā)展歷程,并詳細介紹了鈮酸鋰光子集成技術和硅和鈮酸鋰復合薄膜技術
    的頭像 發(fā)表于 03-12 15:21 ?1967次閱讀
    集成電路和光子集成<b class='flag-5'>技術</b>的<b class='flag-5'>發(fā)展</b><b class='flag-5'>歷程</b>