国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

行動端及云端的語音辨識的成長推動嵌入式語音技術

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Todd Mozer ? 2022-10-26 15:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如今,語音技術領域的許多最大參與者也是手機操作系統(OS)市場的重量級人物。微軟是第一個建立語音團隊的軟件/移動操作系統巨頭。在1990年代早期,比爾·蓋茨(Bill Gates)宣揚語音用戶界面(VUI)的好處,并預測它們將在計算機上的人類界面中發揮作用。谷歌在21世紀初通過建立一支由語音技術專家組成的精英團隊而變得咄咄逼人,并通過其Android版本刺激了移動行業向語音界面和語音控制的方向發展。蘋果一直是用戶體驗之王,直到最近,由于準確性方面的挑戰,蘋果才避免推動語音技術。然而,隨著Siri(一種語音禮賓服務)的收購以及該公司的技術融入iPhone 4S,蘋果可能會通過語音迎來新一代的自然語言用戶體驗。

由于各種原因,語音技術對移動行業至關重要,主要是因為它比打字更容易說話,而且因為手機的外形尺寸是圍繞說話而不是打字而構建的。此外,隨著移動搜索的巨大收入潛力,移動操作系統提供商看到了在其技術組合中添加語音識別的價值。

為什么要嵌入?

VUI 的大部分繁重工作都是在云中完成的。這就是大型操作系統參與者的大部分投資去向的地方。云提供了一個具有幾乎無限的MIPS和內存的環境 - 這是高級語音搜索處理的兩個基本要素。隨著基于云的語音技術使用的增長,嵌入式領域似乎也出現了類似的趨勢。

嵌入式語音是在無法訪問云時啟用語音控制和輸入的唯一解決方案,這是增加用戶體驗的必要功能。嵌入式語音還具有消耗更少MIPS和內存的能力,從而提高了設備電池電量的效率。

客戶端/云語音使用的最佳方案需要在客戶端上激活語音,并在云上繁重地破譯文本和含義。這可以實現設備始終打開并始終偵聽的方案,因此可以給出并執行語音命令,而無需按客戶端上的按鈕。這種“無需手或眼睛”的范例在汽車中特別有用,出于安全目的和在家中的便利性。

例如,在最近推出的Galaxy SII Android手機中,三星的語音通話利用Sension的TrueHandsfree語音控制(一種嵌入式語音技術)來激活帶有“嘿銀河”字樣的手機。這個短語調用了Vlingo基于云的識別服務,該服務允許用戶在不觸摸手機的情況下發出命令和輸入文本。

語音識別可以在具有低至10 MIPS和數萬字節內存的設備上實現。Sensory的語音芯片系列包括基于8位微控制器RISC單芯片和利用小型嵌入式DSP的自然語言處理器。通常,在語音識別中投入的MIPS和內存越多,產品可以具有的功能就越多(更快的響應時間,更大的詞匯量和更復雜的語法)。

無論哪個平臺執行任務,語音識別的一般方法都是相似的。多年來,隱馬爾可夫建模和神經網絡等統計方法一直是語音識別的主要方法。從客戶端遷移到云允許部署統計語言建模和更復雜的技術。

維伊關卡

要創建真正免提、免眼的用戶體驗,必須解決幾個技術階段。

第 1 階段:語音激活

這實質上是取代按鈕按下。識別器需要始終處于打開狀態,準備好將階段 2 調用到運行狀態,并且能夠在非常嘈雜的情況下激活。第一階段的另一個關鍵標準是非??斓捻憫獣r間。鑒于超過幾百毫秒的延遲可能會產生由用戶在識別器偵聽之前與階段 2 交談而導致的準確性問題,因此語音激活的響應時間必須與按鈕的響應時間相同,這幾乎是瞬時的。簡單的命令和控制功能可以通過 Stage 1 識別系統或更復雜的 Stage 2 系統嵌入到客戶端中,該系統可以嵌入或基于云的。

第 2 階段:語音識別和轉錄

更耗電且功能更強大的 Stage 2 識別器可將所講的內容轉換為文本。如果目的是短信或語音撥號,則該過程可以在此處停止。如果用戶希望回答問題或訪問數據,系統將進入第 3 階段。由于 Stage 1 識別器可以響應高噪聲,因此它可以降低汽車收音機或家用 AV 中的音量,以協助階段 2 識別。

第 3 階段:意圖和意義

這可能是這一過程中最大的挑戰。文本翻譯準確,但它是什么意思?例如,互聯網搜索所需的查詢是什么?今天的“智能”可能會嘗試修改搜索,以更好地滿足用戶的需求。然而,計算機在弄清楚意圖方面非常糟糕。蘋果的Siri智能助手是在國防部資助的CALO項目下開發的,該項目涉及300多名研究人員,可能是當今智能詮釋的最佳典范。

第 4 階段:數據搜索和查詢

根據查詢的不同,搜索數據并找到正確的結果可能很簡單,也可能很復雜。映射數據和方向可能是可靠的,因為語法很容易理解,并具有地圖搜索的明確目標。隨著谷歌和其他搜索提供商在數據搜索功能上投入大量資金和時間,這一階段將繼續改善。

第 5 階段:語音響應

對查詢的語音響應是顯示響應的一個很好的替代方法,這可能會導致駕駛員將視線從道路上移開或給家中帶來不便。當今最先進的文本到語音轉換系統具有高度的可理解性,并且已經發展到比以前的自動語音系統聽起來更自然。

為什么嵌入式識別器在第 1 階段替換按鈕需要這么長時間?

語音識別傳統上需要按鈕激活而不是語音激活。其主要原因是按鈕雖然分散了注意力,但即使在嘈雜的環境中也是可靠且響應迅速的。這些類型的環境(如汽車或繁忙的家庭)對語音識別器來說可能具有挑戰性。聲控詞必須在汽車(車窗關閉、收音機打開和道路噪音)或家中(嬰兒哭泣、音樂或電視打開以及電器運行)中創建響應,而無需用戶為其工作。因此,直到最近,只有當用戶處于安靜的環境中,麥克風靠近嘴巴時,語音技術才是可靠的。

快速響應時間的要求使這一挑戰進一步復雜化。語音識別器通常需要數百毫秒才能確定用戶在開始處理語音之前是否完成了通話。這種時間延遲可能是可以接受的,從識別系統產生答案或回復給消費者。但是,在第 1 階段,激活的響應是在階段 2 中調用另一個更復雜的識別器,并且使用者不會接受持續時間遠遠超過按下按鈕所花費的時間的延遲。延遲時間越長,階段 2 發生識別失敗的可能性就越大,因為用戶可能會在階段 2 識別器準備好收聽之前開始說話。

嵌入式語音技術的最新進展,如Sensory的真無握語音接口,無需觸摸設備即可提供真正的VUI。這些技術消除了嘈雜環境中固有的問題以及較長的響應時間,使語音激活可行,準確且更方便。

消費電子產品中語音的未來

許多年前,電視觀眾不得不站起來走到他們的單位來改變頻道。遙控器的到來結束了這一切,今天沒有人會買沒有遙控器的電視。盡管如此,我們仍然站起來,走到我們的大多數計算設備使用它們。隨著語音識別的改進,這將不再是必需的。

帶有語音觸發器的免提設備的快速使用將發展成為智能設備,這些設備可以傾聽我們所說的內容,并決定何時適合從客戶端轉到云端。他們還將決定何時以及如何回應,可能會演變成坐在后臺傾聽一切并決定何時提供幫助的助手。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 嵌入式
    +關注

    關注

    5200

    文章

    20458

    瀏覽量

    334312
  • Android
    +關注

    關注

    12

    文章

    4026

    瀏覽量

    134040
  • 計算機
    +關注

    關注

    19

    文章

    7809

    瀏覽量

    93230
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    XMOS推出專為嵌入式語音交互功能開發提供的全新線上選型指南

    中國北京,2026年2月——生成系統級芯片(GenSoC)領先開發者及音視頻媒體處理AI技術提供商XMOS正式發布其語音方案選型指南,該款高效易用的網上音頻交互解決方案開發平臺以互動
    的頭像 發表于 02-25 09:48 ?360次閱讀
    XMOS推出專為<b class='flag-5'>嵌入式</b><b class='flag-5'>語音</b>交互功能開發提供的全新線上選型指南

    側大模型上車:從“語音助手”到“車內 AI 智能體”的躍遷革命

    2025年,智能汽車的座艙不再只是“語音助手”的舞臺,而是一個搭載生成AI和大語言模型(LLM)的智能體。從云端示范到車內落地,這一跨越不僅改變了人機交互的邊界,更重構了汽車作為“第三
    的頭像 發表于 01-13 09:10 ?486次閱讀

    國產32位MCU語音識別方案

    在智能家居、工業控制及便攜設備領域,語音交互正成為人機界面的重要發展方向。針對離線語音識別需求,基于國產32位MCU的解決方案日益成熟,其中以CH32V307等為代表的32位MCU芯片,憑借高集成度與專用優化,為嵌入式設備提供了
    的頭像 發表于 12-04 15:11 ?546次閱讀

    什么是離線語音識別芯片(離線語音識別芯片有哪些優點)

    離線語音識別芯片,是一種集成了語音信號采集、前端處理和本地識別功能的專用集成電路,無須聯網也可以進行語音控制。它內設先進的數字信號處理模塊及人工智能語音算法,無須依賴
    的頭像 發表于 10-31 15:27 ?524次閱讀

    語音交互數據 精準賦能語音大模型進階

    語音大模型從“能識別”向“懂語境”跨越的關鍵階段,高質量場景化語音數據已成為制約技術突破的核心瓶頸。傳統語音識別數據集采用孤立標注,在語音
    的頭像 發表于 09-11 17:17 ?748次閱讀

    廣和通發布自研語音識別大模型FiboASR

    7月,全球領先的無線通信模組及AI解決方案提供商廣和通,發布其自主研發的語音識別大模型FiboASR。該模型專為側設備上面臨的面對面實時對話及多人會議場景深度優化,在低延遲語音交互、實時語音
    的頭像 發表于 08-04 11:43 ?1614次閱讀

    云協同解鎖智能硬件新體驗,啟明云端正式登陸阿里云云市場

    2025年7月,阿里云戰略產品伙伴——“啟明云端”正式登陸阿里云云市場平臺消費電子專區。啟明云端作為國內領先的AI智能體硬件方案專家,在嵌入式系統、語音交互硬件及
    的頭像 發表于 07-09 18:03 ?1352次閱讀
    <b class='flag-5'>端</b>云協同解鎖智能硬件新體驗,啟明<b class='flag-5'>云端</b>正式登陸阿里云云市場

    語音助手只能聊天?啟明云端AI語音交互方案偷偷修煉了音樂才藝!

    語音助手只能聊天?太out了!”語音交互的新樂章已經奏響!啟明云端基于樂鑫科技芯片的AI語音方案正式解鎖音樂技能樹,只需一句指令,智能設備即刻變身專屬點唱機。只要版權到位,想聽什么?
    的頭像 發表于 06-27 18:03 ?931次閱讀
    <b class='flag-5'>語音</b>助手只能聊天?啟明<b class='flag-5'>云端</b>AI<b class='flag-5'>語音</b>交互方案偷偷修煉了音樂才藝!

    【米爾-RK3562開發板試用評測】RK3562J開發板-語音識別功能測試(一)

    主要開發語言(系統已預裝或手動安裝) ??模型框架?? 采用 ??Vosk?? 離線語音識別框架 優勢:支持嵌入式場景,資源占用低 ??模型文件準備
    發表于 05-17 21:29

    飛凌嵌入式2025嵌入式及邊緣AI技術論壇圓滿結束

    飛凌嵌入式「2025嵌入式及邊緣AI技術論壇」在深圳深鐵皇冠假日酒店盛大舉行,此次活動邀請到了200余位嵌入式技術領域的
    的頭像 發表于 04-28 13:57 ?4150次閱讀
    飛凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及邊緣AI<b class='flag-5'>技術</b>論壇圓滿結束

    飛凌嵌入式2025嵌入式及邊緣AI技術論壇圓滿結束

    4月22日下午,備受矚目的飛凌嵌入式「2025嵌入式及邊緣AI技術論壇」在深圳深鐵皇冠假日酒店盛大舉行,此次活動邀請到了200余位嵌入式技術
    的頭像 發表于 04-27 11:55 ?817次閱讀
    飛凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及邊緣AI<b class='flag-5'>技術</b>論壇圓滿結束

    飛凌嵌入式「2025嵌入式及邊緣AI技術論壇」議程公布

    4月22日,飛凌嵌入式“2025嵌入式及邊緣AI技術論壇”將在深圳舉行,論壇以“新生態,智未來”為主題,旨在匯聚行業智慧,探討嵌入式技術與邊
    的頭像 發表于 04-02 15:12 ?1375次閱讀
    飛凌<b class='flag-5'>嵌入式</b>「2025<b class='flag-5'>嵌入式</b>及邊緣AI<b class='flag-5'>技術</b>論壇」議程公布

    嵌入式去哪個城市好?

    豐富的項目和資源。知名企業如華為、百度、小米等都在北京設有研發中心,積極推動嵌入式技術的應用與發展。北京的創業氛圍濃厚,初創公司專注于嵌入式技術
    發表于 04-02 10:12

    新生態 智未來「飛凌嵌入式2025嵌入式及邊緣AI技術論壇」開啟報名!

    在這個技術日新月異的時代,每一場思想的碰撞都可能成為推動行業前行的力量,每一次深度對話都可能迸發出改變時代的強光——2025年4月22日,飛凌嵌入式將在深圳舉辦“2025嵌入式及邊緣A
    的頭像 發表于 03-28 08:05 ?1246次閱讀
    新生態 智未來「飛凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及邊緣AI<b class='flag-5'>技術</b>論壇」開啟報名!

    新品發布|啟英泰倫聯合啟明云端推出離在線語音大模型方案

    數據及大規模計算任務帶來的響應延遲。其根本原因在于缺乏一顆強計算性能的語音處理芯片。近日,啟英泰倫聯合啟明云端正式推出WT01C202-AI-S1高性能離在線語音
    的頭像 發表于 03-11 14:07 ?1298次閱讀
    新品發布|啟英泰倫聯合啟明<b class='flag-5'>云端</b>推出離在線<b class='flag-5'>語音</b>大模型方案