国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

語音喚醒技術的對比,語音喚醒技術哪家強

語音技術智能匯 ? 來源:語音技術智能匯 ? 作者:語音技術智能匯 ? 2022-03-23 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編輯導語:

隨著語音交互技術的日漸成熟,越來越多的智能硬件都選擇增加語音能力作為產品賣點之一。但是,設備在進入語音交互工作狀態(tài)的時候,需要先進行喚醒操作。

常見的喚醒語音交互的操作有按鍵或者觸屏形式,但是,為了進一步降低學習成本和操作復雜度,也有不少的智能硬件選擇通過語音喚醒的方式來激活交互功能。

本文將綜合對比市面上各家提供的語音喚醒技術相關指標,可以幫助你快速掌握語音喚醒技術的情況。

一、語音喚醒技術的相關核心指標

1、喚醒率

語音喚醒的主要目的既然是激活設備進入交互工作狀態(tài),那么,喚醒率的高低就顯得額外重要了。理論上,最好的狀態(tài)就是我只要說一次喚醒詞,設備就能立即響應。不過,受說話人與設備距離、發(fā)音標準、噪聲等各種各樣的因素,實際工作中比較難達到次次響應的完美工作狀態(tài)。

一般來說,在近距離的安靜場景下,市面上的技術都能夠做到喚醒率在95%以上。

不過,消費者的實際使用場景是較復雜的,因此,需要模擬不同的應用場景進行實測,才能得到最后的喚醒率指標。

2、誤喚醒率

指設備被非喚醒詞喚醒的概率,誤喚醒率越高,效果越不好。

大家在日常生活中可能會經常碰到,放在家里的智能音箱,大晚上莫名其妙答一句“我在”,把人嚇個半死;還有如果家里用的智能電視,喚醒手機語音助手的時候,不是同一個喚醒詞,電視也會蹦出一句“我在”。

這就是典型的誤喚醒場景,一般用24小時被誤喚醒多少次來衡量。

3、響應時長

主要是指用戶說完喚醒詞后,設備給出反饋的耗時,一般越短越好。

而反饋的形式則比較多樣,可以通過語音應答響應、也可以通過亮屏或者指示燈閃爍響應。統計來看,如果是亮屏或者指示燈閃爍響應,控制在200ms以內用戶體驗較好;如果是語音應答響應,太快反而體驗不好,一般控制在500ms左右更佳。

4、功耗

主要是針對電池供電設備,理論上越低越好,這樣,設備的使用時長不會受到太大的影響。

因為喚醒的工作原理是會持續(xù)檢測聲音中是否包含喚醒詞的特定片段,所以,會持續(xù)耗電。

為了進一步降低功耗,部分產品也會采取DSP來完成語音喚醒,再通過AP層兜底的模式,保證喚醒和功耗的均衡。

總結:語音喚醒的技術指標,除了與算法相關之外,還與智能硬件的結構設計、芯片算力、使用場景等息息相關。最后的實際效果,則應以實際測試效果為準,參考下圖:

二、語音喚醒技術對比

該對比信息均從互聯網公開渠道獲取,相關信息來源于提供商官網公開信息,如其官網有更新,請以更新信息為準。(PS:百度搜索關鍵詞“語音喚醒”)

poYBAGI6i66AIXdTAAn5A2rKJxY710.png

三、喚醒詞的區(qū)別

喚醒詞的定義實際是比較廣泛,至少包含了四種使用場景:品牌喚醒詞(如,小飛小飛)、離線命令詞(如,我要聽周杰倫的歌)、云端命令詞(如,我要聽周杰倫的歌)、免喚醒詞(如,下一首、暫停)。這些使用場景,實際上都是使用了喚醒詞的原理,只是喚醒后執(zhí)行不同的動作。

四、語音喚醒項目實施要點

1、喚醒詞評估

大部分服務商都提供了喚醒詞評估服務,不過,有部分服務商對喚醒詞有一定的限制。因此,在選擇喚醒詞的時候,需要充分考慮品牌、發(fā)音特點、詞語等因素,綜合確定最終的喚醒詞。

2、確認測試環(huán)境和工具

以以往交付的喚醒項目來看,主要測試的環(huán)境包括:外噪場景測試、自噪場景測試、安靜場景測試和誤喚醒測試。

3、聲音采集

根據產品主要面向的使用人群,采集真人發(fā)音音頻。

示例:【某某投影儀音頻采集需求】

  • 采集人數200人,總音頻2000句
  • 男女比=1:1
  • 一人10句
  • 語速快:中:慢=1:3:1
  • 年齡兒童:青年:中年=1:3:1
  • 區(qū)域:北上廣深
  • 普通話

4、測試音頻處理

包括去除破音的音頻、去除時長>1.7s的測試音頻、音頻幅度歸一化。

5、數據記錄表

根據實測結果,如實填寫表格中對應測試結果,完成項目驗收。

如果需要更深入地咨詢了解,可添加筆者V:HolaAI,詳細交流。

審核編輯:符乾江

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 語音控制
    +關注

    關注

    5

    文章

    512

    瀏覽量

    29667
  • 語音交互
    +關注

    關注

    3

    文章

    350

    瀏覽量

    29170
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    MAC CE技術為什么能調整語音編碼速率

    隨著NR網絡的快速發(fā)展,5G語音業(yè)務快速增加,5G支持高清語音,需要從技術上讓語音編碼適應網絡覆蓋的技術,商用外場這種訴求越發(fā)強烈,VoNR
    的頭像 發(fā)表于 12-19 16:52 ?672次閱讀
    MAC CE<b class='flag-5'>技術</b>為什么能調整<b class='flag-5'>語音</b>編碼速率

    新品 | Module ASR,AI智能離線語音模塊

    新的指令。內置AEC(回聲消除),有效去除回聲和噪聲干擾,提升語音識別準確性。產品出廠時預設了53條英文喚醒詞和反饋命令詞,支持通過UART指令或語音關鍵詞喚醒
    的頭像 發(fā)表于 12-05 18:15 ?675次閱讀
    新品 | Module ASR,AI智能離線<b class='flag-5'>語音</b>模塊

    智能語音識別控制器是什么?圖形中文編程,多路設備控制

    智能語音識別控制器是一種融合語音識別技術、物聯網通信技術與設備控制模塊的智能終端設備,核心功能是將人類自然語言指令轉化為設備可執(zhí)行的電信號,實現對各類終端設備的
    的頭像 發(fā)表于 12-03 16:35 ?680次閱讀

    揭秘AI玩具“聽得清”的秘密!這幾款語音前端芯片撐起交互體驗天花板

    、混響,而主控SoC的算力/功耗/實時性都扛不住這些7×24的AEC+NR+Beamforming+喚醒運算;前端芯片把“干凈的人聲”先截出來,再送給主控或云端,才能保證打斷喚醒、低誤觸發(fā)、低功耗三樣同時成立。 ? 因此,目前AI玩具中,一款好的
    的頭像 發(fā)表于 10-17 08:42 ?1w次閱讀

    智能語音技術重新定義車載交互邊界

    憑借自主研發(fā)的智能語音技術,為某國內頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術
    的頭像 發(fā)表于 07-11 14:00 ?1165次閱讀

    智芯科超低功耗離線語音喚醒芯片的應用場景

    想讓設備無需聯網也能秒速響應語音指令?我們的超低功耗離線語音喚醒芯片正是答案!采用前沿技術,待機能耗近乎“休眠”,續(xù)航焦慮一掃而空,智能穿戴、智能家居等設備電量更持久。
    的頭像 發(fā)表于 07-08 10:24 ?1351次閱讀

    告別 “起床氣”!NV340D 語音芯片解鎖電子鬧鐘喚醒新體驗!

    在快節(jié)奏的現代生活中,電子鬧鐘作為我們每天清晨的“喚醒伙伴”,其重要性不言而喻。如今,隨著科技的飛速發(fā)展,電子鬧鐘也在不斷進化,功能日益豐富。而這背后,離不開關鍵技術——語音芯片的強力支持
    的頭像 發(fā)表于 07-05 11:09 ?1265次閱讀
    告別 “起床氣”!NV340D <b class='flag-5'>語音</b>芯片解鎖電子鬧鐘<b class='flag-5'>喚醒</b>新體驗!

    芯知識|廣州唯創(chuàng)電子WT2003H語音芯片:智能低功耗,喚醒隨心控

    在電池供電或對功耗敏感的語音應用場景中,WT2003H語音芯片憑借其精心設計的雙模式低功耗休眠架構,為開發(fā)者提供了靈活高效的節(jié)能解決方案,顯著延長設備續(xù)航時間。核心低功耗模式解析深度休眠模式
    的頭像 發(fā)表于 06-30 08:52 ?577次閱讀
    芯知識|廣州唯創(chuàng)電子WT2003H<b class='flag-5'>語音</b>芯片:智能低功耗,<b class='flag-5'>喚醒</b>隨心控

    語音助手只能聊天?啟明云端AI語音交互方案偷偷修煉了音樂才藝!

    設備演示:技術落地的全景呈現在實測場景中,搭載樂鑫科技ESP32-S3芯片的“賽博地平線”手辦伴侶率先登場,響應指令。通過深度整合豆包大模型,用戶通過喚醒詞即可實現
    的頭像 發(fā)表于 06-27 18:03 ?919次閱讀
    <b class='flag-5'>語音</b>助手只能聊天?啟明云端AI<b class='flag-5'>語音</b>交互方案偷偷修煉了音樂才藝!

    AI語音開發(fā)板AiPi-PalChatV1教程:常見問題

    集成度、高性價比等特性,支持 離線語音喚醒語音打斷 功能。 此款開發(fā)板結合 2W/8Ω 揚聲器與雙供電模式(Type-C + 電池),適用于快速部署語音交互能力的硬件創(chuàng)新場景,如
    的頭像 發(fā)表于 06-18 15:27 ?1064次閱讀
    AI<b class='flag-5'>語音</b>開發(fā)板AiPi-PalChatV1教程:常見問題

    可編程SLIC語音芯片哪家好?

    在當今數字化快速發(fā)展的時代,語音芯片的應用越來越廣泛,而可編程SLIC(用戶線路接口電路)語音芯片更是憑借其獨特的優(yōu)勢,受到眾多行業(yè)的青睞。那么,面對眾多的選擇,哪家的可編程SLIC語音
    的頭像 發(fā)表于 06-12 13:55 ?744次閱讀
    可編程SLIC<b class='flag-5'>語音</b>芯片<b class='flag-5'>哪家</b>好?

    小安AI語音板,“廣西表哥”強勢上線!

    集成度、高性價比等特性,支持 離線語音喚醒語音打斷 功能。 此款開發(fā)板結合 2W/8Ω 揚聲器與雙供電模式(Type-C + 電池),適用于快速部署語音交互能力的硬件創(chuàng)新場景,如
    的頭像 發(fā)表于 06-10 17:30 ?752次閱讀
    小安AI<b class='flag-5'>語音</b>板,“廣西表哥”強勢上線!

    芯資訊|基于廣州唯創(chuàng)電子語音芯片的煙霧報警器語音方案技術解析

    了三大煙霧報警器語音方案,覆蓋傳統、高集成度與智能化需求,為不同場景提供靈活選擇。以下從技術特性、應用場景及行業(yè)價值三方面展開分析。一、方案對比技術特性方案類型核
    的頭像 發(fā)表于 04-21 08:54 ?720次閱讀
    芯資訊|基于廣州唯創(chuàng)電子<b class='flag-5'>語音</b>芯片的煙霧報警器<b class='flag-5'>語音</b>方案<b class='flag-5'>技術</b>解析

    信息入選2024語音識別技術公司TOP30榜單

    憑借在語音識別領域多年的技術積淀與持續(xù)的創(chuàng)新突破,成功入選“2024語音識別技術公司TOP30”榜單。作為行業(yè)標桿,普
    的頭像 發(fā)表于 04-18 17:25 ?1207次閱讀

    零知開源——ESP32語音交互系統(AI小智)開發(fā)教程

    小智AI聊天機器人是一個基于嵌入式硬件與人工智能技術深度融合的智能交互系統。該項目以ESP32開發(fā)板為核心,結合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實現人機交互功能
    的頭像 發(fā)表于 03-29 15:33 ?1.2w次閱讀
    零知開源——ESP32<b class='flag-5'>語音</b>交互系統(AI小智)開發(fā)教程