国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

什么是無聲語音接口?

SSDFans ? 來源:SSDFans ? 2023-04-28 10:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

可穿戴設備依賴于具有標準物理能力的人機界面,如語音、觸摸或運動。雖然這種形式的機器交互適用于大多數消費者,但殘疾人可能很難或無法操作標準的可穿戴設備。為了使更多人能夠使用可穿戴設備,研究人員正在研究新的人機界面。

最近,康奈爾大學的一個團隊發表了一篇論文,描述了一副為不能發聲的用戶配備了無聲語音接口(SSI)的智能眼鏡。本文將討論無聲語音接口和來自康奈爾大學的可穿戴原型。

什么是無聲語音接口?

無聲語音接口(Silent speech interface,簡稱SSI)允許人們無需發聲就能與機器互動。雖然AI助手(如蘋果的Siri)等技術是通過聲音交流工作的,但SSI通過與語音相關的動作來完成交流。

SSI技術通過嘴巴和舌頭的運動而不是聲音來識別語音。為了做到這一點,SSI依賴于各種不同的傳感器,包括放置在嘴巴附近的振動傳感器,用于檢測人們嘴巴的振動,以及跟蹤和分類與語音相關運動的攝像頭。在許多情況下,這些信息會被機器學習算法處理,該算法會解釋嘴巴的動作,并將其翻譯成文字。

雖然大多數人可能找不到SSI的用途,但這項技術對于因疾病或受傷而失聲的人來說是必不可少的,可以讓他們更容易地交流。例如,患有聲帶損傷或影響語言的神經系統疾病的患者可以從SSI中獲益良多。

康奈爾大學開發無攝像頭SSI眼鏡

最近,康奈爾大學的研究人員在SSI技術方面取得了重大進展,發明了基于SSI的智能眼鏡。

該系統被稱為EchoSpeech,是一種新穎的、侵入性最小的SSI技術,它使用低功率有源聲學傳感來捕捉由無聲語音引起的細微皮膚變形,并將這些信息轉換為可操作的數據。這款智能眼鏡的原型建立在康奈爾大學之前對一種類似的聲學傳感可穿戴設備(“EarIO”)的研究基礎上,EarIO可以從耳朵內追蹤面部運動。

cf967ebe-e4fb-11ed-ab56-dac502259ad0.png

該系統依靠安裝在眼鏡框架上的一系列揚聲器和麥克風向皮膚發射聽不見的聲波。發出的聲波產生沿多條路徑傳播的回聲,并被系統解釋推斷為佩戴者的無聲語音。EchoSpeech完全可以在標準的智能手機上運行,只需要1到6分鐘的訓練數據,并以73.3 mW的低功耗實時運行。該團隊的深度學習算法可以實時分析回聲,準確率約為95%。

該系統通過12名用戶研究進行了評估,成功展示了識別31個獨立命令和三到六位連接數字的能力,單詞錯誤率(WER)分別為4.5%(標準3.5%)和6.1%(標準4.2%)。此外,在行走和噪聲注入等場景中測試了系統的魯棒性。

更私密、低功耗、易使用

大多數SSI技術使用面部攝像頭,從用戶和與其交流的人那里收集數據。除了造成隱私問題外,可穿戴攝像頭還會收集高帶寬視頻數據。

由于EchoSpeech不需要可穿戴攝像機,設備只捕捉音頻數據,這比圖像或視頻數據需要的帶寬要少得多,并且可以通過藍牙實時發送到手機。隱私信息永遠不會脫離用戶的控制,因為數據是在智能手機上本地處理的(不用在云中處理)。研究人員表示,純音頻傳感器的電池效率也更高:音頻傳感器可以工作10個小時,而攝像頭只能工作30分鐘。

康奈爾大學的研究小組表示,他們發現EchoSpeech在很多應用中都有應用價值,從默念密碼來解鎖智能手機,到跳過播放列表中的歌曲。該設備還可以與智能手機配對,在說話不方便的地方與他人交談,比如嘈雜的餐廳或安靜的圖書館。研究人員表示,該界面與手寫筆和CAD等設計軟件兼容,從而消除了對鼠標和鍵盤的需求。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人機界面
    +關注

    關注

    5

    文章

    564

    瀏覽量

    45608
  • SSI
    SSI
    +關注

    關注

    0

    文章

    40

    瀏覽量

    20146
  • 可穿戴設備
    +關注

    關注

    55

    文章

    3885

    瀏覽量

    170074

原文標題:什么?無聲語音接口?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    告別“無聲警示”短板,從智能語音提醒開始:解讀智能電網安全語音警示牌的“主動守護”

    一、什么是智能傳感器?作為守護電力設施的“電子哨兵”,智能電網安全語音警示牌是主動式安全防護技術在電力運維領域的重要應用。這一概念源于現代電網對“動態風險防控”的迫切需求。傳統的電力設施警示主要依靠
    的頭像 發表于 03-03 10:03 ?346次閱讀
    告別“<b class='flag-5'>無聲</b>警示”短板,從智能<b class='flag-5'>語音</b>提醒開始:解讀智能電網安全<b class='flag-5'>語音</b>警示牌的“主動守護”

    啟英泰倫越南語離線語音識別方案# 語音交互 #離線語音 #語音芯片

    語音芯片
    啟英泰倫
    發布于 :2026年03月02日 14:18:29

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,也叫語音識別集成電路,是一種集聲音存儲、播放、錄音及語音識別功能于一體的專用芯片。語音識別IC的核心功能在于實現語音識別,即讓
    的頭像 發表于 01-14 15:22 ?238次閱讀
    <b class='flag-5'>語音</b>識別IC分類,<b class='flag-5'>語音</b>識別芯片的工作原理

    什么是語音芯片串口AT指令?實現智能語音交互的核心技術詳解

    什么是AT指令AT指令是一套基于串行通信接口的標準化指令集,專門用于聲音播放芯片與其他設備之間的數據傳輸和控制操作。這種通信協議通過簡單的文本命令格式,實現了對語音
    的頭像 發表于 11-10 12:53 ?442次閱讀
    什么是<b class='flag-5'>語音</b>芯片串口AT指令?實現智能<b class='flag-5'>語音</b>交互的核心技術詳解

    無聲的守護者:醫療設備電源濾波器的生命線作用

    無聲的守護者:醫療設備電源濾波器的生命線作用|深圳維愛普
    的頭像 發表于 09-28 11:50 ?513次閱讀

    廣州唯創電子WTN6xxx-8S語音芯片:智能充電樁的語音提示完美解決方案

    的使用說明或面對無聲的操作流程,體驗不夠友好。據統計,清晰的語音提示可以降低40%以上的用戶操作錯誤率,并顯著提升用戶滿意度。廣州唯創電子的WTN6xxx-8S語音芯片以其出色的低功耗、
    的頭像 發表于 09-19 09:27 ?3493次閱讀
    廣州唯創電子WTN6xxx-8S<b class='flag-5'>語音</b>芯片:智能充電樁的<b class='flag-5'>語音</b>提示完美解決方案

    語音跳線和網絡跳線區別

    語音跳線和網絡跳線在傳輸信號類型、接口類型、線纜結構、應用場景等方面存在明顯區別,以下是詳細介紹: 傳輸信號類型 語音跳線:主要用于傳輸模擬語音信號,也就是我們日常打電話時所使用的聲音
    的頭像 發表于 06-27 10:09 ?947次閱讀

    芯知識|語音芯片發碼無聲解析:上電無聲、連發指令才響的三大根源及解決之道

    在嵌入式語音方案開發中,廣州唯創電子語音芯片(如WT系列)以其高性價比和易用性廣受青睞。但當開發者遭遇“上電發碼無聲”或“必須連發兩次指令才有聲音”的問題時,往往陷入調試困境。本文將深入剖析這些現象
    的頭像 發表于 06-19 09:14 ?918次閱讀
    芯知識|<b class='flag-5'>語音</b>芯片發碼<b class='flag-5'>無聲</b>解析:上電<b class='flag-5'>無聲</b>、連發指令才響的三大根源及解決之道

    芯知識|語音芯片“無聲之謎”:當DACL波形正常,功放開啟卻無聲音時……

    信號“通道沖突”這一關鍵陷阱。一、無聲故障的典型表現與診斷盲點“正常”的表象:工程師用示波器檢測語音芯片(如廣州唯創電子某型號)的關鍵引腳:供電電壓穩定,邏輯通信正常
    的頭像 發表于 06-13 08:53 ?1264次閱讀
    芯知識|<b class='flag-5'>語音</b>芯片“<b class='flag-5'>無聲</b>之謎”:當DACL波形正常,功放開啟卻<b class='flag-5'>無聲</b>音時……

    明遠智睿SSD2351開發板:語音機器人領域的變革力量

    連續的長句語音識別,還是復雜口音的處理,都能快速響應,保證語音機器人與用戶之間流暢的對話體驗。 其豐富的接口語音機器人的功能拓展提供了可能。USB
    發表于 05-28 11:36

    芯知識|廣州唯創電子藍牙音頻語音芯片IC通信接口配置與常見問題解析

    隨著智能硬件設備的快速發展,藍牙音頻語音芯片在智能家居、穿戴設備、車載電子等領域得到廣泛應用。廣州唯創電子推出的藍牙音頻語音芯片憑借其低功耗、高集成度和靈活的通信接口,成為許多開發者的選擇。然而,在
    的頭像 發表于 05-19 09:45 ?879次閱讀
    芯知識|廣州唯創電子藍牙音頻<b class='flag-5'>語音</b>芯片IC通信<b class='flag-5'>接口</b>配置與常見問題解析

    芯資訊|廣州唯創電子錄音語音芯片應用指南及常見問題解析

    、存儲及播放功能,但在實際應用中,用戶可能遇到錄音后播放無聲音的問題。本文將從技術原理、常見故障及解決方案展開解析。二、錄音語音芯片的工作原理唯創電子語音芯片的核心
    的頭像 發表于 05-16 08:41 ?590次閱讀
    芯資訊|廣州唯創電子錄音<b class='flag-5'>語音</b>芯片應用指南及常見問題解析

    明遠智睿SSD2351核心板在語音對講與HMI領域的創新應用

    在現代智能設備中,語音對講和HMI(人機界面)作為重要的交互方式,直接影響著用戶體驗。明遠智睿SSD2351核心板憑借其獨特的硬件特性和豐富接口,在這兩個領域實現了諸多創新應用。 在語音對講方面
    發表于 04-16 10:46

    labview語音轉文字

    labview語音轉文字怎么實現,目前在論壇上找到了文字轉語音
    發表于 04-07 19:44