国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺談 聲音人機交互技術

電子工程師 ? 來源:搜狐 ? 作者:搜狐 ? 2021-03-23 10:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如果你同時保留著看電視和聽廣播這兩個習慣——或者,看視頻網站的同時會去找些播客節目聽聽,那么你一定會注意到一個顯著的區別:視頻節目的豐富程度和制作上的復雜度遠高于音頻節目。例如,《新聞聯播》的片頭20多年換了四五次,體現了電視技術的最新進步,但片頭音樂一直不變,人們也能接受。電視節目的攝影棚幾年就得來一次大翻新,但現在的廣播電臺依然可以使用十幾年前的音頻制作系統來播出節目,直播間里的時光仿佛停滯一般。

人類在同一時刻用眼睛可以接收的信息量遠高于用耳朵能接收到的,視覺可以判別空間位置、形狀和顏色疊加起來的豐富信息,比聽覺高了不止一個維度。在看到人說話的時候,我們接收到的不只是話語內容,還包括人的面部特征和表情的細微變動,這都對氛圍和情緒有著潛移默化的影響。相應的,聽覺接收到的話語內容可以用手語或者字幕替代,但視覺附加的更多信息卻難以轉化回音頻。

歷史上,圖書和報紙已經給了人們在視覺信息接收方面的訓練,人們將排版經驗延伸到電影和電視上。盡管留聲機和電影技術幾乎處于同一時代,但人們卻寧愿忍受很多年沒有同期聲的無聲電影時代,寧愿用隨便什么音樂放一下做背景了事。可見,人們習慣上對圖像比對聲音重視得多。

同樣,信息時代的到來也毫不例外的優先偏愛圖像。90年代電腦同時具備獨立的顯卡和聲卡,技術進步之后,人們對聲卡抱著無所謂的態度,卻追求獨立顯卡和屏幕的畫質,以至于追求手機攝像頭的精度。在交互方面,大家非常注重GUI(圖形用戶界面),而對于聲音的設計處理一般比較馬虎,還停留在很多年前的水平。

隨著智能手機帶來的趨勢,一塊巨大的觸屏成為人們交互的全部載體,跑在上面的應用也隨著一股奇怪的扁平化風潮而變得越來越樣式單一,設計師為了與眾不同又好用的界面而絞盡腦汁。對于音頻而言,它終于迎來了走出冷宮的機會。人機交互的下一波趨勢,將很可能在聲音——而不是圖像——方面迎來突破。

聲音不重要,還是人們沒發現它的重要?

“在汽車出現之前,人們都以為自己想要一臺更快的馬車。”這句話大家也許都很熟悉。在iOS 7和微軟Metro界面出現之后,一夜之間各種UI設計都趨向于扁平,而流行多年的擬物化設計很快就退潮了。這表明,人們的審美態度是可以因為外界的強力驅動而受到很大的改變的,并不是一成不變。所以對音頻交互也是如此:并不是說聲音相對于圖像而言不重要,而是需求沒有得到很好的引導。

聲音有什么好處?它是否有足夠潛力成為不可替代的載體呢(為什么我們獲得的是相反的信號,比如交通廣播電臺即將被打車軟件的搶單聲埋葬)?

首先,習慣聲音交互可以讓我們的感覺器官均衡利用,換句話說就是保護眼睛。長期使用手機,比如在地鐵盯著屏幕或者睡覺之前刷屏,會出現很多健康問題,其實不僅限于眼睛,手持閱讀介質的姿勢不同,全身都可能受影響。

而且,作為必須全神貫注進行的活動,閱讀(包括觀看視頻)需要完全沉浸進去,和外界隔離,引發的心理問題也不容忽視。不管是閱讀長文還是碎片化消息,眼睛接受的信息量通常過大,人們接受了過量的信息,以至于形成信息過載而不自覺。

使用聲音可以讓人們強制減少信息攝入量,并更自如的利用碎片時間。對孩子而言,聲音(不使用耳機)也是一種親切自然的交互方式,有助于讓孩子早期就接觸電腦,而不用擔心用眼,孤獨等副作用。

此外,隨著我們使用智能設備的“戶外場景”增多,就像這個年頭智能手表終于迎來了春天一樣,為短信息和免提式交互量身定制的聲音也會派上更大用場。戶外場景其實主要就是開車或者是提著東西走路。在這種情況下,顯然眼睛就只是拿來看路才更合適。

一個例子是,交通電臺提交路況信息,從原來的短信平臺改為用微信公眾號發送語音,電臺會直接播出上傳的語音。這樣,司機可以不停車,用藍牙耳機播報路況,讓整個交流過程更像是真正的無線電臺一樣。

最后,聲音可以極大的幫助視障人士走入信息化。如果不是親身接觸,你根本無法想象視覺在如今的交互中占有如何舉足輕重的地位。完全不用眼睛的網頁瀏覽,必須忍受讀屏軟件以飛快到基本聽不清的速度給你播報每一個文字和圖片信息,而很多圖片都沒有妥當的文本標簽,在沒有充分無障礙化的頁面,比如淘寶店鋪,使用者就會完全陷入迷茫。

在幫助文本信息轉語音,方便視障人士方面,騰訊可能是國內公司中嘗試時間最長的公司,QQ2010正式支持讀屏軟件并延續至今,其他應用如QQ音樂也增加了支持。隨著語音命令可用范圍進一步擴大,電腦之門將會更廣闊地對盲人朋友敞開。

讓基于聲音的人機交互變得更自然

擬人的聲音交互現在來到一個艱難的瓶頸期。著名的“恐怖谷理論”認為,當機器人與人類相像超過一定程度的時候,哪怕與人類有一點點的差別,都會顯得非常顯眼刺目,讓整個機器人顯得非常僵硬恐怖,讓人有面對行尸走肉的感覺。

在廠商跟風推進語音助手成為所有手機、手表的標準配置之后,它正逐步降低人們的心理障礙,培養使用習慣。如上所述,對待機器我們很自然的操作方式是“動手不動口”,對著機器說話會感覺很奇怪。但是調戲Siri或者小娜,已經一定程度上在幫我們克服這種障礙。

這就給語音助手進一步提升智能程度贏得了寶貴的時間。等到一個真正如人類一般智能的聲音出現時,人們對于對著電腦傾訴,侃侃而談,就不會太排斥,電影《Her》當中出現的戀上機器聲音的情節,也會獲得更多用戶的共鳴。

如果一個虛擬的人類聲音始終會讓人心生抗拒,那最理想的辦法是機器直接執行人類短促簡單的語音命令。比如說你走到家門說開門,那么就只是把門打開,不會有什么多余的回應說“好的,我這就把門打開”。

另一種可行的辦法是讓機器用“顯然不是普通人類”的聲音與人交互,比如現在還有點“單字蹦”的Siri和谷歌娘,或者故意用萌化的聲音說“主人回家了喵”,類似這樣的方法其實就是在智能不到位的時候用裝傻賣萌來補充。既然不像真人,也就沒有必要感到不舒服了。

技術進步和概念創新可以互相驅動

當我們站在現在回顧iPhone出現之前的手機市場,我們會發現,現在的應用形態有很多是當年不可想象的。這當中很多更新都基于硬件交互方式的改進,比如多點觸摸,GPS、NFC/RFID和各種感應器的協同作用。所以我們有同樣的信心認為,只要用心去開發語音的交互功能,就會出現更多我們現在無法想象的新的交互方式。

有時候,當新的交互到來的時候,我們才會驚奇的發現為其鋪墊的技術因素已經成熟;而只要出現一個合理的產品,它起到的標志性作用就會引導業界進行自主革新,提升性能和降低成本。

在聲音交互方面,Siri就是一個很好的例子。它需要輸入和輸出技術——語音識別和文字轉語音共同配合。而Siri出現的時候,這兩種技術都已經到了接近能用的程度——就中文而言,語音播報不再那么“單字蹦”了,而多種第三方語音引擎的識別率更可以在安靜環境下達到90%以上,并順理成章成為眾多山寨Siri的選擇。它的結果就是廠商跟風推進語音助手成為所有手機、手表的標準配置。

不管是可穿戴設備,還是普通的電腦,是家庭游戲機或客廳的機頂盒,以至于智能家居和汽車,聲音交互都是非常有用的。但是截至目前,人們對于它的探索還是非常被動。比如說,只有當智能手表在輸入上出現障礙的時候才想到用語音輸入,而并非主動的探索用語音作為屏幕顯示的替代方案。所以,如果進一步整合現有技術,能夠給我們帶來一個具有示范作用的應用,就會顯著加速業界對聲音交互場景的研究。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • RFID
    +關注

    關注

    392

    文章

    6918

    瀏覽量

    248292
  • gps
    gps
    +關注

    關注

    22

    文章

    3030

    瀏覽量

    173562
  • nfc
    nfc
    +關注

    關注

    62

    文章

    1735

    瀏覽量

    185647
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從“人機交互”到“數字預演”:詳解 HMI、SCADA 與虛擬調試的閉環架構

    從“人機交互”到“數字預演”:詳解 HMI、SCADA 與虛擬調試的閉環架構
    的頭像 發表于 03-05 11:36 ?110次閱讀
    從“<b class='flag-5'>人機交互</b>”到“數字預演”:詳解 HMI、SCADA 與虛擬調試的閉環架構

    河南移動榮獲2025年度ICT優秀案例人機交互卓越創新突破方案

    案例”之人機交互卓越創新突破方案。這一殊榮不僅是行業對該解決方案創新性與領先性的權威認可,更標志著我國通信產業在人機交互與體驗經營領域實現關鍵突破,樹立行業標桿。
    的頭像 發表于 02-26 13:57 ?321次閱讀

    中科創達旗下Rightware攜手高通發布智能汽車人機交互解決方案

    在2026年國際消費電子展(CES 2026)上,中科創達旗下Rightware攜手高通技術公司正式發布了一款具有開創性的智能汽車人機交互(HMI)解決方案——IntelliSphere
    的頭像 發表于 01-16 14:59 ?1960次閱讀

    CIE全國RISC-V創新應用大賽 呼吸機人機交互系統

    原有呼吸機人機交互系統基于 imx6Q 芯片進行設計開發,為進一步優化系統性能、降低硬件成本,并拓展硬件的擴展性與兼容性,本次試用選擇進迭時空的 MUSE Pi Pro 開發板進行適配改造,目標
    發表于 11-12 15:07

    眼電EOG人機交互會是未來交互的一種主流嗎?

    HUIYING基于眼電的人機交互系統概述基于眼電(EOG)的人機交互系統(HMI)的研發源于對非侵入式、高精度且持久可穿戴的醫療輔助設備的需求。傳統人機交互方式如觸摸屏、操縱桿或基于肌電(EMG
    的頭像 發表于 11-07 18:01 ?5919次閱讀
    眼電EOG<b class='flag-5'>人機交互</b>會是未來<b class='flag-5'>交互</b>的一種主流嗎?

    重構未來自適應人機交互的創新技術

    人機交互的概念可以追溯到工業革命時期,在當時機器開始取代人類勞動。然而,直到20世紀中葉,人機交互領域才受到廣泛關注。人機界面(HMI)是人與機器之間交互的關鍵點,形成了用戶可以控制復
    的頭像 發表于 10-31 16:30 ?1282次閱讀
    重構未來自適應<b class='flag-5'>人機交互</b>的創新<b class='flag-5'>技術</b>

    大模型驅動下的人機交互革命,“超擬真人互動”?讓玩具讀懂你的情緒

    ,全方位重構了智能硬件的人機交互范式,為行業提供了從技術底層到商業應用的完整路徑。 ? 從人機交互技術演進邏輯來看,經歷了文本交互(CUI
    的頭像 發表于 10-31 09:21 ?6451次閱讀
    大模型驅動下的<b class='flag-5'>人機交互</b>革命,“超擬真人互動”?讓玩具讀懂你的情緒

    邊聊安全 | 人機交互對功能安全的影響

    上海磐時PANSHI“磐時,做汽車企業的安全智庫”人機交互對功能安全的影響HMI,HumanMachineInterface,也就是大家熟知的人機接口。近年來,HMI的功能也隨著汽車智能化的發展
    的頭像 發表于 09-05 16:21 ?21次閱讀
    邊聊安全 | <b class='flag-5'>人機交互</b>對功能安全的影響

    串口屏:重塑人機交互的開發革命

    。我們致力于通過技術創新,讓每個設備都能擁有出色的用戶界面,讓創意不再受技術限制。 探索串口屏的無限可能,開啟人機交互新紀元
    發表于 08-28 14:56

    人機交互:連接人類與數字世界的橋梁

    )等技術的發展,人機交互已經從傳統的鍵盤鼠標操作,演進為語音識別、手勢控制、腦機接口等更自然、更智能的交互方式。 ? 人機交互的發展歷程 早期的人機
    的頭像 發表于 08-11 15:21 ?2085次閱讀

    蘇州唯理科技神經腕帶肌電臂環人機交互演示

    人機交互
    jf_74911425
    發布于 :2025年07月08日 22:02:34

    中山大學:用于呼吸識別和非接觸式人機交互的均勻快速響應濕度場傳感陣列的可擴展制備

    后疫情時代,公共場合的接觸式人機交互(Human-Machine Interaction, HMI)界面因需物理接觸存在讓人們感染病毒的風險。相比之下,基于濕度傳感器的非接觸式交互技術可有效規避此類
    的頭像 發表于 06-07 16:15 ?742次閱讀
    中山大學:用于呼吸識別和非接觸式<b class='flag-5'>人機交互</b>的均勻快速響應濕度場傳感陣列的可擴展制備

    聲智科技全球首發新一代人機交互框架

    全球人工智能產業正經歷人機交互范式升級。過去兩個月中,以OpenAI、Meta為代表的行業領軍企業加速推進交互技術創新迭代,推動產業進入關鍵變革期。值得關注的是,a16z合伙人Olivia
    的頭像 發表于 05-12 10:28 ?1088次閱讀
    聲智科技全球首發新一代<b class='flag-5'>人機交互</b>框架

    聲學技術如何重構人機交互生態

    人機交互的底層邏輯。隨著非線性聲學計算與強化學習的深度融合,聲音交互正從“聽得見”邁向“聽得懂”,并逐漸成為 AI 時代的重要接口。
    的頭像 發表于 04-14 13:50 ?1346次閱讀

    愛普生XV7021BB陀螺儀傳感器在人機交互中的應用

    在元宇宙、智能穿戴與工業自動化加速融合的今天,人機交互的核心挑戰已從“功能實現”轉向“體驗升維”。愛普生XV7021BB單軸陀螺儀傳感器憑借±400°/s高精度角速度測量0.0016°/s/°C
    的頭像 發表于 04-01 14:13 ?1155次閱讀
    愛普生XV7021BB陀螺儀傳感器在<b class='flag-5'>人機交互</b>中的應用