国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新技術(shù)正在快速推動語音生成設(shè)備的進(jìn)步

mK5P_AItists ? 來源:未知 ? 作者:胡薇 ? 2018-11-11 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語言是我們?nèi)粘=涣鞯闹饕绞剑梢宰屛覀兛焖倭私鈱Ψ降囊鈭D,并做出適當(dāng)?shù)姆磻?yīng)。但對很多語言障礙者而言,說話這一看似簡單的行為依舊是難以想象的困難。

語言是件極其復(fù)雜的事情,不僅僅是文字表面上的發(fā)音,還與音量、音調(diào)、速度、說話環(huán)境等眾多因素密切相關(guān)。

同一個詞或句子,在不同的場合、不同的音量和速度,所表達(dá)的意義也是不同的。比如“你吃了么?”,可以是兩人見面的問候語;也可以是我正準(zhǔn)備去吃飯,如果你沒吃,我們可以結(jié)伴去吃飯;還可以是戀人間的關(guān)懷;甚至可以是小孩子玩游戲時,跟玩偶的對話。

語言環(huán)境是如此的復(fù)雜,而對于那些因受傷或生病而無法說話的人,我們怎樣才能更好的理解他們的想法?他們又如何能更快更有效的表達(dá)自己的意圖?

自20世紀(jì)60年代以來,一些語音技術(shù)的先行者就致力于研發(fā)語音生成設(shè)備(SGDs)來幫助語言障礙者。

1963年,英國人Maling和Clarkson開發(fā)了專為嚴(yán)重身體殘疾的人設(shè)計的個人通信工具POSSUM,這是一臺帶開關(guān)控制掃描裝置的打字機(jī)。

自此,隨著語音合成算法的進(jìn)步及微處理器技術(shù)的發(fā)展,電子輔助和替代通信系統(tǒng)(AAC)得以快速普及。通信輔助設(shè)備也變得越來越小巧,功能也越來越強(qiáng)大。

目前,電子輔助和替代通信系統(tǒng)(AAC)、語音生成設(shè)備(SGDs)、語音輸出通信輔助設(shè)備(VOCA)已經(jīng)在美國幫助了200多萬人。患有肌萎縮性側(cè)索硬化癥(ALS)、腦癱、閉鎖綜合征、多發(fā)性硬化癥、帕金森、腦中風(fēng)、創(chuàng)傷性腦損傷等交流障礙或殘疾人都可以使用這類語音生成設(shè)備。著名物理學(xué)家史蒂芬·霍金就使用語音生成裝置與他人進(jìn)行交流。

在過去幾年中,隨著人工智能技術(shù)與語音技術(shù)的突破,以及數(shù)字設(shè)備功能的指數(shù)級增長,數(shù)字化語音正在改變?nèi)藗兊慕涣鞣绞剑貏e是翻譯和醫(yī)療等領(lǐng)域。

據(jù)相關(guān)數(shù)據(jù)顯示, 2017年,語音生成設(shè)備市場規(guī)模為1.9億美元,預(yù)計到2025年將達(dá)到3.3億美元。

各科技創(chuàng)新公司和谷歌、微軟等科技巨頭都在努力通過輔助應(yīng)用APP、語音生成設(shè)備和腦機(jī)接口技術(shù)幫助語言障礙者能夠更有效地與他人進(jìn)行交流。

1)輔助應(yīng)用APP

智能手機(jī)、平板電腦和數(shù)字觸摸屏為患者提供更加直接的交流方式。如自閉癥患者可以通過觸摸屏上的物品圖像、活動圖片或符號來表達(dá)他們的需求。

Proloquo2Go就是這樣一款面向語言障礙患者的輔助交流工具,適用于自閉癥、唐氏綜合癥、腦癱和其他診斷患者,目前已有20多萬用戶。

此外,還有很多APP可以幫助用戶“說話”,如SayIt!和Predictable這兩款文字處理應(yīng)用,可以將用戶輸入的文字內(nèi)容轉(zhuǎn)化成語音,并具有智能聯(lián)想和自動更正單詞的功能。

MyTalkTools Mobile是由一位父親開發(fā)的,以幫助他兒子克服通信困難,他的兒子出生時患有Nager綜合癥,這是一種影響聽力、言語和其他能力的罕見疾病。目前該軟件已擁有超過10萬名用戶。

2017年初,微軟推出了GazeSpeak應(yīng)用程序,幫助肌萎縮性側(cè)索硬化(ALS)患者用眼球運(yùn)動進(jìn)行溝通。該應(yīng)用通過手機(jī)攝像頭跟蹤患者的眼睛運(yùn)動,并用AI進(jìn)行字詞預(yù)測。

2)語音生成設(shè)備

機(jī)器學(xué)習(xí)、自然語言處理和文本預(yù)測技術(shù)極大地推動輔助通信技術(shù)的發(fā)展,語音合成應(yīng)用可以為用戶提供定制化、個性化的服務(wù)。

語音生成設(shè)備可以將單詞或圖片轉(zhuǎn)化成語音,比輔助應(yīng)用APP更加先進(jìn)。某些產(chǎn)品允許用戶可以從幾種不同的聲音中進(jìn)行選擇,例如男性或女性,兒童或成人,甚至可以選擇一些地域口音。某些算法模型可以追蹤患者眼睛運(yùn)動或頭部運(yùn)動來進(jìn)行詞匯選擇,并合成語音。

Pocket Go Talk是一款可穿戴的小型便攜式AAC設(shè)備,也可以在桌面使用,具有五種可調(diào)節(jié)的掃描速度。通過5個易操作的按鈕生成25條語音消息,每條語音可以長達(dá)12秒。

便攜式輔助書寫平板MegaBee是在英國斯托克曼德維爾醫(yī)院的閉鎖綜合征患者的幫助下研發(fā)出來的。通過眼球運(yùn)動和閃爍作為選擇字母或短語的方法,然后在屏幕上顯示,從而幫助中風(fēng)、多發(fā)性硬化癥、運(yùn)動神經(jīng)元疾病患者及其它語言障礙患者進(jìn)行交流。

還有很多新興科技公司正在利用機(jī)器人技術(shù)提升患者的社交能力。盧森堡機(jī)器人公司LuxAI推出適用于自閉癥兒童的社交機(jī)器人QTrobot,實驗證明,該機(jī)器人可以明顯增加自閉癥兒童的注意力和參與度,同時減少他們的焦慮和破壞行為。

美國波士頓公司VocalID利用眾包和語音混合技術(shù)為語言障礙患者提供個性化的合成語音。目前已有110多個國家的超過14000人為公司的語音庫The Human Voicebank提供了600多萬句話。

2017年,谷歌宣布神經(jīng)網(wǎng)絡(luò)模型WaveNet正式商用于Google Assistant中,比初始模型效率提高了1000倍,可以更好地模擬自然語音。該模型可以根據(jù)真實的人類語音對音頻波形進(jìn)行建模分析,從中學(xué)習(xí)并創(chuàng)建自己的聲音。

3)代表未來的腦機(jī)接口

意念交流是很多科幻小說和電影里的場景,而現(xiàn)在科研人員正在通過腦機(jī)接口技術(shù)將之變成現(xiàn)實。

早在1998年,英國雷丁大學(xué)的研究員Kevin Warwick博士在自己的手臂上植入一個發(fā)射器來控制門和其它裝置。2002年,他將電極接入自己的神經(jīng)系統(tǒng),以便用思維控制輪椅,并允許遠(yuǎn)程機(jī)器人手臂模仿他的手臂動作。

Warwick博士的目標(biāo)是幫助語言障礙患者進(jìn)行溝通,他將一個芯片植入他妻子的手臂,通過互聯(lián)網(wǎng)將兩人的大腦聯(lián)系在一起,創(chuàng)造了世界上第一個腦—腦電子通信。

2012年,美國因中風(fēng)而癱瘓的患者Cathy Hutchinson利用腦植入芯片成功的用思維控制機(jī)器手臂端起一杯咖啡,并和吸管中喝了一口。

2014年初,法國公司Axilum Robotics與西班牙巴塞羅那大學(xué)、Starlab公司和哈佛醫(yī)學(xué)院一起進(jìn)行第一次腦對腦的溝通,在5000公里外,實現(xiàn)了直接在兩個人的大腦之間進(jìn)行溝通。

2016年埃隆·馬斯克成立了Neuralink公司進(jìn)行腦機(jī)接口研究,以幫助治療人類的腦部疾病。

2018年5月,俄羅斯新西伯利亞國立技術(shù)大學(xué)聲稱研制出了一款用意念控制的越野輪椅。頸部以下癱瘓者可乘坐該輪椅在室內(nèi)甚至城市街道上獨(dú)立行動。

2018年6月,美國麻省理工學(xué)院下屬計算機(jī)科學(xué)與人工智能實驗室(CSAIL)的研究人員開發(fā)了一種新界面系統(tǒng),它可以讀取人類操作人員的腦電波,通過思維命令機(jī)器執(zhí)行任務(wù)。

目前腦控科技已經(jīng)成為各國科研人員競相研究的前沿課題。盡管大多數(shù)研究目前還停留在實驗室階段,一旦該技術(shù)成功商業(yè)化,癱瘓者、語言障礙者、盲人等群體將迎來生命中的第二個春天。

語音2.0:語音界面技術(shù)和實時翻譯

未來,科技創(chuàng)新將使人類的交流與溝通提升到另外一個層次,它不僅僅是幫助語言障礙患者進(jìn)行無障礙交流;還會在人與人或人與機(jī)器之間進(jìn)行信息交換。

由于人類語言的多樣化,限制了人與人之間的溝通,特別是跨國別和跨語種的交流。近幾年,隨著實時翻譯技術(shù)的成熟,語言鴻溝正被慢慢地消除。

2017年10月,谷歌推出Pixel Buds藍(lán)牙耳機(jī),使用Pixel智能手機(jī)即可在40種不同語言之間進(jìn)行即時翻譯。

微軟的Skype Translator可以對語音、視頻及50種語言的文本內(nèi)容實現(xiàn)八種語言之間的實時翻譯

各種便攜式翻譯設(shè)備可以幫助游客在幾秒鐘內(nèi)進(jìn)行語言翻譯。未來,小小的耳機(jī)設(shè)備將打破出行的語言限制,而傳統(tǒng)的翻譯這一職業(yè)也將被新技術(shù)所替代。

在語言的新技術(shù)革命中,手語也正在被技術(shù)所替代。2015年,美國德克薩斯A&M大學(xué)開發(fā)了一款可穿戴設(shè)備,通過感知用戶的手臂動作,將手語翻譯成英語。該設(shè)備可以識別出大約40個美國標(biāo)準(zhǔn)手語動作,準(zhǔn)確率達(dá)到了96%。

利益于人工智能技術(shù)的飛速發(fā)展,機(jī)器不僅僅是充當(dāng)翻譯人員,還可以成為溝通伙伴。據(jù)Gartner預(yù)測,到今年年底,我們與新技術(shù)的互動中有30%將通過與智能機(jī)器完成。目前每六個美國成年人中,就有一個擁有智能音箱或相關(guān)設(shè)備。除了控制智能家居外,亞馬遜的AI助手Alexa已經(jīng)可以幫助用戶在線購物。未來AI助手將能實現(xiàn)更多的功能。

無論是在醫(yī)療、旅游、還是商業(yè)活動,以人工智能為代表的新技術(shù)正在徹底改變?nèi)伺c人之間的交流方式,并將打破身體、地域、國別、語種的各種限制。未來,我們的交流對象也將不再局限在人類,可以是機(jī)器、可以是動物。

這一切都是科技帶來的福利。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50108

    瀏覽量

    265565
  • 語音技術(shù)
    +關(guān)注

    關(guān)注

    2

    文章

    226

    瀏覽量

    21791

原文標(biāo)題:深度:語音技術(shù)革命正在改變?nèi)祟惖慕涣鞣绞?/p>

文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    MAC CE技術(shù)為什么能調(diào)整語音編碼速率

    隨著NR網(wǎng)絡(luò)的快速發(fā)展,5G語音業(yè)務(wù)快速增加,5G支持高清語音,需要從技術(shù)上讓語音編碼適應(yīng)網(wǎng)絡(luò)覆
    的頭像 發(fā)表于 12-19 16:52 ?694次閱讀
    MAC CE<b class='flag-5'>技術(shù)</b>為什么能調(diào)整<b class='flag-5'>語音</b>編碼速率

    商湯科技推出實時語音驅(qū)動數(shù)字人技術(shù)SekoTalk

    在數(shù)字人技術(shù)蓬勃發(fā)展的今天,生成效率仍是行業(yè)面臨的核心挑戰(zhàn)。商湯科技憑借在生成式 AI 與多模態(tài)交互領(lǐng)域的深厚積累,推出了實時語音驅(qū)動數(shù)字人技術(shù)
    的頭像 發(fā)表于 12-17 13:52 ?432次閱讀
    商湯科技推出實時<b class='flag-5'>語音</b>驅(qū)動數(shù)字人<b class='flag-5'>技術(shù)</b>SekoTalk

    語音芯片白噪音支持功能詳解:打造舒適音頻體驗的關(guān)鍵技術(shù) | 廣州唯創(chuàng)電子語音IC廠家

    前言:探索語音芯片的白噪音技術(shù)世界在現(xiàn)代電子設(shè)備日益普及的今天,語音芯片的功能創(chuàng)新正在不斷豐富著我們的日常生活體驗。作為專業(yè)的
    的頭像 發(fā)表于 11-06 08:56 ?517次閱讀
    <b class='flag-5'>語音</b>芯片白噪音支持功能詳解:打造舒適音頻體驗的關(guān)鍵<b class='flag-5'>技術(shù)</b> | 廣州唯創(chuàng)電子<b class='flag-5'>語音</b>IC廠家

    廣州唯創(chuàng)電子WTK6900H-24SS語音識別芯片:智能語音控制賦能臺燈創(chuàng)新應(yīng)用 | 語音IC廠家

    在智能家居快速發(fā)展的今天,語音交互技術(shù)正在深刻改變?nèi)藗兣c家居設(shè)備的互動方式。臺燈作為日常生活中不可或缺的照明工具,其智能化升級已成為行業(yè)發(fā)展
    的頭像 發(fā)表于 11-05 09:20 ?796次閱讀
    廣州唯創(chuàng)電子WTK6900H-24SS<b class='flag-5'>語音</b>識別芯片:智能<b class='flag-5'>語音</b>控制賦能臺燈創(chuàng)新應(yīng)用 | <b class='flag-5'>語音</b>IC廠家

    廣州唯創(chuàng)電子WTK6900H-32N離線語音識別芯片:精準(zhǔn)遠(yuǎn)場識別引領(lǐng)智能電風(fēng)扇創(chuàng)新 | 語音IC廠家

    隨著人工智能技術(shù)快速發(fā)展,語音交互正在成為智能家居領(lǐng)域的重要入口。廣州唯創(chuàng)電子作為專業(yè)的語音IC廠家,推出的WTK6900H-32N離線
    的頭像 發(fā)表于 10-31 09:03 ?679次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N離線<b class='flag-5'>語音</b>識別芯片:精準(zhǔn)遠(yuǎn)場識別引領(lǐng)智能電風(fēng)扇創(chuàng)新 | <b class='flag-5'>語音</b>IC廠家

    光纖光譜儀廠家的技術(shù)進(jìn)步對行業(yè)未來的影響

    在現(xiàn)代科學(xué)研究與工業(yè)應(yīng)用中,光纖光譜儀作為一種高效的分析工具,正在迅速崛起。然而,用戶常常在選擇光纖光譜儀時面臨著許多問題,諸如如何選擇最適合的設(shè)備?如何確保測量結(jié)果的準(zhǔn)確性?這部分問題的根源在于
    的頭像 發(fā)表于 10-21 14:49 ?399次閱讀

    廣州唯創(chuàng)電子WTN6系列語音芯片:四維控制模式重塑智能設(shè)備交互體驗

    在智能化設(shè)備普及的今天,靈活高效的控制方式成為產(chǎn)品差異化競爭的關(guān)鍵。廣州唯創(chuàng)電子WTN6系列語音芯片以其獨(dú)特的四種控制模式,為智能設(shè)備提供了前所未有的設(shè)計靈活性。隨著物聯(lián)網(wǎng)技術(shù)
    的頭像 發(fā)表于 10-09 08:45 ?451次閱讀
    廣州唯創(chuàng)電子WTN6系列<b class='flag-5'>語音</b>芯片:四維控制模式重塑智能<b class='flag-5'>設(shè)備</b>交互體驗

    Waytronic廣州唯創(chuàng)電子 MP3語音芯片:現(xiàn)代智能設(shè)備的音頻解決方案

    高品質(zhì)音頻與低功耗設(shè)計的完美結(jié)合,為智能設(shè)備注入聲音靈魂在智能化浪潮席卷全球的今天,語音交互已成為人機(jī)互動的重要方式。MP3語音芯片作為高度集成的音頻處理解決方案,正以其出色的性能和創(chuàng)新技術(shù)
    的頭像 發(fā)表于 09-23 08:41 ?790次閱讀
    Waytronic廣州唯創(chuàng)電子 MP3<b class='flag-5'>語音</b>芯片:現(xiàn)代智能<b class='flag-5'>設(shè)備</b>的音頻解決方案

    羅克韋爾攜手Sensia推動油田運(yùn)營升級

    技術(shù)進(jìn)步推動下,石油和天然氣行業(yè)正在經(jīng)歷快速轉(zhuǎn)型。自動化、電力和數(shù)字系統(tǒng)處于此次升級的前沿,為提高效率、安全性和環(huán)境的可持續(xù)性創(chuàng)造了潛力。
    的頭像 發(fā)表于 09-03 14:51 ?817次閱讀

    Molex莫仕互聯(lián)汽車解決方案推動汽車行業(yè)智能化轉(zhuǎn)型

    隨著車聯(lián)網(wǎng) (V2X)、高級信息娛樂系統(tǒng)和自動駕駛等創(chuàng)新技術(shù)快速發(fā)展,汽車行業(yè)正在經(jīng)歷快速變革。這些技術(shù)進(jìn)步需要連接解決方案在緊湊的輕量化
    的頭像 發(fā)表于 08-19 09:43 ?2073次閱讀

    語音識別---大家怎么看呢?

    語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實驗室走向市場。人們預(yù)計,未來10年內(nèi),語音識別
    發(fā)表于 08-09 10:54

    杰理科技榮獲2024年廣東省高新技術(shù)企業(yè)協(xié)會科技進(jìn)步獎一等獎

    近日,廣東省高新技術(shù)企業(yè)協(xié)會第四屆第三次會員大會在廣州市東方賓館隆重召開。同時頒布了2024年廣東省高新技術(shù)企業(yè)協(xié)會科技進(jìn)步獎獎勵項目。
    的頭像 發(fā)表于 07-04 18:08 ?1233次閱讀

    技術(shù)|基于WT588E02B-8S語音芯片的遠(yuǎn)程更新技術(shù)及應(yīng)用實踐

    引言隨著物聯(lián)網(wǎng)和智能設(shè)備快速發(fā)展,語音交互技術(shù)逐漸成為提升用戶體驗的核心功能之一。在此背景下,廣州唯創(chuàng)電子推出的WT588E02B-8S語音
    的頭像 發(fā)表于 04-01 08:40 ?894次閱讀
    芯<b class='flag-5'>技術(shù)</b>|基于WT588E02B-8S<b class='flag-5'>語音</b>芯片的遠(yuǎn)程更<b class='flag-5'>新技術(shù)</b>及應(yīng)用實踐

    新能源時代推動鋰電池生產(chǎn)設(shè)備進(jìn)步

    新能源時代,隨著全球能源結(jié)構(gòu)的深刻變革,鋰電池作為新能源的重要組成部分,正快速推動著電動汽車、儲能系統(tǒng)以及各類便攜式電子設(shè)備的發(fā)展。在這一背景下,鋰電池生產(chǎn)設(shè)備
    的頭像 發(fā)表于 03-31 10:58 ?946次閱讀
    新能源時代<b class='flag-5'>推動</b>鋰電池生產(chǎn)<b class='flag-5'>設(shè)備</b><b class='flag-5'>進(jìn)步</b>

    表面貼裝技術(shù)(SMT):推動電子制造的變革

    ,同時也推動了生產(chǎn)的自動化。這種小型化的元器件通常被稱為表面貼裝器件(SMD),而將元件裝配到印刷電路板(PCB)或其他基板上的工藝方法則稱為SMT工藝。相關(guān)的組裝設(shè)備則統(tǒng)稱為SMT設(shè)備。 SMT
    發(fā)表于 03-25 20:55