国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

人類進化的歷程當中語音起到了多大的作用

人工智能和機器人研究院 ? 來源:未知 ? 作者:李倩 ? 2018-04-15 10:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

黃學東:大家好!今天我主要想和大家分享一下微軟的故事,相信一定會很激動人心。但在正式分享之前,我想介紹一下人類進化的歷程當中語音起到了多大的作用。

達爾文的進化論已經(jīng)說明,最新的科學驗證也再次證明,我們?nèi)撕痛笮尚蒁NA的相似度接近99%,就那1%的區(qū)別造就了我們是這個地球的主宰。為什么呢?因為我們更聰明嗎?還是漫長的進化過程當中有什么其他因素?計算機視覺非常重要,但動物的視力其實比人還厲害,晚上的夜貓子看得比人更厲害,但我們?nèi)匀皇沁@個地球的主宰。最重要的原因之一是我們的語音和語言,所以大家可以在今天準時地來到這個地方和我們一起討論人工智能激動人心的進展。語音和語言對人類的進化是起到?jīng)Q定性作用的,當然對人工智能的進化也有同等的重要性。

微軟在過去的幾年當中多次創(chuàng)造了接近人類水平的人工智能進展。以今天的ImageNet作為圖像識別的標準,微軟兩年前就第一次在圖像識別斯坦福大學的ImageNet達到了超越人的水平。去年微軟又宣布公開測試級對話系統(tǒng)Switchboard的最新成果最新成果。這是語音領域大家都很熟悉的一個很重要的任務,就是識別兩個人在電話上的交談,微軟第一次在業(yè)界達到了超過普通人的專業(yè)水平。今年在斯坦福大學的SQuAD閱讀理解挑戰(zhàn)賽,微軟再次達到了媲美人類的水平。上個月微軟再次創(chuàng)造了在中文和英文翻譯上達到了超過專業(yè)人員翻譯質(zhì)量的水平,這是前所未有的。所以這確實是一個激動人心的時刻,人類進化的長河當中語音起了決定性的作用,今天在人工智能的進化當中語音和語言會起到同樣的作用。

去年《經(jīng)濟學人》有一篇封面文章,總結(jié)了過去的四十年語音和語言的重要進展,早在五十年代IBM就開始了機器翻譯的工作,那個時候我還沒有出生。過去的幾年當中有三個很重大的歷史事件:蘋果第一次推出Siri,也就是手機上的個人助理。Google推出了基于神經(jīng)翻譯的產(chǎn)品,大大推動了機器翻譯的進步。微軟第一次在業(yè)界歷史性地創(chuàng)造了超越人的自然對話系統(tǒng)——語音識別系統(tǒng)。

這張圖顯示了過去的二十年當中語音識別的同行們通過不懈的努力,創(chuàng)造出了很多輝煌的成果,但有一條紅線,就是Switchboard錯誤率一直在10%以上,直到最近幾年因為深度學習的進展,微軟和IBM的公開評測當中一直起到了領頭羊的作用。

去年微軟是第一次達到了5.1%的水平,超過了普通轉(zhuǎn)錄人員的標準,也是非常激動人心的進展。采用的方法是組合了多種不同的深度神經(jīng)網(wǎng)絡,包括ResNet、LACE和BLSTM,通過并行的處理組合成了一個工程上完美的語音識別系統(tǒng),其實在云上是不費吹灰之力的,只是計算機的資源會比較多。

微軟在語音合成領域也有很多進展。我們支持將近包括50種語言的語音合成系統(tǒng),而且它的質(zhì)量也達到了4.3 MOS, 這是非常振奮人心的。

這是微軟和哈曼音箱聯(lián)合推出的聯(lián)想語音識別系統(tǒng),喚醒智能音箱的時候不是非常自然,微軟最近和小米聯(lián)合推出了全雙工的語音對話系統(tǒng),就是喚醒以后可以連續(xù)講,不需要每次都說喚醒詞“小娜”再說語音指令。這是微軟核心的語音技術(shù)在中國落地的一個非常好的案例,它的基本思想非常簡單,就是我跟你講話,比如我見到鄧院士每次都說“鄧院士,今天你好嗎?”“鄧院士,你今天吃飯了沒有?”所以大家會覺得很煩,全雙工的系統(tǒng)只要喚醒一次,接下來就可以很自然地跟它交互。

大家可以看出,全雙工的語音交互在中國已經(jīng)落地,和小米的合作產(chǎn)品今天可以很便宜地買到一臺,讓它幫你掃地、開燈、看股票,這些都沒問題,如果實在閑得慌的話可以和小冰聊天斗嘴,這是已經(jīng)落地的產(chǎn)品。

和大家介紹一下最近微軟在機器翻譯上的重大突破。就像《經(jīng)濟學人》說過的,1954年開始IBM Wason就開始了機器翻譯的研發(fā)工作,那個時候是傳統(tǒng)的機器翻譯,根據(jù)自然語言的處理方法。后來IBM再次引導了新潮流,將語音識別的核心技術(shù)統(tǒng)計方法使用在機器翻譯上,Peter Brown這些人把語音翻譯的質(zhì)量推向了新高度。過去的幾年因為神經(jīng)網(wǎng)絡學習的進步,我們再次把機器翻譯推向了新的高度,但還沒有達到人的水平。

非常振奮人心的是,今年微軟公司首次在公開測試當中中英新聞翻譯當中第一次達到了類人的水平,這是非常了不起的歷史性里程碑,這樣對幫助中國的聲音走向世界是毫無疑問的,因為翻譯的水平和專業(yè)人員是同等可比的。

微軟不僅是在研發(fā)上進行推廣,實際上很多產(chǎn)品已經(jīng)落地。比如PPT,你們只要下載一個Presentation Translator的插件,所有的講話可以同聲翻譯、同聲傳錄,而且是免費的。下載以后可以支持60種語言、100個人在課堂上同步交流。演講之前可以讓大家掃描二維碼,通過微軟翻譯的手機應用可以加入對話。大家知道,字幕當中只能顯示一種語言,如果是60種語言怎么辦?沒關系,也可以顯示在你的手機上面。

分享一下我個人的經(jīng)歷,我在八十年代離開清華,當時在清華學的都是美式英語,然后到蘇格蘭愛丁堡大學留學,當時我就懵了,因為蘇格蘭教授的口音非常嚴重,當時我就想要是有一個字幕機多好?那是三十年前的痛點,今天可以很驕傲地告訴大家,這個痛點早就可以由微軟Office免費為大家提供同聲翻譯服務。大家可以讓教授在臺上講蘇格蘭英語,臺下可以在你的手機上看到從希臘文到廣東話的近60種語言的實時字幕翻譯。這是非常振奮人心的時刻,如果今天還有哪位同學要去蘇格蘭留學,我想大家不會再為蘇格蘭英語而苦惱了。

所謂的中英翻譯達到人的水平是怎么回事?這是一個標準的新聞翻譯任務,也是在業(yè)界廣泛使用的。在這之前,中國的搜狗在這個測試集上做到了最優(yōu)秀,可以看出如果要人來評估,第三行的搜狗基本上是62分,就像老師打分一樣,把這個東西翻譯過來以后如果是十全十美的學生可以拿100分,如果出了很多錯誤的話這個老師非常嚴厲,可能會給零分。在微軟技術(shù)突破之前,業(yè)界在這個測試任務上最先進的機器翻譯系統(tǒng)是中國搜狗,達到了62.3分,現(xiàn)有的產(chǎn)品我也不說是誰的產(chǎn)品了,以免大家覺得我們對同行有不誠之意,只有54分左右。如果今天用微軟的Microsoft Translator也只有56分,勉強及格。微軟最新的機器翻譯突破分數(shù)達到69分,拿到中英翻譯執(zhí)照的專業(yè)翻譯人員得出的結(jié)果是68.5分,所以如果大家是翻譯人員水平是67.3分。這是最新的機器中英翻譯第一次取得歷史性突破,對中國走向世界是非常有積極意義的。

下面簡單介紹一下這個突破是怎么回事,它的主要核心技術(shù)用的是Transformer的機器翻譯模型。

微軟亞洲研究院自主研發(fā)的Dual Translation Learning,就是大家在中英翻譯的時候,翻譯成英文后再用一下反向翻譯,就是英翻中,保證這兩種翻譯的一致性比較好,可以得到一個最高、最優(yōu)的聯(lián)合優(yōu)化目標函數(shù)。通過這樣一個正向和反向的翻譯,我們可以大大提高現(xiàn)有機器翻譯的質(zhì)量,這是和人進行翻譯的過程類似的機器學習的新算法,機器翻譯上取得了長足的進步。

大家在做翻譯作業(yè)的時候翻完了一遍是不是想再翻一遍把它優(yōu)化?所以我們還有一個Deliberation,就是可以在第一次翻譯的基礎上同步優(yōu)化,這樣也更進一步提高了機器翻譯的質(zhì)量。

我們還有從左到右、從右到左的聯(lián)合優(yōu)化函數(shù),再一次提高了機器翻譯的質(zhì)量,就是因為這些聯(lián)合系統(tǒng)的組合造就了我們歷史性地第一次達到了中翻英超人的水平。要做其它語言同樣是沒有問題的,我們希望其他語言和中英翻譯的落地很快就會產(chǎn)業(yè)化,再再過一些時候你們再用Microsoft Translator的時候會享受到與真人相似的機器翻譯質(zhì)量。

這是微軟公司在斯坦福大學對話文本理解上的進步,過去的幾年當中斯坦福大學建立了圖像認識的標準,現(xiàn)在自然語言處理方面也有一個華人教授和他的團隊建立了閱讀理解系統(tǒng),微軟亞洲研究院和微軟的同事們又一次達到了超人的水平。

特定的認識對話方面的水平確實是相當高的,用的方法也像機器學習、機器翻譯的系統(tǒng)一樣有一個Embedding,通過不斷的深度優(yōu)化達到最優(yōu)的結(jié)果,就像現(xiàn)在的機器翻譯一樣。

剛才我講的過程是從認知到感知的循環(huán)系統(tǒng),大家在對話的時候閉著眼睛也能聽懂,但聽懂的效果不是很好,睜開眼睛的話一定會幫助你理解語義,所以在人的交互過程當中一定是Congnitive Intelligence和Perceptive Intelligience的共同進展,現(xiàn)在自主學習、知識積累和長遠規(guī)劃方面沒有多大進展,所以大家不要聽人工智能的忽悠,現(xiàn)在我們基本上還早得很。機器翻譯現(xiàn)在是基于這兩種智能過渡的一個小成果。我們非常高興,也非常激動人心,因為從感知到認知的過程當中人工智能深度學習終于有了一個長足的進步。

微軟AI的平臺把所有的認知服務都打包到了Azure這個云上,從最底層的核心架構(gòu)到最高層的算法都有,大家可以去微軟的平臺選用、享受、分享微軟的最新人工智能研發(fā)進展和工程化的結(jié)果。

這是第三方對微軟、Google和亞馬遜在語音和語言API方面的評估,可以看出微軟中間綠顏色的比較多,這當然是符合大家預期的。另外想介紹一下幾個簡單的例子:極易中文學校是在西雅圖的一個創(chuàng)新。海外的很多華人學習中文非常困難,他們用微軟的語音認知服務,小孩學中文的興趣大大進步了,不僅是興趣進步,而且做家庭作業(yè)和掌握中文的速度也有一個長足的進步。所以用人工智能服務于教育,幫助小孩擴展中文文化,這在西雅圖極易中文學校已經(jīng)得到了非常高度的認可。我們知道中國的華為公司包括Mate10都預裝了微軟認知服務的機器翻譯系統(tǒng)。我們最近跟小米生態(tài)系統(tǒng)中要推出的魔芋翻譯機,更是人工智能翻譯的一大杰出代表。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301431
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265399

原文標題:AI 翻譯能夠取代人類?微軟黃學東:我們?nèi)栽诟兄悄芎驼J知智能的過渡期

文章出處:【微信號:gh_ecbcc3b6eabf,微信公眾號:人工智能和機器人研究院】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一文了解語音AI的運作方式

    語音 AI 是對話式 AI 的一個子集,包括可將人類語音轉(zhuǎn)換為文本的自動語音識別 (ASR) 和文本轉(zhuǎn)語音 (TTS)。
    的頭像 發(fā)表于 02-27 16:10 ?315次閱讀
    一文了解<b class='flag-5'>語音</b>AI的運作方式

    面對AI降維打擊,陳天橋的全新解法:人類必須“肉身進化

    到了更深層的危機:AI作為一種“外來物種”,正在進入我們的生態(tài)位競爭。 在陳天橋看來,人類真正的短板不在于算力或知識儲備,而在于碳基個體的物理上限——我們的壽命、帶寬、健康跨度決定了我們學習和進化的速度。相比之下
    的頭像 發(fā)表于 01-16 17:11 ?831次閱讀

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,也叫語音識別集成電路,是一種集聲音存儲、播放、錄音及語音識別功能于一體的專用芯片。語音識別IC的核心功能在于實現(xiàn)語音識別,即讓
    的頭像 發(fā)表于 01-14 15:22 ?243次閱讀
    <b class='flag-5'>語音</b>識別IC分類,<b class='flag-5'>語音</b>識別芯片的工作原理

    碳化硅器件在新能源汽車中的核心作用

    碳化硅(SiC)器件在新能源汽車中起到了非常核心的作用,尤其是在提升電能轉(zhuǎn)換效率、減小體積和重量、延長續(xù)航里程等方面,具有不可替代的優(yōu)勢。具體來說,碳化硅器件在以下幾個關鍵環(huán)節(jié)中發(fā)揮著重要作用。
    的頭像 發(fā)表于 12-29 11:39 ?666次閱讀

    四維集成,全面進化:WT2606B驅(qū)屏語音芯片重塑智能門鎖交互新標準

    當“嘀”一聲的單調(diào)提示被清晰的屏幕指引與溫馨的語音問候取代,智能門鎖正從一個功能性工具,進化為有溫度的家庭交互中樞。深夜歸家,門鎖屏幕伴隨識別成功的動畫輕聲問候;電量不足時,清晰的圖標與語音提示替代
    的頭像 發(fā)表于 12-15 09:45 ?329次閱讀
    四維集成,全面<b class='flag-5'>進化</b>:WT2606B驅(qū)屏<b class='flag-5'>語音</b>芯片重塑智能門鎖交互新標準

    電子電路當中 “地” 的介紹

    在電子電路當中地的種類和作用特別多,大家很容易混淆,其中就有我z們的電源地,信號地,數(shù)字地,模擬地等等,不同的地都有不同的作用,在我們進行設計的時候都需要對這些地做特殊的處理才能保證我們板子的信號
    發(fā)表于 11-12 07:44

    語音報警器:TTS語音播報,云平臺邏輯自控

    TTS語音播報報警器是一種集成了傳統(tǒng)報警器和TTS(文本轉(zhuǎn)語音)技術(shù)的智能設備。清晰、準確地用人類語言播報報警原因、位置、狀態(tài)等具體信息。 工作原理 文本語音:輸入文字自動合成
    的頭像 發(fā)表于 10-29 16:31 ?761次閱讀

    再掀語音交互革命,廣和通AI解決方案加速機器人聽覺進化

    在機器人世界里,感知是智能化的第一步,是機器人獲取環(huán)境信息,學習適應并自主決策的前提。聽覺作為五感之一,深度融合AI,可幫助機器人實現(xiàn)高效感知、數(shù)據(jù)獲取、語音交互和環(huán)境事件檢測,使機器人“耳聽八方
    的頭像 發(fā)表于 08-26 17:44 ?894次閱讀

    瑞芯微RK3576語音識別算法

    1.語音識別簡介語音識別技術(shù),也被稱為自動語音識別(AutomaticSpeechRecognition,ASR),其目標是將人類語音中的
    的頭像 發(fā)表于 08-15 15:13 ?2193次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b>識別算法

    語音輸出模塊是什么?自控語音播報

    語音輸出模塊(VoiceOutputModule)是一種將數(shù)字信號或文本信息轉(zhuǎn)換為人類可聽語音的硬件/軟件組件。相當于設備的“嘴巴”,讓機器能夠通過聲音與人進行交互。 一、工作原理 1.輸入接收
    的頭像 發(fā)表于 08-13 15:20 ?916次閱讀

    EASY EAl Orin Nano(RK3576) whisper語音識別訓練部署教程

    Whisper是OpenAI開源的,識別語音識別能力已達到人類水準自動語音識別系統(tǒng)。Whisper作為一個通用的語音識別模型,它使用了大量的多語言和多任務的監(jiān)督數(shù)據(jù)來訓練,能夠在英語
    的頭像 發(fā)表于 07-17 14:55 ?1769次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b>識別訓練部署教程

    從“聽得見”到“聽得懂”:語音識別芯片的AI進化

    在科技飛速發(fā)展的當下,語音識別技術(shù)已成為人機交互領域的核心力量。從最初只能簡單接收聲音信號,到如今能夠理解語義并作出準確回應,語音識別芯片經(jīng)歷了一場深刻的 AI 進化。這一進化不僅重塑
    的頭像 發(fā)表于 07-01 16:45 ?631次閱讀
    從“聽得見”到“聽得懂”:<b class='flag-5'>語音</b>識別芯片的AI<b class='flag-5'>進化</b>

    labview語音轉(zhuǎn)文字

    labview語音轉(zhuǎn)文字怎么實現(xiàn),目前在論壇上找到了文字轉(zhuǎn)語音
    發(fā)表于 04-07 19:44

    csu34f20的歷程

    請問csu34f20的歷程哪里有,請發(fā)到2209453423@qq.com謝謝
    發(fā)表于 03-17 16:07

    施密特觸發(fā)器是起到什么作用呢?使用adc時必須禁止嗎?

    想請教一下,施密特觸發(fā)器是起到什么作用呢?使用adc時必須禁止嗎?
    發(fā)表于 03-14 10:56