国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌推出端到端語音翻譯技術,讓優質高效的機器翻譯不再遙遙無期

電子工程師 ? 來源:YXQ ? 2019-05-17 16:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

40年前,英國科幻作家Douglas Adams在他的《銀河系漫游指南》中這樣描述巴別魚(bable fish):迷你黃色生物,水蛭狀,以聲音中的語言概念為食,消化后排出跟寄主同頻的腦波。只要塞到耳朵里去,就可以聽懂各種語言。

而在這個充滿嬉皮風格的科幻作品中,來自地球的Arthur Dent也因為這條丑陋的魚,能夠完美地理解并與他遇到的各種外星種族交流。

自小說誕生,巴別魚便成為了即時語音翻譯的代名詞。但在當時,人類的翻譯技術距離這一目標仍遙不可及。

直到2014年,加拿大蒙特利爾大學的Kyunghyun Cho、Yoshua Bengio等人發布了一篇在機器翻譯領域應用神經網絡的論文——Neural Machine Translation by Jointly Learning to Align and Translate。

神經網絡的出現,讓優質高效的機器翻譯不再遙遙無期。

每次技術的突破都讓我們離巴別魚更近一步,直到今天,谷歌的發布了一項新研究Translatotron,這是一種可以實現端到端的語音轉語音的翻譯技術。該工具放棄了將語音翻譯成文本在返回語音的步驟,可以直接從一種語言轉換稱另外一種語言,并同時保持說話著的語調和節奏。

告別Siri,我們先來感受一下翻譯的調調:

通過結合揚聲器編碼器網絡,使得Translatotron能夠在翻譯的語音中保留原始揚聲器的聲音特征,這使得翻譯的語音聽起來更自然,更少刺耳。

更多聲音樣本可以在Translatotron的Google Research的Github頁面上找到。

此功能利用了谷歌之前specker verification 和 speaker adaptation for TTS 的研究。揚聲器編碼器在specker verification任務上預先訓練,學習從簡短的示例話語對揚聲器特性進行編碼。即使內容是不同的語言,該編碼上調節頻譜圖解碼器也可使得合成具有類似揚聲器特性的語音。

Translatotron模型

其實語音翻譯的端到端模型的早在2016年就開始出現了,當時研究人員證明了使用單個序列到序列模型進行語音到文本翻譯的可行性。

2017年,谷歌研究員們證明了這種端到端模型可以勝過cascade模型。之后又進一步改進許多端到端語音到文本翻譯模型的方法。

最終在2019年,谷歌的研究員們在arXiv發表Translatotron模型,通過證明單個序列到序列模型可以直接將語言從一種語言翻譯成另一種語言的語音,而不依賴于任何一種語言的中間文本表示。

Translatotron基于序列到序列網絡將源光譜圖作為輸入并生成目標語言中的翻譯內容的光譜圖輸出。它還使用了另外兩個經過單獨訓練的組件:神經聲碼器將輸出頻譜圖轉換為時域波形,使用揚聲器編碼器來保持合成的翻譯語音中源說話者的語音的特征。

在訓練期間,序列到序列模型使用多任務目標來在生成目標譜圖的同時預測源和目標轉錄物。

Translatotron的模型結構

該團隊稱,翻譯的準確性并不如傳統翻譯系統那么好,傳統系統有更多時間來磨練其準確性。但Translatotron是第一個能夠將語言從一種語言直接翻譯成另一種語言的語音的端到端模型。他們希望這項工作可以作為未來端到端語音轉語音翻譯系統研究的起點。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111373
  • 語音識別
    +關注

    關注

    39

    文章

    1812

    瀏覽量

    116047

原文標題:巴別魚雛形,谷歌推出端到端語音翻譯技術,還能模仿你說話

文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    谷歌推出TranslateGemma全新開放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新的開放翻譯模型系列基于 Gemma 3 構建,并提供 4B、12B 和 27B 三種參數規模。TranslateGemma 的問世標志著開放翻譯領域邁出了重要一步,它可幫助人
    的頭像 發表于 02-26 10:22 ?494次閱讀

    晶晨攜手谷歌,助力側大模型Gemini的硬件落地

    電子發燒友網報道 在科技飛速發展的當下,側智能技術正以前所未有的速度滲透各個領域。1月28日,晶晨股份透露,公司與谷歌有著長達十余年的深度合作基礎。作為
    的頭像 發表于 01-29 10:44 ?1293次閱讀

    側大模型上車:從“語音助手”“車內 AI 智能體”的躍遷革命

    2025年,智能汽車的座艙不再只是“語音助手”的舞臺,而是一個搭載生成式AI和大語言模型(LLM)的智能體。從云端示范車內落地,這一跨越不僅改變了人機交互的邊界,更重構了汽車作為“第三
    的頭像 發表于 01-13 09:10 ?468次閱讀

    視美泰發布AI即時翻譯機解決方案,硬核配置+多語種覆蓋破解跨語言溝通難題

    機器翻譯語音合成和大模型四項能力構建高效同聲傳譯鏈路,實現70+種語言全覆蓋的強大能力,為跨境商貿、文化交流、戶外出行等場景提供高效精準的翻譯
    的頭像 發表于 12-03 10:50 ?1069次閱讀
    視美泰發布AI即時<b class='flag-5'>翻譯</b>機解決方案,硬核配置+多語種覆蓋破解跨語言溝通難題

    國慶出國游,時空壺新T1翻譯機,首個側模型突破助力跨語言交流

    的旗艦機型,最大亮點是搭載業內首個側AI翻譯模型。這一模型將原本依賴云端算力的復雜AI翻譯模型,通過先進的模型剪枝、量化壓縮等技術,巧妙部署于設備本地,并對神經網
    的頭像 發表于 09-12 12:20 ?1016次閱讀
    國慶出國游,時空壺新T1<b class='flag-5'>翻譯</b>機,首個<b class='flag-5'>端</b>側模型突破助力跨語言交流

    語音交互數據 精準賦能語音大模型進階

    模型在多輪對話、噪聲環境及語義理解方面表現不佳。 相較于傳統數據集僅關注語音-文本的單點轉寫,語音交互數據集強調在真實多輪對話場景下的
    的頭像 發表于 09-11 17:17 ?735次閱讀

    黑芝麻智能全棧式輔助駕駛系統的應用場景

    黑芝麻智能推出的全新一代全棧輔助駕駛系統,以武當C1200系列高算力芯片為基石,深度融合自研感知算法,實現從場景感知車輛控制的完全閉
    的頭像 發表于 09-09 17:19 ?2581次閱讀

    翻譯失去網絡,時空壺新T1翻譯機開創首個離線模型賦能全球溝通新體驗

    全球首創的離線側AI翻譯模型,這一技術突破堪稱行業變革性創舉。與傳統依賴網絡或僅靠靜態離線語言包的翻譯設備不同,T1的離線模型基于先進的
    的頭像 發表于 09-08 16:52 ?1202次閱讀
    當<b class='flag-5'>翻譯</b>失去網絡,時空壺新T1<b class='flag-5'>翻譯</b>機開創首個離線模型賦能全球溝通新體驗

    當經典IP撞上AI技術:利爾達助力躍然創新推出全球首款AI互動玩具

    //當孩子們手中的奧特曼玩具不僅能發光發聲,還能真正智能對話、情感陪伴,傳統的玩具行業正經歷一場前所未有的技術革命……今日,AI玩具領軍企業躍然創新(Haivivi)推出全球首款搭載
    的頭像 發表于 08-26 17:37 ?1963次閱讀
    當經典IP撞上AI<b class='flag-5'>技術</b>:利爾達助力躍然創新<b class='flag-5'>推出</b>全球首款<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>AI互動玩具

    聲智科技出席2025年北京市多語種AI語音翻譯大賽

    8月20日,由北京市科委、中關村管委會主辦,北京語言大學、北京第二外國語學院、北京市翻譯協會、中國人工智能百人會共同承辦的“2025年北京市多語種AI語音翻譯大賽”在中關村展示中心順利啟幕。聲智作為
    的頭像 發表于 08-25 17:18 ?1236次閱讀

    傳音斬獲WMT 2025國際機器翻譯大賽四項冠軍

    近日,在由國際計算語言學協會(ACL)主辦的WMT 2025國際機器翻譯大賽中,傳音在低資源印度語言翻譯任務(Low-Resource Indic Language Translation)中斬獲
    的頭像 發表于 08-06 18:21 ?1227次閱讀

    廣和通發布自研語音識別大模型FiboASR

    高效會議記錄、多語種即時翻譯等核心領域實現重大技術突破,致力于為終端用戶帶來更自然、高效、私密的語音交互體驗。
    的頭像 發表于 08-04 11:43 ?1592次閱讀

    水表界的“翻譯官”:CCLinkIE和Modbus TCP“無障礙聊天”!

    ,耐達訊通信技術CCLinkIE轉Modbus TCP網關堪稱“設備和諧大使”。它無需替換舊設備,就能讓新老系統高效協作,為工程師省下大筆改造費用,還帶來靈活的系統升級方案。當你的車間出現“協議吵架”時,不妨請這位“翻譯官”來場
    發表于 07-10 15:43

    時空壺 T1 離線翻譯機:解鎖無網生活溝通自由

    頻頻“掉鏈子”。時空壺T1離線翻譯機,憑借強大的側AI模型與離線翻譯能力,為人們在多元生活場景中打破語言壁壘,帶來高效、穩定且流暢的溝通體驗。一、全場景適配,出
    的頭像 發表于 06-05 10:30 ?912次閱讀
    時空壺 T1 離線<b class='flag-5'>翻譯</b>機:解鎖無網生活溝通自由

    小米汽車智駕技術介紹

    后起之秀,小米在宣布造車前被非常多的人質疑,但在“真香”定律下,小米創下了很多友商所不能及的成就。作為科技企業,小米也在智能駕駛領域也不斷研發及突破,并推送了自動駕駛系統。 小米
    的頭像 發表于 03-31 18:17 ?5256次閱讀
    小米汽車<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>智駕<b class='flag-5'>技術</b>介紹