国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI精確復制聲音, 真假“比爾·蓋茨”難辨

Gv1N_smartman16 ? 來源:yxw ? 2019-06-15 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日, 臉書的研究人員成功克隆了微軟總裁比爾·蓋茨的聲音。

臉書人工智能研究中心的肖恩·瓦斯奎茲(Sean Vasquez)和邁克·劉易斯(Mike Lewis)于本周表示,他們已經努力模仿人類語言有一段時間了。然而,模仿人類語言顯然是件難事,當人們聽到斯蒂芬·霍金所使用的那套最著名的說話機器發聲時,會發現它聽起來仍然很不像人類。

但是現在,研究員們似乎已經取得了進展。如果你聽了蓋茨的克隆所發出的聲音,我想你是會同意的。因為它聽起來很像比爾·蓋茨,你甚至很難分辨出它和他真實聲音的區別。

研究人員展示了他們的研究。在這里,機器模仿著蓋茨的腔調發聲,“請給你珍愛的朋友發一封充滿愛意的短信?!逼渲凶畈豢伤甲h的是,這臺機器在說“珍愛(cherish)”時,準確無誤地捕捉到蓋茨不斷上升的語調變化的。

這項技術被稱為MelNet,可以用來復制人類的語調。到目前為止,蓋茨和其他許多人的聲音都被它完美地再現了。瓦斯奎茲和劉易斯說,克隆的音頻取自各類Ted演講。

兩位研究人員還表示,直到最近,文本到語音轉換軟件還不能很好地工作的原因是它使用了波形圖記錄聲音。這些圖顯示了聲音在幾秒鐘內的音階變化。如果你聽到過蓋茨說“珍愛”這個詞,就知道他的語氣是變化劇烈的。在試圖模仿一個人的時候,深度學習機器必須預測到所有這些細微的變化,這很不容易。

瓦斯奎茲和劉易斯說,他們通過使用一種叫做光譜圖的東西來訓練機器,成功地克隆了聲音。

研究人員說:“光譜圖的時間軸比波形圖的時間軸緊湊幾個數量級,這意味著在波形中跨越數萬個時間步長的依賴關系在光譜圖中只跨越數百個時間步長。這使得我們的光譜圖模型能夠在數秒內記錄各種語音和音樂樣本,并保持它們一致性?!?/p>

不過,他們也經歷了一些挫折。研究小組表示,對他們來說,幾乎完美地復制一個句子并不難,難的是復制那些在長達幾十秒或幾分鐘的時間里,顯示了情緒變化的復雜語調”。盡管如此,當涉及到人機交互時,研究小組說,在只涉及簡短對話的情境中,這項技術可能會帶來革命性的變化。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39820

    瀏覽量

    301504
  • 機器學習
    +關注

    關注

    66

    文章

    8554

    瀏覽量

    136981
  • 智能語音
    +關注

    關注

    11

    文章

    826

    瀏覽量

    50278

原文標題:AI精確復制聲音, 真假“比爾·蓋茨”難辨

文章出處:【微信號:smartman163,微信公眾號:網易智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何查看小智是否成功進入聲音設置?

    你可以通過后臺頁面狀態、設備反饋、語音測試三種方式,快速確認小智是否成功進入聲音設置并生效。 一、后臺頁面直接查看(最準) 登錄小智AI后臺:https://xiaozhi.me/console
    發表于 02-16 06:39

    Transformer 入門:從零理解 AI 大模型的核心原理

    : 身高:175cm 體重:70kg 年齡:25歲 我們可以把這些數字排成一排:[175, 70, 25],這就是一個向量! arduino 體驗AI代碼助手 代碼解讀 復制代碼 向量就像一張
    發表于 02-10 16:33

    使用NORDIC AI的好處

    運動/手勢識別、可穿戴健康監測、預測性維護、樓宇與工業傳感網絡本地分析、聲音/關鍵詞/圖像識別等,都有官方明確提到的典型用例。[Unlock Edge AI 博客; Nordic Edge AI 技術頁]
    發表于 01-31 23:16

    AI板級供電紋波與噪聲的精確測量

    AI板級供電的電壓已經低至1V以內,這就要求有更低的疊加在電壓母線上的紋波和噪聲進行測試,以確保良好的電源完整性,避免影響AI芯片的正常工作,確保信號完整性,降低誤碼率。
    的頭像 發表于 01-29 15:46 ?230次閱讀
    <b class='flag-5'>AI</b>板級供電紋波與噪聲的<b class='flag-5'>精確</b>測量

    純4G?血版AI小智產品方案 #小智AI #AI方案商 #4G通話 #AI終端產品

    AI
    不太正經的攻城獅
    發布于 :2025年12月21日 14:36:55

    IC聲音放大芯片怎么焊接區分啊,好小感覺四面都一樣?

    想做一個簡單的基于ESP32的AI語音識別助手,焊接好的聲音輸出一直是000。
    發表于 12-09 22:08

    【CPKCOR-RA8D1】關于AI人臉檢測移植遇到的一些問題

    /MainLoop_obj.cc、src/ai_apps/common/Main.cc 等文件已復制到項目并未被排除在構建之外。 確認工程配置包含 C++ 編譯器 設置,并在 C++ 編譯選項加入 -std=c++11(或更高
    發表于 10-31 13:39

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區
    發表于 10-14 07:14

    釋放聲音的維度:高性能評估板為沉浸式音頻體驗快速便捷構建聲場工具

    A316-V71-Game-V1是一款基于XMOS XU316技術的虛擬7.1游戲聲卡評估平臺,能夠將立體聲音頻轉換為虛擬7.1聲道環繞聲,為游戲玩家提供身臨其境的音頻體驗,幫助精確定位游戲中的聲音方向。
    的頭像 發表于 09-30 14:14 ?468次閱讀
    釋放<b class='flag-5'>聲音</b>的維度:高性能評估板為沉浸式音頻體驗快速便捷構建聲場工具

    如何進行聲音定位?

    文章主要介紹了如何利用一種簡單的TDOA算法進行聲音點位,并使用數據采集卡進行聲音定位的實驗。
    的頭像 發表于 09-23 15:47 ?1833次閱讀
    如何進行<b class='flag-5'>聲音</b>定位?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    復制人類智能的AI---AGI。 走向AGI的五個層次發現階段: ①L1,聊天機器人:具備基礎的對話能力,能夠理解和回應簡單的文本輸入 ②L2,推理者:具備基本的邏輯推理能力,能夠分析復雜信息并進行推斷
    發表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導下,AI自主的提出科學假設,諾貝爾獎級別的假設哦。 AI驅動科學被認為是科學發現的第五個范式了,與實驗科學、理論科學、計算科學、數據驅動科學一起構成
    發表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導體芯片技術加以實現。 而大腦是一個由無數神經元通過突觸連接而成的復雜網絡,是極其復雜和精密的。大腦在本質上就是一臺濕潤的軟組織
    發表于 09-06 19:12

    聲源定位模塊-AR1105# 聲源定位# 聲音定位

    聲音降噪
    深圳市聲訊電子有限公司
    發布于 :2025年08月01日 16:01:09

    正點原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!

    品非它莫屬! 為什么選擇小智AI? 真人級交互體驗 ① AI情感對話:不止問答,更能陪你聊心事、講笑話,像朋友一樣懂你! ② 10+音色百變:溫柔御姐、萌趣童聲、磁性男神… 每天換一種聲音陪伴
    發表于 04-24 16:11