国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

借助深度學習算法實現5秒內克隆你的聲音

Android編程精選 ? 來源:開源前線整理 ? 作者:開源前線整理 ? 2021-09-29 11:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家應該都知道聲音克隆技術,通俗的來說就是借助深度學習算法,可以完全模擬某個人的聲音,而且由機器合成的語音連情緒都能夠完美表達出來,基本可以以假亂真,只要不見面,你根本就察覺不出來向你發出聲音的知識一個機器。

語音克隆最大的創新之一是減少創建語音所需的原始數據量。過去,該系統需要數十甚至數百小時的音頻。但是,今天猿妹要和大家分享的這個工具5秒鐘就可以克隆成功,這個工具名叫——MockingBird。

MockingBird已經登上Github熱榜,收獲3.5K的Star,累計分支 303(Github地址:https://github.com/babysor/MockingBird)

MockingBird具有如下特性:

支持普通話并使用多種中文數據集進行測試

適用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中測試,GPU Tesla T4 和 GTX 2060

支持 Windows + Linux

僅使用新訓練的合成器(synthesizer)就有良好效果,復用預訓練的編碼器/聲碼器

MockingBird如何使用

MockingBird的安裝要求如下:

首先,MockingBird需要Python 3.7 或更高版本

安裝 PyTorch

安裝 ffmpeg。

運行pip install -r requirements.txt 來安裝剩余的必要包。

安裝 webrtcvad 用 pip install webrtcvad-wheels。

接著,你需要使用數據集訓練合成器:

下載 數據集并解壓:確保您可以訪問 train 文件夾中的所有音頻文件(如.wav)

使用音頻和梅爾頻譜圖進行預處理:python synthesizer_preprocess_audio.py 《datasets_root》 可以傳入參數 --dataset {dataset} 支持 adatatang_200zh, magicdata, aishell3

預處理嵌入:python synthesizer_preprocess_embeds.py 《datasets_root》/SV2TTS/synthesizer

訓練合成器:python synthesizer_train.py mandarin 《datasets_root》/SV2TTS/synthesizer

當你在訓練文件夾 synthesizer/saved_models/ 中看到注意線顯示和損失滿足您的需要時,請轉到下一步。

使用預先訓練好的合成器,如果沒有設備或者不想慢慢調試,可以使用網友貢獻的模型。

訓練聲碼器

預處理數據: python vocoder_preprocess.py 《datasets_root》

訓練聲碼器: python vocoder_train.py mandarin 《datasets_root》

啟動工具箱

然后你可以嘗試使用工具箱:python demo_toolbox.py -d 《datasets_root》

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    4204

    瀏覽量

    46130
  • 克隆
    +關注

    關注

    0

    文章

    22

    瀏覽量

    8036
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124396

原文標題:5秒內克隆你的聲音,并生成任何內容,這個工具細思極恐...還特么的開源~

文章出處:【微信號:AndroidPush,微信公眾號:Android編程精選】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    歡迎使用中國香河英茂科工豆包智能體

    (替出鏡/直播) 適合:短視頻、直播、虛擬主播、口播 1. 剪映(最快,免費) 導入的30+說話視頻(單人、清晰) 底部工具欄 → 文本 → 滑到數字人 → 選克隆視頻形象 上傳
    發表于 02-14 07:22

    穿孔機頂頭檢測儀 機器視覺深度學習

    頂頭狀態。 檢測頂頭算法 引入人工智深度學習技術,通過Keras實現卷積神經網絡(CNN),用Numpy實現采集數據的訓練,得到符合現場需求
    發表于 12-22 14:33

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課(11大系列課程,共5000+分鐘)

    行業市場具備深度學習能力的視覺系統占比已突破40%,催生大量復合型技術崗位需求: ? 崗位缺口:視覺算法工程師全國缺口15萬+,缺陷檢測專項人才招聘響應率僅32% ? 薪資水平:掌握LabVIEW+
    發表于 12-04 09:28

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課程(11大系列課程,共5000+分鐘)

    行業市場具備深度學習能力的視覺系統占比已突破40%,催生大量復合型技術崗位需求: ? 崗位缺口:視覺算法工程師全國缺口15萬+,缺陷檢測專項人才招聘響應率僅32% ? 薪資水平:掌握LabVIEW+
    發表于 12-03 13:50

    如何深度學習機器視覺的應用場景

    深度學習視覺應用場景大全 工業制造領域 復雜缺陷檢測:處理傳統算法難以描述的非標準化缺陷模式 非標產品分類:對形狀、顏色、紋理多變的產品進行智能分類 外觀質量評估:基于學習的外觀質量標
    的頭像 發表于 11-27 10:19 ?220次閱讀

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學

    Cat M-1 用于遙測/連接。 用于邊緣處理和機器學習的 ARMSoM 計算模塊 (CM5)。 項目背景 []() 通過聆聽自然界的聲音,我們可以監測動物之間的交流方式,并獲得基本的基線數據,從而
    發表于 10-27 09:18

    重大更新,LVGL有UI編輯器用了,2秒內加載,快到飛起!

    憑借對平臺的深度適配與輕量化優勢,成為圖形界面開發的最優解。LVGL與Linux系統的高度協同性,完美平衡了開發效率與硬件資源占用,適配從ARM到X86再到RISC
    的頭像 發表于 10-21 12:58 ?1634次閱讀
    重大更新,LVGL有UI編輯器用了,2<b class='flag-5'>秒內</b>加載,快到飛起!

    信息流全面轉向AI推薦!馬斯克稱X本周將發布AI算法更新

    X 平臺將于本周發布更新后的“新”算法,據其表示,新算法更新后,X 將實現完全的 AI 推薦。
    的頭像 發表于 10-21 10:19 ?412次閱讀
    信息流全面轉向AI推薦!馬斯克稱X本周<b class='flag-5'>內</b>將發布AI<b class='flag-5'>算法</b>更新

    思必馳聲音轉換算法通過國家備案

    近日,國家互聯網信息辦公室公告第十三批深度合成服務算法備案信息,思必馳聲音轉換算法通過備案,這也是思必馳第7項通過備案的算法,標志著思必馳在
    的頭像 發表于 09-18 14:05 ?933次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創新方法與架構

    、Transformer 模型的后繼者 二、用創新方法實現深度學習AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(ISA)。優勢如下: ①模塊化特性②標準接口③開源
    發表于 09-12 17:30

    零基礎在智能硬件上克隆原神可莉實現桌面陪伴(提供人設提示詞、知識庫、固件下載)

    個步驟:1、創建智能體:配置可莉的基礎信息2、聲音復刻:克隆可莉的聲音3、配置知識庫:配置可莉和嘟嘟可的背景、故事經歷、語錄等知識庫 4、自定義喚醒詞:修改喚醒詞和喚醒回復語 (篇尾提供修改了喚醒詞
    發表于 08-22 19:51

    思必馳聲音復刻算法獲得深度合成服務算法備案

    近日,國家互聯網信息辦公室正式發布第十二批深度合成服務算法備案信息,思必馳聲音復刻算法通過此次備案。該算法能夠高精度復刻人類
    的頭像 發表于 07-31 17:42 ?866次閱讀

    思必馳7月份大事件回顧

    近日,思必馳聲音復刻算法通過國家互聯網信息辦公室第十二批深度合成服務算法備案。該算法能夠高精度復刻人類
    的頭像 發表于 07-28 17:52 ?797次閱讀

    【高云GW5AT-LV60 開發套件試用體驗】基于開發板進行深度學習實踐,并盡量實現皮膚病理圖片的識別,第二階段

    算法一個一個的去用verilog實現,我還是有點吃力的?因為我有幾個問題還沒有弄清楚? 1、圖像的采集,保存,以及相關處理,以便符合后續model的需要? 當然談到model,這里有好多可以
    發表于 06-23 18:37

    正點原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!

    ! ③ 聲音克隆黑科技:錄制聲音,定制專屬家人的聲音,異地也能溫暖相伴! 全場景覆蓋的神器 ① 學習加速器:孩子作業輔導、英語對話練習、百科
    發表于 04-24 16:11