国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RealTalk系統利用文本輸入生成逼近真人聲音 社會影響巨大

電子工程師 ? 來源:yxw ? 2019-05-20 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

加拿大創業公司 Dessa 開發出一個語音合成系統 RealTalk,與以往基于語音輸入學習人聲的系統不同,它可以僅基于文本輸入生成完美逼近真人的聲音。不過,出于倫理、社會影響等方面的考慮,Dessa 并未公布該項目的研究細節、模型和數據集。

加拿大創業公司 Dessa 近日發布了一項新研究:利用其最新開發的 RealTalk 系統,僅利用文本輸入即可生成完美逼近真人的聲音。其 demo 中展示了美國著名脫口秀喜劇演員、主持人 Joe Rogan 的聲音(Joe Rogan 就是那個讓馬斯克在節目中嗨了的主持人)。

所有音頻均為機器學習模型使用文本輸入生成的。音頻中包括換氣聲、「um」「ah」等詞語和噪聲。

視頻中,「Joe Rogan」用他一貫的語調和風格,談論黑猩猩曲棍球隊、快速說繞口令,甚至模擬了一段「Joe Rogan 被人工智能研究者困在機器中」的情境……

Joe Rogan 本人在聽了模擬音頻后表示:「it's terrifyingly accurate」。有 twitter 網友評論道「你應該和 AI Joe Rogan 來一次訪談,lol」……

Joe Rogan 發 ins 表示:「我的立場就是驚訝地聳肩搖頭,然后接受它。未來越來越奇怪了,朋友們。」

復制 Rogan 聲音這一項目是由 Dessa 公司機器學習工程師 Hashiam Kadhim、Joe Palermo 和 Rayhane Mama 組成的團隊創造的,他們使用了一個文本轉語音的深度學習系統 RealTalk,可以僅基于文本輸入生成逼真的語音。

是不是很瘋狂?Dessa 首席機器學習架構師 Alex Krizhevsky (是的沒錯,他就是 AlexNet 的發明者)認為這是「我所看到的人工智能領域最酷也最恐怖的事件之一。與理論上 40100 年后才會出現的奇點不同,語音合成已經成為現實。」也許大家和他的想法是一樣的。

這意味著什么?會產生什么社會影響?

想想看,Dessa 的工程師用 AI 合法地創建了 Joe Rogan 聲音的逼真復制品,多么不可思議。而且,該模型能夠復制任何人的聲音,只要能夠獲得足夠的訓練數據。

而作為構建現實世界應用的 AI 從業者,Dessa 也考慮到了這一點:這項技術會帶來什么影響?

很明顯,語音合成等技術的社會影響是巨大的。它會影響到每一個人:不管有錢沒錢,不管是企業還是政府。

目前,要創建像 RealTalk 這樣性能良好的模型需要技術知識、獨創性、計算能力和數據。所以,不是任何人都可以實現它。但是在接下來的幾年里(甚至更短的時間內),技術可能會發展到只需要幾秒鐘的音頻就能復制出世界上任何人的聲音。

這樣就很恐怖了。

如果這種技術落入壞人之手,可能會發生下面的情況:

垃圾郵件發送者假冒你母親或者愛人來獲取你的個人信息;

以霸凌或騷擾為目的冒充別人;

冒充政府官員進入絕密區域;

利用政客的「audio deepfake」來操縱選舉或引發社會暴動;

……

除了消極影響之外,Dessa 也考慮了這項技術的積極一面。

如果這項技術被正確利用的話,則:

和語音助手說話的時候感覺很自然,就像與朋友聊天一樣。

可以定制語音應用程序,比如,健身 app 里鼓勵大家鍛煉的個性化話語來自阿諾·施瓦辛格。

為只能通過文本-語音設備進行交流的人提供了一種交流選項,比如患有盧·格里克病(漸凍人癥,ALS)的人。

用任何語言為任意媒體文件自動配音。

正如牛津大學人類未來研究所在最近發布的一份報告《The Malicious Use of Artificial Intelligence》中所提到的那樣:人工智能領域的進步不僅擴大了現有威脅,還帶來了新的威脅。

如何從倫理方面考慮來構建這個技術,Dessa 還沒有完全得出答案。但未來幾年里,這項技術將不可避免地建立起來并應用到現實世界中。因此,除了提高意識和承認問題以外,Dessa 表示希望這項研究能夠開啟關于語音合成技術的對話和討論。

每個人都應該知道,隨著語音合成技術的發展,可能會發生什么樣的情況。正如 Deepfake 技術出現時我們看到的那樣,公眾意識和對話促使政府、政策制定者、立法者迅速采取行動并制定對策。

Dessa 在相關博客中表示:作為應用人工智能公司,Dessa 的一個重要責任是,了解在研究領域探索 AI 和在現實中應用 AI 有著巨大的差別。為了負責任地對待這種技術,他們認為在開源該項目之前,應該讓公眾首先意識到語音合成模型的影響。

也因此,Dessa 目前沒有公開研究細節、模型或數據集。

Dessa 表示后續將發布博客,介紹 RealTalk 的工作原理和構建過程。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39866

    瀏覽量

    301513
  • 機器學習
    +關注

    關注

    66

    文章

    8554

    瀏覽量

    136986
  • 語音合成技術

    關注

    0

    文章

    8

    瀏覽量

    2670

原文標題:語音版deepfake出現:從文本到逼真人聲,被模仿者高呼真得可怕

文章出處:【微信號:smartman163,微信公眾號:網易智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    詳解DBC的Signal與JSON文本結合

    為了優化CAN數據發送與接收的操作流程,更改以前手動輸入狀態對應數據的模式,采用下拉列表選擇內容,但這需要用到超出DBC原有承載能力的信息。因此,將JSON與其結合,采用JSON格式文本寫入Signal的Comment屬性,將Comment屬性的字符串通過JSON
    的頭像 發表于 01-06 10:57 ?306次閱讀
    詳解DBC的Signal與JSON<b class='flag-5'>文本</b>結合

    數據中心不斷演進以滿足 AI 的巨大電力需求

    隨著大型語言模型徹底改變我們訪問數據的方式,人工智能(AI) 的進步正在顛覆各行各業及社會對數據中心計算資源的運用模式。我們正逐步進入能夠直接向 AI 提問并獲取詳盡答案的時代,這與向真人提問無異
    的頭像 發表于 12-01 14:37 ?6930次閱讀
    數據中心不斷演進以滿足 AI 的<b class='flag-5'>巨大</b>電力需求

    萬里紅文本生成算法通過國家網信辦備案

    近日,國家互聯網信息辦公室發布了第十四批深度合成服務算法備案信息,北京萬里紅科技有限公司(以下簡稱:萬里紅)自主研發的“萬里紅文本生成算法”正式通過備案。該算法致力于通過自動化的方式,提升知識問答、RAG分類、預測、文檔生成的準確率,確保信息的安全性和合規性,為用戶提供及
    的頭像 發表于 11-14 09:06 ?692次閱讀

    大模型驅動下的人機交互革命,“超擬真人互動”?讓玩具讀懂你的情緒

    電子發燒友網報道(文/黃山明)日前,在大灣區AI玩具生態大會上,百度智能云正式發布基于“超擬真人互動”理念的智能硬件多模態交互解決方案。該方案通過大模型與多模態技術的深度融合,從技術架構到場景落地
    的頭像 發表于 10-31 09:21 ?6452次閱讀
    大模型驅動下的人機交互革命,“超擬<b class='flag-5'>真人</b>互動”?讓玩具讀懂你的情緒

    【內測活動同步開啟】這么小?這么強?新一代大模型MCP開發板來啦!

    ,將碰撞出怎樣的智能火花?關注并私信獲得內測資格! 視頻: 「Arcs-Mini」聆思打造全新大模型MCP開發板小巧機身,蘊含強大能量 實現真人般自然對話體驗,會感知、會表達、會表情、懂共情,獨家人聲
    發表于 09-25 11:47

    如何進行聲音定位?

    文章主要介紹了如何利用一種簡單的TDOA算法進行聲音點位,并使用數據采集卡進行聲音定位的實驗。
    的頭像 發表于 09-23 15:47 ?1840次閱讀
    如何進行<b class='flag-5'>聲音</b>定位?

    如何利用 DDR 參數文件生成 Linux 映像?

    如何利用 DDR 參數文件生成 Linux 映像
    發表于 09-02 06:39

    聲源定位模塊-AR1105# 聲源定位# 聲音定位

    聲音降噪
    深圳市聲訊電子有限公司
    發布于 :2025年08月01日 16:01:09

    Copilot操作指南(一):使用圖片生成原理圖符號、PCB封裝

    “ ?上周推出支持圖片生成模型的華秋發行版之后,得到了很多小伙伴的肯定。但看到更多的回復是:為什么我的 Copilot 無法生成符號?只有普通的文本回復?今天就為大家詳細講解下圖片生成
    的頭像 發表于 07-15 11:14 ?4658次閱讀
    Copilot操作指南(一):使用圖片<b class='flag-5'>生成</b>原理圖符號、PCB封裝

    關于鴻蒙App上架中“AI文本生成模塊的資質證明文件”的情況說明

    的應用缺少AI文本生成模塊的資質證明文件,不符合相關法律法規要求。 修改建議:AI文本生成模塊需補充提供《安全評估報告》并加手寫簽名、《安全評估報告》在全國互聯網安全服務管理平臺的提交結果截圖,且現場
    發表于 06-30 18:37

    從代碼到聲音,Air8000 TTS開源應用開啟創作新紀元!

    Air8000顛覆傳統TTS開發模式,以開源之力重塑語音合成領域!獲取應用源碼,開發者即可自由修改參數、適配多場景,讓文字與聲音的結合,迸發無限創意價值。 TTS (Text-to-Speech文本
    的頭像 發表于 06-27 17:06 ?585次閱讀
    從代碼到<b class='flag-5'>聲音</b>,Air8000 TTS開源應用開啟創作新紀元!

    邊緣生成式AI面臨哪些工程挑戰?

    本文由TechSugar編譯自electronicdesign當大多數人想到人工智能(AI)時,他們通常能想到的是能夠生成文本、圖像或語音內容的應用。像ChatGPT這樣流行的文本應用(在幾天
    的頭像 發表于 06-25 10:44 ?1151次閱讀
    邊緣<b class='flag-5'>生成</b>式AI面臨哪些工程挑戰?

    Arm與Stability AI攜手合作加快文本轉音頻的響應速度

    想象一下,你正在智能手機上編輯視頻,需要為其添加合適的音效;或是你想要生成自定義聲音,用于設置鈴聲、鬧鐘或發布社交媒體帖子。你無需在網上搜索或購買音頻片段,只需輸入一段描述,例如“日落時的輕柔海浪聲
    的頭像 發表于 03-25 15:54 ?801次閱讀

    利用OpenVINO GenAI解鎖LLM極速推理

    隨著 DeepSeek、 GPT 和 Llama 等大語言模型(LLMs)不斷推動人工智能的邊界,它們在高效部署方面也帶來了重大挑戰。這些模型在生成類似人類的文本方面具有革命性,但每生成一個
    的頭像 發表于 03-18 14:09 ?1113次閱讀
    <b class='flag-5'>利用</b>OpenVINO GenAI解鎖LLM極速推理

    使用OpenVINO GenAI和LoRA適配器進行圖像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用戶可以將平平無奇的文本提示詞轉換為令人驚艷的視覺效果。
    的頭像 發表于 03-12 13:49 ?1904次閱讀
    使用OpenVINO GenAI和LoRA適配器進行圖像<b class='flag-5'>生成</b>