国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

首例“AI聲音侵權案”,聲音AI化用于短視頻

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2023-12-20 00:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/李彎彎)AI技術的應用,給我們的生活帶來了巨大改變。同時,它的不當使用也帶來了侵權、詐騙等風險。近日,北京互聯網法院首次組成五人合議庭,依法公開審理全國首例“AI聲音侵權案”。

該案中,原告殷某某以配音為職業,曾錄制多部有聲作品。殷某某意外發現,自己的聲音被AI化后,在一款名為“魔音工坊”的APP上以“魔小璇”的名義對外出售。因此,殷某某以被告行為侵害其聲音權為由,將“魔音工坊”的運營主體北京小問智能科技有限公司等五被告起訴到北京互聯網法院。

AI聲音侵權案始末

目前,該案件仍在審理中,五被告均否認侵權。北京小問智能科技有限公司認為,其APP中的聲音產品有合法來源,來自于微軟(中國)有限公司。微軟(中國)有限公司稱其使用的聲音來源于中廣影音(北京)文化傳媒有限公司。

中廣影音(北京)文化傳媒有限公司認為其與原告有過合作,約定經原告錄制形成的作品著作權歸屬其所有。上海藍云網絡科技有限公司和北京信諾時代科技發展有限公司辯稱,其分別為微軟中國的平臺運營商與涉案產品的經銷商,不構成侵權。

原告則認為,他人利用原告聲音的配音作品在抖音、直播吧等APP廣泛流傳,其中抖音用戶“小禾侃劇”自2021年9月7日至今,共發布使用原告聲音的作品119部。經聲音篩選和溯源,發現上述聲音作品中的聲音來自于被告北京小問智能科技有限公司運營的“魔音工坊”APP。

被告中廣影音(北京)文化傳媒有限公司將原告為其錄制的3本書的音頻交給被告微軟(中國)有限公司,被告微軟(中國)有限公司將原告的聲音進行AI化處理,并向被告上海藍云網絡科技有限公司和被告北京信諾時代科技發展有限公司授權對外出售。

但是,原告從未授權過任何第三人將其錄制的聲音進行AI化并對外銷售,上述被告的行為已經嚴重侵犯了原告的聲音權,應承擔停止侵權、賠禮道歉及賠償原告經濟損失、精神損失的侵權責任。

北京小問智能科技有限公司是出門問問旗下公司,魔音工坊是出門問問面向AI配音場景推出的新一代AI配音產品。在大模型技術的加持下,“魔音工坊”是全球首款搭載了大模型AI寫作功能的配音平臺,覆蓋了AI寫作、AI配音和剪輯等多個場景。用戶可以在它的輔助下輕松完成影視解說、有聲書、在線教育、新聞播報等集文案與配音于一體的內容創作。

如今,短視頻、有聲書市場蓬勃發展,這也使得聲音合成技術有了廣泛的應用空間。在應用市場和深度學習技術的發展下,語音合成技術已經非常成熟。可以看到上述情況是,原告給某公司錄過幾本書,它的聲音在沒被授權的情況下通過AI化之后,進行出售。

這其實就是現在大家談到的聲音克隆,也稱為語音合成定制,是一種深度學習算法。平臺方可以通過各種渠道獲得某人的聲音之后,哪怕這個人只是說了幾段話,通過AI技術都可以合成與原說話人非常相似的聲音。

語音合成歷史及應用趨勢

語音合成,又稱文語轉換(Text to Speech)技術,能將任意文字信息實時轉化為標準流暢的語音朗讀出來,相當于給機器裝上了人工嘴巴。它涉及聲學、語言學、數字信號處理、計算機科學等多個學科技術,是中文信息處理領域的一項前沿技術,解決的主要問題就是如何將文字信息轉化為可聽的聲音信息,也即讓機器像人一樣開口說話。

事實上,早在18到19世紀,語音合成技術就已經出現,當時是用機械裝置來模擬人的發聲,那時候科學家們會制作出一些精巧的氣囊和風箱去搭建發聲的系統,可以合成出一些元音和單音。20世紀初,出現了用電子合成器來模擬人發聲的技術,最具代表性的就是貝爾實驗室的Dudley,他在1939年推出了名為“VODER”的電子發聲器,使用電子器件來模擬聲音的諧振。

到了20世紀80年代,隨著集成電路技術的發展,出現了比較復雜的組合型的電子發生器,比較代表性的KLATT在1980年發布的串/并聯混合共振峰合成器。到了20世紀80、90年代隨著PSOLA方法的提出和計算機能力的發展,單元挑選和波形拼接技術逐漸走向成熟,90年代末劉慶峰博士提出聽感量化思想,首次將中文語音合成技術做到了實用化地步。

在20世紀末期,還有另外一種基于HMM的參數合成技術出現。而近些年,隨著AI技術不斷發展,基于深度學習的語音合成技術逐漸被人們所知道,DNN/CNN/RNN等各種神經網絡構型都可以用來做語音合成系統的訓練,深度學習的算法可以更好地模擬人聲變化規律。語音合成技術應用也迎來了高速發展。

當下,AI聲音合成技術的市場需求確實非常明顯。直播、短視頻、有聲書的市場需求空間大,然而未接受過聲音培訓的普通人對于自己的聲音滿意度并不高。而通過AI技術讓配音,或者美化自己的聲音正在成為趨勢。上文提到的魔音工坊正是通過技術手段為用戶提供好聽的聲音。

小結

當前來說,AI技術侵權的問題仍然還未得到解決,就如之前使用圖片所有權人的圖片進行訓練,生成的圖片,這是否構成對圖片所有權人的圖片的侵權。聲音訓練也是如此,使用某人的聲音訓練出了跟這個人類似的聲音,這個合成的聲音所有權算誰的?這些還需要進一步探討出相應的規范才行。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301438
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何查看小智是否成功進入聲音設置?

    你可以通過后臺頁面狀態、設備反饋、語音測試三種方式,快速確認小智是否成功進入聲音設置并生效。 一、后臺頁面直接查看(最準) 登錄小智AI后臺:https://xiaozhi.me/console
    發表于 02-16 06:39

    歡迎使用中國香河英茂科工豆包智能體

    (替你出鏡/直播) 適合:短視頻、直播、虛擬主播、口播 1. 剪映(最快,免費) 導入你的30秒+說話視頻(單人、清晰) 底部工具欄 → 文本 → 滑到數字人 → 選克隆視頻形象 上傳視頻
    發表于 02-14 07:22

    使用NORDIC AI的好處

    運動/手勢識別、可穿戴健康監測、預測性維護、樓宇與工業傳感網絡本地分析、聲音/關鍵詞/圖像識別等,都有官方明確提到的典型用例。[Unlock Edge AI 博客; Nordic Edge AI 技術頁]
    發表于 01-31 23:16

    IC聲音放大芯片怎么焊接區分啊,好小感覺四面都一樣?

    想做一個簡單的基于ESP32的AI語音識別助手,焊接好的聲音輸出一直是000。
    發表于 12-09 22:08

    VS680 HDMI AI分析解決方案 #目標識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導體
    發布于 :2025年11月12日 10:29:33

    如何進行聲音定位?

    文章主要介紹了如何利用一種簡單的TDOA算法進行聲音點位,并使用數據采集卡進行聲音定位的實驗。
    的頭像 發表于 09-23 15:47 ?1820次閱讀
    如何進行<b class='flag-5'>聲音</b>定位?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    配備科學發現仍需人類的直覺和靈感 ④正價可解釋性和透明性 ⑤解決倫理和道德問題六、AI芯片用于AI科學家”系統 AI芯片的作用:七、用量子啟發AI
    發表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    AI的應用多種多樣。比如:DALL-E2、Midjourney、Stable Diffusion等,不僅包括對話功能,還包括生成圖像、視頻、語音和程序代碼等功能。 竟然連代碼都可以生成,會取代程序員
    發表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    想到,除了研究大腦的抽象數學模型外,能否拋棄傳統的芯片實現方式,以化學物質和生物組件、材料及相關現象來構建人工神經網絡或提取其功能來用于AI處理,甚至直接用生物體來實現AI功能,這就是從AI
    發表于 09-06 19:12

    關于NanoEdge AI用于n-Class的問題求解

    我想請教一下關于NanoEdge AI用于n-Class的問題。我使用NanoEdge AI的n-Class模式,訓練好模型,設計了3個分類,使用PC端的模擬工具測試過,模型可以正常對數據進行分類
    發表于 08-11 06:44

    聲源定位模塊-AR1105# 聲源定位# 聲音定位

    聲音降噪
    深圳市聲訊電子有限公司
    發布于 :2025年08月01日 16:01:09

    AI視頻分析和算法集合

    AI
    jf_02235694
    發布于 :2025年07月23日 16:10:12

    正點原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!

    品非它莫屬! 為什么選擇小智AI? 真人級交互體驗 ① AI情感對話:不止問答,更能陪你聊心事、講笑話,像朋友一樣懂你! ② 10+音色百變:溫柔御姐、萌趣童聲、磁性男神… 每天換一種聲音陪伴
    發表于 04-24 16:11

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    正式提出“智能體化用戶體驗”方向,并啟動“天璣智能體化體驗領航計劃”。更值得注意的是,其三大AI工具鏈的發布——天璣開發工具集、AI開發套件2.0,以及升級的天璣星速引擎與旗艦芯片天璣9400+,標志著聯發
    發表于 04-13 19:52

    Banana Pi 發布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    ,包括 PCIe Gen3(2 Lanes)、USB 3.2、雙 USB 2.0 及 2x GbE,支持 MIPI CSI 攝像頭輸入和 MIPI DSI/LVDS 視頻輸出,為 AI 視覺應用和工業物
    發表于 03-19 17:54