2月4日消息 據(jù)外媒 engadget 報道,微軟宣布開放其文本語音轉(zhuǎn)換 AI 的訪問權(quán)限,該技術(shù)名為 “自定義神經(jīng)語音”,允許開發(fā)人員通過文字創(chuàng)建自定義合成語音。
該技術(shù)是微軟 Azure 服務(wù)的一部分,開發(fā)人員可以將其用于諸如語音助手、聊天機(jī)器人、在線學(xué)習(xí)以及閱讀有聲讀物或新聞之類的工具。不過開發(fā)人員必須先申請微軟的訪問權(quán)限并獲得后者的批準(zhǔn)。
微軟表示,該技術(shù)可以提供比許多其他文本語音轉(zhuǎn)換服務(wù)更自然的聲音,其使用多個神經(jīng)網(wǎng)絡(luò)來確保韻律(每個音素的音調(diào)和持續(xù)時間)和發(fā)音正確,AI 可以正確地模仿演員的聲音或合成任意逼真的人聲。
IT之家了解到,包括 AT&T 和華納兄弟在內(nèi)的多家公司已經(jīng)在使用這項技術(shù),它們在微軟的幫助下錄制了 2000 多個行和短語,開發(fā)了一個兔八哥的語音助手。
責(zé)任編輯:PSY
-
微軟
+關(guān)注
關(guān)注
4文章
6741瀏覽量
107860 -
語音
+關(guān)注
關(guān)注
3文章
405瀏覽量
39776 -
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301405
發(fā)布評論請先 登錄
電能質(zhì)量在線監(jiān)測裝置的數(shù)據(jù)在云端的訪問權(quán)限是如何管控的?
Arm獲任開放計算項目董事會成員
Simcenter FLOEFD高級模塊:為設(shè)計工程師提供對特殊物理功能的訪問權(quán)限
語音輸出模塊是什么?自控語音播報
華為宣布CANN全面開源開放
最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語音視覺識別篇)
Air8000 TTS開源,語音合成從此“零距離”!
關(guān)于鴻蒙App上架中“AI文本生成模塊的資質(zhì)證明文件”的情況說明
微軟宣布全球裁員6000人
Linux權(quán)限管理基礎(chǔ)入門
90元打造小智AI腕表,語音交互超有趣!
高質(zhì)量 HarmonyOS 權(quán)限管控流程
Apple Intelligence全球開放 支持簡體中文
【CW32模塊使用】語音合成播報模塊
微軟宣布開放其文本語音轉(zhuǎn)換 AI 的訪問權(quán)限
評論