国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

微軟在人工智能TTS語音合成技術上的最新進展

微軟科技 ? 來源:微軟科技 ? 作者:微軟科技 ? 2022-02-08 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

小編說:在這個技術快速更迭的時代,人工智能的可能性在逐漸拓寬。為了讓大家可以更好的理解人工智能在智能語音方面的強大能力,今天小編就來詳細為大家介紹微軟在人工智能TTS語音合成(Text-to-Speech)技術上的一些最新進展。

不同對話場景

用戶期待不同語氣的擬人 AI 語音

TTS 語音已被越來越多地用于支持人機對話或機器輔助的日常交流——例如人與人之間對話的同聲傳譯。在這些場景中,人們普遍期待能夠實現更自然、更口語化的對話風格。我們不妨從以下三個典型場景中,來理解用戶對于對話聲音和風格的不同需求。

客服機器人:語氣要自然、友好且專業

很多企業正在使用支持語音的聊天機器人或 IVR(互動式語音應答)系統,為客戶帶來相比傳統方式更為高效、體貼的客戶服務。例如國際移動通訊網絡公司沃達豐就成功地創建了一個擁有自然語音的客服機器人 TOBi。Azure 的人工智能和自然語言處理功能賦予了 TOBi 鮮明的個性,使客戶與 TOBi 之間的人機對話變得輕松自然,讓客戶更樂于與之交流。

設想這樣的情景:在客戶對 TOBi 報出姓名后,當 TOBi 需要了解客戶的地址以便提供進一步服務時,TOBi 并不會生硬地接著發問:「請說出您的地址。」而是會這樣表達:「嘿,好名字!接下來我還需要了解一下您住在哪里?」此時此刻,客戶一定希望 AI 能夠以聽起來熱情、友好、溫暖,且又專業的聲音來說出這句話。類似的需求不僅體現在 AI 解答客戶疑問時,還適用于 AI 語音向客戶打招呼,或表達共情態度時。個人助理:表情符號、重點強調要讀懂

隨著虛擬助手和虛擬現實技術的興起,使用 Neural TTS 來支持閑聊和日常對話功能的客戶數量正在不斷增加。想要讓 AI 與人類的對話更加自然,最主要的挑戰之一在于如何讓 AI 理解包含特殊字符在內的聊天用語——比如「呵呵」、「哈哈」、「哎喲」這類詞匯。

這類表情符號,還有重復字母如「soooo good」——然后再以自然的語氣提供即時響應。此外,讓 AI 能使用不同的信息來表達相應情感,從而表現出對人類感受的共鳴感,也正在成為一種越來越普遍的用戶需求。同聲傳譯:翻譯前后說話風格、語氣要一致

語音互譯是又一個對話式 AI 語音可支持的典型場景。Azure Neural TTS 已覆蓋 110 多種不同語言,被應用于多種翻譯場景中。不過,如何在翻譯的同時保持講話者的原始語氣風格,一直都是個挑戰。尤其是在較為隨意的對話場景中,講話者往往會使用語氣上的細微差別來與聽眾建立情感聯系。在這種情況下,如果 AI 語音可在提供同步翻譯的同時,又能捕捉并理解講話者的風格,就能使不同語言之間的對話依然生動且具有吸引力。

Azure Neural TTS

進化:多國語言皆可栩栩如生戶

Sara(英語):更能表現自然情感的聊天機器人語音

Sara 是一個新近推出的美式英語音色,尤其擅長輕松的對話。「她」有著輕松自然的年輕女性聲線,能夠勝任各種需要聊天機器人的場景。Sara 擁有三種情緒:快樂、悲傷和氣憤。她在閱讀表情符號時,可以發出笑聲、嘆息或氣憤語氣,而且還能發出「太~(拉長語調)好了」這種人類特有的語調。播放下面的語音,親耳感受一下效果。

下面這段錄音,來自 Sara 作為聊天機器人與人類用戶之間的自然對話。(此示例來自機器人和人類用戶之間的閑聊,對話很隨意,可能包含錯誤。)

除了預設的幾種「情緒」,用戶還可以通過 SSML 讓 Sara 在常規交流、歡快、悲傷和憤怒等幾種語氣風格之間隨意切換。

曉辰和曉顏(中文普通話):專為日常對話及客服場景而優化的全新中文語音

曉辰和曉顏是專為中文用戶提供的普通話語音。其中曉辰擅長逼真的自然語氣,曉顏與客戶服務場景更匹配。曉辰和曉顏最顯著的特征,在于能逼真模仿人類在日常場合下的交流。與朗誦、播音這類「嚴肅」場合不同,人們的日常對話中除了語氣隨意,韻律多變,而且常常出現詞語發音不完整,句子語法不像課本那么嚴謹,且會出現重復、不完整、或者啰嗦等情況。借助先進的建模技術,曉辰和曉顏的 AI 語音能夠學習并活用這些人類表達的「缺陷」,并逼真地還原這些「不完美」,使合成語音聽起來更加真實親切。在下面這段客服場景模擬對話中,曉顏是客服助理,曉辰是客戶。您可以從中感受到他們如同真人一般輕松、自然的對話語氣。

Nanami(日語):元氣滿滿的東瀛女聲

Nanami 是擁有動聽女性聲線的日語語音。「她」有著三種不同語音風格:聊天風格、客服風格和開朗風格,讓合成語音在各種場景中都更具吸引力。

來聽一聽 Nanami 元氣滿滿的聲音:

現在就來感受

Azure Neural TTS 擬人語音的動人表現力吧!

微軟不斷傾聽全球用戶對于 Azure Neural TTS 在不同情況下語音發音準確性的反饋,以負責任的 AI 及公平、可靠和安全、隱私和保障、包容、透明、負責的六項人工智能準則為前提,進行了這次更新,為用戶帶來表達更自然、語義更清晰的語音體驗。現在,微軟的文本轉語音可以支持超過 110 種語言的 270 多種 AI 語音。如果想親身感受 Azure Neural TTS 的強大,就來 Azure 官網親自體驗吧!還有聲音定制平臺可以即刻為企業創建多種語言和風格的獨特品牌語音。

原文標題:什么!跟我說話的竟然是AI!

文章出處:【微信公眾號:微軟科技】歡迎添加關注!文轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6741

    瀏覽量

    107860
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301414
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265386

原文標題:什么!跟我說話的竟然是AI!

文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國芯科技DPNPU新IP產品最新進展,單核支持0.5~4.8TOPS靈活算力配置

    國芯科技DPNPU新IP產品 最新進展,單核支持0.5~4.8TOPS 靈活算力配置 ? 電子發燒友網綜合報道 國芯科技發布公告稱,其自主研發的神經網絡處理器DPNPU(Dataflow
    的頭像 發表于 01-09 09:19 ?1879次閱讀
    國芯科技DPNPU新IP產品<b class='flag-5'>最新進展</b>,單核支持0.5~4.8TOPS靈活算力配置

    從協議到實踐——EtherNet/IP與NetStaX的最新進展

    從協議到實踐——EtherNet/IP與NetStaX的最新進展
    的頭像 發表于 12-19 15:26 ?1509次閱讀
    從協議到實踐——EtherNet/IP與NetStaX的<b class='flag-5'>最新進展</b>

    微軟與新思科技分享智能人工智能技術的行業影響

    2025年世界移動通信大會(MWC 2025)微軟(Microsoft)與新思科技(Synopsys)兩家科技巨頭攜手登臺,分享了他們對人工智能(AI)發展的最新洞見、
    的頭像 發表于 11-30 09:48 ?405次閱讀

    芯科科技分享物聯網領域的最新進展

    Labs(芯科科技)亞太區業務副總裁王祿銘、中國大陸區總經理周巍及臺灣區總經理寶陸格就公司技術路線、產品策略及市場趨勢回答了媒體提問。三位高管圍繞安全認證、無線連接、邊緣計算等議題,介紹了公司物聯網領域的最新進展
    的頭像 發表于 11-13 10:48 ?1664次閱讀

    TTS文字合成語音芯片的使用場景

    下觸發固定的語音內容,而TTS文字合成語音播報芯片則不一樣的,他可以通過文章直接生成語音播報,這一點是傳統的語音芯片拍馬也趕不上的,并且
    的頭像 發表于 08-22 17:11 ?1006次閱讀

    從開發工程師視角看TTS語音合成芯片

    從開發工程師視角看TTS語音合成芯片 語音交互領域,TTS
    的頭像 發表于 08-13 14:52 ?834次閱讀

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    和生態體系帶到使用者身邊 ,讓我們技術學習和使用上不再受制于人。 三、多模態實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能
    發表于 08-07 14:30

    CES Asia 2025同期低空智能感知與空域管理技術論壇即將啟幕

    最新進展,探討如何打破系統間的壁壘,實現不同系統之間的信息共享與協同工作,為未來城市空中交通的大規模商業化運營奠定基礎。 人工智能技術的飛速發展,為空域動態管理帶來了新的機遇。在這一議題下,與會者將深入探討
    發表于 07-10 10:16

    Air8000 TTS開源,語音合成從此“零距離”!

    技術不應有圍墻,創新需要共生長。Air8000宣布TTS應用源代碼全面開放,開發者可自由定制語音風格、優化合成效果,讓文字與聲音的對話,不再受限于黑箱算法。
    的頭像 發表于 07-03 16:33 ?618次閱讀
    Air8000 <b class='flag-5'>TTS</b>開源,<b class='flag-5'>語音</b><b class='flag-5'>合成</b>從此“零距離”!

    英特爾持續推進核心制程和先進封裝技術創新,分享最新進展

    近日,2025英特爾代工大會上,英特爾展示了多代核心制程和先進封裝技術最新進展,這些突破不僅體現了英特爾技術開發領域的持續創新,也面向
    的頭像 發表于 05-09 11:42 ?870次閱讀
    英特爾持續推進核心制程和先進封裝<b class='flag-5'>技術</b>創新,分享<b class='flag-5'>最新進展</b>

    百度AI領域的最新進展

    近日,我們武漢舉辦了Create2025百度AI開發者大會,與全球各地的5000多名開發者,分享了百度AI領域的新進展
    的頭像 發表于 04-30 10:14 ?1334次閱讀

    智能收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術應用解析

    一、行業應用背景零售業態智能化轉型的浪潮中,收銀設備正經歷從功能型向服務型轉變的關鍵階段。WT3000T8語音合成芯片應運而生,專為滿足新零售場景下
    的頭像 發表于 04-24 08:45 ?1003次閱讀
    <b class='flag-5'>智能</b>收銀<b class='flag-5'>語音</b>交互新標桿—WT3000T8<b class='flag-5'>語音</b><b class='flag-5'>合成</b>芯片<b class='flag-5'>TTS</b><b class='flag-5'>技術</b>應用解析

    芯資訊|WT3000T8語音合成芯片TTS智能收款機中的創新應用設計方案介紹

    一、智能語音播報技術演進與市場需求隨著人工智能技術的快速發展,TTS(Text-to-Speech)技術
    的頭像 發表于 04-15 08:55 ?895次閱讀
    芯資訊|WT3000T8<b class='flag-5'>語音</b><b class='flag-5'>合成</b>芯片<b class='flag-5'>TTS</b><b class='flag-5'>在</b><b class='flag-5'>智能</b>收款機中的創新應用設計方案介紹

    谷歌Gemini API最新進展

    體驗的 Live API 的最新進展,以及正式面向開發者開放的高質量視頻生成工具 Veo 2。近期,我們面向 Google AI Studio 中使用 Gemini API 的開發者推出了許多不容錯過的重要更新,一起來看看吧。
    的頭像 發表于 04-12 16:10 ?1681次閱讀

    京東方華燦光電氮化鎵器件的最新進展

    日前,京東方華燦的氮化鎵研發總監馬歡應半導體在線邀請,分享了關于氮化鎵器件的最新進展,引起了行業的廣泛關注。隨著全球半導體領域對高性能、高效率器件的需求不斷加大,氮化鎵(GaN)技術逐漸成為新一代電子器件的熱點,其優越的性能使其
    的頭像 發表于 03-13 11:44 ?1711次閱讀