国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌的智能助理Google Assistant 開啟了多語言支持

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-09-02 09:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從今天開始,谷歌的智能助理可以同時說兩種語言了!這意味著雙語家庭可以用任何一種語言進行查詢,而無需每次都更改設置。聽起來簡單,實現這一功能所需的技術可不簡單,谷歌的口語識別LangID技術已經開發了5年!

使用 Google Assistant 的 Google Home Mini

多語家庭正變得越來越普遍,有一些研究發現多語人口已經超過單語人口,而且這個數字還將繼續增長。隨著多語用戶數量的不斷增加,開發能夠同時支持多種語言的產品比以往任何時候都更加重要。

今天,谷歌的智能助理Google Assistant開啟了多語言支持,允許用戶同時使用兩種不同的語言進行查詢,而無需返回語言設置。一旦用戶選擇了兩種支持的語言(目前支持的語言包括英語、西班牙語、法語、德語、意大利語和日語),他們就可以使用其中任一種語言與Google Assistant進行對話,智能助理也會以同一種語言做出回復。

在此之前,用戶必須為智能助理選擇一種語言設置,每次想要使用另一種語言時都必須更改設置。但現在,對于多語家庭來說,與谷歌助理交流的體驗變得更加簡單方便了。

Google Assistant現在能夠識別語言、解釋查詢并使用正確的語言提供回復,而無需用戶手動設置設置。

然而,實現這一功能并非易事。事實上,研究人員努力了多年,解決了許多具有挑戰性的問題。最后,我們將問題分解為三個獨立的部分:識別多種語言,理解多種語言,以及為Google Assistant用戶優化多語言識別。

識別多種語言

人類是有能力識別出別人在說另一種語言的,即使他們自己不會說這種語言,只需要注意語音的聲學特征(語調、音域等等)。但是,即使借助于全自動語音識別系統,定義一個自動口語語言識別的計算框架也是很有挑戰性的。

研究者通常認為,口語識別比基于文本的語言識別更具挑戰性,對于文本語言識別來說,相對簡單的基于字典的技術已經可以做得很好。口語詞匯的時間/頻率模式很難比較,口語詞匯很難劃界,因為口語可以毫無停頓地以不同的節奏說話,而且麥克風可能會記錄除了語音之外的背景噪音。

在2013年,谷歌開始使用深度神經網絡開發口語識別(LangID)技術。今天,谷歌最先進的LangID模型已經可以使用遞歸神經網絡區分超過2000種可供選擇的語言對。遞歸神經網絡特別適用于序列建模問題,例如語音識別、語音檢測、說話人識別等。研究人員遇到的挑戰之一是使用更大的音頻集——獲取能夠自動理解多種語言的模型,并達到允許這些模型正常工作的質量標準。

理解多種語言

要同時理解一種以上的語言,需要并行地運行多個進程,每個進程都會產生增量結果,這樣智能助理不僅可以識別查詢所使用的語言,還可以解析查詢以創建可操作的命令。

例如,即使是單語環境,如果用戶要求“設一個下午6點的鬧鈴”,谷歌助理必須理解“設置鬧鈴”意味著打開時鐘app,完成“6pm”的顯式參數,并推斷鬧鐘應該設在今天。為任何一對支持的語言實現這個功能都是一項挑戰,因為智能助理需要執行與單語環境時相同的工作,但現在還必須另外啟用LangID。這不僅是一個語言識別系統,而是相當于兩個單語言識別系統。

更重要的是,Google Assistan以及在用戶查詢中異步引用的其他服務會生成需要在幾毫秒內評估的實時增量結果。這是借助另外一種算法實現的,該算法使用LangID生成的候選語言的概率、我們對轉錄的信心以及用戶的偏好(例如,最喜歡的藝術家)對兩個語音識別系統提供的轉錄假設進行排序。

Google Assistant使用的多語言語音識別系統與標準單語語音識別系統的示意圖。排序算法用于從兩個單語語音識別器中選擇最佳的識別假設,利用了用戶的相關信息和增量的langID結果。

當用戶停止說話時,該模型不僅確定了用戶所講的語言,還確定了所講的內容。當然,這個過程需要一個復雜的架構,增加了處理成本,并可能造成不必要的延遲。

優化多語識別模型

為了最大限度地減少這些不良影響,系統決定使用哪種語言的速度越快越好。如果系統在用戶完成查詢之前確定了所使用的語言,那么它將停止通過losing recognizer運行用戶的語音,并丟棄losing hypothesis,從而降低處理成本,減少任何潛在的延遲。

考慮到這一點,我們嘗試了優化系統的幾種方法。

我們考慮的一個用例是,人們通常在一個完整查詢過程中使用相同的語言(這個語言通常也是用戶希望智能助理回復使用的語言),除了詢問某個東西用不同語言怎樣說之外。這意味著,在大多數情況下,關注查詢的開頭部分就可以讓智能助理對所使用的語言進行初步猜測,甚至在包含不同語言實體的句子中也是如此。

有了這種早期識別,我們就可以像處理單語查詢那樣,通過切換到單語語音識別器來簡化任務。然而,快速決定如何以及何時切換到一個單語言,在最后會需要一個技術轉折:具體來說,我們使用隨機森林(random forest)方法,結合多個上下文信號,例如正在使用的設備類型、發現的語音假設的數量、多久收到類似的假設、各個語音識別器的不確定性、以及每種語言的使用頻率等。

另外一種簡化和改進系統質量的方法是限制用戶可以選擇的候選語言列表。用戶可以谷歌智能助理設備目前支持的六種語言中選擇兩種語言,這已經能夠支持大多數多語使用者。

不過,隨著LangID技術的不斷改進,谷歌希望接下來能夠解決三語支持的問題,這將進一步提升多語用戶群的體驗。而且,谷歌負責產品的副總裁 Nick Fox 此前表示,接下來的幾個月里 Google Assistant 將增加支持丹麥語、荷蘭語、印地語、印度尼西亞語、挪威語、瑞典語和泰語。到今年年底,谷歌助理將支持超過 30 種語言,覆蓋 Android 手機使用語言的 95%。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111392
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107768

原文標題:谷歌雙語助理來了!中英夾雜也不怕,遞歸神經網絡和隨機森林顯神威

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    智能顯示模塊支持腳本語言嗎?

    智能顯示模塊支持腳本語言嗎?
    發表于 02-26 11:18

    RK平臺ROS2適配全指南:從編譯到運行,手把手搞定嵌入式機器人開發

    Operating System 2)作為新一代機器人操作系統,在分布式通信、實時性、多語言支持上的升級,更是嵌入式機器人開發的核心框架。
    的頭像 發表于 02-06 16:42 ?3444次閱讀
    RK平臺ROS2適配全指南:從編譯到運行,手把手搞定嵌入式機器人開發

    京東多語言質量解決方案

    一、業界多語言面臨的通用挑戰是什么 做這個事之前,我們先看看業界做了什么。 ??阿里巴巴全球化測試技術介紹? ??螞蟻全球化無線端質量解決方案? ??談談多語言測試? 總結下來,需要面臨3個通用
    的頭像 發表于 01-13 16:18 ?922次閱讀
    京東<b class='flag-5'>多語言</b>質量解決方案

    泰凌微:布局端側AI,產品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發布的基于TL721X系列芯片的TL-EdgeAI平臺,支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯網連接協議平臺。其芯片已在谷歌
    的頭像 發表于 12-15 08:21 ?1w次閱讀

    阿里巴巴國際站關鍵字搜索 API 實戰:3 步搞定多語言適配 + 限流破局,詢盤量提升 40%

    跨境電商API開發常陷合規、多語言、限流等坑。本文詳解從國際合規(GDPR/CCPA)到參數優化、數據結構化及區域化搜索的全鏈路方案,附Python代碼模板與緩存重試架構,助力提升調用成功率至99%+,精準詢盤增長42%。
    的頭像 發表于 10-20 14:44 ?1719次閱讀

    速賣通全球運營利器:商品詳情接口多語言 + 合規 + 物流適配技術全解析

    速賣通全球化適配是跨境成功關鍵!本文詳解2025最新接口方案,涵蓋多語言智能翻譯、合規自動校驗、物流精準推薦與性能優化四大模塊,助力商家提升轉化率30%+,降低風險,提效80%。附實操代碼與新手三步走策略,適合所有想出海的賣家。
    的頭像 發表于 10-16 09:30 ?535次閱讀
    速賣通全球運營利器:商品詳情接口<b class='flag-5'>多語言</b> + 合規 + 物流適配技術全解析

    谷歌查找我的設備配件(Google Find My Device Accessory)詳解和應用

    谷歌查找我的設備配件(Google Find My Device Accessory)介紹 谷歌查找我的設備配件是與谷歌 “查找我的設備” 應用程序配合使用的配件,旨在幫助用戶更方便地
    發表于 08-31 21:10

    用藥提醒新升級:WT588E02B-8S語音提示芯片實現語言播報

    老齡化趨勢下,老年群體用藥錯漏問題突出,傳統藥盒缺乏有效提醒功能。健康管理智能化需求推動下,語音交互成為提升藥盒實用性的關鍵。而產品全球化布局中,多語言適配需求迫切,催生了支持靈活語音更新的專用芯片
    的頭像 發表于 08-13 16:32 ?776次閱讀

    匠芯創發布新版GUI開發工具 新增多國語言設置等功能

    ,為開發者提供直觀的參考。 多國語言示例模板 該模板重點演示不同語言之間的切換流程,幫助開發者快速掌握多語言支持的實現方法。 視頻播
    發表于 07-16 13:54

    Google Fast Pair服務簡介

    谷歌賬號,并嘗試配對已保存到其谷歌賬號的設備時所發生的一系列事件。在此過程中,新手機會識別出廣播里的Model ID ,它已保存到用戶的 Google 帳號中,并提供一條通知,以加快將該設備與這部
    發表于 06-29 19:28

    中科曙光DeepAI深算智能引擎全面支持Qwen3

    日前,Qwen3正式發布并全部開源8款混合推理模型。作為Qwen系列中的最新一代大型語言模型,Qwen3在推理、指令遵循、工具調用、多語言能力等方面實現全面增強。
    的頭像 發表于 05-06 15:17 ?1158次閱讀

    廣州唯創電子WT3000A離在線TTS語音提示器芯片IC設計方案深度解析

    引言:語音交互的智能化躍遷在全球化與智能化深度融合的今天,語音交互設備的應用場景已從單一提示功能向多語言支持、情感化表達及AI深度交互演進。傳統離線語音方案受限于語種單一、存儲容量不足等問題,而純
    的頭像 發表于 04-25 09:13 ?793次閱讀
    廣州唯創電子WT3000A離在線TTS語音提示器芯片IC設計方案深度解析

    智能收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術應用解析

    性的TTS技術集成,解決傳統收銀系統語音播報存在的多語言支持不足、資源占用過高、語音定制不靈活等行業痛點。二、芯片核心特性多模態語音處理架構?采用32位240M
    的頭像 發表于 04-24 08:45 ?1003次閱讀
    <b class='flag-5'>智能</b>收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術應用解析

    S1C31D50/51/41愛普生MCU系列語音芯片助力智能語音應用

    與背景音樂的協同播放、多語言支持以及靈活的音調和語速調整等。此外,該系列芯片的低功耗設計和高壓縮率存儲算法,使其在保持高性能的同時,顯著降低了功耗和存儲需求,為電池供電設備和對功耗敏感的應用場景提供理想的解決方案。
    的頭像 發表于 03-15 14:13 ?1078次閱讀
    S1C31D50/51/41愛普生MCU系列語音芯片助力<b class='flag-5'>智能</b>語音應用

    廣和通發布QuickTaste AI智能解決方案

    近日,在2025世界移動通信大會(MWC Barcelona 2025)期間,廣和通發布QuickTaste AI,為餐飲行業帶來革新性的AI人機交互和多語言翻譯體驗。
    的頭像 發表于 03-12 09:11 ?1017次閱讀