2月24日消息,為了擴展AI語音服務的市場,谷歌除了加強語音辨識模型、語言支持數量和聲音種類之外,也調整了語音服務的價格。
谷歌更新文字轉語音和語音轉文字服務,除了優化語音辨識模型、新支持7種語言和31種聲音之外,也調整了語音服務的價格,在特定的應用情境中,用戶最多可以省下約50%的支出,而谷歌也提供每月前60分鐘免費的語言轉文字服務。
谷歌指出,語音辨識和生成技術在人機互動的應用中非常關鍵,要讓人機互動更加自然、簡單且普遍,并不容易,即便使用準確度高達90%的語音辨識模型,還是很難真正達到有效的對話,由于許多企業的語音辨識模型都是要在電話中運行,受到噪音的干擾,產生的文字資訊讓模型難以處理,谷歌于去年4月針對這種應用場景推出電話和影片的語音轉文字服務。
經過不斷優化,現在電話的文字錯誤已降低了62%,而影片的語音轉文字模型錯誤率也降低了64%,除此之外,影片的語音轉文字模型在辨識多個說話者的情境中,像是會議或是廣播,也有很好的表現。
在價格方面,為了吸引更多用戶,谷歌將影片語音轉文字模型收費調降了25%,而在標準和影片模型服務中,選擇加入資料收集計畫的用戶,收費價格會減少33%,因此,若使用影片模型且選擇加入收集資料計畫的用戶,將能夠減少約50%的支出。
此外,支持的語言也是企業使用語音轉文字辨識模型的一大考量,現在谷歌新增了7個語言和方言,包含丹麥語、葡萄牙語、俄語、波蘭語、斯洛伐克語、烏克蘭語和挪威語,加上上述新增的語言,目前總共支持持21種語言,這些新增的語言都還是測試版。在語音生成模型方面,谷歌的語音生成系統WaveNet也新增了31種聲音,目前總共有包含21種語言的57種聲音。
發布評論請先 登錄
如何查看小智是否成功進入聲音設置?
【MCP】同時支持stdio,streamableHttpless和sse三種協議的MCP服務框架
芯知識|可錄音語音芯片如何實現聲音的儲存與重放?
AI人工智能語音識別控制模塊:自定義命令詞,全維度落地應用場景
C語言和單片機C語言有什么差異
揭秘AI玩具“聽得清”的秘密!這幾款語音前端芯片撐起交互體驗天花板
輕松配置小智AI語音開發板,安信可IOT小程序功能更新
思必馳聲音復刻算法獲得深度合成服務算法備案
AI語音控制模塊能做些什么
正點原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!
90元打造小智AI腕表,語音交互超有趣!
谷歌新一代 TPU 芯片 Ironwood:助力大規模思考與推理的 AI 模型新引擎?
S1C31D50/51/41愛普生MCU系列語音芯片助力智能語音應用
谷歌AI語音服務新增7種語言和31種聲音
評論