近日,美國著名人工智能研發機構OpenAI正式宣布,自本周二(2022年7月30日)起,面向部分ChatGPT Plus用戶推出嶄新的GPT-4o語音模式產品。
據OpenAI詳細闡述,這款高級語音模式具備高度的實時性和互動性,支持用戶隨時隨地打斷對話過程,并且能夠敏銳察覺并反應出用戶的情緒變化。實際上,實時交互及對話中斷兩大技術難題一直是語音助手領域面臨的挑戰。
早在今年五月份,OpenAI便成功推出了全新升級版的大型語言模型GPT-4o,并同步展示了其語音模式的強大功能。原本計劃在六月底逐步向廣大用戶開放此項服務,然而經過慎重考慮,OpenAI最終決定將其發布日期延至七月。預計在今年秋季,語音模式將全面覆蓋到所有ChatGPT Plus用戶群體中。
OpenAI在本周二明確指出:“我們采取逐步推廣策略,以便能夠密切關注用戶的使用體驗,并依據實際反饋持續提升模型的性能以及安全性。”此外,該公司還透露正在積極推進五月份發布會上展示的視頻和屏幕分享功能的研發工作。至于這些功能的具體上線時間,目前尚無確切消息。
因此,在語音模式的初始階段,其功能可能相對較為單一。舉例來說,ChatGPT將暫時無法運用計算機視覺功能,這項技術可以使聊天機器人借助智能手機的攝像頭,為用戶的舞蹈動作提供語音反饋。
現階段,GPT-4o語音模式已經配備了四種預設聲音——Juniper、Breeze、Cove和Ember,這些聲音均由經驗豐富的付費配音演員精心打造而成。
值得一提的是,之前ChatGPT中的一位名為Sky的女性配音曾因與好萊塢巨星斯嘉麗·約翰遜的聲線極為相似而備受爭議。在接獲約翰遜團隊的律師函之后,OpenAI不得不暫停使用Sky語音。
此外,OpenAI還特別強調,他們已經引入了全新的過濾機制,旨在確保軟件能夠準確識別并拒絕任何試圖生成受版權保護的音樂或其他音頻內容的請求。對于AI企業而言,如何規避潛在的法律風險已然成為必須高度重視的問題。
-
語音
+關注
關注
3文章
405瀏覽量
39774 -
OpenAI
+關注
關注
9文章
1245瀏覽量
10061 -
ChatGPT
+關注
關注
31文章
1598瀏覽量
10264
發布評論請先 登錄
GPT-5震撼發布:AI領域的重大飛躍
OpenAI與Anthropic對戰,Claude Opus 4.6與GPT-5.3-Codex同日發布
AutoDrill 推出創新型在線產品配置器,提升客戶體驗
GPT-5.1發布 OpenAI開始拼情商
【RA4M2-SENSOR】3、使用GPT定時器-PWM輸出
NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實現150萬TPS推理
澎峰科技完成OpenAI最新開源推理模型適配
訊飛星辰MaaS平臺率先上線OpenAI最新開源模型
OpenAI或在周五凌晨發布GPT-5 OpenAI以低價向美國政府提供ChatGPT
OpenAI發布2款開源模型
Centos7分用戶記錄歷史命令至日志文件教程
AI真會人格分裂!OpenAI最新發現,ChatGPT善惡開關已開啟
“天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型
如何獲取 OpenAI API Key?API 獲取與代碼調用示例 (詳解教程)
OpenAI向部分用戶推出GPT-4o語音模式產品
評論