據報道,OpenAI于昨日凌晨推出了全新的GPT-4o模型,是對前期產品GPT-4的進階改進版。這一模型擁有實時推理處理視覺、音頻及文字信息的強大能力,尤其在與ChatGPT的對接使用方面表現出色。
緊接著,OpenAI總裁暨聯合創始人Greg Brockman發布了詳細演示,展示了兩部搭載GPT-4o的設備如何實現語音或視頻交互。
在演示前,Brockman表達了希望兩部AI聊天機器人能夠進行有效溝通的愿望。他向A聊天機器人闡述了這一想法,并允許B聊天機器人調用攝像頭觀察周邊環境。
B聊天機器人成功調用前置攝像頭,清晰地呈現了用戶的著裝以及所在環境。接著,A聊天機器人與其展開對話,詢問相關問題,如調整攝像頭視角等。
在此過程中,新版ChatGPT不僅借助視覺AI技術理解攝像頭中的畫面,還能通過語音交互實現更豐富有趣的互動體驗,同時支持中途打斷和對話插入,并具備上下文記憶功能。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
GPT
+關注
關注
0文章
368瀏覽量
16880 -
聊天機器人
+關注
關注
0文章
348瀏覽量
13092 -
OpenAI
+關注
關注
9文章
1245瀏覽量
10090
發布評論請先 登錄
相關推薦
熱點推薦
OpenAI與Anthropic對戰,Claude Opus 4.6與GPT-5.3-Codex同日發布
電子發燒友網報道 北京時間2月6日凌晨,Anthropic與OpenAI分別推出了新版本基礎大模型——Claude Opus 4.6和GPT-5.3-Codex。 ? ? Claude
GPT-5.1發布 OpenAI開始拼情商
-5.1 Thinking:高級推理模型,在簡單任務上更快,在復雜任務上更持久,也更容易理解。 對于新上線的GPT-5.1大模型,OpenAI?官方表示出色的 AI 不僅是要夠聰明,還
NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實現150萬TPS推理
? 自 2016 年推出 NVIDIA DGX 以來,NVIDIA 與 OpenAI 便開始共同推動 AI 技術的邊界。此次 OpenAI gpt-oss-20b 和
澎峰科技完成OpenAI最新開源推理模型適配
澎峰科技現已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機上的原生適配與優化,用戶可一鍵啟用這顆“小而強悍”的新引擎,在本地享受企
訊飛星辰MaaS平臺率先上線OpenAI最新開源模型
8月6日凌晨,OpenAI 時隔六年再次回歸開源,發布兩款全新的大語言模型:gpt-oss-120b和gpt-oss-20b,性能與o4-m
OpenAI或在周五凌晨發布GPT-5 OpenAI以低價向美國政府提供ChatGPT
外界一直在期待的OpenAI新一代大語言模型GPT-5或將發布。據外媒的報道,GPT-5很可能在周五凌晨發布。這是OpenAI在2023年的
亞馬遜云科技現已上線OpenAI開放權重模型
開放權重模型,向數百萬亞馬遜云科技客戶開放。 客戶可利用這些全新開放權重模型的先進推理能力,支持Agentic工作流、代碼生成、科學分析和數學問題求解等應用。 開放權重
OpenAI發布2款開源模型
o4-mini水平,并且能在高端筆記本上運行。而且還有一個更小的版本,可以在智能手機上應用。 據悉;OpenAI 此次開源的gpt-oss-120b 總參數量為 1170 億,激活參數為 51 億,能夠在
大模型推理顯存和計算量估計方法研究
過程中需要占用大量顯存,導致推理速度變慢,甚至無法進行。
計算量過大:大模型的計算量較大,導致推理速度慢,難以滿足實時性要求。
為了解決這些問題,本文將針對大
發表于 07-03 19:43
將Whisper大型v3 fp32模型轉換為較低精度后,推理時間增加,怎么解決?
將 openai/whisper-large-v3 FP32 模型轉換為 FP16、INT8 和 INT4。
推理所花費的時間比在 FP32 上花費的時間要多
發表于 06-24 06:23
“天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型
的人工智能模型均為純文本模型,新一代的 Gemini 2.5 Pro、OpenAI o4 mini、馬斯克旗下 xAI 的 Grok-3 T
上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5
開源新一代通義千問模型Qwen3。據悉,Qwen3模型參數量僅為DeepSeek - R1的1/3,能夠大幅降低成本,而且性能全面超越R1、OpenAI - o1等全球頂尖
大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產品
RISC-V”六軸機械臂為教育場景量身定制,具備6個自由度,280mm臂展,支持250g負載,整機重量僅860克。提供豐富接口,末端兼容樂高/M4拓展接口,可自由替換筆夾、夾爪、吸泵、視覺模塊等多種
發表于 04-25 17:59
OpenAI正式推出GPT-4o模型,支持實時音頻、視覺和文本推理處理
評論