電子發燒友網報道(文/李彎彎)2025年8月8日凌晨1點,OpenAI以一場長達1小時的線上發布會正式推出GPT-5。這場被業界稱為“AI進化分水嶺”的發布,終結了長達兩年的技術猜測,更以多維度性能躍升重新定義了人工智能的能力邊界。OpenAI首席執行官山姆·奧特曼在發布會上直言:“這不僅是模型的升級,更是通往通用人工智能(AGI)的關鍵里程碑。”

GPT-5:集成模型,能力躍升
GPT-5是一款集成模型(integrated model),它巧妙地融合了大語言模型GPT系列和推理模型o系列。這一創新設計意義重大,用戶在使用時無需再手動切換各類不同模型,極大地提升了使用的便捷性和效率。例如,奧特曼在其個人社交平臺上連發十余條推文介紹GPT-5,首條就著重強調“GPT-5是一個集成模型,這意味著不再需要模型切換器,它將自行決定何時需要更深入地思考”。

GPT-5首次采用了內嵌式三位一體集成架構,系統由三部分組成。GPT-5-main模型負責處理常規問題,GPT-5-thinking深度思考模型用于解決復雜任務,實時決策的路由機制則根據對話類型、復雜程度、工具需求以及用戶的明確意圖,快速決定使用哪個模型,自主決定是否進入深度思考模式,自動匹配最適合的模型。此外,還有一個額度使用完后啟動的mini版本。這種架構設計使得GPT-5能夠更加智能、高效地應對各種任務。

OpenAI公開的測試數據顯示,GPT-5在多個關鍵領域展現出了頂尖性能。在數學領域,GPT-5在2025年AIME測試中無工具輔助達到94.6%,大幅超過了o3模型;在編程領域,在SWE-bench Verified(一項基于GitHub真實編程任務的測試)中,GPT-5首次嘗試的得分達到74.9%,略優于Anthropic最新的Claude Opus 4.1模型(得分74.5%)和谷歌DeepMind的Gemini 2.5 Pro模型(得分59.6%),展現出前沿水平;在視覺感知和健康領域,GPT-5的表現同樣出色,大幅超越包括GPT-4o、o1、o3和o4-mini在內的所有前代模型。在大模型競技場LMArena上,剛剛上線的GPT-5憑借著極強的性能在所有細分類目中都位列第一。

“AI幻覺”一直是所有大模型難以克服的痛點,而GPT-5在減少AI幻覺方面展現出了行業領先的水平。與GPT-4o相比,GPT-5的事實錯誤率降低了45%;在深度思考模式下,事實錯誤率更是比o3大幅下降80%,變得更加準確可靠。在開放性事實準確性基準LongFact和FActScore測試中,GPT-5的幻覺率比o3減少大約六倍,長篇內容生成的準確性顯著提升。這使得GPT-5在提供信息時更加值得信賴,為用戶提供了更可靠的交互體驗。
能耗方面,GPT-5通過混合專家模型(MoE)架構,在保持性能的同時大幅降低計算資源消耗。實測數據顯示,其輸出token數量較前代減少50%-80%,這意味著在相同硬件條件下,GPT-5可支持更多并發用戶或更復雜的任務。
GPT-5:應用多元,前景廣闊
在應用場景方面,GPT-5展現出了強大的實力和廣泛的適用性。現場展示的多個案例令人印象深刻,例如GPT-5編碼能力突出,只需幾句話就可以創建一個名為"Jumping Ball Runner”的游戲。該游戲界面色彩豐富,游戲角色采用卡通風格設計,且具備最高分記錄功能、重試按鈕、趣味音效等多種特色功能。此外,GPT-5還可以在幾分鐘內開發一個學習法語的網絡應用、一個復雜的財務分析模版等等。

對于創意工作者來說,GPT-5也是一大助力。一位用喜劇傳遞科普內容的博主,利用GPT-5寫劇本、寫段子、測試角色邏輯和情緒動機、出分鏡,甚至用語音和GPT-5“對戲”。在正經的科研場景中,GPT-5同樣表現出色,免疫學教授用GPT-5解讀實驗數據,模型不僅能解釋結果,還會預測未來實驗趨勢,并主動提出下一步實驗方案,大大壓縮了科研迭代周期。
在醫療健康領域,GPT-5也發揮著積極作用。一位名為Carolina的用戶在短短一周內被診斷出三種不同形式的癌癥,但她一直在排隊等候報告解讀,于是她將醫院報告截圖上傳給GPT-5,模型迅速將復雜的醫學術語轉化為易于理解的語言。在后續治療過程中,GPT-5不僅持續幫助她解讀術語,還協助她評估治療選項、準備就診問題,甚至在是否接受放射治療的決策上給予Carolina情感支持。盡管OpenAI并不把GPT-5定位為醫療設備,但它可以成為“健康素養支持工具”,讓患者在慌亂和未知里,不再完全仰賴醫生,而是成為有準備、有信息支持、能了解身體情況的患者。
GPT-5擁有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四個版本,以滿足不同用戶的需求。免費用戶的GPT-5用量有限,超過限額后將自動轉至GPT-5-mini,GPT-5-pro僅供Pro訂閱用戶使用。在定價方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向開發者提供API服務,三款模型的輸入、輸出價格分別為每百萬token 1.25美元/10美元、每百萬token 0.5美元/5美元、每百萬token 0.15美元/1.5美元。與主要競爭對手Anthropic和谷歌相比,OpenAI的GPT-5模型對于開發人員來說成本相當甚至更低,這無疑將吸引更多的開發者使用GPT-5進行創新和應用開發。
GPT-5的發布也引起了眾多合作伙伴的關注和積極響應。微軟首席執行官薩蒂亞·納德拉在8月6日的X帖子中表達了對GPT-5的贊嘆,他提到從首次在必應中向世界展示GPT-4以來,僅僅過去了兩年半的時間,就已經取得了如此巨大的進步。新模型將于8月6日登陸微軟產品,微軟365 Copilot將獲得GPT-5,以及面向消費者的Copilot和Azure AI Foundry,開發人員可以使用它們將人工智能模型整合到第三方應用程序中。幫助企業管理計算機文件的Box公司最近幾周一直在各種數據集中測試GPT-5,Box公司首席執行官艾倫·列維表示,之前的人工智能模型在該公司許多最先進的測試中都失敗了,因為它們難以理解長文檔中的復雜數學或邏輯,但GPT-5是一個“徹底的突破”,該模型能夠保留更多它正在查看的信息,然后使用更高水平的推理和邏輯能力來做出決策。
總結
GPT-5的發布是OpenAI在人工智能領域的一次重大突破。它以集成模型的創新設計、在多個領域的能力提升、顯著降低的幻覺率等亮點,為用戶帶來了更智能、更準確、更便捷的交互體驗。其廣泛的應用場景、多樣的版本選擇和合理的定價策略,以及與眾多合作伙伴的積極合作,都為GPT-5的未來發展奠定了堅實的基礎。我們有理由相信,GPT-5將推動人工智能技術向更高水平發展,為人們的生活和工作帶來更多的改變和驚喜,成為數字世界的重要基礎設施,就像曾經的Office 365、Google和百度等產品一樣,深刻地融入我們的生活。
發布評論請先 登錄
Wolfspeed最新推出TOLT封裝650V第四代MOSFET產品組合
重磅合作!Quintauris 聯手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地
正面對決GPT-5和Germini-3,DeepSeek-V3.2震撼發布
Altera Agilex 5 D系列FPGA和SoC家族全面升級
GPT-5.1發布 OpenAI開始拼情商
Altera發布 Quartus? Prime 專業版和 FPGA AI 套件 25.3 版:編譯更快,智能更強
Altera Agilex 3/5 FPGA和SoC的功能特性
微軟企業級應用AI能力全面升級
OpenAI或在周五凌晨發布GPT-5 OpenAI以低價向美國政府提供ChatGPT
中軟國際在大型銀行AI項目領域實現重大突破
GPT-5震撼發布:AI領域的重大飛躍
評論