電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年8月8日凌晨1點,OpenAI以一場長達1小時的線上發(fā)布會正式推出GPT-5。這場被業(yè)界稱為“AI進化分水嶺”的發(fā)布,終結(jié)了長達兩年的技術(shù)猜測,更以多維度性能躍升重新定義了人工智能的能力邊界。OpenAI首席執(zhí)行官山姆·奧特曼在發(fā)布會上直言:“這不僅是模型的升級,更是通往通用人工智能(AGI)的關(guān)鍵里程碑。”

GPT-5:集成模型,能力躍升
GPT-5是一款集成模型(integrated model),它巧妙地融合了大語言模型GPT系列和推理模型o系列。這一創(chuàng)新設(shè)計意義重大,用戶在使用時無需再手動切換各類不同模型,極大地提升了使用的便捷性和效率。例如,奧特曼在其個人社交平臺上連發(fā)十余條推文介紹GPT-5,首條就著重強調(diào)“GPT-5是一個集成模型,這意味著不再需要模型切換器,它將自行決定何時需要更深入地思考”。

GPT-5首次采用了內(nèi)嵌式三位一體集成架構(gòu),系統(tǒng)由三部分組成。GPT-5-main模型負責(zé)處理常規(guī)問題,GPT-5-thinking深度思考模型用于解決復(fù)雜任務(wù),實時決策的路由機制則根據(jù)對話類型、復(fù)雜程度、工具需求以及用戶的明確意圖,快速決定使用哪個模型,自主決定是否進入深度思考模式,自動匹配最適合的模型。此外,還有一個額度使用完后啟動的mini版本。這種架構(gòu)設(shè)計使得GPT-5能夠更加智能、高效地應(yīng)對各種任務(wù)。

OpenAI公開的測試數(shù)據(jù)顯示,GPT-5在多個關(guān)鍵領(lǐng)域展現(xiàn)出了頂尖性能。在數(shù)學(xué)領(lǐng)域,GPT-5在2025年AIME測試中無工具輔助達到94.6%,大幅超過了o3模型;在編程領(lǐng)域,在SWE-bench Verified(一項基于GitHub真實編程任務(wù)的測試)中,GPT-5首次嘗試的得分達到74.9%,略優(yōu)于Anthropic最新的Claude Opus 4.1模型(得分74.5%)和谷歌DeepMind的Gemini 2.5 Pro模型(得分59.6%),展現(xiàn)出前沿水平;在視覺感知和健康領(lǐng)域,GPT-5的表現(xiàn)同樣出色,大幅超越包括GPT-4o、o1、o3和o4-mini在內(nèi)的所有前代模型。在大模型競技場LMArena上,剛剛上線的GPT-5憑借著極強的性能在所有細分類目中都位列第一。

“AI幻覺”一直是所有大模型難以克服的痛點,而GPT-5在減少AI幻覺方面展現(xiàn)出了行業(yè)領(lǐng)先的水平。與GPT-4o相比,GPT-5的事實錯誤率降低了45%;在深度思考模式下,事實錯誤率更是比o3大幅下降80%,變得更加準確可靠。在開放性事實準確性基準LongFact和FActScore測試中,GPT-5的幻覺率比o3減少大約六倍,長篇內(nèi)容生成的準確性顯著提升。這使得GPT-5在提供信息時更加值得信賴,為用戶提供了更可靠的交互體驗。
能耗方面,GPT-5通過混合專家模型(MoE)架構(gòu),在保持性能的同時大幅降低計算資源消耗。實測數(shù)據(jù)顯示,其輸出token數(shù)量較前代減少50%-80%,這意味著在相同硬件條件下,GPT-5可支持更多并發(fā)用戶或更復(fù)雜的任務(wù)。
GPT-5:應(yīng)用多元,前景廣闊
在應(yīng)用場景方面,GPT-5展現(xiàn)出了強大的實力和廣泛的適用性。現(xiàn)場展示的多個案例令人印象深刻,例如GPT-5編碼能力突出,只需幾句話就可以創(chuàng)建一個名為"Jumping Ball Runner”的游戲。該游戲界面色彩豐富,游戲角色采用卡通風(fēng)格設(shè)計,且具備最高分記錄功能、重試按鈕、趣味音效等多種特色功能。此外,GPT-5還可以在幾分鐘內(nèi)開發(fā)一個學(xué)習(xí)法語的網(wǎng)絡(luò)應(yīng)用、一個復(fù)雜的財務(wù)分析模版等等。

對于創(chuàng)意工作者來說,GPT-5也是一大助力。一位用喜劇傳遞科普內(nèi)容的博主,利用GPT-5寫劇本、寫段子、測試角色邏輯和情緒動機、出分鏡,甚至用語音和GPT-5“對戲”。在正經(jīng)的科研場景中,GPT-5同樣表現(xiàn)出色,免疫學(xué)教授用GPT-5解讀實驗數(shù)據(jù),模型不僅能解釋結(jié)果,還會預(yù)測未來實驗趨勢,并主動提出下一步實驗方案,大大壓縮了科研迭代周期。
在醫(yī)療健康領(lǐng)域,GPT-5也發(fā)揮著積極作用。一位名為Carolina的用戶在短短一周內(nèi)被診斷出三種不同形式的癌癥,但她一直在排隊等候報告解讀,于是她將醫(yī)院報告截圖上傳給GPT-5,模型迅速將復(fù)雜的醫(yī)學(xué)術(shù)語轉(zhuǎn)化為易于理解的語言。在后續(xù)治療過程中,GPT-5不僅持續(xù)幫助她解讀術(shù)語,還協(xié)助她評估治療選項、準備就診問題,甚至在是否接受放射治療的決策上給予Carolina情感支持。盡管OpenAI并不把GPT-5定位為醫(yī)療設(shè)備,但它可以成為“健康素養(yǎng)支持工具”,讓患者在慌亂和未知里,不再完全仰賴醫(yī)生,而是成為有準備、有信息支持、能了解身體情況的患者。
GPT-5擁有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四個版本,以滿足不同用戶的需求。免費用戶的GPT-5用量有限,超過限額后將自動轉(zhuǎn)至GPT-5-mini,GPT-5-pro僅供Pro訂閱用戶使用。在定價方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向開發(fā)者提供API服務(wù),三款模型的輸入、輸出價格分別為每百萬token 1.25美元/10美元、每百萬token 0.5美元/5美元、每百萬token 0.15美元/1.5美元。與主要競爭對手Anthropic和谷歌相比,OpenAI的GPT-5模型對于開發(fā)人員來說成本相當甚至更低,這無疑將吸引更多的開發(fā)者使用GPT-5進行創(chuàng)新和應(yīng)用開發(fā)。
GPT-5的發(fā)布也引起了眾多合作伙伴的關(guān)注和積極響應(yīng)。微軟首席執(zhí)行官薩蒂亞·納德拉在8月6日的X帖子中表達了對GPT-5的贊嘆,他提到從首次在必應(yīng)中向世界展示GPT-4以來,僅僅過去了兩年半的時間,就已經(jīng)取得了如此巨大的進步。新模型將于8月6日登陸微軟產(chǎn)品,微軟365 Copilot將獲得GPT-5,以及面向消費者的Copilot和Azure AI Foundry,開發(fā)人員可以使用它們將人工智能模型整合到第三方應(yīng)用程序中。幫助企業(yè)管理計算機文件的Box公司最近幾周一直在各種數(shù)據(jù)集中測試GPT-5,Box公司首席執(zhí)行官艾倫·列維表示,之前的人工智能模型在該公司許多最先進的測試中都失敗了,因為它們難以理解長文檔中的復(fù)雜數(shù)學(xué)或邏輯,但GPT-5是一個“徹底的突破”,該模型能夠保留更多它正在查看的信息,然后使用更高水平的推理和邏輯能力來做出決策。
總結(jié)
GPT-5的發(fā)布是OpenAI在人工智能領(lǐng)域的一次重大突破。它以集成模型的創(chuàng)新設(shè)計、在多個領(lǐng)域的能力提升、顯著降低的幻覺率等亮點,為用戶帶來了更智能、更準確、更便捷的交互體驗。其廣泛的應(yīng)用場景、多樣的版本選擇和合理的定價策略,以及與眾多合作伙伴的積極合作,都為GPT-5的未來發(fā)展奠定了堅實的基礎(chǔ)。我們有理由相信,GPT-5將推動人工智能技術(shù)向更高水平發(fā)展,為人們的生活和工作帶來更多的改變和驚喜,成為數(shù)字世界的重要基礎(chǔ)設(shè)施,就像曾經(jīng)的Office 365、Google和百度等產(chǎn)品一樣,深刻地融入我們的生活。
發(fā)布評論請先 登錄
AI算力軍備競賽:電力系統(tǒng)的隱形戰(zhàn)場
Wolfspeed最新推出TOLT封裝650V第四代MOSFET產(chǎn)品組合
重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領(lǐng)域落地
正面對決GPT-5和Germini-3,DeepSeek-V3.2震撼發(fā)布
Altera Agilex 5 D系列FPGA和SoC家族全面升級
GPT-5.1發(fā)布 OpenAI開始拼情商
Altera發(fā)布 Quartus? Prime 專業(yè)版和 FPGA AI 套件 25.3 版:編譯更快,智能更強
Altera Agilex 3/5 FPGA和SoC的功能特性
微軟企業(yè)級應(yīng)用AI能力全面升級
OpenAI或在周五凌晨發(fā)布GPT-5 OpenAI以低價向美國政府提供ChatGPT
中軟國際在大型銀行AI項目領(lǐng)域實現(xiàn)重大突破
GPT-5震撼發(fā)布:AI領(lǐng)域的重大飛躍
評論