NVIDIA 為 gpt-oss-120b 帶來業界領先性能,在單個 NVIDIA Blackwell 系統上實現每秒 150 萬個 Token。
OpenAI 發布了兩個全新開放權重 AI 邏輯推理模型,為全球各個行業、規模的開發者、愛好者、企業、初創公司及政府機構帶來前沿 AI 開發技術。
由 NVIDIA 與 OpenAI 共同開發的開放模型 gpt-oss-120b 和 gpt-oss-20b,展現了由社區驅動創新的力量,并凸顯 NVIDIA 在推動全球 AI 普及中的關鍵作用。
任何人都可以使用這兩個模型開發生成式 AI、邏輯推理 AI 和物理 AI 以及醫療和制造領域的突破性應用,甚至在 AI 驅動的新一輪工業革命發展過程中開拓新的行業領域。
OpenAI 新發布的靈活、開放權重的文本推理大語言模型 (LLM) 在 NVIDIA Hopper 架構 GPU 上訓練而成,能夠在全球數億顆運行NVIDIA CUDA平臺的 GPU 上實現極佳推理性能。
這些模型現已作為NVIDIA NIM的形式提供,可輕松地部署在任何 GPU 加速基礎設施上,并同時具有靈活性、數據隱私和提供企業級安全等特性。
憑借專為 NVIDIA Blackwell 平臺開發的軟件優化措施,這兩個模型可在 NVIDIA GB200 NVL72 系統上實現每秒 150 萬個 Token 的卓越推理性能,極大提升推理效率。
NVIDIA 創始人兼首席執行官黃仁勛表示:“OpenAI 向世界展示了基于 NVIDIA AI 開發的技術,現在他們正在推動開源軟件領域的創新。新發布的 gpt-oss 模型使全球各地的開發者都能夠在先進的開源基礎上進行開發,而這一切都要依托領先的 AI 計算基礎設施。”
NVIDIA Blackwell 提供先進的推理技術
隨著 gpt-oss 等先進邏輯推理模型所生成 Token 的數量指數級增長,對計算基礎設施的需求也大幅增加。NVIDIA Blackwell 驅動的專用 AI 工廠能夠滿足這一需求,該架構旨在提供超高性能推理所需的規模、效率和投資回報。
NVIDIA Blackwell 包含 NVFP4 4 位精度等創新技術,可在大幅降低功耗和顯存需求的同時,實現極高的推理效率和準確性。這使得實時部署萬億參數級的大語言模型 (LLM) 成為可能,進而為企業創造數十億美元的價值。
幫助全球數百萬 AI 構建者實現開放式開發
NVIDIA CUDA 是全球廣泛使用的計算基礎設施。無論是在強大的NVIDIA DGX Cloud平臺,還是NVIDIA GeForce RTX和NVIDIA RTX PRO驅動的 PC 和工作站,用戶都可以任意部署和運行 AI 模型。
截至目前,NVIDIA CUDA 的下載量已超過 4.5 億次。龐大的 CUDA 開發者社區現已能夠使用這兩個最新模型,并在其自身使用的 NVIDIA 技術棧上運行。
為進一步推動軟件開源,OpenAI 與 NVIDIA 還攜手頂級開源框架提供商,為 FlashInfer、Hugging Face、llama.cpp、Ollama 和 vLLM 等框架以及NVIDIA Tensor-RT LLM等庫提供模型優化方案,使開發者能夠選擇自己常用的框架進行開發。
建立在開源基礎上的長期合作
新發布的模型展現了 NVIDIA 的全棧技術如何將全球前沿的 AI 項目帶給盡可能廣泛的用戶群體。
這個故事可追溯到 NVIDIA 與 OpenAI 的初期合作。2016 年,黃仁勛親自將首臺 NVIDIA DGX-1 AI 超級計算機送至 OpenAI 位于舊金山的總部。
自那時起,兩家公司就一直共同推動 AI 技術的邊界,為用戶提供大規模訓練所需的核心技術與專業知識。
如今,全球 250 個國家 / 地區共有 650 萬開發者正在使用 900 多種 NVIDIA 軟件開發套件和 AI 模型進行開發,這一數字仍在持續增長。通過對 OpenAI 的 gpt-oss 模型進行 NVIDIA Blackwell 和 RTX GPU 適配優化以及推出豐富的軟件堆棧,NVIDIA 正在為這些開發者提供更加快速、更具有經濟效益的先進 AI 技術。
-
NVIDIA
+關注
關注
14文章
5594瀏覽量
109743 -
AI
+關注
關注
91文章
39793瀏覽量
301430 -
模型
+關注
關注
1文章
3752瀏覽量
52111 -
OpenAI
+關注
關注
9文章
1245瀏覽量
10075
原文標題:OpenAI 與 NVIDIA 共同開發專為全球大型 AI 推理基礎設施優化的全新開放模型,推動 AI 創新
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
NVIDIA推出代理式AI藍圖與電信推理模型
谷歌推出TranslateGemma全新開放翻譯模型系列
NVIDIA全新開放物理AI模型和框架加速人形機器人開發
NVIDIA在CES 2026發布全新開放模型、數據和工具
NVIDIA 推出 Nemotron 3 系列開放模型
NVIDIA攜手Mistral AI發布全新開源大語言模型系列
NVIDIA推動面向數字與物理AI的開源模型發展
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發
面向科學仿真的開放模型系列NVIDIA Apollo正式發布
NVIDIA推出面向語言、機器人和生物學的全新開源AI技術
NVIDIA 利用全新開源模型與仿真庫加速機器人研發進程
NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實現150萬TPS推理
OpenAI與NVIDIA共同開發全新開放模型
評論