全新 Mistral 3 系列涵蓋從前沿級到緊湊型模型,針對 NVIDIA 平臺進行了優(yōu)化,助力 Mistral AI 實現(xiàn)云到邊緣分布式智能愿景。
Mistral AI 近日發(fā)布了開源多語言、多模態(tài)模型 Mistral 3 系列,并且針對 NVIDIA 超級計算和邊緣平臺進行了優(yōu)化。
Mistral Large 3 是專家混合 (MoE) 模型,無需為每個 token 激活全部神經(jīng)元,可以僅調(diào)用模型中影響最大的部分,既可在無浪費的前提下實現(xiàn)高效擴展,又可確保準確性不受損,使企業(yè)級 AI 不僅成為可能,而且更具實用性。
Mistral AI 的全新模型為企業(yè)級 AI 帶來了業(yè)界領(lǐng)先的準確性與效率。模型自 12 月 2 日起全面上線,覆蓋云端、數(shù)據(jù)中心、邊緣等場景。
憑借 41B 活躍參數(shù)、675B 總參數(shù)及 256K 上下文窗口,Mistral Large 3 實現(xiàn)了可擴展、高效且具有自適應(yīng)性的企業(yè)級 AI 工作負載。
通過整合 NVIDIA Grace Blackwell 機架級擴展系統(tǒng)與 Mistral AI 的 MoE 架構(gòu),企業(yè)可借助先進的并行計算與硬件優(yōu)化技術(shù),高效部署并擴展大型 AI 模型。
該整合成為 Mistral AI 邁向其倡導(dǎo)的“分布式智能”時代的重要一步,彌合了研究突破與實際應(yīng)用之間的差距。
該模型采用精細化 MoE 架構(gòu),通過調(diào)用 NVIDIA NVLink 的協(xié)同內(nèi)存域及寬專家并行的優(yōu)化技術(shù),充分發(fā)揮大規(guī)模專家并行的性能優(yōu)勢。
這些優(yōu)勢與保持準確性的低精度 NVFP4 及 NVIDIA Dynamo 分離推理優(yōu)化技術(shù)相疊加,確保大規(guī)模訓(xùn)練與推理達到極佳性能。
在 NVIDIA Grace Blackwell 機架級擴展系統(tǒng)上,Mistral Large 3 的性能較基于前代 NVIDIA Hopper GPU 提升了 10 倍。這種代際飛躍帶來了更好的用戶體驗、更低的單 token 成本及更高的能效。
Mistral AI 不僅推動了前沿大語言模型技術(shù)的發(fā)展,還發(fā)布了九款小語言模型,助力開發(fā)者在任意環(huán)境中運行 AI。
緊湊型的 Ministral 3 套件經(jīng)過優(yōu)化,可在 NVIDIA 的邊緣平臺運行,包括 NVIDIA Spark、RTX PC 或筆記本及 NVIDIA Jetson 設(shè)備。
NVIDIA 與 Llama.cpp、Ollama 等頂尖的 AI 框架合作,確保能夠在邊緣的 NVIDIA GPU 上達到優(yōu)異性能。
開發(fā)者和愛好者現(xiàn)可通過 Llama.cpp 和 Ollama 體驗 Ministral 3 套件中快速、高效的邊緣 AI。
Mistral 3 模型系列現(xiàn)已上線,在助力全球研究者與開發(fā)者試驗、定制和加速 AI 創(chuàng)新的同時,推動前沿技術(shù)全民化。
通過將 Mistral AI 模型連接到用于 AI 智能體生命周期開發(fā)的開源 NVIDIA NeMo 工具 (例如 Data Designer、Customizer、Guardrails 和 NeMo Agent Toolkit),企業(yè)可根據(jù)自身用例進一步定制這些模型,從而加速從原型到生產(chǎn)的轉(zhuǎn)化。
為了實現(xiàn)云端到邊緣的高效運算,NVIDIA 針對 Mistral 3 系列模型優(yōu)化了包括 NVIDIA TensorRT LLM、SGLang 和 vLLM 在內(nèi)的推理框架。
Mistral 3 現(xiàn)已登陸主流開源平臺及云服務(wù)提供商。此外,該系列模型很快將能以 NVIDIA NIM 的形式部署。
無論 AI 需要應(yīng)用于何種場景,這些模型均已就緒。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5513瀏覽量
109200 -
AI
+關(guān)注
關(guān)注
90文章
38414瀏覽量
297711 -
模型
+關(guān)注
關(guān)注
1文章
3658瀏覽量
51804
原文標題:NVIDIA 攜手 Mistral AI 共同加速開放模型新系列的落地
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA推動面向數(shù)字與物理AI的開源模型發(fā)展
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
面向科學(xué)仿真的開放模型系列NVIDIA Apollo正式發(fā)布
NVIDIA推出面向語言、機器人和生物學(xué)的全新開源AI技術(shù)
NVIDIA ACE現(xiàn)已支持開源Qwen3-8B小語言模型
NVIDIA 利用全新開源模型與仿真庫加速機器人研發(fā)進程
澎峰科技完成OpenAI最新開源推理模型適配
歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語言模型
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型
NVIDIA發(fā)布全球首個開源人形機器人基礎(chǔ)模型Isaac GR00T N1
NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

NVIDIA攜手Mistral AI發(fā)布全新開源大語言模型系列
評論