Mistral NeMo 處理和生成高度準確內容的能力為企業帶來了新機遇。
Mistral AI 和 NVIDIA 于近日共同發布了一款全新的領先語言模型Mistral NeMo 12B。開發者可以輕松定制和部署該模型,令其適用于支持聊天機器人、多語言任務、編碼和摘要的企業應用。
Mistral NeMo 模型結合了 Mistral AI 在訓練數據領域的專業知識與 NVIDIA 經過優化的軟硬件生態系統,能夠為各種應用提供高性能。
Mistral AI 聯合創始人兼首席科學家 Guillaume Lample 表示:“我們十分幸運能與 NVIDIA 團隊合作,并充分利用他們的頂尖硬件和軟件。得益于NVIDIA AI Enterprise的部署,我們共同開發了一個具有前所未有的準確性、靈活性、高效率以及企業級支持和安全性的模型。”
Mistral NeMo 是在NVIDIA DGX CloudAI 平臺上所訓練而成,該平臺提供對最新 NVIDIA 架構的專用可擴展訪問。
另外,為了推進和優化進程,還使用了用于加速大語言模型推理性能的NVIDIA TensorRT-LLM和用于構建自定義生成式 AI 模型的NVIDIA NeMo開發平臺。
此次合作突顯了 NVIDIA 致力于支持模型構建生態系統的決心。
實現前所未有的準確性、
靈活性和效率
這款企業級 AI 模型在多輪對話、數學、常識推理、世界知識和編碼方面表現出色,能夠在各種任務中提供精確、可靠的性能。
Mistral NeMo 具有 128K 的上下文長度,能夠更加連貫、準確地處理大量復雜信息,確保輸出結果與上下文的關聯性。
Mistral NeMo 是一個擁有 120 億個參數的模型,以 Apache 2.0 許可證發布,該許可證旨在促進創新并支持更廣泛的人工智能社區。此外,該模型使用 FP8 數據格式進行模型推理,在不降低準確性的前提下減少了內存大小并加快了部署速度。
這意味著該模型能夠更好地了解任務,并更加有效地處理各種場景,是企業用例的理想選擇。
Mistral NeMo 被打包成NVIDIA NIM 推理微服務,借助 NVIDIA TensorRT-LLM 引擎提供性能優化的推理。
這種容器化格式便于在任何地方進行部署,為各種應用帶來了更大的靈活性。
因此,該模型可以部署到任何位置,而且時間也從原來的幾天縮短到幾分鐘。
NIM 使用 NVIDIA AI Enterprise 中的企業級軟件,提供專門的功能分支、嚴格的驗證流程以及企業級安全和支持。
NIM 包含全方位的支持、與 NVIDIA AI 專家的直接連線以及明確的服務水平協議,保證了可靠、一致的性能。
由于使用的是開放模型許可證,企業可以將 Mistral NeMo 無縫集成到商業應用中。
Mistral NeMo NIM 適用于NVIDIA Ada Lovelace架構 RTX 40 系列獨立 GPU,如NVIDIA GeForce RTX 4090 D或NVIDIA RTX 4500 GPU的顯存,具有高效率、低計算成本以及更高的安全性和隱私性。
先進的模型開發和定制
Mistral AI 與 NVIDIA 工程師結合雙方的專業知識,優化了 Mistral NeMo 的訓練和推理。
該模型使用 Mistral AI 的專業知識(尤其是多語言、代碼和多輪內容方面的專業知識)訓練,并從 NVIDIA 全棧加速訓練中獲益。
它采用了具有最佳性能的設計,通過Megatron-LM實現了高效的模型并行技術、可擴展性和混合精度。
該模型使用 NVIDIA NeMo 中的 Megatron-LM 以及 DGX Cloud 上的 3072 個 80GB Tensor Core GPU 訓練而成。DGX Cloud 由 NVIDIA AI 架構組成,包括加速計算、網絡編織結構、軟件等,可提高訓練的效率。
可用性和部署
Mistral NeMo 可以靈活地在云、數據中心或 RTX 工作站等任何地方運行,隨時隨地為各種平臺上的 AI 應用帶來變革。
立刻通過https://developer.nvidia.cn/nim 了解以 NVIDIA NIM 形式提供的 Mistral NeMo。可下載的 NIM 也即將推出。
-
NVIDIA
+關注
關注
14文章
5594瀏覽量
109742 -
AI
+關注
關注
91文章
39793瀏覽量
301422 -
模型
+關注
關注
1文章
3752瀏覽量
52111
原文標題:Mistral AI 與 NVIDIA 宣布推出領先的企業 AI 模型 Mistral NeMo 12B
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
NVIDIA推出代理式AI藍圖與電信推理模型
谷歌推出TranslateGemma全新開放翻譯模型系列
NVIDIA攜手Mistral AI發布全新開源大語言模型系列
NVIDIA推動面向數字與物理AI的開源模型發展
NVIDIA推出面向語言、機器人和生物學的全新開源AI技術
NVIDIA ACE現已支持開源Qwen3-8B小語言模型
Votee AI借助NVIDIA技術加速方言小語種LLM開發
NVIDIA通過全新 Omniverse庫、Cosmos物理AI模型及AI計算基礎設施,為機器人領域開啟新篇章
如何本地部署NVIDIA Cosmos Reason-1-7B模型
NVIDIA推出全新智慧城市AI Blueprint
歐洲借助NVIDIA Nemotron優化主權大語言模型
ServiceNow攜手NVIDIA構建150億參數超級助手
企業使用NVIDIA NeMo微服務構建AI智能體平臺
英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數據工具的重大更新
NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺
Mistral AI與NVIDIA推出全新語言模型Mistral NeMo 12B
評論