NVIDIA推出用于大型語言模型和生成式AI工作負載的推理平臺

谷歌云、D-ID、Cohere將新平臺用于各種生成式AI服務，包括聊天機器人、文本生成圖像內容、AI視頻等。
?

?
加利福尼亞州圣克拉拉 -? GTC - 太平洋時間2023年3月21日 – NVIDIA于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式AI應用進行了優化，能夠幫助開發人員快速構建用于提供新服務和洞察的AI驅動的專業應用。
?
這些平臺將NVIDIA的全棧推理軟件與最新的NVIDIA Ada、Hopper和Grace Hopper處理器相結合，包括今天推出的NVIDIA L4 Tensor Core GPU和NVIDIA H100 NVL GPU。各平臺針對AI視頻、圖像生成、大型語言模型部署、推薦系統推理等需求激增的工作負載進行了優化。
?
NVIDIA創始人兼首席執行官黃仁勛表示：“生成式AI的興起需要更加強大的推理計算平臺。生成式AI應用的數量是無限的，它唯一的限制就是人類的想象力。為開發人員提供最強大、靈活的推理計算平臺將加快新服務的創造速度，這些新服務將以前所未有的方式改善我們的生活。”
?
加速生成式AI的各種推理工作負載集

每個平臺都包含一個為特定生成式AI推理工作負載而優化的NVIDIA GPU和專用的軟件：
?

適用于AI視頻的NVIDIA L4可提供比CPU高出120倍的AI視頻性能，同時能效提高了99%。這款適用于幾乎所有工作負載的通用GPU提供更加強大的視頻解碼和轉碼能力、視頻流式傳輸、增強現實、生成式AI視頻等。

適用于圖像生成的NVIDIA L40針對圖形以及AI支持的2D、視頻和3D圖像生成進行了優化。L40平臺是NVIDIA Omniverse?（一個用于在數據中心構建和運行元宇宙應用的平臺）的引擎，與上一代產品相比，其Stable Diffusion推理性能提高了7倍，Omniverse性能提高了12倍。

適用于大型語言模型部署的NVIDIA H100 NVL是規模化部署像ChatGPT這樣的大型語言模型（LLMs）的理想平臺。這款新的H100 NVL擁有94GB內存和Transformer引擎加速，在數據中心規模，與上一代A100相比，GPT-3上的推理性能提高了多達12倍。

適用于推薦模型的NVIDIA Grace Hopper是圖形推薦模型、矢量數據庫和圖神經網絡的理想平臺。通過NVLink-C2C以900 GB/s 的速度連接CPU和GPU，Grace Hopper的數據傳輸和查詢速度比PCIe 5.0快了7倍。

?
這些平臺的軟件層采用NVIDIA AI Enterprise軟件套件，包括用于高性能深度學習推理的軟件開發套件NVIDIA TensorRT?，以及幫助實現模型部署標準化的開源推理服務軟件NVIDIA Triton Inference Server?。
?
早期采用者與支持

谷歌云是NVIDIA推理平臺的重要云合作伙伴和早期客戶。該公司正在將L4平臺整合到其機器學習平臺Vertex AI中，并且是第一家提供L4實例的云服務提供商，其G2虛擬機的私人預覽版已于今天推出。
?
NVIDIA和谷歌今天分別宣布了首批在谷歌云上使用L4的兩家機構——Descript和WOMBO，前者使用生成式AI幫助創作者制作視頻和播客，后者提供“Dream”這一AI驅動的文本-數字藝術轉換應用程序。
?
另一個早期采用者快手提供了一個短視頻應用程序，利用GPU對傳入的實時流媒體視頻進行解碼、捕捉關鍵幀并優化音視頻。然后，它使用一個基于Transformer的大型模型理解多模態內容，從而提高全球數億用戶的點擊率。
?
快手高級副總裁于越表示：“快手推薦系統所服務的社區每天的用戶人數超過3.6億，他們每天貢獻3000萬條UGC視頻。在相同的總體擁有成本下，相較于CPU，NVIDIA GPU將系統的端到端吞吐量提高了11倍，將延遲降低了20%。”
?
領先的生成式AI技術平臺D-ID，通過使用NVIDIA L40 GPU從文本中生成逼真的數字人，支持任何內容來生成人臉，不僅幫助專業人士改進視頻內容，同時減少了大規模視頻制作的成本和麻煩。
?
D-ID研發副總裁Or Gorodissky表示：“L40的性能十分驚人。有了它，我們將推理速度提高了一倍。D-ID十分高興能夠將這個新硬件作為我們產品的一部分，以前所未有的性能和分辨率實現AI人的實時流傳輸，并降低我們的計算成本。”
?
領先的AI制作工作室Seyhan Lee使用生成式AI為電影、廣播和娛樂行業開發沉浸式體驗和迷人的創意內容。
?
Seyhan Lee聯合創始人Pinar Demirdag表示：“L40 GPU為我們的生成式AI應用帶來了驚人的性能提升。憑借L40的推理能力和內存容量，我們可以部署非常先進的模型，并以驚人的速度和精度向客戶提供創新的服務。”
?
語言AI領域的先鋒Cohere所運行的平臺使得開發人員能夠在保護數據隱私和安全的情況下，構建自然語言模型。
?
Cohere首席執行官Aidan Gomez表示：“憑借NVIDIA的全新高性能H100推理平臺，我們可以使用先進的生成式模型為客戶提供更加優質、高效的服務，推動對話式AI、多語言企業搜索、信息提取等各種NLP應用的發展。”
?
供應情況
NVIDIA L4 GPU私人預覽版現已通過谷歌云平臺以及30多家計算機制造商所組成的全球網絡提供。
?
NVIDIA L40 GPU現已通過全球領先的系統提供商提供，并且合作伙伴平臺的數量將在今年持續增加。
?
Grace Hopper超級芯片已開始樣品供貨，預計下半年將全面投產。H100 NVL GPU也將于下半年面市。
?
NVIDIA AI Enterprise現在通過各大云市場以及數十家系統提供商和合作伙伴提供。NVIDIA AI Enterprise為客戶提供NVIDIA 企業級支持、定期安全審查以及NVIDIA Triton Inference Server?、TensorRT?和50多個預訓練模型與框架的API穩定性。
?
NVIDIA LaunchPad上免費提供的動手實驗室可以試用用于生成式AI的NVIDIA推理平臺。樣品實驗室的內容包括訓練和部署一個客服聊天機器人、部署一個端到端AI工作負載、在H100上調整和部署一個語言模型以及使用NVIDIA Triton部署一個欺詐檢測模型。
?

閱讀全文

NVIDIA(109324) NVIDIA(109324)
AI(298911) AI(298911)
生成式AI(1051) 生成式AI(1051)

大型語言模型的邏輯推理能力探究

最新研究揭示，盡管大語言模型LLMs在語言理解上表現出色，但在邏輯推理方面仍有待提高。為此，研究者們推出了GLoRE，一個全新的邏輯推理評估基準，包含12個數據集，覆蓋三大任務類型。

2023-11-23 15:05:16

2019

NVIDIA 借助超大規模 AI 語言模型為全球企業賦能

NVIDIA NeMo Megatron 框架; 可定制的大規模語言模型 Megatron 530B；多GPU、多節點 Triton推理服務器助力基于語言的AI開發和部署，推動行業和科學發展。

2021-11-10 14:22:52

1160

NVIDIA 推出大型語言模型云服務以推進 AI 和數字生物學的發展

NVIDIA NeMo 大型語言模型（LLM）服務幫助開發者定制大規模語言模型；NVIDIA BioNeMo 服務幫助研究人員生成和預測分子、蛋白質及 DNA ? 美國加利福尼亞州圣克拉拉

2022-09-21 15:24:52

737

NVIDIA推出DGX GH200 AI超級計算機

驅動的NVIDIA DGX?超級計算機，旨在助力開發面向生成式AI語言應用、推薦系統和數據分析工作負載的巨型、下一代模型。 ? NVIDIA DGX GH200的超大共享內存空間通過NVLink互連技術以及NVLink

2023-05-30 14:15:36

1010

NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型

Foundry 提供從數據策管、合成數據生成、微調、檢索、防護到評估的全方位生成式 AI 模型服務，以便部署自定義 Llama 3.1 NVIDIA NIM 微服務和新的 NVIDIA NeMo

2024-07-24 09:39:45

1105

NVIDIA 推出高性價比的生成式 AI 超級計算機

Jetson Orin Nano Super 可將生成式 AI 性能提升至1.7 倍，支持科技愛好者、開發者和學生使用的主流模型。 ? ? NVIDIA 推出了一款全新的尺寸小巧的生成式 AI 超級

2024-12-18 17:01:32

971

NVIDIA 在首個AI推理基準測試中大放異彩

的BERT、GNMT 和Jasper 等AI模型開源優化幫助開發者實現頂尖推理性能。NVIDIA的客戶和合作伙伴中包括有會話式AI領域的一流公司，比如Kensho、微軟、Nuance、Optum等。最后要

2019-11-08 19:44:51

【大語言模型：原理與工程實踐】大語言模型的應用

，它通過抽象思考和邏輯推理，協助我們應對復雜的決策。相應地，我們設計了兩類任務來檢驗大語言模型的能力。一類是感性的、無需理性能力的任務，類似于人類的系統1，如情感分析和抽取式問答等。大語言模型在這

2024-05-07 17:21:45

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

。這一過程的不斷迭代使大語言模型的語言理解和生成能力逐步提升。大語言模型在自然語言處理領域應用廣泛，尤其在問答系統和機器翻譯方面。它能理解用戶意圖并生成準確答案，實現高質量的自動翻譯。此外，模型還可用于

2024-05-04 23:55:44

信而泰×DeepSeek：AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

DeepSeek-R1：強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發的新一代AI大模型。其核心優勢在于強大的推理引擎能力，融合了自然語言處理（NLP）、深度

2025-07-16 15:29:20

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

NVIDIA NVLink，支持 FP4 AI 精度。 GB200 NVL72是一款性能卓越的計算平臺，采用更快的第二代Transformer引擎和FP8精度，可將大型語言模型的訓練速度提升4倍。通過每秒

2024-05-13 17:16:22

LuxStudio增材制造晶格模型自動生成平臺

對一些非參數化設計師以及3D打印純小白非常不友好。為此，清鋒科技推出了面向增材制造的晶格模型自動生成平臺——LuxStudio，不僅可以實現多種結構晶格的自動生成

2022-11-09 10:43:02

NVIDIA為全球企業開發和部署大型語言模型打開一扇新的大門

NVIDIA NeMo Megatron 框架; 可定制的大規模語言模型Megatron 530B；多GPU、多節點 Triton推理服務器助力基于語言的AI開發和部署，推動行業和科學發展

2021-11-12 14:30:07

2126

NVIDIA宣布其AI推理平臺的重大更新

軟件的新功能，該軟件為所有AI模型和框架提供跨平臺推理；同時也包含對NVIDIA TensorRT的更新，該軟件優化AI模型并為NVIDIA GPU上的高性能推理提供運行時優化。 NVIDIA還推出了NVIDIA A2 Tensor Core GPU，這是一款用于邊

2021-11-12 14:42:53

2690

NVIDIA Triton推理服務器幫助Teams使用認知服務優化語音識別模型

Microsoft Teams借助AI生成的實時字幕和轉錄功能，幫助全球學生和職場人士順利進行在線會議。用于訓練的NVIDIA AI計算技術和用于推理語音識別模型的NVIDIA Triton推理服務器進一步提升了這兩個功能。

2022-01-04 17:45:12

2204

使用NVIDIA Triton推理服務器簡化邊緣AI模型部署

　　NVIDIA Triton 有助于在每個數據中心、云和嵌入式設備中實現標準化的可擴展生產 AI 。它支持多個框架，在 GPU 和 DLA 等多個計算引擎上運行模型，處理不同類型的推理查詢。通過與 NVIDIA JetPack 的集成， NVIDIA Triton 可用于嵌入式應用。

2022-04-18 15:40:02

3480

騰訊云TI平臺利用NVIDIA Triton推理服務器構造不同AI應用場景需求

騰訊云 TI 平臺 TI-ONE 利用 NVIDIA Triton 推理服務器構造高性能推理服務部署平臺，使用戶能夠非常便捷地部署包括 TNN 模型在內的多種深度學習框架下獲得的 AI 模型，并且顯著提升推理服務的吞吐、提升 GPU 利用率。

2022-09-05 15:33:01

3067

螞蟻鏈AIoT團隊與NVIDIA合作加速AI推理

螞蟻鏈 AIoT 團隊與 NVIDIA 合作，將量化感知訓練(QAT)技術應用于深度學習模型性能優化中，并通過 NVIDIA TensorRT 高性能推理 SDK 進行高效率部署，通過 INT8 推理，吞吐量提升了 3 倍，助力螞蟻鏈版權 AI 平臺中的模型推理服務大幅降本增效。

2022-09-09 09:53:52

1845

NVIDIA NeMo最新語言模型服務幫助開發者定制大規模語言模型

NVIDIA NeMo 大型語言模型（LLM）服務幫助開發者定制大規模語言模型；NVIDIA BioNeMo 服務幫助研究人員生成和預測分子、蛋白質及 DNA

2022-09-22 10:42:29

1203

KT利用NVIDIA AI平臺訓練大型語言模型

韓國先進的移動運營商構建包含數百億個參數的大型語言模型，并使用 NVIDIA DGX SuperPOD 平臺和 NeMo Megatron 框架訓練該模型。

2022-09-27 09:24:30

1995

NVIDIA AI平臺為大型語言模型帶來巨大收益

隨著大型語言模型（ LLM ）的規模和復雜性不斷增長， NVIDIA 今天宣布更新 NeMo Megatron 框架，提供高達 30% 的訓練速度。

2022-10-10 15:39:42

1436

NVIDIA 和 Evozyne 創建用于生成蛋白質的生成式 AI 模型

科學家使用 NVIDIA BioNeMo 創建出能夠生成高質量蛋白質的大型語言模型，以此加快藥物研發并助力創造更具可持續性的環境。初創企業 Evozyne 使用 NVIDIA 提供的預訓練 AI

2023-01-13 23:15:02

1012

大型語言模型有哪些用途？

大型語言模型能識別、總結、翻譯、預測和生成文本及其他內容。 AI 應用在大型語言模型的幫助下，可用于解決總結文章、編寫故事和參與長對話等多種繁重工作。大型語言模型（LLM）是一種深度學習算法，可以

2023-02-23 19:50:04

6084

大型語言模型有哪些用途？大型語言模型如何運作呢？

大型語言模型能識別、總結、翻譯、預測和生成文本及其他內容。

2023-03-08 13:57:00

9399

NVIDIA 為全球企業帶來生成式 AI 推出用于創建大型語言模型和視覺模型的云服務

為AI驅動的應用構建自定義模型 ? 加利福尼亞州圣克拉拉 – GTC – 太平洋時間 2023年3月21日 – 為了加速企業應用生成式AI，NVIDIA今日宣布推出一套云服務，使企業能夠構建、完善

2023-03-22 13:45:40

608

Adobe 攜手 NVIDIA 釋放生成式 AI 的力量

的力量，以進一步推動創作流程的發展。Adobe 和 NVIDIA 將共同開發新一代先進的生成式 AI 模型，側重于將生成式 AI 深度集成到全球頂尖創作者和營銷人員所使用的應用中。 ? 其中一些模型將采取

2023-03-22 14:14:06

641

GTC23 | NVIDIA 為全球企業帶來生成式 AI，推出用于創建大型語言模型和視覺模型的云服務

Foundations 云服務為 AI 驅動的應用構建自定義模型加利福尼亞州圣克拉拉 – GTC – 太平洋時間 2023年3月21日 – 為了加速企業應用生成式 AI，NVIDIA 宣布推出一套云服務，使企業

2023-03-23 06:50:04

907

GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

– NVIDIA 于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式 AI 應用進行了優化，能夠幫助開發人員快速構建用于提供新服務和洞察的 AI 驅動的專業應用。這些平臺將 NVIDIA

2023-03-23 06:55:02

1494

GTC23 | NVIDIA 攜手谷歌云提供強大的全新生成式 AI 平臺，基于新款 L4 GPU 和 Vertex AI 構建

NVIDIA 生成式 AI 推理平臺將集成至谷歌云 Vertex AI 中；谷歌云成為首家提供 NVIDIA L4 GPU 實例的云服務商加利福尼亞州圣克拉拉 – GTC – 太平洋時間 2023

2023-03-23 06:55:02

1217

GTC23 | NVIDIA 發布大型語言模型和生成式 AI 服務以推動生命科學研發

21 日 – NVIDIA 今日推出一整套用于自定義 AI 基礎模型的生成式 AI 云服務。這些服務將加速新蛋白質和治療方法的創建以及基因組學、化學、生物學和分子動力學等領域的研究。作為

2023-03-23 06:55:03

1114

ServiceNow 與 NVIDIA 宣布聯合打造面向企業 IT 的生成式 AI

基于 ServiceNow 平臺并采用 NVIDIA AI 軟件和 DGX 基礎設施構建的自定義大型語言模型將為企業帶來更智能的工作流自動化 ServiceNow 和 NVIDIA 宣布達成合作伙伴

2023-05-19 00:50:02

968

NVIDIA 與微軟合作加速企業就緒的生成式 AI

NVIDIA AI Enterprise 與 Azure 機器學習集成，提供端到端云平臺，供開發者構建、部署和管理大型語言模型的 AI 應用微軟 Build 大會——太平洋時間 2023 年 5

2023-05-25 09:15:02

994

NVIDIA 攜手微軟，在生成式 AI 的新時代推動 Windows PC 創新

行業領導者打破藩籬，使開發人員能夠輕松地在 Windows 11 上訓練并部署先進的 AI 模型，并在配備 RTX 的 PC 和工作站上提供節能的推理。生成式 AI，以 ChatGPT 等大型語言

2023-05-25 09:15:02

1255

大型語言模型能否捕捉到它們所處理和生成的文本中的語義信息

? 大型語言模型能否捕捉到它們所處理和生成的文本中的語義信息？這一問題在計算機科學和自然語言處理領域一直存在爭議。然而，MIT的一項新研究表明，僅基于文本形式訓練、用于預測下一個token的語言模型

2023-05-25 11:34:11

1273

COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超級計算機

Switch System 驅動的 NVIDIA DGX 超級計算機，旨在助力開發面向生成式 AI 語言應用、推薦系統和數據分析工作負載的巨型、下一代模型。 NVIDIA DGX GH200 的超大共享內存空間通過 NVLink 互連技術以及 NV

2023-05-30 01:40:01

2532

NVIDIA 為 1 億臺 Windows RTX PC 和工作站提供全新生成式 AI 功能與突破性性能

搭載 Tensor Core 的 NVIDIA RTX GPU 正在加速生成式 AI 模型的開發與部署；即將推出的 Max-Q 低功耗 AI 推理將提高能效比。生成式 AI 正在迅速開創一個計算

2023-05-31 03:50:02

888

NVIDIA為Windows RTX工作站提供全新生成式AI功能與突破性性能

的推理任務時，GPU 將以極低的功耗運行，而在運行繁重負載如生成式 AI 工作時，則可升至極高的性能水平。

2023-06-07 14:55:24

1121

IGT Solutions推出企業級生成式人工智能平臺TechBud.AI以實現卓越客戶體驗

人工智能的無縫運用，這款先進的生成式人工智能平臺可以促進快速創新，并幫助企業實現更快的結果和客戶體驗的提升。在大型語言模型的支持下，它是一個安全的可以解決現實世界企業挑戰的平臺。TechBud.AI是一個可靠、安全的技術專家級人工智能伙伴，可以解決查詢、支持任務，讓用戶的

2023-06-24 21:20:00

1037

Snowflake 攜手 NVIDIA 助力企業在數據云端利用數據實現生成式 AI

AI 應用，而這一切都可以在 Snowflake 數據云中安全地實現。憑借用于開發大語言模型（LLM）的 NVIDIA NeMo 平臺以及 NVIDIA GPU 加速計算，Snowflake 將助力企業使用 Snowf

2023-06-27 21:10:01

838

大型語言模型的應用

?? 大型語言模型（LLM）是一種深度學習算法，可以通過大規模數據集訓練來學習識別、總結、翻譯、預測和生成文本及其他內容。大語言模型（LLM）代表著 AI 領域的重大進步，并有望通過習得的知識改變

2023-07-05 10:27:35

2808

即刻報名第三屆 NVIDIA TensorRT Hackathon 生成式 AI 模型優化賽

近日，由阿里云及 NVIDIA 聯合舉辦的?“NVIDIA TensorRT Hackathon 2023 生成式 AI 模型優化賽”已正式啟動。此大賽是由阿里云天池組織運營，TensorRT

2023-07-17 19:45:03

1140

ServiceNow、NVIDIA 和埃森哲攜手合作，助力企業加快采用生成式 AI

（NYSE: ACN）近日宣布推出 AI 燈塔計劃。這個業界首創的計劃旨在快速推進企業級生成式 AI 功能的開發和采用。在 ServiceNow、NVIDIA 和埃森哲現有戰略合作的基礎上，AI 燈塔

2023-07-31 20:40:02

1331

NVIDIA 與 Hugging Face 將連接數百萬開發者與生成式 AI 超級計算

8 月 8 日 — NVIDIA 與 Hugging Face 宣布建立合作伙伴關系，為數百萬開發者提供生成式 AI 超級計算服務，幫助他們構建大語言模型（LLM）和其他高級 AI 應用。 ? 此次

2023-08-09 11:41:59

435

SIGGRAPH 2023 | NVIDIA 與全球數據中心系統制造商大力推動 AI 與工業數字化的發展

計算密集型的復雜應用，包括 AI 訓練與推理、3D 設計與可視化、視頻處理以及工業數字化等。這款全新 GPU 將加速生成式 AI 的計算工作負載。生成式 A

2023-08-09 19:10:06

858

英偉達全球首發HBM3e 專為生成式AI時代打造

2023年8月8日，NVIDIA創始人兼CEO黃仁勛在計算機圖形年會SIGGRAPH上發布了HBM3e內存新一代GH200 Grace Hopper超級芯片。這款芯片被黃仁勛稱為“加速計算和生成式AI時代的處理器”，旨在用于任何大型語言模型，以降低推理成本。

2023-08-11 16:29:17

2011

VMware 與 NVIDIA 為企業開啟生成式 AI 時代

全新 VMware Private AI Foundation With NVIDIA 幫助企業為生成式 AI 在業務中的應用做好準備；該平臺將在數據隱私性、安全性和可控性方面提供進一步支持

2023-08-23 19:10:07

1156

NVIDIA AI Enterprise 4.0 推出，助力企業構建生產就緒的生成式 AI 為業務賦能

時。NVIDIA 正在將專業知識投入到解決方案的開發過程中，助力企業實現這樣的飛躍。推出 NVIDIA AI Enterprise 4.0 最新版? NVIDIA AI Enterprise? 助力利用生成

2023-09-19 20:20:04

1232

Oracle 云基礎設施提供新的 NVIDIA GPU 加速計算實例

生成式 AI 和大語言模型（LLM）不斷推動突破性創新，訓練和推理對算力的需求也隨之急劇上升。這些現代生成式 AI 應用需要全棧加速計算，首先要有能夠快速、準確處理大量工作負載的先進基礎設施

2023-09-25 20:40:02

1220

NVIDIA 擴展機器人平臺，迎接生成式 AI 的崛起

基于 NVIDIA Jetson 平臺進行開發的 1 萬多家公司現在可以利用全新的生成式 AI、API 和微服務來加快推進行業數字化 ? ? 強大的生成式 AI 模型、云原生應用程序接口（ API

2023-10-19 17:16:24

853

NVIDIA 擴展機器人平臺，迎接生成式 AI 的崛起

基于 NVIDIA Jetson 平臺進行開發的 1 萬多家公司現在可以利用全新的生成式 AI、API 和微服務來加快推進行業數字化強大的生成式 AI 模型、云原生應用程序接口（API）和微服務已

2023-10-20 02:05:02

1057

周四研討會預告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會，將幫助您了解 NVIDIA 開源大型語言模型（LLM）推理加速庫 TensorRT-LLM ?及其功能

2023-10-26 09:05:02

684

現已公開發布！歡迎使用 NVIDIA TensorRT-LLM 優化大語言模型推理

NVIDIA 于 2023 年 10 月 19 日公開發布 TensorRT-LLM ，可在 NVIDIA GPU 上加速和優化最新的大語言模型（Large Language Models）的推理

2023-10-27 20:05:02

1917

全新NVIDIA Spectrum-X網絡平臺構筑阿里生成式AI云底座

全新 NVIDIA Spectrum-X 網絡平臺構筑阿里生成式 AI 云底座。

2023-11-02 09:07:25

1564

利用 NVIDIA Jetson 實現生成式 AI

交互速率運行的 Llama-2-70B 模型。圖 1. 領先的生成式 AI 模型在? Jetson AGX Orin 上的推理性能如要在 Jetson 上快速測試最新的模型和應用，請使用 Jetson 生成式 AI 實驗室提供的教程和資源。

2023-11-07 21:25:01

2182

NVIDIA 為全球領先的 AI 計算平臺 Hopper 再添新動力

Tensor Core GPU 和領先的顯存配置，可處理生成式 AI 與高性能計算工作負載的海量數據。 ? NVIDIA H200 是首款采用 HBM3e 的 GPU，其運行更快、更大的顯存容量將進一步加速生成式 AI 與大語言模型，同時

2023-11-14 14:30:01

827

NVIDIA 在 Microsoft Azure 上推出面向全球企業和初創公司的生成式 AI Foundry 服務

Models、NVIDIA NeMo? 框架和工具，以及 NVIDIA DGX? 云 AI 超算服務三大要素，為企業提供創建自定義生成式 AI 模型

2023-11-16 14:13:08

859

NVIDIA 在 Microsoft Azure 上推出面向全球企業和初創公司的生成式 AI Foundry 服務

AI Enterprise 軟件進行部署 NVIDIA 于今日推出一項 AI foundry 服務，助力企業和初創公司在 Microsoft Azure 上開發、調優和部署其自定義生成式 AI

2023-11-16 21:15:02

1193

NVIDIA 加快企業自定義生成式 AI 模型開發

的業務數據進行自定義。如今，免費、開源的大語言模型對企業來說就像是一頓“自助餐”。但對于構建自定義生成式 AI 應用的開發者來說，這頓“大餐”可能會讓他們應接不暇，因為他們需要滿足各種不同的項目和業務

2023-11-16 21:15:02

1309

NVIDIA 通過企業級生成式 AI 微服務為聊天機器人、AI 助手和摘要工具帶來商業智能

— 太平洋時間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務，支持企業將自定義大語言模型與企業數據相連接，使其 AI 應用能夠提供高度準確的響應

2023-11-29 14:37:12

799

NVIDIA 通過企業級生成式 AI 微服務為聊天機器人、AI 助手和摘要工具帶來商業智能

微服務，支持企業將自定義大語言模型與企業數據相連接，使其 AI 應用能夠提供高度準確的響應。 NVIDIA NeMo Retriever 是 NVIDIA NeMo （一個用于構建、自定義和部署生成式

2023-11-29 21:05:02

1182

NVIDIA 為部分大型亞馬遜 Titan 基礎模型提供訓練支持

GPU 和海量的數據集上所訓練而成。不過這可能會給想要使用生成式 AI 的企業帶來很多巨大的挑戰。 NVIDIA NeMo （一個用于構建、自定義和運行 LLM 的框架）能夠幫助企業克服上述挑戰

2023-11-29 21:15:02

1183

大語言模型簡介：基于大語言模型模型全家桶Amazon Bedrock

本文基于亞馬遜云科技推出的大語言模型與生成式AI的全家桶：Bedrock對大語言模型進行介紹。大語言模型指的是具有數十億參數（B+）的預訓練語言模型（例如：GPT-3, Bloom, LLaMA)。這種模型可以用于各種自然語言處理任務，如文本生成、機器翻譯和自然語言理解等。

2023-12-04 15:51:46

1470

安霸發布全新N1系列生成式AI芯片

安霸在CES 2024上發布了全新的N1系列生成式AI芯片，這是一款專門為前端設備設計的芯片，支持本地運行大型語言模型（LLM）應用。其單顆SoC能夠支持1至340億參數的多模態大模型（Multi-Modal LLM）推理，從而實現低功耗的生成式AI功能。

2024-01-09 15:32:54

2295

NVIDIA生成式AI開啟藥物研發與設計的新紀元

NVIDIA BioNeMo 現已提供十余個生成式 AI 模型以及云服務，正在推動計算機輔助藥物發現生態系統的發展。

2024-01-10 16:00:05

1255

NVIDIA Isaac將生成式AI應用于制造業和物流業

NVIDIA Isaac 機器人平臺利用最新的生成式 AI 和先進的仿真技術，加速 AI 機器人技術的發展。

2024-03-22 10:06:21

1297

生成式 AI 進入模型驅動時代

隨著ChatGPT和大型語言模型(LLM)呈現爆炸式增長，生成式人工智能(GenerativeAI)成為近來的一大熱詞。由此引發了一場爭論：哪種AI模型使用的訓練參數最多？與此同時，更多

2024-04-13 08:12:27

1132

世界數字技術院發布：生成式AI安全測試標準及大語言模型

據悉，上述兩款標準主要針對大型模型與生成式AI應用領域的安全檢測設定了新基準。參與制定工作的單位有OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等多家知名企業，其中，《大語言模型安全測試方法》由螞蟻集團主導完成。

2024-04-17 16:51:04

2059

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優化從 PC 到云端的 NVIDIA GPU 上運行的大語言模型推理。

2024-04-28 10:36:08

1584

Snowflake推出企業級AI模型

Snowflake公司近日重磅推出了一款名為Snowflake Arctic的企業級大型語言模型（LLM）。這款AI模型針對復雜的企業工作負載進行了深度優化，特別是在SQL代碼生成和指令跟蹤等方面，表現卓越，已超越多個行業基準。

2024-05-06 14:38:54

871

Snowflake推出面向企業AI的大語言模型

Snowflake公司近日推出了企業級AI模型——Snowflake Arctic，這是一款大型語言模型（LLM），專為滿足企業復雜工作負載的需求而設計。Snowflake Arctic在多個關鍵領域，如SQL代碼生成和指令跟蹤等，均超越了行業基準，展現出卓越的性能。

2024-05-07 10:03:54

915

英偉達推出AI模型推理服務NVIDIA NIM

英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程，為全球的2800萬英偉達開發者提供前所未有的便利。

2024-06-04 09:15:06

1278

NVIDIA宣布全面推出 NVIDIA ACE 生成式 AI 微服務

采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成式 AI 微服務，以加速新一代數字人的發展，并將在平臺上推出全新的生成式 AI 突破。客戶服務、游戲和醫療健康領域的公司率先采用 ACE

2024-06-04 10:18:37

1413

如何加速大語言模型推理

隨著人工智能技術的飛速發展，大語言模型（LLM）已成為自然語言處理領域的核心工具，廣泛應用于智能客服、文本生成、機器翻譯等多個場景。然而，大語言模型的高計算復雜度和資源消耗成為其在實際應用中面臨

2024-07-04 17:32:04

1976

基于CPU的大型語言模型推理實驗

隨著計算和數據處理變得越來越分散和復雜，AI 的重點正在從初始訓練轉向更高效的AI 推理。Meta 的 Llama3 是功能強大的公開可用的大型語言模型（LLM）。本次測試采用開源 LLM

2024-07-18 14:28:51

1401

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務，與同樣剛推出的 Llama 3.1 系列開源模型一起，為全球企業的生成式 AI 提供強力支持。

2024-07-25 09:48:21

1350

NVIDIA攜手Meta推出AI服務，為企業提供生成式AI服務

NVIDIA近日宣布了一項重大舉措，正式推出NVIDIA AI Foundry服務與NVIDIA NIM（NVIDIA Inference Microservices）推理微服務，這兩項創新成果與同步問世的Llama 3.1系列開源模型強強聯合，為全球企業構建強大的生成式AI能力鋪設了堅實的基石。

2024-07-25 16:57:37

1068

三行代碼完成生成式AI部署

OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分為兩個安裝包分別是基礎包與生成式AI支持包，新發布的GenAI開發包支持C++與Python語言接口調用，支持多種

2024-08-30 16:49:58

1273

AMD助力HyperAccel開發全新AI推理服務器

HyperAccel 是一家成立于 2023 年 1 月的韓國初創企業，致力于開發 AI 推理專用型半導體器件和硬件，最大限度提升推理工作負載的存儲器帶寬使用，并通過將此解決方案應用于大型語言模型來

2024-09-18 09:37:26

1202

NVIDIA NIM助力企業高效部署生成式AI模型

Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM，將允許用戶通過 API 調用來大規模地部署大語言模型。

2024-10-10 09:49:24

1199

NVIDIA助力Amdocs打造生成式AI智能體

正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發和交付基于商用大語言模型（LLM）和領域適配模型的解決方案。該公司還在使用NVIDIA NIM，這是一套易于使用的推理微服務，旨在加速生成式 AI 在企業中的部署。

2024-11-19 14:48:15

1401

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 開發了一個全新的生成式 AI 模型。利用輸入的文本和音頻，該模型可以創作出包含任意的音樂、人聲和聲音組合的作品。

2024-11-27 11:29:39

1230

大語言模型開發框架是什么

大語言模型開發框架是指用于訓練、推理和部署大型語言模型的軟件工具和庫。下面，AI部落小編為您介紹大語言模型開發框架。

2024-12-06 10:28:43

926

Google兩款先進生成式AI模型登陸Vertex AI平臺

新的 AI 模型，包括最先進的視頻生成模型Veo以及最高品質的圖像生成模型Imagen 3。近日，我們在 Google Cloud 上進一步推動這一勢頭，客戶可以在Vertex AI平臺上使用這兩款先進的生成式 AI 模型。

2024-12-30 09:56:10

1054

NVIDIA Cosmos世界基礎模型平臺發布

NVIDIA 宣布推出NVIDIA Cosmos，該平臺由先進的生成式世界基礎模型、高級 tokenizer、護欄和加速視頻處理管線組成，將推動自動駕駛汽車（AV）和機器人等物理 AI 系統的發展。

2025-01-08 10:39:32

1123

NVIDIA推出多個生成式AI模型和藍圖

NVIDIA 宣布推出多個生成式 AI 模型和藍圖，將 NVIDIA Omniverse 一體化進一步擴展至物理 AI 應用，如機器人、自動駕駛汽車和視覺 AI 等。全球軟件開發和專業服務領域的領先企業正在使用 Omniverse 開發新的產品和服務，加快工業 AI 新時代的到來。

2025-01-08 10:48:54

1119

NVIDIA發布Cosmos?平臺，助力物理AI系統發展

NVIDIA近日宣布推出全新的NVIDIA Cosmos?平臺，該平臺專為自動駕駛汽車(AV)和機器人等物理AI系統而設計，旨在推動這些領域的快速發展。 Cosmos平臺融合了先進的生成式世界

2025-01-08 15:36:45

958

NVIDIA推出開放式Llama Nemotron系列模型

作為 NVIDIA NIM 微服務，開放式 Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何加速系統上為 AI 智能體提供強效助力。

2025-01-09 11:11:40

1330

NVIDIA Omniverse擴展至生成式物理AI領域

NVIDIA近日宣布，其Omniverse?平臺再次實現重大突破，成功推出多個生成式AI模型和藍圖，將Omniverse的應用范圍進一步擴展至物理AI領域，包括機器人、自動駕駛汽車和視覺AI等多個

2025-01-13 10:56:31

1131

新品| LLM630 Compute Kit，AI 大語言模型推理開發平臺

LLM630LLM推理，視覺識別，可開發，靈活擴展···LLM630ComputeKit是一款AI大語言模型推理開發平臺，專為邊緣計算和智能交互應用而設計。該套件的主板搭載愛芯AX630CSoC

2025-01-17 18:48:02

1268

使用NVIDIA推理平臺提高AI推理性能

NVIDIA推理平臺提高了 AI 推理性能，為零售、電信等行業節省了數百萬美元。

2025-02-08 09:59:03

1512

NVIDIA 推出開放推理 AI 模型系列，助力開發者和企業構建代理式 AI 平臺

、德勤、IQVIA、微軟、SAP 和 ServiceNow 與 NVIDIA 合作，率先推出推理 AI 智能體，改變工作方式 ? ? ? 美國加利福尼亞州圣何塞 —— ?GTC —— 2025 年 3

2025-03-19 09:31:53

352

NVIDIA 與行業領先的存儲企業共同推出面向 AI 時代的新型企業基礎設施

3 月 18 日 —— NVIDIA 今日推出了 NVIDIA AI 數據平臺 —— 一項可自定義的參考設計，領先的存儲提供商可用來構建全新的 AI 基礎設施，以滿足 AI 推理工作負載的嚴苛要求

2025-03-19 10:11:45

450

Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

——Oracle 和 NVIDIA 今日宣布，NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務首次實現集成，以幫助全球企業組織加速創建代理式 AI 應用。 ? 此次

2025-03-19 15:24:36

504

英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數據工具的重大更新

推理模型，讓開發者以前所未有的方式控制世界生成。 NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺提供支持的新藍圖，為開發者提供用于機

2025-03-20 19:01:26

1226

英偉達GTC2025亮點：NVIDIA與行業領先存儲企業共同推出面向AI時代的新型企業基礎設施

存儲提供商構建搭載 AI 查詢智能體的基礎設施，利用 NVIDIA 計算、網絡和軟件，針對復雜查詢進行推理并快速生成準確響應 NVIDIA 推出了 NVIDIA AI 數據平臺 —— 一項可自定義

2025-03-21 09:42:43

1146

使用NVIDIA Earth-2生成式AI基礎模型革新氣候建模

NVIDIA 正通過 cBottle（Climate in a Bottle 的簡稱）為這項工作帶來新的突破，這是全球首個專為以公里尺度分辨率模擬全球氣候而設計的生成式 AI 基礎模型。

2025-06-12 15:54:21

1141

利用NVIDIA推理模型構建AI智能體

開放式推理模型能夠更快、更廣泛地進行思考，為客戶服務、網絡安全、制造、物流和機器人等領域的 AI 智能體生成更明智的結果。

2025-08-13 14:32:27

1422

NVIDIA Nemotron Nano 2推理模型發布

NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。

2025-08-27 12:45:44

1573

什么是AI模型的推理能力

NVIDIA 的數據工廠團隊為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎，該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。

2025-09-23 15:19:23

1043

通過NVIDIA Jetson AGX Thor實現7倍生成式AI性能

Jetson Thor 平臺還支持多種主流量化格式，包括 NVIDIA Blackwell GPU 架構的新 NVFP4 格式，有助于進一步優化推理性能。該平臺同時支持推測解碼等新技術，為在邊緣端加速生成式 AI 工作負載提供了新的途徑。

2025-10-29 16:53:18

1249

已全部加載完成

搜索歷史

NVIDIA推出用于大型語言模型和生成式AI工作負載的推理平臺

評論