Nvidia用于開發(fā)和運(yùn)行可理解和響應(yīng)請(qǐng)求的對(duì)話式AI的GPU強(qiáng)化平臺(tái),已經(jīng)達(dá)成了一些重要的里程碑,并打破了一些記錄。
這對(duì)任何基于其技術(shù)進(jìn)行開發(fā)的人來說意義重大——當(dāng)中包括大大小小的公司,因?yàn)?a href="http://www.3532n.com/tags/英偉達(dá)/" target="_blank">英偉達(dá)將很多用于實(shí)現(xiàn)這些進(jìn)步的代碼開源。那些代碼用PyTorch編寫,易于運(yùn)行。
英偉達(dá)今天宣布的最大成果包括:BERT訓(xùn)練用時(shí)打破記錄,進(jìn)入1小時(shí)關(guān)口。BERT是世界上最先進(jìn)的人工智能語言模型之一,也被廣泛認(rèn)為是自然語言處理(NLP)標(biāo)桿的先進(jìn)模型。Nvidia的AI平臺(tái)僅僅需要53分鐘就能夠完成模型訓(xùn)練,經(jīng)過訓(xùn)練的模型在短短2毫秒多一點(diǎn)的時(shí)間里(10毫秒在業(yè)內(nèi)被認(rèn)為是高水平線)就能夠成功地做出推理(即利用通過訓(xùn)練學(xué)習(xí)到的能力得出結(jié)果)——又一個(gè)記錄。
英偉達(dá)的這些突破不僅僅是吹噓的資本——這些進(jìn)步可為任何使用NLP對(duì)話式人工智能和GPU硬件的人提供切實(shí)的好處。Nvidia在它的其中一個(gè)SuperPOD系統(tǒng)上打破了訓(xùn)練時(shí)間記錄,該SuperPOD系統(tǒng)由運(yùn)行1472個(gè)V100 GPU的92個(gè)Nvidia DGX-2H系統(tǒng)組成;在運(yùn)行Nvidia TensorRT的Nvidia T4 GPU上完成推理過程。Nvidia TensorRT在性能上超出高度優(yōu)化的CPU許多個(gè)量級(jí)。不過,該公司將公開BERT訓(xùn)練代碼和經(jīng)過TensorRT優(yōu)化的BERT樣本,讓所有人都可以通過GitHub利用。
除了這些里程碑以外,英偉達(dá)的研究部門還建立并訓(xùn)練了有史以來最大的一個(gè)基于“Transformer”的語言模型。這也是BERT的技術(shù)基礎(chǔ)。該定制模型包含的參數(shù)多達(dá)83億個(gè),規(guī)模是當(dāng)前最大的核心BERT模型BERT-Large的24倍。英偉達(dá)將這個(gè)模型命名為“Megatron”,它也對(duì)外提供了用于訓(xùn)練這個(gè)模型的PyTorch代碼,因而其他人能夠自行訓(xùn)練出類似的基于“Transformer”的大型語言模型。
-
AI
+關(guān)注
關(guān)注
91文章
39866瀏覽量
301508 -
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4090瀏覽量
99232
原文標(biāo)題:【網(wǎng)上研討會(huì)】如何從海量的非結(jié)構(gòu)化數(shù)據(jù)中提取和分析關(guān)鍵信息?
文章出處:【微信號(hào):FPGA-EETrend,微信公眾號(hào):FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
邊緣AI算力臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值
NVIDIA推出代理式AI藍(lán)圖與電信推理模型
AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴
基于NVIDIA模組與軟件套件推動(dòng)邊緣與機(jī)器人AI推理
NVIDIA DGX SuperPOD為Rubin平臺(tái)橫向擴(kuò)展提供藍(lán)圖
什么是AI模型的推理能力
一文看懂AI訓(xùn)練、推理與訓(xùn)推一體的底層關(guān)系
NVIDIA Nemotron Nano 2推理模型發(fā)布
信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代
英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理
英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新
英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時(shí)代
英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開源庫加速并擴(kuò)展AI推理模型
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理
NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)
Nvidia打破實(shí)時(shí)對(duì)話AI的訓(xùn)練和推理用時(shí)記錄
評(píng)論