3月19日上午,英偉達2024 GTC AI大會,黃仁勛發(fā)布了英偉達最新一代AI芯片Blackwell GPU,AI算力能力較上代提升30倍!
黃仁勛說:"我們已經(jīng)來到了一個臨界點,因此需要一種新的計算方式來加速整個行業(yè)的發(fā)展效率。那么英偉達能夠做什么?當(dāng)然,答案就是——更大的芯片。”接著,英偉達新一代圖形計算平臺Blackwell正式登場,它被英偉達稱為 “新工業(yè)革命的引擎”。
采用全新Blackwell架構(gòu)的B200和GB200系列芯片正式到來。
Blackwell以第一位入選美國國家科學(xué)院的黑人學(xué)者、數(shù)學(xué)家David Harold Blackwell的名字命名,它將允許客戶能夠在萬億參數(shù)大型語言模型上構(gòu)建和運行實時生成人工智能。
Blackwell平臺引入了六項開創(chuàng)性技術(shù)來支持高達10萬億參數(shù)的AI模型訓(xùn)練和大語言模型的實時推理。有望在數(shù)據(jù)處理、工程模擬、電子設(shè)計自動化、計算機輔助藥物設(shè)計、量子計算和生成人工智能等領(lǐng)域?qū)崿F(xiàn)新的突破。用黃仁勛的原話來說,它就是“當(dāng)今世界上最強大的芯片”。這六項技術(shù)分別為:
更大芯片:Blackwell 架構(gòu) GPU 擁有2080億個晶體管,尺寸是Hopper(800億晶體管)的兩倍多。Blackwell B200不是傳統(tǒng)的單一GPU,而是由兩個緊密耦合的芯片組成,這兩個芯片通過10 TB/秒的芯片到芯片鏈路連接成了一個統(tǒng)一的GPU 。
第二代Transformer引擎:配備了新的微張量縮放支持和先進的動態(tài)范圍管理算法,通過創(chuàng)新的4位浮點AI推理功能使計算和模型大小加倍。
第五代 NVLink 網(wǎng)絡(luò)技術(shù):最新的NVLink迭代增強了數(shù)萬億參數(shù)AI模型的性能,為每個GPU提供了高達1.8TB/s的雙向吞吐量,確保當(dāng)今最復(fù)雜的大語言模型能在多達576個GPU之間實現(xiàn)無縫高速通信。
RAS引擎:Blackwell驅(qū)動的GPU集成了專用引擎和基于人工智能的預(yù)防性維護功能,可確保可靠性、可用性和可維護性,從而最大限度地延長系統(tǒng)運行時間并最大限度地降低運營成本。
安全人工智能:全新的機密計算功能可在不影響性能的情況下保護人工智能模型和客戶數(shù)據(jù),并支持新的本機接口加密協(xié)議,在傳輸過程中、靜止狀態(tài)和計算時都能保證安全。
解壓縮引擎:通過支持最新格式加速數(shù)據(jù)庫查詢,增強數(shù)據(jù)分析和數(shù)據(jù)科學(xué)性能,徹底改變數(shù)據(jù)處理。
英偉達表示,此前訓(xùn)練一個1.8萬億參數(shù)模型需要用到8000個Hopper GPU和 15兆瓦的功率。而如今,同樣的訓(xùn)練量2000個Blackwell GPU就可以做到,功耗僅為4兆瓦。
基于Blackwell,此次英偉達還推出了其AI超級芯片GB2000。GB2000由兩個B200 Blackwell GPU和一個基于Arm的Grace CPU組成,可以為大語言模型推理工作負載提供30倍的性能,而成本能耗要比其“前輩”Hopper低25倍。在具有1750億個參數(shù)的GPT-3 LLM基準測試中,GB200的性能是H100的7倍,訓(xùn)練速度是H100的4倍。
GB200還將成為英偉達全新大型機架系統(tǒng)GB200 NVL72的基石。該系統(tǒng)擁有72個Blackwell GPU和36個Grace GPU,擁有1.4 exaflops的AI性能和30TB的快速內(nèi)存。英偉達表示,該系統(tǒng)可以部署27萬億參數(shù)的模型,而目前最大的模型GPT-4僅約有1.7萬億個參數(shù),因此能夠加快釋放生成式AI的能力。
審核編輯:劉清
-
人工智能
+關(guān)注
關(guān)注
1819文章
50207瀏覽量
266434 -
英偉達
+關(guān)注
關(guān)注
23文章
4109瀏覽量
99529 -
AI芯片
+關(guān)注
關(guān)注
17文章
2146瀏覽量
36838 -
大模型
+關(guān)注
關(guān)注
2文章
3715瀏覽量
5245
原文標題:剛剛!英偉達發(fā)布“AI核彈”!
文章出處:【微信號:CSF211ic,微信公眾號:中國半導(dǎo)體論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
豪言自家芯片比英偉達GPU強10倍,這家AI公司再獲融資
英偉達Rubin GPU采用鉆石銅散熱,解決芯片散熱難題
云巨頭算力戰(zhàn)升級!微軟新一代3nm AI推理芯片性能提升30%,落地數(shù)據(jù)中心
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4倍
今日看點:特朗普:英偉達Blackwell AI芯片不會廣泛對海外開放;閃迪 NAND 閃存11 月報價漲幅高達 50%
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)
英偉達最新B30A芯片曝光:算力角逐中的新變數(shù)
外媒:英偉達正開發(fā)新款中國特供芯片B30A 或為旗艦AI芯品B300的閹割版
英偉達最新一代AI芯片Blackwell GPU,AI算力能力較上代提升30倍!
評論