国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA CPU+GPU超級芯片終于量產

硬件世界 ? 來源:硬件世界 ? 2023-05-30 14:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2022年3月,NVIDIA發布了首款數據中心CPU Grace、新一代高性能計算GPU Hopper,同時利用它們打造了兩顆“超級芯片”(Super Chip),一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一,看起來都極為酷炫。

現在,足足14個月過去了,NVIDIA終于宣布,GH200 Grace Hopper超級芯片已經全面投產,將為復雜AI、HPC工作負載提供澎湃的動力。

再加上Grace CPU、Hopper GPU、Ada Lovelace GPU、BlueField DPU等全套系統方案,NVIDIA現在已經有400多種配置,可滿足市場對生成式AI的激增需求。

歐洲和美國的超大規模云服務商、超算中心,將會成為接入GH200系統的首批客戶。

同時,黃仁勛還公布了Grace Hopper的更多細節,尤其是它的CPU、GPU之間使用NVLink-C2C互連技術,總帶寬高達900GB/s,相比傳統的PCIe 5.0通道超出足足7倍,能夠滿足要求最苛刻的生成式AI和HPC應用,功耗也降低了超過80%。

Grace Hopper是一塊CPU+GPU合體的超級芯片,CPU是NVIDIA自研的72核處理器,Neoverse V2內核,擁有480GB LPDDR5內存,512GB/s帶寬。

GPU部分是H100,FP64性能34TFLOPS,但更強的是INT8性能,AI運算能力達到了3958TFLOPS,帶96GB HBM3內存。

同時,NVIDIA發布了針對AI推出的大內存DGX GH200超算系統,配備了256個Grace Hopper芯片,總計1.8萬CPU核心,144TB內存,相比之前漲了500倍。

AI運算對內存容量的要求更高,所以DGX GH200通過最新的NVLink、NVLink Switch等技術連接了256塊Grace Hooper超級芯片,實現了極為夸張的性能及內存。

GH200總計有256塊Grace Hooper芯片,因此總計18432個CPU核心,144TB HBM3內存,AI性能達到了1 exaFLOPS,也就是100億億次。

這是什么概念?當前最強的TOP500超算也就是百億億次性能,只不過這個性能是HPC計算的,NVIDIA的是百億億次AI性能。

45b302e0-fe68-11ed-90ce-dac502259ad0.jpg

為了讓256個超級芯片互聯,GH200還使用了256塊單口400Gb/s InfiniBand互聯芯片,256個雙口200Gb/s InfiniBand芯片,還有96組L1 NVLink、36組L2 NVLink開關等等,設計非常復雜。

NVIDIA表示,谷歌、Meta及微軟是首批獲得DGX H200系統的公司,后續他們還會開放給更多客戶,運行客戶定制。

不過DGX H200還不是最強的,NVIDIA今年晚些時候會推出名為NVIDIA Helios的AI超算系統,由4組GH200組成,總計1024個Grace Hooper超級芯片,576TB HBM內存。

黃仁勛還向傳統的CPU服務器集群發起“挑戰”,認為在人工智能加速計算這一未來方向上,GPU服務器有著更為強大的優勢。

根據黃仁勛在演講上展示的范例,訓練一個LLM大語言模型,將需要960個CPU組成的服務器集群,這將耗費大約1000萬美元(約合人民幣7070萬元),并消耗11千兆瓦時的電力。

45ce1166-fe68-11ed-90ce-dac502259ad0.png

相比之下,同樣以1000萬美元的成本去組建GPU服務器集群,將以僅3.2千兆瓦時的電力消耗,訓練44個LLM大模型。

45fca774-fe68-11ed-90ce-dac502259ad0.png

如果同樣消耗11千兆瓦時的電量,那么GPU服務器集群能夠實現150倍的加速,訓練150個LLM大模型,且占地面積更小。

而當用戶僅僅想訓練一個LLM大模型時,則只需要一個40萬美元左右,消耗0.13千兆瓦時電力的GPU服務器即可。

換言之,相比CPU服務器,GPU服務器能夠以4%的成本和1.2%的電力消耗來訓練一個LLM,這將帶來巨大的成本節省。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109754
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135467
  • 超級芯片
    +關注

    關注

    0

    文章

    39

    瀏覽量

    9318

原文標題:領先幾光年!NVIDIA CPU+GPU超級芯片終于量產

文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發表于 02-10 10:31 ?245次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產品,其各項核心指標均針對 GPU 加速工作流的高性能
    的頭像 發表于 01-06 09:51 ?2327次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用
    的頭像 發表于 12-13 10:12 ?1203次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡化<b class='flag-5'>GPU</b>編程

    NVIDIA擴大與微軟合作推動AI超級工廠建設

    在 Microsoft Ignite 大會上,NVIDIA 擴大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅動的全新 Microsoft Fairwater AI 超級工廠中部署新一代
    的頭像 發表于 12-01 09:52 ?801次閱讀

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應用正在使用 AI 加速,而無論工作站的大小或形態如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發表于 11-28 09:39 ?6321次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA在ISC 2025分享最新超級計算進展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網絡和量子技術實現了飛躍。在 SC25 上展示的加速系統突顯了全球超級計算和 AI 的進展。
    的頭像 發表于 11-25 10:59 ?906次閱讀
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新<b class='flag-5'>超級</b>計算進展

    NVIDIA推出NVQLink高速互連架構

    NVIDIA 推出 NVIDIA NVQLink,這是一種開放式系統架構,可將 GPU 計算的極致性能與量子處理器緊密結合,以構建加速的量子超級計算機。
    的頭像 發表于 11-03 14:53 ?727次閱讀

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構 GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產品 NVIDIA RTX 450
    的頭像 發表于 08-28 11:02 ?3996次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴展新產品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發表于 08-18 11:50 ?1418次閱讀

    英偉達:我們的芯片不存監控軟件 NVIDIA官方發文 NVIDIA芯片不存在后門、終止開關和監控軟件

    今天凌晨,英偉達通過官微發布長文《NVIDIA 芯片不存在后門、終止開關和監控軟件》。以下是全文: NVIDIA GPU 是現代計算的核心,被廣泛應用于醫療健康、金融、科學研究、自動駕
    的頭像 發表于 08-06 12:13 ?2452次閱讀

    GB10超級芯片開賣!正式殺入AI PC

    上,英偉達就正式發布了首款個人超級電腦Project DIGITS,其搭載了由英偉達與聯發科合作開發的NVIDIA GB10 Grace Blackwell Superchip 芯片,由Blackwell
    的頭像 發表于 07-09 01:21 ?4099次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    。。) 原理學習 在「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」書中,作者詳解了從帕斯卡架構到40系的Hopper架構的技術演變進化,按照出版時間算是囊括了NVIDIA
    發表于 06-18 19:31

    借助NVIDIA技術加速半導體芯片制造

    NVIDIA Blackwell GPUNVIDIA Grace CPU、高速 NVIDIA NVLink 網絡架構和交換機,以及諸如
    的頭像 發表于 05-27 13:59 ?1113次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發

    NVIDIA GTC 推出新一代專業級 GPU 和 AI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的 NVIDIA
    的頭像 發表于 03-28 09:59 ?1306次閱讀

    使用NVIDIA CUDA-X庫加速科學和工程發展

    NVIDIA GTC 全球 AI 大會上宣布,開發者現在可以通過 CUDA-X 與新一代超級芯片架構的協同,實現 CPUGPU 資源間
    的頭像 發表于 03-25 15:11 ?1537次閱讀