国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深入解讀Grace CPU芯片架構(gòu)

架構(gòu)師技術(shù)聯(lián)盟 ? 來源:半導(dǎo)體行業(yè)觀察 ? 2023-02-02 11:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Grace CPU是 NVIDIA 開發(fā)的第一款數(shù)據(jù)中心 CPU。通過將 NVIDIA 專業(yè)知識(shí)與 Arm 處理器、片上結(jié)構(gòu)、片上系統(tǒng) (SoC) 設(shè)計(jì)和彈性高帶寬低功耗內(nèi)存技術(shù)相結(jié)合。參考內(nèi)容“NVIDIA GraceCPU處理器合集”。

NVIDIA Grace CPU 從頭開始構(gòu)建,以創(chuàng)建世界上第一個(gè)用于計(jì)算的超級(jí)芯片(super chip)。超級(jí)芯片的核心是NVLink Chip-2-Chip (C2C),它允許 NVIDIA Grace CPU 以 900 GB/s 的雙向帶寬與超級(jí)芯片中的另一個(gè) NVIDIA Grace CPU 或NVIDIA Hopper GPU進(jìn)行通信

NVIDIA Grace Hopper Superchip將節(jié)能、高帶寬的 NVIDIA Grace CPU 與功能強(qiáng)大的 NVIDIA H100 Hopper GPU 結(jié)合使用 NVLink-C2C,以最大限度地提高強(qiáng)大的高性能計(jì)算 (HPC) 和巨型 AI 工作負(fù)載的能力。 NVIDIA Grace CPU 超級(jí)芯片是使用兩個(gè)通過 NVLink-C2C 連接的 Grace CPU 構(gòu)建的。該超級(jí)芯片建立在現(xiàn)有 Arm 生態(tài)系統(tǒng)的基礎(chǔ)上,為 HPC、要求苛刻的云工作負(fù)載以及高性能和高能效的密集基礎(chǔ)設(shè)施創(chuàng)建了首個(gè)毫不妥協(xié)的 Arm CPU。 在本文中,您將了解 NVIDIA Grace CPU 超級(jí)芯片以及提供 NVIDIA Grace CPU 性能和能效的技術(shù)。有關(guān)詳細(xì)信息。

cde8af2a-a2ab-11ed-bfe3-dac502259ad0.png

圖 1. 與雙插槽 Milan 7763 CPU 相比,NVIDIA Grace CPU Superchip 上應(yīng)用程序的性能和節(jié)能效果

專為 HPC 和 AI 工作負(fù)載打造的超級(jí)芯片

NVIDIA Grace CPU 超級(jí)芯片通過將旗艦雙路 x86-64 服務(wù)器或工作站平臺(tái)提供的性能水平集成到單個(gè)超級(jí)芯片中,代表了計(jì)算平臺(tái)設(shè)計(jì)的一場(chǎng)革命。高效的設(shè)計(jì)可在較低的功率范圍內(nèi)實(shí)現(xiàn) 2 倍的計(jì)算密度。

cdfc2992-a2ab-11ed-bfe3-dac502259ad0.png

NVIDIA Grace CPU 旨在提供高單線程性能、高內(nèi)存帶寬和出色的數(shù)據(jù)移動(dòng)能力,每瓦性能領(lǐng)先。NVIDIA Grace CPU Superchip 結(jié)合了兩個(gè)連接超過 900 GB/s 雙向帶寬 NVLink-C2C 的 NVIDIA Grace CPU,提供 144 個(gè)高性能 Arm Neoverse V2 內(nèi)核和高達(dá) 1 TB/s 帶寬的數(shù)據(jù)中心級(jí) LPDDR5X 內(nèi)存,帶糾錯(cuò)碼( ECC)內(nèi)存。

ce11bd20-a2ab-11ed-bfe3-dac502259ad0.png

圖2. 具有 900 GB/s NVLink-C2C 的 NVIDIA Grace CPU 超級(jí)芯片

使用 NVLink-C2C 互連緩解瓶頸

為了擴(kuò)展到 144 個(gè) Arm Neoverse V2 內(nèi)核并在兩個(gè) CPU 之間移動(dòng)數(shù)據(jù),NVIDIA Grace CPU Superchip 需要在 CPU 之間建立高帶寬連接。NVLink C2C 互連在兩個(gè) NVIDIA Grace CPU 之間提供高帶寬直接連接,以創(chuàng)建 NVIDIA Grace CPU 超級(jí)芯片。

使用 NVIDIA Scalable Coherency Fabric 擴(kuò)展內(nèi)核和帶寬

現(xiàn)代 CPU 工作負(fù)載需要快速的數(shù)據(jù)移動(dòng)。由 NVIDIA 設(shè)計(jì)的可擴(kuò)展一致性結(jié)構(gòu) (SCF) 是一種網(wǎng)狀結(jié)構(gòu)和分布式緩存架構(gòu),旨在擴(kuò)展內(nèi)核和帶寬(圖 3)。SCF 提供超過 3.2 TB/s 的總二分帶寬,以保持?jǐn)?shù)據(jù)在 CPU 內(nèi)核、NVLink-C2C、內(nèi)存和系統(tǒng) IO 之間流動(dòng)。 CPU 核心和 SCF 緩存分區(qū)分布在整個(gè)網(wǎng)格中,而緩存交換節(jié)點(diǎn)通過結(jié)構(gòu)路由數(shù)據(jù)并充當(dāng) CPU、緩存內(nèi)存和系統(tǒng) IO 之間的接口。NVIDIA Grace CPU 超級(jí)芯片在兩個(gè)芯片上具有 234 MB 的分布式三級(jí)緩存。

ce212ec2-a2ab-11ed-bfe3-dac502259ad0.jpg

圖3. NVIDIA Grace CPU 和可擴(kuò)展一致性結(jié)構(gòu)

LPDDR5X

能效和內(nèi)存帶寬都是數(shù)據(jù)中心 CPU 的關(guān)鍵組成部分。NVIDIA Grace CPU Superchip 使用高達(dá) 960 GB 的服務(wù)器級(jí)低功耗 DDR5X (LPDDR5X) 內(nèi)存和 ECC。此設(shè)計(jì)為大規(guī)模 AI 和 HPC 工作負(fù)載實(shí)現(xiàn)了帶寬、能效、容量和成本的最佳平衡。 與八通道 DDR5 設(shè)計(jì)相比,NVIDIA Grace CPU LPDDR5X 內(nèi)存子系統(tǒng)以每千兆字節(jié)每秒八分之一的功率提供高達(dá) 53% 的帶寬,同時(shí)成本相似。HBM2e 內(nèi)存子系統(tǒng)本可以提供大量?jī)?nèi)存帶寬和良好的能效,但每 GB 成本是其 3 倍多,并且僅為 LPDDR5X 可用最大容量的八分之一。 LPDDR5X 較低的功耗降低了整體系統(tǒng)功率要求,并使更多資源能夠用于 CPU 內(nèi)核。緊湊的外形使基于 DIMM 的典型設(shè)計(jì)的密度提高了 2 倍。

NVIDIA Grace CPU I/O

NVIDIA Grace CPU Superchip 支持多達(dá) 128 條用于 IO 連接的 PCIe Gen 5 通道。8 個(gè) PCIe Gen 5 x16 鏈路中的每一個(gè)都支持高達(dá) 128 GB/s 的雙向帶寬,并且可以分為 2x8 個(gè)以提供額外的連接,并且可以支持各種 PCIe 插槽形狀因數(shù),開箱即用地支持NVIDIA GPU和NVIDIA DPU、NVIDIA ConnectX SmartNIC、E1.S 和 M.2 NVMe 設(shè)備、模塊化 BMC 選項(xiàng)等。?

NVIDIA Grace CPU 核心架構(gòu)

為了實(shí)現(xiàn)最大的工作負(fù)載加速,快速高效的 CPU 是系統(tǒng)設(shè)計(jì)的重要組成部分。Grace CPU 的核心是 Arm Neoverse V2 CPU 內(nèi)核。Neoverse V2 是 Arm V 系列基礎(chǔ)架構(gòu) CPU 內(nèi)核中的最新產(chǎn)品,經(jīng)過優(yōu)化可提供領(lǐng)先的每線程性能,同時(shí)與傳統(tǒng) CPU 相比提供領(lǐng)先的能效。

ce3caf44-a2ab-11ed-bfe3-dac502259ad0.jpg

圖4. NVIDIA Grace CPU 的 Arm Neoverse V2 內(nèi)核

Arm架構(gòu)

NVIDIA Grace CPU Neoverse V2 核心實(shí)現(xiàn)了 Armv9-A 架構(gòu),它將 Armv8-A 架構(gòu)中定義的架構(gòu)擴(kuò)展到 Armv8.5-A。為 Armv8.5-A 之前的 Armv8 架構(gòu)構(gòu)建的任何應(yīng)用程序二進(jìn)制文件都將在 NVIDIA Grace CPU 上執(zhí)行。這包括針對(duì) Ampere Altra、AWS Graviton2 和AWS Graviton3等 CPU 的二進(jìn)制文件。

SIMD指令

Neoverse V2 在 4×128 位配置中實(shí)現(xiàn)了兩個(gè)單指令多數(shù)據(jù) (SIMD) 向量指令集:可擴(kuò)展向量擴(kuò)展版本 2 (SVE2) 和高級(jí) SIMD (NEON)。四個(gè) 128 位功能單元中的每一個(gè)都可以退出 SVE2 或 NEON 指令。這種設(shè)計(jì)使更多代碼能夠充分利用 SIMD 性能。SVE2 通過高級(jí)指令進(jìn)一步擴(kuò)展了 SVE ISA,這些指令可以加速機(jī)器學(xué)習(xí)、基因組學(xué)和密碼學(xué)等關(guān)鍵 HPC 應(yīng)用程序。

原子操作(Atomic operation)

NVIDIA Grace CPU 支持在 Armv8.1 中首次引入的大型系統(tǒng)擴(kuò)展 (LSE)。LSE 提供低成本的原子操作,可以提高 CPU 到 CPU 通信、鎖和互斥鎖的系統(tǒng)吞吐量。這些指令可以對(duì)整數(shù)數(shù)據(jù)進(jìn)行操作。所有支持 NVIDIA Grace CPU 的編譯器都將在同步函數(shù)中自動(dòng)使用這些指令,例如 GNU 編譯器集合__atomic內(nèi)置函數(shù)和std::atomic. 當(dāng)使用 LSE 原子而不是加載/存儲(chǔ)獨(dú)占時(shí),改進(jìn)可以達(dá)到一個(gè)數(shù)量級(jí)。

Armv9 附加功能

NVIDIA Grace CPU實(shí)現(xiàn)了Armv9 產(chǎn)品組合的多項(xiàng)關(guān)鍵功能,可在通用數(shù)據(jù)中心 CPU 中提供實(shí)用程序,包括但不限于加密加速、可擴(kuò)展分析擴(kuò)展、虛擬化擴(kuò)展、全內(nèi)存加密、安全啟動(dòng)等。

NVIDIA Grace CPU 軟件

NVIDIA Grace CPU Superchip 旨在為軟件開發(fā)人員提供符合標(biāo)準(zhǔn)的平臺(tái)。 NVIDIA Grace CPU 符合 Arm 服務(wù)器基礎(chǔ)系統(tǒng)架構(gòu) (SBSA),以支持符合標(biāo)準(zhǔn)的硬件和軟件接口。此外,為了在基于 Grace CPU 的系統(tǒng)上啟用標(biāo)準(zhǔn)引導(dǎo)流程,Grace CPU 被設(shè)計(jì)為支持 Arm 服務(wù)器基本引導(dǎo)要求 (SBBR)。所有主要的 Linux 發(fā)行版,以及它們提供的大量軟件包,都可以在 NVIDIA Grace CPU 上完美運(yùn)行,無(wú)需修改。 編譯器、庫(kù)、工具、分析器、系統(tǒng)管理實(shí)用程序以及用于容器化和虛擬化的框架現(xiàn)已上市,并且可以像在任何其他數(shù)據(jù)中心 CPU 上一樣輕松地在 NVIDIA Grace CPU 上安裝和使用。 此外,整個(gè) NVIDIA 軟件堆棧都可用于 NVIDIA Grace CPU。NVIDIA HPC SDK 和每個(gè) CUDA 組件都有 Arm 原生安裝程序和容器。NVIDIA GPU Cloud (NGC) 還提供深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和針對(duì) Arm 優(yōu)化的 HPC 容器。NVIDIA Grace CPU 遵循主流 CPU 設(shè)計(jì)原則,并且與任何其他服務(wù)器 CPU 一樣進(jìn)行編程

ce504d1a-a2ab-11ed-bfe3-dac502259ad0.png

圖 5. NVIDIA Grace CPU 軟件生態(tài)系統(tǒng)將用于 CPU、GPU 和 DPU 的全套 NVIDIA 軟件與完整的 Arm 數(shù)據(jù)中心生態(tài)系統(tǒng)相結(jié)合

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20250

    瀏覽量

    252186
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11277

    瀏覽量

    224934
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109711
  • 芯片架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    32

    瀏覽量

    14878

原文標(biāo)題:深入解讀Grace CPU芯片架構(gòu)

文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    全球首創(chuàng)!RISC-V+AI架構(gòu)高性能服務(wù)器CPU成功點(diǎn)亮

    電子發(fā)燒友網(wǎng)報(bào)道 長(zhǎng)久以來,全球高端服務(wù)器CPU市場(chǎng)一直被x86和ARM架構(gòu)所主導(dǎo),我國(guó)在核心算力領(lǐng)域長(zhǎng)期受制于人,高端芯片供應(yīng)鏈安全面臨重大挑戰(zhàn)。 ? 近日,藍(lán)芯算力(深圳)科技有限公司宣布,公司
    的頭像 發(fā)表于 02-28 09:22 ?1798次閱讀

    深入剖析LTC3541-3:高效電源管理芯片的多面解讀

    深入剖析LTC3541-3:高效電源管理芯片的多面解讀 引言 在電子設(shè)備小型化和多功能化發(fā)展的大趨勢(shì)下,電源管理芯片的性能和集成度變得尤為關(guān)鍵。LTC3541-3 以其獨(dú)特的設(shè)計(jì)和卓越
    的頭像 發(fā)表于 02-05 14:45 ?108次閱讀

    德州儀器(TI)解讀汽車區(qū)域架構(gòu)中的 TSN:?jiǎn)⒂靡蕴W(wǎng)環(huán)形架構(gòu)和 AVB 分布式音頻

    德州儀器(TI)解讀汽車區(qū)域架構(gòu)中的 TSN:?jiǎn)⒂靡蕴W(wǎng)環(huán)形架構(gòu)和 AVB 分布式音頻
    的頭像 發(fā)表于 12-24 18:10 ?1.2w次閱讀
    德州儀器(TI)<b class='flag-5'>解讀</b>汽車區(qū)域<b class='flag-5'>架構(gòu)</b>中的 TSN:?jiǎn)⒂靡蕴W(wǎng)環(huán)形<b class='flag-5'>架構(gòu)</b>和 AVB 分布式音頻

    TE Connectivity 2.0mm信號(hào)GRACE INERTIA連接器技術(shù)解析

    TE Connectivity (TE) 2.0mm信號(hào)GRACE INERTIA連接器采用緊湊、節(jié)省空間的設(shè)計(jì),額定電壓為50V ~AC~ ,設(shè)有2至10位。這些連接器具有慣性鎖定機(jī)制(有助于防止
    的頭像 發(fā)表于 11-09 15:12 ?766次閱讀

    2025年AI 智能終端和SoC芯片解讀

    電子發(fā)燒友網(wǎng)站提供《2025年AI 智能終端和SoC芯片解讀.pptx》資料免費(fèi)下載
    發(fā)表于 09-15 16:38 ?618次下載

    Imagination亮相汽車芯片產(chǎn)業(yè)大會(huì) 深入解讀高安全GPU+AI融合計(jì)算架構(gòu)

    9月12日,由蓋世汽車主辦的2025第五屆全球汽車芯片產(chǎn)業(yè)大會(huì)在上海啟幕。本次大會(huì)以“芯”動(dòng)汽車智引未來為主題,圍繞車規(guī)級(jí)芯片標(biāo)準(zhǔn)與安全認(rèn)證、車企自研芯片、智能輔助駕駛芯片、高算力智能
    的頭像 發(fā)表于 09-12 18:10 ?1025次閱讀
    Imagination亮相汽車<b class='flag-5'>芯片</b>產(chǎn)業(yè)大會(huì) <b class='flag-5'>深入</b><b class='flag-5'>解讀</b>高安全GPU+AI融合計(jì)算<b class='flag-5'>架構(gòu)</b>

    深入剖析RabbitMQ高可用架構(gòu)設(shè)計(jì)

    在微服務(wù)架構(gòu)中,消息隊(duì)列故障導(dǎo)致的系統(tǒng)不可用率高達(dá)27%!如何構(gòu)建一個(gè)真正可靠的消息中間件架構(gòu)?本文將深入剖析RabbitMQ高可用設(shè)計(jì)的核心要點(diǎn)。
    的頭像 發(fā)表于 08-18 11:19 ?952次閱讀

    探索CPU架構(gòu)的奧秘,揭秘高性能計(jì)算的隱形引擎

    本文轉(zhuǎn)自:綠算技術(shù)CPU的內(nèi)部工作原理:指令周期的精密舞蹈CPU,這顆無(wú)形的“心臟”,默默地驅(qū)動(dòng)著每一臺(tái)智能設(shè)備的脈動(dòng)。它不僅是數(shù)據(jù)的處理中心,更是智慧與效率的源泉。今天與大家一同潛入CPU
    的頭像 發(fā)表于 08-13 11:58 ?788次閱讀
    探索<b class='flag-5'>CPU</b><b class='flag-5'>架構(gòu)</b>的奧秘,揭秘高性能計(jì)算的隱形引擎

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識(shí)是比較接近當(dāng)前的頂尖芯片水平的,同時(shí)包含了
    發(fā)表于 06-18 19:31

    RISC-V架構(gòu)CPU的RAS解決方案

    RISC-V架構(gòu)以追趕者的姿態(tài)在多個(gè)應(yīng)用領(lǐng)域與X86架構(gòu)和ARM架構(gòu)展開競(jìng)爭(zhēng)。在服務(wù)器應(yīng)用領(lǐng)域,RISC-V架構(gòu)正在重新定義服務(wù)器芯片領(lǐng)域必
    的頭像 發(fā)表于 06-06 17:03 ?1805次閱讀
    RISC-V<b class='flag-5'>架構(gòu)</b><b class='flag-5'>CPU</b>的RAS解決方案

    借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 網(wǎng)絡(luò)架構(gòu)和交換機(jī),以及諸如 NVIDIA cuDSS 和 NVIDIA cuLitho 等特定領(lǐng)域的 NVIDIA C
    的頭像 發(fā)表于 05-27 13:59 ?1105次閱讀

    NVIDIA Grace CPU C1獲得廣泛支持

    NVIDIA 在本周 COMPUTEX 上重點(diǎn)展示了其全新的 Grace CPU C1,并獲得多家主要原始設(shè)計(jì)制造商合作伙伴的大力支持。
    的頭像 發(fā)表于 05-22 10:01 ?791次閱讀

    CPU的各種指令和執(zhí)行流程

    、數(shù)據(jù)傳輸?shù)裙δ堋R?b class='flag-5'>深入理解CPU的指令,我們需要從多個(gè)維度進(jìn)行分析,尤其是指令的構(gòu)成、分類、執(zhí)行流程以及與不同架構(gòu)的關(guān)系。
    的頭像 發(fā)表于 04-18 11:24 ?2610次閱讀

    深入解讀智多晶FIR IP

    在數(shù)字信號(hào)處理領(lǐng)域,F(xiàn)IR 濾波器憑借其穩(wěn)定性強(qiáng)、線性相位等優(yōu)勢(shì),被廣泛應(yīng)用于各類信號(hào)處理場(chǎng)景。今天,就帶大家深入解讀西安智多晶微電子有限公司推出的FIR IP。
    的頭像 發(fā)表于 03-20 17:08 ?1179次閱讀
    <b class='flag-5'>深入</b><b class='flag-5'>解讀</b>智多晶FIR IP

    芯來科技攜手芯芒科技發(fā)布RISC-V CPU系統(tǒng)仿真平臺(tái)

    專業(yè)RISC-V處理器IP及解決方案公司芯來科技與杭州芯芒科技深入合作,共同研發(fā)推出芯來全系列RISC-V CPU系統(tǒng)仿真平臺(tái)。幫助下游SoC和產(chǎn)品開發(fā)團(tuán)隊(duì)基于該仿真平臺(tái)快速構(gòu)建從芯片核心架構(gòu)
    的頭像 發(fā)表于 03-19 14:36 ?1720次閱讀