国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英特爾聚力整合實現可持續的異構計算

英特爾中國 ? 來源:英特爾中國 ? 作者:Jeff McVeigh ? 2022-06-12 17:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

接下來的超算普及化時代,英特爾將滿足永無止境的計算需求,并將可持續發展作為重中之重。

本文作者:Jeff McVeigh

英特爾副總裁兼超級計算事業部總經理

隨著我們進入E級(Exascale)計算時代并邁向Z級(Zettascale)計算時代,科技行業也越來越影響著全球的碳排放。據估計,到2030年數據中心的能耗估計將達到全球能源產量的3%-7%①,而計算基礎設施將成為新增用電量的主要驅動因素。

今年,英特爾承諾到2040年實現全球業務的溫室氣體凈零排放,并開發更加可持續的技術解決方案。在創造可持續未來的同時滿足對計算永無止境的需求,這是高性能計算(HPC)面臨的最大挑戰之一。這個任務雖然艱巨,但如果我們能夠把芯片、軟件和系統這些HPC計算堆棧的每個部分都做好,它就是可以實現的。

我在德國漢堡舉行的2022國際超算大會(ISC2022)上發表了主題演講,上述內容就是我在演講中傳達的核心信息。

從芯片和異構計算架構開始

英特爾公布了直到2024年的高性能計算產品路線圖,期間我們將致力于提供多樣化的異構架構。這些架構不僅將使我們能夠實現幾個數量級的性能提升,同時亦可降低通用工作負載及諸如人工智能、加密、分析等新興工作負載的能耗。

以內置高帶寬內存(HBM),代號為Sapphire Rapids的英特爾至強處理器為例,該款處理器能夠很好地展示我們如何利用先進的封裝技術和芯片創新,為高性能計算帶來性能、帶寬和節能方面的顯著提升。通過封裝高達64GB的高帶寬內存HBM2e并把加速器集成到CPU中,我們能夠釋放內存敏感型工作負載的潛力,為這些關鍵的高性能計算應用場景大幅提升性能。在對比第三代英特爾 至強 可擴展處理器和即將推出的內置高帶寬內存(HBM)的Sapphire Rapids處理器時,我們發現,后者把氣候研究、能源、制造和物理學工作負載的性能提升了2-3倍②。在主題演講中,Ansys首席技術官Prith Banerjee還展示了內置高帶寬內存的Sapphire Rapids為Ansys Fluent和ParSeNet的實際工作負載帶來了高達2倍的性能提升③。

為實現跨HPC和AI超算工作負載的幾個數量級的性能提升,計算密度是另一必不可少的要素。代號為Ponte Vecchio的英特爾首個旗艦級數據中心圖形處理器(GPU),已經在復雜的金融服務應用以及AI推理和訓練工作負載方面展現出了卓越的優勢。

創新不止于此。今天,我們還宣布這款出色數據中心GPU的下一代產品代號為Rialto Bridge。通過升級Ponte Vecchio架構,并結合使用下一代制程節點技術制造的增強型芯片子模塊,Rialto Bridge將大幅提高計算密度、性能和效率,同時提供軟件一致性。

展望未來,Falcon Shores是我們路線圖中下一個重要的架構創新,即把x86 CPU和Xe GPU集成在同一插槽中。這一架構計劃將在2024年推出,它將在每瓦性能、計算密度、內存容量與帶寬方面均實現超過5倍的性能提升④。

成功的軟件戰略遵循三個原則:

開放、選擇、信任

如果沒有軟件為芯片注入活力,它將僅僅只是砂礫。英特爾的軟件策略是促進整個堆棧的開放式發展,并提供工具、平臺和軟件IP,以幫助開發者提升工作效率,產出可擴展、更高性能、更高效的代碼,這些代碼能充分利用最新的芯片創新,沒有重構代碼的負擔。oneAPI行業計劃為HPC開發者提供了跨架構編程,使代碼能透明、可遷移地適用于CPU、GPU和其他專用加速器。

目前,在世界各地領先的科研和學術機構中已有20多個oneAPI卓越中心(CoE),它們正取得重要的進展。例如,布里斯托大學科學系的Simon McIntosh-Smith和他的團隊,正在使用oneAPI和Khronos Group的SYCL抽象層進行跨架構編程,為在E級計算規模上實現性能可移植性開發最佳實踐。他們的工作將確保科學代碼能在大規模異構超算系統上實現高性能。

聚力整合:實現可持續的異構計算

隨著數據中心和HPC工作負載越來越多采用分布式架構和異構計算,我們需要借助工具來幫助有效管理和應對復雜多樣的計算環境。

今天,我們將推出一款開源解決方案Intel XPU Manager,它可以在本地或遠程監測和管理英特爾數據中心GPU。該解決方案旨在簡化管理,并通過綜合診斷更好地實現可靠性和延長設備運行時間,以及提升利用率并支持固件更新。

針對能耗很高的數據傳輸和存儲任務,分布式異步對象存儲(DAOS)文件系統提供了系統級的優化。DAOS可以顯著地改善文件系統的性能,它不僅可以縮短整體訪問時間,而且能夠降低存儲所需的容量,從而減少數據中心的占用空間并提高能源效率。相比于Lustre在I/O500中的測試結果,DAOS實現了直接寫入文件系統性能70倍⑤的提升。

應對HPC的可持續性挑戰

我們很榮幸能夠與全球志同道合的客戶和行業領先的科研機構合作,朝著實現更具可持續性和開放性的高性能計算而努力。我們近期取得了一系列成果——我們與巴塞羅那超算中心合作建立了開創性的RISC-V Z級計算實驗室;并與劍橋大學和戴爾繼續合作,將當前的E級計算實驗室進一步打造成為新的劍橋Z級計算實驗室。

獨木難支,完整生態的構建需要在制造、芯片、互連、軟件和系統等各方面攜手共進。通過與整個生態的協作,我們致力于將本世紀最大的HPC挑戰轉化為前所未有的機遇,創造改變世界的技術,讓未來更美好。

注意事項與免責聲明:

①《對2020年至2030年期間全球計算機的一次能源使用、電力使用和二氧化碳排放及其所占份額的假設》,作者:Anders S.G. Andrae,《WSEAS電力系統匯刊》,15(2020)

②測量依據如下:

CloverLeaf

由英特爾于2022年4月26日測試。1節點,2個英特爾至強鉑金8360Y CPU,72個內核,超線程開啟,睿頻開啟,總內存256GB(16x16GB DDR4 3200MT/s),SE5C6200.86B.0021.D40.2101090208,Ubuntu 20.04,Kernel 5.10,0xd0002a0,ifort 2021.5,Intel MPI 2021.5.1,編譯器參數:-xCORE-AVX512-qopt-zmm-usage=high

由英特爾于2022年4月19日測試。1節點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內核,超線程開啟,睿頻開啟,總內存128GB(HBM2e以3200MHz的頻率運行),BIOS版本EGSDCRB1.86B.0077.D11.2203281354,ucode版本=0x83000200,CentOS Stream 8,Linux版本5.16,ifort 2021.5,Intel MPI 2021.5.1,編譯器參數:-xCORE-AVX512–qopt-zmm-usage=high

OpenFOAM

由英特爾于2022年1月26日測試。1節點,2個英特爾至強鉑金8380 CPU,80個內核,超線程開啟,睿頻開啟,總內存256GB(16x16GB 3200MT/s,雙面),BIOS版本SE5C6200.86B.0020.P23.2103261309,0xd000270,Rocky Linux 8.5 ,Linux版本4.18.,OpenFOAMv1912,Motorbike 28M@250次迭代;編譯說明:工具:Intel Parallel Studio 2020u4,編譯器參數:-O3-ip-xCORE-AVX512

由英特爾于2022年1月26日測試。1節點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內核,超線程關閉,睿頻關閉,總內存128GB(HBM2e以3200MHz的頻率運行),試生產的平臺和BIOS,CentOS 8,Linux版本5.12,OpenFOAMv1912,Motorbike 28M@250次迭代;編譯說明:工具:Intel Parallel Studio 2020u4,編譯器參數:-O3-ip-xCORE-AVX512

WRF

由英特爾于2022年5月3日測試。1節點,2個英特爾至強8380 CPU,80個內核,超線程開啟,睿頻開啟,總內存256GB(16x16GB 3200MT/s,雙面),BIOS版本SE5C6200.86B.0020.P23.2103261309,ucode版本=0xd000270,Rocky Linux 8.5,Linux版本4.18,WRF v4.2.2

由英特爾于2022年5月3日測試。1節點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內核,超線程開啟,睿頻開啟,總內存128GB(HBM2e以3200MHz的頻率運行),BIOS版本EGSDCRB1.86B.0077.D11.2203281354,ucode版本=0x83000200,CentOS Stream 8,Linux版本5.16,WRF v4.2.2

YASK

由英特爾于2022年5月9日測試。1節點,2個英特爾至強鉑金8360Y CPU,72個內核,超線程開啟,睿頻開啟,總內存256GB(16x16GB DDR4 3200MT/s),SE5C6200.86B.0021.D40.2101090208,Rocky linux 8.5,Kernel 4.18.0,0xd000270,編譯器參數:make-j YK_CXX='mpiicpc-cxx=icpx' arch=avx2 stencil=iso3dfd radius=8,

由英特爾于2022年5月3日測試。1節點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內核,超線程開啟,睿頻開啟,總內存128GB(HBM2e以3200MHz的頻率運行),BIOS版本EGSDCRB1.86B.0077.D11.2203281354,ucode版本=0x83000200,CentOS Stream 8,Linux版本5.16,編譯器參數:make-j YK_CXX='mpiicpc-cxx=icpx'arch=avx2 stencil=iso3dfd radius=8,

③Ansys Fluent

由英特爾于2022年2月測試。1節點,2個英特爾至強鉑金8380 CPU,80個內核,超線程開啟,睿頻開啟,總內存256GB(16x16GB 3200MT/s,雙面),BIOS版本SE5C6200.86B.0020.P23.2103261309,ucode版本=0xd000270,Rocky Linux 8.5,Linux版本4.18,Ansys Fluent 2021 R2 Aircraft_wing_14m;編譯說明:商業版本使用Intel 19.3編譯器和Intel MPI 2019u

由英特爾于2022年2月測試。1節點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,40個以上內核,超線程關閉,睿頻關閉,總內存128GB(HBM2e以3200MHz的頻率運行),預生產的平臺和BIOS,CentOS 8,Linux版本5.12,Ansys Fluent 2021 R2 Aircraft_wing_14m;編譯說明:商業版本使用Intel 19.3編譯器和Intel MPI 2019u8

Ansys ParSeNet

由英特爾于2022年5月24日測試。1節點,2個英特爾至強鉑金8380CPU,80個內核,超線程開啟,睿頻開啟,總內存256GB(16x16GB DDR4 3200MT/s [3200 MT/s]),SE5C6200.86B.0021 .D40.2101090208,Ubuntu 20.04.1 LTS,5.10,ParSeNet (SplineNet),PyTorch 1.11.0,Torch-CCL 1.2.0,IPEX 1.10.0,MKL (2021.4-Product Build 20210904),oneDNN (V2.5.0)

由英特爾測試于2022年4月18日。1節點,2個早期的英特爾至強可擴展處理器測試樣品,代號為Sapphire Rapids+HBM,112個內核,超線程開啟,睿頻開啟,總內存128GB(HBM2e 3200 MT/s),EGSDCRB1.86B.0077.D11.2203281354,CentOS Stream 8,5.16,ParSeNet (SplineNet),PyTorch 1.11.0,Torch-CCL 1.2.0,IPEX 1.10.0,MKL(2021.4-Product Build 20210904),oneDNN(v2.5.0)

④Falcon Shores的性能目標基于截至2022年2月相對于當前平臺的預測。結果可能有所不同。

⑤結果可能有所不同。更多信息請訪問io500和YouTube視頻《DAOS與Lustre的性能對比測試》

原文標題:加速創新,打造更具可持續性和開放性的HPC

文章出處:【微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10301

    瀏覽量

    180447
  • HPC
    HPC
    +關注

    關注

    0

    文章

    346

    瀏覽量

    24976
  • 高性能計算
    +關注

    關注

    0

    文章

    96

    瀏覽量

    13808

原文標題:加速創新,打造更具可持續性和開放性的HPC

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    香港科技大學與英特爾共建聯合實驗室,聚焦高能效智能計算

    軟硬件協同設計創新,雙方旨在為智能設備與持續人工智能系統的未來發展提供技術參考。 在香港科技大學首席副校長郭毅可教授、英特爾中國區董事長王稚聰先生及英特爾公司大學合作資深總監Gabr
    的頭像 發表于 02-05 16:30 ?483次閱讀
    香港科技大學與<b class='flag-5'>英特爾</b>共建聯合實驗室,聚焦高能效智能<b class='flag-5'>計算</b>

    銳寶智聯入選英特爾首批尊享級合作伙伴

    余年深耕物聯網領域的技術沉淀、持續創新能力及廣泛市場影響,成功入選首批 “尊享級” 合作伙伴,成為英特爾生態中核心協同力量的重要一員。
    的頭像 發表于 12-02 18:16 ?1426次閱讀
    銳寶智聯入選<b class='flag-5'>英特爾</b>首批尊享級合作伙伴

    英特爾舉辦行業解決方案大會,共同打造機器人“芯”動脈

    具身智能和機器人應用提供強大算支持。會上,英特爾攜手普聯技術、海石商用、海信醫療、阿丘科技等眾多的生態伙伴,共同分享了豐富的行業應用成果,攜手勾勒出端側AI領域的未來發展新藍圖。
    的頭像 發表于 11-19 21:51 ?6759次閱讀
    <b class='flag-5'>英特爾</b>舉辦行業解決方案大會,共同打造機器人“芯”動脈

    向新而生,同“芯”向上!2025英特爾技術創新與產業生態大會在重慶舉行

    11月19日,2025英特爾技術創新與產業生態大會今天在重慶開幕。英特爾公司首席執行官陳立武在視頻致辭中表示:“在AI浪潮中,我們將持續加強與各位伙伴的合作,從客戶端、數據中心,到邊緣計算
    的頭像 發表于 11-19 21:34 ?5788次閱讀
    向新而生,同“芯”向上!2025<b class='flag-5'>英特爾</b>技術創新與產業生態大會在重慶舉行

    硬件與應用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    于OpenVINO? 構建的 AI 軟件平臺的擴展性,英特爾助力ISV生態伙伴率先實現應用端Day 0 模型適配,大幅加速了新模型的落地進程,彰顯了 “硬件 + 模型 + 生態” 協同的強大爆發
    的頭像 發表于 08-07 14:42 ?1365次閱讀
    硬件與應用同頻共振,<b class='flag-5'>英特爾</b>Day 0適配騰訊開源混元大模型

    異構計算解決方案(兼容不同硬件架構)

    異構計算解決方案通過整合不同類型處理器(如CPU、GPU、NPU、FPGA等),實現硬件資源的高效協同與兼容,滿足多樣化計算需求。其核心技術與實踐方案如下: 一、硬件架構設計
    的頭像 發表于 06-23 07:40 ?851次閱讀

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅動的“實時響應、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶端計算
    的頭像 發表于 06-20 17:32 ?891次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣AI的“智能引擎”

    能效提升3倍!異構計算架構讓AI跑得更快更省電

    電子發燒友網報道(文/李彎彎)異構計算架構通過集成多種不同類型的處理單元(如CPU、GPU、NPU、FPGA、DSP等),針對不同計算任務的特點進行分工協作,從而在性能、能效和靈活性之間實現最優平衡
    的頭像 發表于 05-25 01:55 ?3999次閱讀

    英特爾發布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業用戶和AI開發者的英特爾銳炫Pro GPU系列,發布英特爾? Gaudi 3 AI加速器機架級和PCIe部署方案 ? 2025 年 5 月 19 日,北京 ——今日,在
    發表于 05-20 11:03 ?1844次閱讀

    英特爾持續推進核心制程和先進封裝技術創新,分享最新進展

    近日,在2025英特爾代工大會上,英特爾展示了多代核心制程和先進封裝技術的最新進展,這些突破不僅體現了英特爾在技術開發領域的持續創新,也面向客戶需求提供了更高效、更靈活的解決方案。 在
    的頭像 發表于 05-09 11:42 ?870次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>持續</b>推進核心制程和先進封裝技術創新,分享最新進展

    英特爾宣布裁員20% 或2萬人失業

    據外媒彭博社的報道,在當地時間4月24日,英特爾宣布裁員計劃,比例超20%。按照截至2024年底英特爾在全球擁有108900名員工來計算的話,預計此次裁員將波及大約2.2萬名員工。旨在精簡管理,并重
    的頭像 發表于 04-25 17:34 ?620次閱讀

    RAKsmart智能算架構:異構計算+低時延網絡驅動企業AI訓練范式升級

    在AI大模型參數量突破萬億、多模態應用爆發的今天,企業AI訓練正面臨算效率與成本的雙重挑戰。RAKsmart推出的智能算架構,以異構計算資源池化與超低時延網絡為核心,重構AI訓練基礎設施,助力企業
    的頭像 發表于 04-17 09:29 ?763次閱讀

    盟通科技攜手Acontis助力英特爾虛擬化驅動工業負載整合

    近期,盟通科技聯合合作伙伴Acontis與英特爾針對虛擬化驅動工業負載的整合這一課題展開了合作。Acontis經過多年技術積累,推出了成熟、可靠且高效的實時虛擬化擴展方案,對于這些方案,盟通科技擁有
    的頭像 發表于 04-11 10:50 ?946次閱讀
    盟通科技攜手Acontis助力<b class='flag-5'>英特爾</b>虛擬化驅動工業負載<b class='flag-5'>整合</b>

    部署成本顯著降低!英特爾助陣高效AI算一體機方案

    3月27日,英特爾舉辦了名為“‘至’繪未來,銳炫來襲”的創新解決方案研討會,與生態伙伴共同分享最新AI算一體機方案。該方案基于英特爾?至強? W處理器和多個英特爾銳炫?顯卡,可為日益
    的頭像 發表于 03-29 16:29 ?2095次閱讀
    部署成本顯著降低!<b class='flag-5'>英特爾</b>助陣高效AI算<b class='flag-5'>力</b>一體機方案

    英特爾至強6處理器助力數據中心整合升級

    繼去年9月重磅推出英特爾 至強 6900性能核處理器后,英特爾進一步擴充至強6產品家族,于近期發布了包括至強6700性能核處理器及至強6500性能核處理器在內的多款新品,以更豐富的產品組合、卓越性能與出色能效,應對橫跨數據中心、網絡與邊緣的廣泛工作負載需求。
    的頭像 發表于 03-13 17:36 ?1487次閱讀