国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA HPC SDK提高HPC應(yīng)用性能和可移植性

星星科技指導(dǎo)員 ? 來源:Jay Gould ? 作者:Jay Gould ? 2022-04-14 14:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 宣布了即將發(fā)布的 HPCSDK21.11 版本,其中包含新的庫增強功能。該軟件將在未來幾周內(nèi)免費提供。

NVIDIA HPC SDK 是一套用于高性能計算開發(fā)的綜合編譯器和庫。它包括各種各樣的工具,這些工具被證明可以最大限度地提高開發(fā)人員的生產(chǎn)率,以及 HPC 應(yīng)用程序的性能和可移植性。

HPC SDK 及其組件每年都會更新多次,包括新功能、性能提升和其他增強功能。

有什么新鮮事嗎

此 21.11 版本將包括對 HPC ++/ Fortran 編譯器支持和開發(fā)人員環(huán)境的更新,以及新的多節(jié)點 mulit GPU 庫功能。

編譯器、構(gòu)建系統(tǒng)和其他增強功能

NVFORTRAN 編譯器在去年的版本 20.11 中引入,它自動并行化使用 DO 并發(fā)標準語言功能編寫的代碼,如 此文章 中所述。

在 21.11 版中,程序員可以使用 ISO Fortran 標準當前工作草案中描述的 REDUCE 子句來執(zhí)行約簡操作,這是許多科學(xué)算法的要求。

從 21. 11 版本開始, HPC 編譯器現(xiàn)在支持– gcc 工具鏈選項,類似于基于 clang 的編譯器。除了現(xiàn)有的指定非默認 GNU 編譯器集合( GCC )版本的 rc 文件方法之外,還提供了此方法。 HPC 編譯器利用開源 GCC 庫來支持常見的系統(tǒng)操作和 C ++標準庫支持。

有時,開發(fā)人員需要與系統(tǒng)默認版本不同的 GCC 工具鏈版本。現(xiàn)在, 21. 11 既有基于命令行的方式,也有基于文件的方式來制定該規(guī)范。除了– gcc 工具鏈之外, 21.11 HPC 編譯器還添加了幾個與 gcc 兼容的命令行標志,用于指定 x86-64 目標體系結(jié)構(gòu)詳細信息。

21.11 版本現(xiàn)在包括兩個新的 Fortran 模塊,可與 NVIDIA 庫集成, Fortran 應(yīng)用程序可最大限度地利用 NVIDIA 平臺, Fortran 開發(fā)人員可盡可能提高工作效率。用 Fortran 編寫的 HPC 應(yīng)用程序可以直接使用 cufftX —— NVIDIA 提供的高度優(yōu)化的多 GPU FFT 庫。它還可以更方便地使用 NVIDIA Tools Extension Library (NVTX) 進行性能和 Nsight 的評測研究。

版本 21. 11 將與 CsFig 配置文件一起運行,該文件定義了 HPCSDK 的各個組件的 CMAPK 目標。這為應(yīng)用打包程序和開發(fā)人員提供了與 NVIDIA HPC SDK 更無縫的代碼集成。

新的多節(jié)點、多 GPU 數(shù)學(xué)庫

HPC SDK 21.11 版將包括我們即將推出的第一個多節(jié)點、多 GPU 數(shù)學(xué)庫功能,即 cuSOLVERMp 。初始功能將包括 Cholesky 和 LU 分解,有無旋轉(zhuǎn)。未來的版本將包括具有多個 RH 的 LU 。

關(guān)于作者

Jay Gould 是 NVIDIA 的高級產(chǎn)品營銷經(jīng)理,專注于 GPU 加速應(yīng)用程序的 HPC 軟件和平臺。在 NVIDIA 之前,他曾在 Cray 、 Xilinx 和頂級 csp 從事高性能計算工作。杰伊在哈維·穆德學(xué)院獲得學(xué)士學(xué)位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109758
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135479
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    346

    瀏覽量

    24980
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Chiplet,如何助力HPC

    縱橫小芯片架構(gòu)代表了芯片設(shè)計和集成方式的根本性變革。隨著傳統(tǒng)芯片架構(gòu)在功耗、散熱和空間方面逼近物理極限,一種新型架構(gòu)正在興起,有望為高性能計算(HPC)開辟一條新的發(fā)展道路。這種架構(gòu)被稱為小芯片架構(gòu)
    的頭像 發(fā)表于 02-26 15:15 ?706次閱讀
    Chiplet,如何助力<b class='flag-5'>HPC</b>?

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發(fā)表于 02-10 10:31 ?247次閱讀

    愛普科技擴大S-SiCap?技術(shù)應(yīng)用版圖 滿足AI與HPC新需求

    全球客制化存儲芯片解決方案設(shè)計公司愛普科技今日宣布,S-SiCapTM(Stack Silicon Capacitor)產(chǎn)品線持續(xù)深化技術(shù)布局,聚焦AI服務(wù)器與高性能計算(HPC)的整合挑戰(zhàn)
    的頭像 發(fā)表于 12-24 17:53 ?622次閱讀

    NVIDIA 收購開源工作負載管理提供商 SchedMD

    NVIDIA 將持續(xù)提供 SchedMD 的廠商中立的開源 Slurm 軟件,確保其在高性能計算(HPC)和 AI 領(lǐng)域的廣泛可用NVIDIA
    的頭像 發(fā)表于 12-16 18:24 ?1346次閱讀

    Amphenol 400POS 0.635MM PITCH COM - HPC 連接器:高性能嵌入式應(yīng)用新選擇

    Amphenol 400POS 0.635MM PITCH COM - HPC 連接器:高性能嵌入式應(yīng)用新選擇 在嵌入式計算機領(lǐng)域,隨著應(yīng)用對性能和帶寬的要求不斷攀升,高性能計算機模塊
    的頭像 發(fā)表于 12-11 10:30 ?473次閱讀

    ?TE Connectivity HPC 200A連接器技術(shù)解析與應(yīng)用指南

    通過單極200A/1500V大電流連接器,TE Connectivity (TE) 的 HPC 200A連接器提供一種高安全和可靠的電池儲能系統(tǒng) (BESS) 解決方案。TE的HPC
    的頭像 發(fā)表于 11-09 11:44 ?940次閱讀

    TE Connectivity HPC 350A BESS連接器技術(shù)解析與應(yīng)用指南

    TE Connectivity HPC 350A電池儲能系統(tǒng)(BESS) 連接器專注于通過單極350A/1500V大電流連接器提供高安全可靠的解決方案。這些HPC 350A連接器采用一體式成型觸點
    的頭像 發(fā)表于 11-02 17:59 ?1445次閱讀

    RISC-V HPC新標桿Sophon SG2044深度評估:支持RVV v1.0適配GCC 15.2,多核性能潛力巨大!

    在RISC-V架構(gòu)的普及浪潮中,嵌入式領(lǐng)域的成功早已眾人皆知,但高性能計算(HPC)始終是其難以突破的“高地”。算能SOPHONSG2044的出現(xiàn)打破了僵局。國際權(quán)威技術(shù)媒體發(fā)布的深度評測《IsRISC-VreadyforHighPerformanceComputing?
    的頭像 發(fā)表于 10-16 13:23 ?1471次閱讀
    RISC-V <b class='flag-5'>HPC</b>新標桿Sophon SG2044深度評估:支持RVV v1.0適配GCC 15.2,多核<b class='flag-5'>性能</b>潛力巨大!

    新思科技測試IO方案加速HPC和AI芯片量產(chǎn)

    為實現(xiàn)更高性能目標,AI與HPC芯片設(shè)計正加速向芯粒架構(gòu)演進。但是傳統(tǒng)單片機SOC已經(jīng)很難在尺寸上繼續(xù)擴張,異構(gòu)集成已成為推動半導(dǎo)體創(chuàng)新的核心動力。然而,它也增加了芯片設(shè)計的復(fù)雜,需要更先進的測試
    的頭像 發(fā)表于 10-15 11:33 ?757次閱讀
    新思科技測試IO方案加速<b class='flag-5'>HPC</b>和AI芯片量產(chǎn)

    PIC32 WFI32 Curiosity HPC開發(fā)板技術(shù)解析

    Microchip Technology WFI32E02高引腳數(shù) (HPC) Curiosity板 (EV89Y10A) 用于評估和演示具有高達200 MHz CPU時鐘頻率
    的頭像 發(fā)表于 10-09 14:10 ?687次閱讀
    PIC32 WFI32 Curiosity <b class='flag-5'>HPC</b>開發(fā)板技術(shù)解析

    【產(chǎn)品介紹】Altair PBS Professional HPC工作負載管理器和作業(yè)調(diào)度管理系統(tǒng)

    AltairPBSProfessional行業(yè)領(lǐng)先的HPC工作負載管理器和作業(yè)調(diào)度管理系統(tǒng)PBSProfessional是一款快速、強大的工作負載管理器和作業(yè)調(diào)度管理系統(tǒng),旨在提高生產(chǎn)力、優(yōu)化利用率
    的頭像 發(fā)表于 09-19 17:03 ?630次閱讀
    【產(chǎn)品介紹】Altair PBS Professional <b class='flag-5'>HPC</b>工作負載管理器和作業(yè)調(diào)度管理系統(tǒng)

    澎峰科技邀您相約CCF HPC China 2025

    第21屆CCF全國高性能計算學(xué)術(shù)年會(CCF HPC China 2025) 將于 2025年8月13日至16日在承載千年風(fēng)華的歷史名城鄂爾多斯盛大舉辦。
    的頭像 發(fā)表于 08-07 11:33 ?1173次閱讀

    NVIDIA技術(shù)賦能歐洲最快超級計算機JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺的 JUPITER 超級計算機成為歐洲最快超級計算機,其運行 HPC 和 AI 工作負載的速度是第二名的兩倍以上。
    的頭像 發(fā)表于 06-12 15:33 ?1432次閱讀

    解決應(yīng)用性能問題的策略

    性能調(diào)優(yōu)貫穿于鴻蒙應(yīng)用開發(fā)的整個生命周期中,開發(fā)前有性能最佳指南等賦能套件讓你快速上手學(xué)習(xí),開發(fā)過程中有性能工具開發(fā)套件覆蓋應(yīng)用開發(fā)各階段,應(yīng)用開發(fā)完成上架后有專業(yè)的性能測試工具檢查測
    的頭像 發(fā)表于 04-24 11:42 ?828次閱讀
    解決<b class='flag-5'>應(yīng)用性能</b>問題的策略

    超級計算與 HPC 之間的界限日趨模糊

    難以區(qū)分,這推動了商業(yè)和科學(xué)應(yīng)用性能的巨大提升,也給兩者帶來了類似的挑戰(zhàn)。雖然超級計算和高性能計算(HPC)的目標一直很相似(超快處理速度),但它們所服務(wù)的市場卻截
    的頭像 發(fā)表于 03-17 10:33 ?1030次閱讀
    超級計算與 <b class='flag-5'>HPC</b> 之間的界限日趨模糊