国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

近600個應用程序通過NVIDIA GPU實現了提速

NVIDIA英偉達企業解決方案 ? 來源:cc ? 2019-02-14 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

十幾年前,還不曾有加速應用程序。而如今已有近600個應用程序通過NVIDIA GPU實現了提速。

這些應用程序涵蓋了物理、生物科學、分子動力學、化學和天氣預報等各個領域。其中包括全球最熱門的15個高性能計算應用程序,也都是通過GPU實現加速的。去年,NVIDIA GPU應用程序目錄收錄了100多個應用程序,接下來還會有更多的程序將被陸續添加到目錄中。

Intersect 360研究所的一份報告中收錄了數據中心運行的各個關鍵應用程序。其中,排名前15的應用程序均由GPU加速,這些都是一系列殺手級的核心科學應用程序。其中包括:

GROMACS(化學)– 分子動力學應用程序,旨在模擬包含了數百到數百萬個粒子的系統的牛頓運動方程。

ANSYS(流體動力學分析)– 模擬液體和氣體與表面的相互作用。

Gaussian(化學)– 預測分子系統的能量、分子結構和振動頻率。

VASP(化學)– 用于從頭計算法量子力學分子動力學模擬。

NAMD(化學)– 大型生物分子系統的高性能模擬。

Simulia Abaqus(結構分析)– 用于結構力學的模擬和分析。

WRF(天氣/環境建模)– 數值天氣預報系統,專為大氣研究和操作預測應用程序而設計。

OpenFOAM(流體動力學分析)– 通用型 CFD 軟件的求解器庫。

ANSYS(結構分析)– 對高頻和高速電子元件中的 3D 全波電磁場進行建模。

LS-DYNA(結構分析)– 結構力學的模擬和分析工具。

BLAST(生物科學)– 應用最為廣泛的生物信息學工具之一。

LAMMPS(化學)– 經典分子動力學程序包。

Amber(化學)– 專門針對生物分子系統模擬而開發的分子動力學應用程序。

Quantum Espresso(化學)– 一套集成的計算機代碼,用于電子結構計算和納米級材料建模。

GAMESS(化學)– 用于模擬原子和分子電子結構的計算化學套件。

這些工具本身無法實現性能的遞增性提升。但通過采用NVIDIA GPU的服務器,其性能通常可提高10 倍或更多。并且,GPU加速可以改善數據中心的經濟效益。

預測天氣

天氣預報是一項遠比其看起來更加困難的工作。天氣預報是高性能計算領域的一個重要分支。準確可靠的天氣預報不僅可以拯救生命,還有助于航空、能源和公用事業、保險、零售和其他行業做出經濟決策。

天氣預報需要大量的計算資源,包括幾何尺度(尤其是全球天氣預報),和大量描述大氣狀態的變量。

但是,受限于可用的計算量和應用程序的性能,當前的天氣預報模型僅限于低分辨率的模擬,例如12公里的分辨率。

這些模型忽略了一些重要的細節,例如云層的影響(云層可以反射太陽輻射,在天氣模式中扮演著重要的角色)。采用1公里云分辨率可以改善預測效果,但這需要 應用程序的性能提升1700倍。

GPU加速可以彌補此差距,提高天氣預報的準確性。

加速空氣動力學模擬

使用NASA的FUN3D代碼模擬SLS Block 1B助推器分離流場。該圖片由Jamie Meeroff,Henry Lee,NASA/Ames提供。

火箭能夠以超高的速度飛行,然而利用大規模空氣動力學模擬,我們可以對其進行改進,讓火箭可以飛得更快、更高效。

NASA蘭利研究中心開發的FUN3D計算流體動力學軟件,可用于模擬各種空氣動力學應用程序中的流體流動。該應用程序在NASA Pleiades超級計算機上消耗的周期比其他任何應用程序都要多。借助于GPU加速,采用了6個NVIDIA V100 Tensor Core GPU的服務器能夠以高出雙插槽CPU服務器30倍的性能運行這些模擬。

總結:GPU具備非常好的性能,從而高效地計算規模更大、更復雜的模擬。NASA已經證明,在Summit超級計算機上,僅需運行1000臺GPU服務器就可以完成100多萬個CPU核心的工作。而且,其能源成本遠低于CPU。

性能持續提升

我們在各個加速計算領域都擁有深厚的儲備。結合由100多萬名開發人員組成的生態系統,我們將共同形成一個不斷改進的平臺。該平臺可以在相同的 GPU加速服務器上提供更高的應用程序性能。

例如,在包含 11 個高性能計算應用程序的組合中,對于采用4個NVIDIA Tesla P100 GPU的服務器,其當前的運行速度比兩年前提高了2倍。如果同時改進軟件堆棧和GPU架構,您可以獲得更大的性能提升。

現在,通過單一平臺,您可以加速各種高性能計算領域的應用程序:科學計算、工業模擬、深度學習機器學習

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109722
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135433

原文標題:GPU已加速的近600個高性能計算應用程序都有哪些?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發表于 02-10 10:31 ?240次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產品,其各項核心指標均針對 GPU 加速工作流的高性能
    的頭像 發表于 01-06 09:51 ?2258次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    Generation 的全面超越。那么,這款劃時代的專業 GPU 在真實應用場景中的表現究竟如何?今天,我們將通過深度實測,為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產品的性能躍遷。
    的頭像 發表于 12-29 15:30 ?1333次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能測試

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增基于 Tile 的GPU 編程模式。它是自 CUDA 發明以來 GPU 編程最核心的更新之一。借助 GP
    的頭像 發表于 12-13 10:12 ?1191次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡化<b class='flag-5'>GPU</b>編程

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應用正在使用 AI 加速,而無論工作站的大小或形態如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發表于 11-28 09:39 ?6293次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA Isaac Lab多GPU多節點訓練指南

    NVIDIA Isaac Lab 是一適用于機器人學習的開源統一框架,基于 NVIDIA Isaac Sim 開發,其模塊化高保真仿真適用于各種訓練環境,可提供各種物理 AI 功能和由 GP
    的頭像 發表于 09-23 17:15 ?2406次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節點訓練指南

    學生適合使用的SOLIDWORKS 云應用程序

    隨著科技的不斷發展,計算機輔助設計(CAD)技術已經成為現代工程教育的重要組成部分。SOLIDWORKS作為一款CAD軟件,其教育版云應用程序為學生提供強大而靈活的設計平臺。本文將探討
    的頭像 發表于 09-15 10:39 ?775次閱讀
    學生適合使用的SOLIDWORKS 云<b class='flag-5'>應用程序</b>

    DeepSeek R1 MTP在TensorRT-LLM中的實現與優化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創下了 DeepSeek-R1 推理性能的世界紀錄,Multi-Token Prediction (MTP) 實現
    的頭像 發表于 08-30 15:47 ?4447次閱讀
    DeepSeek R1 MTP在TensorRT-LLM中的<b class='flag-5'>實現</b>與優化

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構 GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產品 NVIDIA RTX 450
    的頭像 發表于 08-28 11:02 ?3984次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴展新產品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發表于 08-18 11:50 ?1410次閱讀

    NVIDIA Blackwell GPU優化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀錄:在 G
    的頭像 發表于 07-02 19:31 ?3292次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    兩種結構: ①GPU-GPU ②CPU-GPU 這是書中介紹的一包括完全
    發表于 06-18 19:31

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術可在虛擬桌面基礎設施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬化環境中的 AI 驅動工作負載提供動力,提高了
    的頭像 發表于 04-07 11:28 ?1430次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發

    NVIDIA GTC 推出新一代專業級 GPU 和 AI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的 NVIDIA
    的頭像 發表于 03-28 09:59 ?1302次閱讀

    可以手動構建imx-gpu-viv嗎?

    所需的庫版本。但是當我嘗試運行應用程序時,它導致分段錯誤。 有沒有辦法在 Debian 10 中自己構建 imx-gpu 庫,這樣它們就不需要 glibc 2.28 版本? 如
    發表于 03-28 06:35