案例簡介
? 江西師范大學數字產業學院,利用搭載了NVIDIA V100和 T4 Tensor Core GPU的聯想ThinkSystem SR650和SR670服務器高性能計算集群,幫助學生和教師開展深度學習突破性研究。
? 本案例主要應用到NVIDIA Tesla V100 , NVIDIA T4 Tensor Core GPU ,NVIDIA RIVA平臺、NVIDIA NEMO模型訓練平臺。
客戶簡介及應用背景
江西師范大學數字產業學院是江西省的第一所數字產業學院,學院于2021年成立,專注于計算機科學與技術、人工智能、大數據、物聯網及動畫等領域的教學和研究。
作為新成立的機構,江西師范大學數字產業學院計劃從零開始構建一套行業頂尖的數字化基礎架構,而這需要從設計并建立全新的數據中心開始。
客戶挑戰
“聯想和NVIDIA在人工智能和傳統高性能計算領域實力雄厚,在我們的評估中獲得了最高的技術評分。”
——江西師范大學數字產業學院副院長
在為新的數據中心選擇服務器和存儲基礎架構時,江西師范大學數字產業學院主要考慮兩大需求。
首先,它需要一個強大的平臺支持日常運營。該平臺將運行學院的學生信息、圖書館、教室和校園系統,而且需要足夠的靈活性和可擴展性,在學院不斷發展壯大、招生人數增多的情況下實現快速擴展。
其次,它還需要一套強大的高性能計算基礎架構,幫助教師和學生開展突破性科研工作。江西師范大學數字產業學院設立了多個和人工智能、深度學習相關的優勢學科和科研項目。因此,找到一種不僅能夠支持CPU密集型工作負載,同時還能支持GPU密集型工作負載的通用架構為教學和科研的必要的實驗環境尤為重要。
由于學院可用于IT管理的資源非常有限,這兩個平臺都應當非常可靠且易于管理。此外,考慮到隨著科研工作的逐步深入,數據量預計將迅速增加,強大的數據存儲和數據保護功能必不可少。
應用方案
聯想幫助江西師范大學數字產業學院設計并部署了一套基于兩大主要解決方案的基礎架構,這兩套方案協同運行,能夠對學院的運營系統和科研項目進行全面管理。“
首先,學院采用聯想ThinkAgile AH超融合解決方案作為統一平臺,支持日常行政管理、教學和科研管理等企業級應用。超融合的部署意味著學院可以根據需要隨時添加計算和存儲資源來支持業務增長。聯想ThinkAgile AH還是為數不多能夠支持異構設備擴容的超融合解決方案,以最大化的資源利用和靈活性充分保護學院的投資。
其次,利用聯想ThinkSystem SR650和SR670服務器組成的高性能計算集群,學院搭建了一個可供各學科完成教學和科研工作的IT環境。這些服務器搭載了CPU和NVIDIA V100及T4 Tensor Core GPU。NVIDIA V100 GPU專門設計用于加速人工智能和高性能計算工作負載,可提供比傳統CPU高32倍的訓練吞吐量。
憑借4顆NVIDIA V100 GPU和18顆NVIDIA T4 Tensor Core GPU,聯想高性能計算集群可交付出色的性能,滿足深度學習和計算機視覺工作負載的苛刻要求。該系統可支持多種常見的深度學習框架(如Caffe和TensorFlow)以及容器技術。
與此同時,聯想的LiCO 平臺(Lenovo Intelligent Computing Orchestration)作為集群管理器,提供了一個簡單且直觀的操作界面,使集群資源對研究人員垂手可得,并幫助非技術用戶消除復雜性。同時,聯想LiCO平臺能夠實現細粒度資源監控,和CPU、GPU資源的靈活分配。
最后,學院通過聯想ThinkSystem DM3000H和DE6000H存儲系統以及DPA24000備份一體機,實現對核心數據的歸檔、備份和保護。這種并行文件系統還可幫助包括科研人員在內的所有用戶進行統一的數據訪問。
使用效果及影響
“我們的學生和導師非常期待使用聯想和NVIDIA的高性能計算平臺開展突破性科學研究。這將有助于我們推動城市的數字產業的發展,實現教育鏈、創新鏈、產業鏈的深度融合。”
——江西師范大學數字產業學院副院長
新平臺就緒后,江西師范大學數字產業學院具備了所需的工具幫助教師和學生開展一流的科研工作。
通過輕松訪問高性能計算工作負載所需的CPU和GPU資源,學院的學生和科研人員將能夠有效地規劃、實施和管理項目而不需要額外的技術幫助,進而減輕IT技術人員的負擔。利用聯想LiCO平臺,只需簡單點擊鼠標就可以分配資源,部署深度學習應用和訓練模型。技術和研究人員的時間和精力能夠釋放出來,幫助學院集中精力于學術工作,而不必被淹沒在繁瑣的部署、運營或系統維護任務中。
基于NVIDIA GPU的強大處理能力,可以很好的支持人工智能和深度學習研究項目。 用戶友好的高性能計算集群管理,使學生和科研人員如虎添翼 。小維護工作量的基礎架構,提供自動備份,可輕松擴展。
-
聯想
+關注
關注
3文章
2746瀏覽量
64653 -
NVIDIA
+關注
關注
14文章
5594瀏覽量
109738 -
gpu
+關注
關注
28文章
5194瀏覽量
135453
發布評論請先 登錄
NVIDIA DRIVE AV軟件平臺與Halos架構助力梅賽德斯奔馳CLA車型獲得最高安全評分
NVIDIA RTX PRO 5000 72GB Blackwell GPU現已全面上市
NVIDIA Omniverse基于Container的部署推流方案
在Python中借助NVIDIA CUDA Tile簡化GPU編程
NVIDIA RTX PRO 2000 Blackwell GPU性能測試
NVIDIA推出NVQLink高速互連架構
OpenAI和NVIDIA宣布達成合作,部署10吉瓦NVIDIA系統
NVIDIA RTX PRO 4500 Blackwell GPU測試分析
NVIDIA桌面GPU系列擴展新產品
Arm方案 基于Arm架構的邊緣側設備(樹莓派或 NVIDIA Jetson Nano)上部署PyTorch模型
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理
GPU架構深度解析
NVIDIA GPU和聯想助力學校部署應用基礎架構
評論