国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息AS13000G7存儲創造MLPerf佳績,揭秘三大秘密武器!

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2024-11-01 14:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

北京2024年11月1日/美通社/ -- 如果說2023年是全球認識生成式AI(GenAI)的開始,那么2024年則是全球各大組織/企業真正探索人工智能商業價值的一年。

隨著越來越多用戶開始采用生成式AI等人工智能技術,存儲等數據基礎設施也面臨著嚴峻考驗,用戶意識到存儲需要滿足人工智能數據訓練與推理對于性能、延時、容量、擴展性等各種嚴苛需求。

近日,在最新發布的MLPerf AI存儲基準評測中,浪潮信息分布式存儲平臺AS13000G7通過一系列創新技術,顯著提升數據處理效率,勇奪8項測試中5項性能最佳成績,實現集群帶寬360GB/s、單節點帶寬達120GB/s,在滿足AI場景下的高性能存儲需求方面展現出卓越能力,為大規模數據處理和AI應用提供堅實基礎。

不僅是"容器",還是"加速器"

在傳統觀念里,存儲等數據基礎設施就像一個存儲數據的"容器";進入到AI時代,在各種AI應用場景中,存儲則搖身一變,成為推動AI應用和推動AI產業化的"加速器"。

以此次MLPerf測試為例,通過運行一個分布式AI訓練測試程序,模擬GPU計算過程,要求在GPU利用率高達90%或70%的條件下,以存儲帶寬和支持的模擬 GPU (模擬加速器)數量為關鍵性能指標,來評估AI訓練場景下存儲的性能表現,從而驗證存儲對GPU算力的加速能力。

如果把計算節點比作"數據工廠",存儲介質則相當于數據倉庫。提升存儲性能,意味著用戶能夠在同一時間內通過"存儲高速"在"數據工廠"和"數據倉庫"之間更高效地存取"數據物料"。

例如,人工智能的大模型訓練數據加載、PB級檢查點斷點續訓(其中,檢查點相關開銷平均可占訓練總時間的12%,甚至高達43%)和高并發推理問答等場景下,存儲系統的性能直接關乎整個訓練與推理過程中GPU的有效利用率。尤其是在萬卡集群規模下,相當于規模龐大"數據工廠","生產機器"GPU一旦開動,如果沒有及時輸送"數據物料",約等于讓GPU閑置。有數據顯示,存儲系統1小時的開銷,在千卡集群中就意味著將浪費1000卡時,造成計算資源的損失和業務成本劇增。

wKgZomckdjCASb7YAABTSM2KaMs663.jpg


那么,要實現"數據物料"的快速高效運輸,可以從存儲哪些方向入手?

其一,減少中轉站--數控分離。通過軟件層面的創新,將控制面(數據工廠)和數據面(介質倉庫)分離,減少數據中轉,縮短傳輸路徑,提升存儲單節點及集群的整體性能。

其二,增加車道數--硬件升級。硬件層面采用新一代的高性能硬件,通過DDR5和PCIe5.0等,升級存儲帶寬,增加傳輸通道數量,提升存儲性能的上限。

其三,物料就近存儲--軟硬協同。在軟硬協同層面,基于數控分離架構,自主控制數據頁緩存(儲備倉)分配策略,靈活調度內核數據移動,數據就近獲取,從而實現快速I/O。

接下來,我們將一一介紹這三大性能提升手段背后的實現原理及其主要價值。

軟件優化

數控分離,降低80%節點間數據轉發量

在傳統分布式文件系統中,數據和元數據高度耦合,導致數據讀寫信息的分發、傳輸和元數據處理都需要經過主存儲節點。在AI應用場景下,隨著客戶端數量激增和帶寬需求擴大,CPU、內存、硬盤和網絡I/O的處理能力面臨嚴峻考驗。盡管數控一體的分布式文件系統在穩定性方面表現優異,但在面對AI訓練等大I/O、高帶寬需求時,其性能瓶頸逐漸顯現。數據需通過主節點在集群內部進行轉發,這不僅占用了大量的CPU、內存、帶寬和網絡資源,還導致了數據傳輸的延遲。

為解決該問題,業界曾嘗試通過RDMA技術來提升存儲帶寬。RDMA允許外部設備繞過CPU和操作系統直接訪問內存,從而降低了數據傳輸延遲并減輕了CPU負載,進而提升了網絡通信效率。然而,這種方式并未從根本上解決數據中轉帶來的延遲問題。

wKgaomckdjGAWWXYAABnsUzgCy4181.jpg


基于此背景,浪潮信息創新自研分布式軟件棧,采用全新數控分離架構,將文件系統的數據面和控制面完全解耦。控制面主要負責管理數據的屬性信息,如位置、大小等,通過優化邏輯控制和數據管理算法來提高存儲系統的訪問效率和數據一致性。而數據面則直接負責數據的讀寫操作,消除中間環節的數據處理延遲,從而縮短"數據物料"的存取時間。

wKgZomckdjGAIrqDAAA26YFm7tA342.jpg


這種數控分離的方式顯著減少數據流在節點間的轉發次數,降低80%的東西向(節點間)數據轉發量,充分發揮硬盤帶寬,特別是全閃存儲性能。以浪潮信息分布式存儲平臺AS13000G7為例,在相同配置下,相比于單一TCP和單一RDMA方案,數控分離架構能夠帶來60%讀帶寬提升和110%寫帶寬提升。

硬件升級

拓寬傳輸通路,實現存儲性能翻倍

在AI應用場景下,"數據物料"的快速運輸依賴于高效的"存儲高速"通道。隨著CPU、內存、硬盤等硬件技術的不斷創新,升級"存儲高速"通道的硬件成為提升存儲性能的重要途徑。

浪潮信息分布式存儲平臺AS13000G7采用業界最新高端處理器芯片,如Intel第五代至強可拓展處理器,單顆最大支持60核,支持Intel 最新2.0版本睿頻加速技術、超線程技術以及高級矢量拓展指令集512(AVX-512)。同時,支持DDR5內存,如三星、海力士的32G、64G高性能、大容量內存,單根內存在1DPC1情況下,可以支持5600MHz頻率,相比與DDR4的3200MHz的內存,性能提升75%。

基于最新處理器的硬件平臺,AS13000G7已經支持PCIe5.0標準,并在此基礎上支持NVDIA最新的CX7系列400G IB卡及浪潮信息自研PCIe5.0 NVMe。相較于上一代AS13000G6的PCIe4.0的I/O帶寬,實現帶寬提升100%。

在設計上,G7一代硬件平臺將硬件模塊化設計理念最大化,將處理器的I/O全部扇出,采用線纜、轉接卡等標準設計,實現配置的靈活性。最大可支持4張PCIe5.0 X16的FHHL卡,所有后端的SSD設備均通過直連實現,取消了AS13000G6 的PCIe Switch設計,從而消除了數據鏈路上的瓶頸點。前端IO的性能及后端IO的理論性能均提升了4倍。

wKgaomckdjGAJSDYAAA_NZOgvwM003.jpg


為測試性能表現,浪潮信息將兩種軟件棧分別部署在兩代硬件上并進行讀寫測試。結果顯示,與上一代硬件平臺相比,在不同軟件棧上AS13000G7的性能可提升170%-220%,有效保障了AI應用場景下的存儲性能。

軟硬協同

內核親和力調度,內存訪問效率提升4倍

在當前的AI基礎設施平臺中,計算服務器配置非常高,更高性能的CPU和更多的插槽數帶來了NUMA(Non-Uniform Memory Access)節點數據的增加。在NUMA架構中,系統內存被劃分為多個區域,每個區域屬于一塊特定的NUMA節點,每個節點都有自己的本地內存。因此,每個處理器訪問本地內存的速度遠快于訪問其他節點內存的速度。

然而,在多核處理器環境下,會產生大量的跨NUMA遠端訪問。在分布式存儲系統中,由于IO請求會經過用戶態、內核態和遠端存儲集群,中間頻繁的上下文切換會帶來內存訪問延遲。如下圖,在未經過NUMA均衡的存儲系統中,存儲的緩存空間集中在單個NUMA節點內存內。當IO請求量增大時,所有其他NUMA節點的CPU核的數據訪問均集中在單個Socket內,造成了大量跨Socket 、跨NUMA訪問。這不僅導致了CPU核的超負荷運載和大量閑置,還使得不同Socket上的內存帶寬嚴重不均衡,單次遠端NUMA節點訪問造成的微小時延累積將進一步增大整體時延,導致存儲系統聚合帶寬嚴重下降。

wKgZomckdjOAfYUTAACcKPv1hto928.jpg


為了降低跨NUMA訪問帶來的時延,浪潮信息通過內核親和力調度技術,在全新數控分離架構下,使內核客戶端可自主控制數據頁緩存分配策略并主動接管用戶下發的IO任務。這種方式能夠更加靈活地實現各類客戶端內核態到遠端存儲池的數據移動策略。其中,針對不同的IO線程進行NUMA感知優化,將業務讀線程與數據自動分配到相同的NUMA節點上,這樣,所有數據均在本地NUMA內存命中,有效減少了高并發下NUMA節點間數據傳輸,降低了IO鏈路時延,4倍提升內存訪問效率,保證負載均衡。

總體而言,進入到AI時代,存儲性能關系到整個人工智能訓練、推理和應用的效率。浪潮信息分布式存儲平臺AS13000G7軟件優化、硬件升級和軟硬協同三個優勢,具備極致性能,成為AI時代各大用戶的存儲理想之選。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據傳輸
    +關注

    關注

    9

    文章

    2201

    瀏覽量

    67586
  • 存儲
    +關注

    關注

    13

    文章

    4791

    瀏覽量

    90065
  • 浪潮
    +關注

    關注

    1

    文章

    476

    瀏覽量

    25421
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301429
  • MLPerf
    +關注

    關注

    0

    文章

    37

    瀏覽量

    970
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    探索ADuM4224:高性能隔離半橋驅動器的秘密武器

    探索ADuM3224/ADuM4224:高性能隔離半橋驅動器的秘密武器 在電子工程師的日常設計工作中,選擇合適的隔離半橋驅動器至關重要,它能直接影響電路的性能、安全性和穩定性。在眾多產品中,ADI
    的頭像 發表于 02-04 08:55 ?415次閱讀

    安達發|增效50%?揭秘糧食大廠的秘密武器:APS生產排產軟件

    民以食為天”,糧食加工行業作為國計民生的支柱,正面臨著前所未有的機遇與挑戰。市場需求的個性化、原料價格的波動、嚴格的保質期管理與激烈的成本競爭,都在考驗著企業的精細化管理能力。傳統的、依賴“老師傅”經驗的計劃模式,如同“盲人摸象”,已難以適應現代糧食加工的高效、低耗要求。在此背景下, APS生產排產軟件 應運而生,正以其科學的決策能力,成為驅動糧食加工企業提質、降本、增效的“智慧引擎”。 一、 糧食加工的生產
    的頭像 發表于 11-27 14:56 ?260次閱讀
    安達發|增效50%?<b class='flag-5'>揭秘</b>糧食大廠的<b class='flag-5'>秘密武器</b>:APS生產排產軟件

    淘寶京東拼多多API:電商營銷的秘密武器

    ? 在當今競爭激烈的電商環境中,精準營銷和高效運營是商家制勝的關鍵。而淘寶、京東、拼多多等頭部電商平臺提供的開放接口(API),正逐漸成為商家們不可或缺的“秘密武器”。這些API為開發者提供了強大
    的頭像 發表于 11-27 14:17 ?421次閱讀
    淘寶京東拼多多API:電商營銷的<b class='flag-5'>秘密武器</b>

    “光伏+儲能家庭的秘密武器:安科瑞 ADL-W 智能電表揭秘

    安科瑞劉鴻鵬172一6972一5322 如今,家庭儲能系統已經從“未來科技”變成現實場景——光伏發電、儲能電池、智能管理者協同,為每個家庭創造綠色、安全、高效的能源系統。然而,沒有一款專業且智能
    的頭像 發表于 09-01 14:19 ?1085次閱讀

    浪潮信息發布&quot;元腦SD200&quot;超節點,面向萬億參數大模型創新設計

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發布面向萬億參數大模型的超節點AI服務器"元腦SD200"。該產品基于浪潮信息創新研發的多主機低延遲內存語義通信架構,以開放系統設計向上
    的頭像 發表于 08-08 22:17 ?677次閱讀
    <b class='flag-5'>浪潮信息</b>發布&quot;元腦SD200&quot;超節點,面向萬億參數大模型創新設計

    登頂!華為OceanStor A系列存儲再登MLPerf全球性能之巔

    2025年8月5日,全球權威AI性能評測組織公布最新MLPerf? Storage v2.0基準測試結果,華為OceanStor A系列存儲聯合濟南超級計算技術研究院(簡稱“JNIST”)斬獲佳績
    的頭像 發表于 08-07 14:02 ?829次閱讀

    耐達訊RS232轉Ethercat網關:建筑驅動連接的“秘密武器

    在建筑行業中,工程師們常常會面臨各種設備連接的挑戰。特別是驅動器的連接,其穩定性和高效性直接影響著建筑設備的運行。而耐達訊通信技術Rs232轉Ethercat網關,就是解決這些問題的“秘密武器
    發表于 07-21 15:29

    飛利信與浪潮信息達成戰略合作

    近日,2025年浪潮信息北京ISP戰略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術有限公司等22家戰略合作伙伴達成簽約,其中將面向北京人工智能應用大市場,在產品技術共創、行業場景深化及區域
    的頭像 發表于 06-24 17:37 ?1107次閱讀

    圖書館WiFi總掉線?我的秘密武器居然是它.

    裝著蜂鳥IP客戶端,堪稱當代大學生的“數字生存工具包”~ ??PS:?? 本文純屬個人體驗,圖書館WiFi和蜂鳥IP都沒給我廣告費(如果有,請給我打錢)。如果你也在圖書館被網絡折磨過,不妨試試這個“秘密武器”?
    發表于 06-10 18:05

    筑基&quot;AI+人才&quot;培養,浪潮信息攜手元腦伙伴拓爾思推出智慧教育新平臺

    北京2025年3月22日?/美通社/ -- 近期,元腦生態伙伴拓爾思信息技術股份有限公司(以下簡稱:拓爾思)攜手浪潮信息,聯合為高校AI人才培養推出"AI創新培養綜合服務平臺",基于該平臺實現實訓
    的頭像 發表于 03-27 16:56 ?825次閱讀
    筑基&quot;AI+人才&quot;培養,<b class='flag-5'>浪潮信息</b>攜手元腦伙伴拓爾思推出智慧教育新平臺

    天瞳威視與浪潮信息達成戰略合作,推進高階智駕車載計算系統創新

    北京2025年3月22日?/美通社/ -- 近日,蘇州天瞳威視電子科技有限公司與浪潮信息旗下蘇州元腦智能科技有限公司達成戰略合作協議。此次合作依托浪潮信息提供的車載算力平臺硬件系統、底層軟件環境
    的頭像 發表于 03-27 16:55 ?639次閱讀
    天瞳威視與<b class='flag-5'>浪潮信息</b>達成戰略合作,推進高階智駕車載計算系統創新

    樹莓派生產力革命!Snap版PyCharm一鍵安裝,告別安裝過程中的依賴麻煩

    導語“上期揭秘的Snap跨平臺‘秘密武器’,這次要讓樹莓派變身開發主力機!”當樹莓派遇上UbuntuSnap,我們曾解鎖了“一次打包,處處運行”的跨設備魔法。但你可能不知道——Snap的容器化技術
    的頭像 發表于 03-25 09:22 ?805次閱讀
    樹莓派生產力革命!Snap版PyCharm一鍵安裝,告別安裝過程中的依賴麻煩

    FreeRTOS進階使用之流緩沖區:高效處理字節流的秘密武器

    開銷 基于連續內存存儲,相比隊列(每個數據項獨立存儲)更節省RAM。 觸發通知機制 當緩沖區數據量達到預設的觸發閾值**時,自動喚醒等待的任務,避免輪詢開銷。 阻塞與非阻塞模式 阻塞模式:任務在緩沖區滿
    發表于 03-24 11:37

    浪潮信息:元腦企智DeepSeek一體機將舉辦生態伙伴推介體驗會

    ?3月11日,浪潮信息將面向全國元腦生態伙伴舉辦"元腦企智DeepSeek一體機生態伙伴推介體驗會"。活動現場,伙伴可深入了解元腦企智DeepSeek一體機的最新功能亮點,上手實操體驗深度優化的元腦
    的頭像 發表于 03-09 14:20 ?597次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智DeepSeek一體機將舉辦生態伙伴推介體驗會