国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

應用NVIDIA Spectrum-X網絡構建新型主權AI云

NVIDIA英偉達 ? 來源: NVIDIA英偉達 ? 2024-07-26 18:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

法國云服務提供商 Scaleway 正在基于 NVIDIA 的 Hopper GPUSpectrum-X 以太網網絡平臺構建區域性 GPU 集群,為用戶提供 AI 按需服務業務。

Scaleway 是法國的一家擁有高性能基礎設施的云服務提供商,創立于 1999 年,擁有 80+ 云產品及服務,為全球 25,000+ 客戶提供云服務,客戶包括 Mistral AI、Aternos、Hugging Face、Golem.ai 等。Scaleway 提供一站式的云服務,以開發創新解決方案并幫助用戶從零開始構建和擴展 AI 項目,目前 Scaleway 正在構建區域 AI 云,提供 GPU 基礎設施,用于大規模的 AI 模型訓練、推理及部署。

客戶挑戰

云 AI 工作負載需求正以前所未有的速度增長,同時生成式 AI 應用也在激增。為滿足客戶部署生成式 AI 應用程序、訓練基礎 AI 大模型的需求,云服務提供商面臨巨大挑戰,需要構建 AI 云,使用加速計算技術和高性能網絡來支持 AI 業務。

Scaleway 的核心需求包括:

對于分布式 AI 訓練任務,單個任務的訓練時間由最慢的計算節點的運行時間決定,這使得尾部延遲至關重要。AI 云需要一個高吞吐、低延遲、低抖動、易擴展的高性能網絡,來確保 GPU 間快速、高效的通信,尤其是在大規模部署的場景下。

在多個 AI 任務同時運行的多租戶環境中,性能隔離對于保護一個租戶的 AI 任務免受其他租戶業務的影響是必不可少的。由此提出了對多租戶多任務場景下性能隔離的需求。

對于復雜的 AI 云環境,需要專門適用于 AI 網絡的監控管理工具,提供細粒度的網絡可視化功能、同時具備網絡監控和故障定位能力。

為實現 AI 云數據中心的高效、快速部署,需要強大的網絡仿真及自動化平臺。

隨著云上用戶、數據、應用的快速增長,網絡安全威脅不容忽視,需要提供私有的、安全的零信任基礎設施,保障用戶的業務安全。

解決方案

Scaleway 采用了 NVIDIA 的 Hopper GPU 和 Spectrum-X 網絡平臺應對以上挑戰。

Scaleway 將 HGX Hopper GPU 服務器加入其 GPU 集群陣容中,以覆蓋廣泛的計算需求,利用 GPU 的速度和效率加速 AI 分布式工作負載。

對于 Scale-Out AI 網絡,Scaleway 采用了基于 BlueField-3 SuperNICSpectrum SN5600 交換機構建的 Spectrum-X 網絡平臺。NVIDIA 的 Spectrum-X 網絡平臺是全球首個專為 AI 構建的以太網端到端解決方案,與傳統以太網相比,其生成式 AI 訓練的網絡通信效率提高了 1.6 倍。

同時 Spectrum-X 部署將利用以下網絡軟件堆棧:

NVIDIA Air 用于 AI 網絡仿真,NVIDIA Air 是一個云托管的數據中心網絡仿真平臺,其行為類似于真實世界的生產環境。使用 NVIDIA Air 創建數據中心的數字孿生,可以驗證網絡配置、網絡功能以及自動化部署代碼,提升數據中心的部署效率。

NetQ 用于 AI 網絡監控,通過高頻遙測技術監控 AI 工作負載,NetQ 提供有關數據中心運行狀況的數據和統計信息,關聯配置和運行狀態,并跟蹤狀態變化?;谶b測信息,NetQ 提供動態路由監控,RoCE 流量計數器,交換機隊列直方圖等功能,以識別和應對網絡微突發、擁塞場景,方便網絡故障定位。

Cumulus Linux 用于軟件驅動的數據中心網絡自動化,Cumulus Linux 是創新的開放網絡操作系統,支持 BGP/OSPF 路由協議,以太網虛擬專用網絡 EVPN,虛擬路由和轉發。

DOCA SDK 和庫用于增強 BlueField-3 SuperNIC 性能,DOCA SDK 提供行業標準的開放 API 和軟件框架,包括針對 RDMA、網絡、安全、存儲、數據路徑加速的 SDK,幫助開發者快速創建軟件定義、SuperNIC 加速的服務。

使用的 NVIDIA 產品

硬件:

NVIDIA HGX Hopper 服務器

NVIDIA Spectrum-4 SN5600 以太網交換機

NVIDIA BlueField-3 B3140H SuperNICs

軟件:

Cumulus Linux 網絡操作系統

NetQ 監控管理平臺

NVIDIA Air 仿真平臺

DOCA SDK

實際效果

采用 NVIDIA 的整體解決方案后,極大地提升了 AI 計算能力,縮短了 AI 訓練時間,同時加速了 AI 解決方案的開發、部署和上市時間,有效提高了投資回報率。

Scaleway 客戶可以從幾個 GPU 擴展到幾千個 GPU,以適應任何 AI 用例

Spectrum-X 提供多租戶、多任務的 AI 環境所需的高性能和安全性, 借助動態路由、擁塞控制、全局共享緩沖區等多種機制,實現了多任務的性能隔離。

NetQ 提供對 AI 網絡健康狀況的深度可視性,具有 RoCE 流量計數器、事件和 WJH(What Just Happened)警報等豐富的儀表板,實現 AI 網絡可視化、故障排除和驗證功能。

NVIDIA Air 和 Cumulus Linux 支持 API 原生網絡環境,該環境可集成到 DevOps 工具鏈中,實現了第 0 天、第 1 天 和第 2 天操作的無縫銜接。

NVIDIA 網絡高級副總裁 Gilad Shainer 表示:

“生成式 AI 等開創性技術的飛速發展,使每家企業都必須把網絡創新放在第一位,從而獲得競爭優勢。NVIDIA Spectrum-X 是對以太網絡的一次革命,讓企業能夠充分利用其 AI 基礎設施的強大力量來改變其運營方式,甚至顛覆他們的行業?!?/p>

Scaleway 首席執行官 Damien Lucas 表示:

“NVIDIA Spectrum-X 網絡技術為我們的‘GPU 集群按需服務’提供了更快的網絡連接和更高效的 GPU 通信,使我們的客戶能夠加速開發和部署他們的 AI 解決方案?!?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109738
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301407
  • 英偉達
    +關注

    關注

    23

    文章

    4087

    瀏覽量

    99187

原文標題:應用 NVIDIA Spectrum-X 網絡構建新型主權 AI 云

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA推出代理式AI藍圖與電信推理模型

    借助全新開源大型電信模型與 NVIDIA Blueprint,電信運營商能夠利用自有數據訓練 AI 智能體,構建自主網絡。
    的頭像 發表于 03-06 17:37 ?1165次閱讀

    NVIDIA Spectrum-X以太網硅光技術助力AI工廠網絡創新

    NVIDIA 將率先為 AI 工廠引入采用光電一體封裝 (CPO) 的優化以太網網絡,通過 NVIDIA Spectrum-X 以太網硅光
    的頭像 發表于 01-14 09:06 ?610次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum-X</b>以太網硅光技術助力<b class='flag-5'>AI</b>工廠<b class='flag-5'>網絡</b>創新

    NVIDIA擴大與微軟合作推動AI超級工廠建設

    在 Microsoft Ignite 大會上,NVIDIA 擴大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅動的全新 Microsoft Fairwater AI 超級工廠中部署新一代
    的頭像 發表于 12-01 09:52 ?796次閱讀

    NVIDIA Spectrum-X 以太網交換機助力 Meta 和 Oracle 加速網絡性能

    Facebook 開放交換系統平臺。 Oracle 采用 Spectrum-X 以太網交換機構建十億瓦級(Giga-Scale)AI 超級計算機。 NVIDIA 宣布 Meta 和
    的頭像 發表于 10-14 10:26 ?1797次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum-X</b> 以太網交換機助力 Meta 和 Oracle 加速<b class='flag-5'>網絡</b>性能

    NVIDIA AI網絡閃耀2025云棲大會

    2025 云棲大會于 9 月 24 日至 9 月 26 日舉辦,NVIDIA 作為大會巔峰合作伙伴參與 2025 云棲大會。本文將帶您回顧 NVIDIA AI 網絡在本屆云棲大會上的精
    的頭像 發表于 10-13 11:19 ?1178次閱讀

    NVIDIA在Hot Chips 2025大會展示創新技術

    本周在加利福尼亞州帕洛阿爾托(Palo Alto)舉行的 Hot Chips 大會上,NVIDIA 專家詳細介紹了 NVIDIA NVLink 和Spectrum-X 以太網技術、Blackwell 以及 CUDA 如何為全球數
    的頭像 發表于 08-27 12:52 ?1923次閱讀

    NVIDIA推出Spectrum-XGS以太網技術

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太網。這項跨區域擴展(scale-across)技術可將多個分布式數據中心組合成一個十億瓦級 AI 超級工廠。
    的頭像 發表于 08-27 12:51 ?1324次閱讀

    NVIDIA技術助力企業創建主權AI智能體

    AI Factory 的經驗證設計將加速基礎設施與軟件(包括全新 NVIDIA NIM 微服務和經擴展的 NVIDIA Blueprint)相結合,為各國和企業簡化了全棧式 AI 開發
    的頭像 發表于 06-16 14:28 ?1345次閱讀

    歐洲聯手NVIDIA打造AI基礎設施

    NVIDIA 于近日宣布,其正在攜手歐洲各國、科技和行業領導者,共同建造 NVIDIA Blackwell AI 基礎設施,以強化數字主權、支撐經濟增長,并推動歐洲大陸成為
    的頭像 發表于 06-16 14:25 ?1429次閱讀

    NVIDIA計劃打造全球首個工業AI平臺

    NVIDIA 宣布,其正在為歐洲制造商構建全球首個工業 AI 。這家總部位于德國的 AI 工廠將配備 1 萬個 GPU,包括通過
    的頭像 發表于 06-16 14:17 ?1431次閱讀

    歐洲借助NVIDIA Nemotron優化主權大語言模型

    NVIDIA 正攜手歐洲和中東的模型構建商與提供商,共同優化主權大語言模型 (LLM),加速該地區各行業采用企業級 AI。
    的頭像 發表于 06-12 15:42 ?1186次閱讀

    企業使用NVIDIA NeMo微服務構建AI智能體平臺

    已發布的 NeMo 微服務可與合作伙伴平臺集成,作為創建 AI 智能體的構建模塊,使用商業智能與強大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務。
    的頭像 發表于 04-27 15:05 ?1286次閱讀

    英偉達GTC2025亮點:NVIDIA與行業領先存儲企業共同推出面向AI時代的新型企業基礎設施

    存儲提供商構建搭載 AI 查詢智能體的基礎設施,利用 NVIDIA 計算、網絡和軟件,針對復雜查詢進行推理并快速生成準確響應 NVIDIA
    的頭像 發表于 03-21 09:42 ?1326次閱讀

    NVIDIA推出全新硅光網絡交換機

    NVIDIA 今天推出了 NVIDIA Spectrum-XNVIDIA Quantum-X 硅光
    的頭像 發表于 03-20 14:52 ?998次閱讀

    NVIDIA 與行業領先的存儲企業共同推出面向 AI 時代的新型企業基礎設施

    存儲提供商構建搭載 AI 查詢智能體的基礎設施,利用 NVIDIA 計算、網絡和軟件,針對復雜查詢進行推理并快速生成準確響應 ? 美國加利福尼亞州圣何塞 —— GTC —— 太平洋時間
    發表于 03-19 10:11 ?498次閱讀
    <b class='flag-5'>NVIDIA</b> 與行業領先的存儲企業共同推出面向 <b class='flag-5'>AI</b> 時代的<b class='flag-5'>新型</b>企業基礎設施