国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

將NVIDIA加速計算引入Polars

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-11-20 10:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)科學家僅在一臺機器上就能實現(xiàn)在數(shù)秒內(nèi)處理數(shù)億行數(shù)據(jù)。

日新月異的數(shù)據(jù)挑戰(zhàn)

Pandas 等傳統(tǒng)數(shù)據(jù)處理庫均為單線程,當處理數(shù)據(jù)超過數(shù)百萬行時就會顯得“力不從心”。分布式數(shù)據(jù)處理系統(tǒng)雖然可以處理數(shù)十億行數(shù)據(jù),但又會增加處理中小型數(shù)據(jù)集的復雜程度和經(jīng)費開支。

在高效處理數(shù)千萬至數(shù)億行數(shù)據(jù)的工具之間一直存在著差距。這類工作負載常見于金融、零售、制造等行業(yè)的模型開發(fā)、需求預測和物流中。

在面向數(shù)據(jù)科學家和工程師Python 庫中,Polars 的增長速度位居前列,其設計初衷就是為了應對這些挑戰(zhàn)。該程序庫使用了先進的查詢優(yōu)化技術(shù),以減少不必要的數(shù)據(jù)移動和處理,使數(shù)據(jù)科學家可以僅用一臺機器就能流暢地處理數(shù)億行規(guī)模的工作負載。Polars 彌補了單線程解決方案速度過慢和分布式系統(tǒng)會增加非必要復雜性的缺陷,提供了一個極具吸引力的“中等規(guī)模”數(shù)據(jù)處理解決方案。

將 NVIDIA 加速計算引入 Polars

與其他僅使用 CPU 的數(shù)據(jù)處理工具相比,Polars 利用多線程執(zhí)行、高級內(nèi)存優(yōu)化和惰性求值(lazy evaluation)功能,可顯著提升開箱即用的加速性能。

但由于各行各業(yè)的企業(yè)面臨日益增長的數(shù)據(jù)處理需求,例如需要分析數(shù)十億筆金融交易、管理復雜的庫存系統(tǒng)等,都需要更加強大的性能。這時就該輪到加速計算發(fā)揮作用了:

cuDF 是 NVIDIA CUDA-X 加速庫中的 RAPIDS 套件的一部分,它是一個由 GPU 提供加速的 DataFrame 程序庫,能夠利用 GPU 的大規(guī)模并行處理能力顯著提高數(shù)據(jù)處理性能。

Polars 團隊與 NVIDIA 一起將 cuDF 的速度與 Polars 的效率相結(jié)合,使性能最高提速至在 CPU 上 Polars 的 13 倍。如此,即便用戶的數(shù)據(jù)處理工作量增長到數(shù)億甚至數(shù)十億行數(shù)據(jù),依然能夠保持交互。

9f9cb96c-a016-11ef-93f3-92fbcf53809c.jpg

圖 1.圖中所示的是 PDS-H 基準測試 22 個查詢中加速幅度最大的 4 個查詢。在運行包含眾多復雜分組和連接操作的查詢時,RAPIDS cuDF 驅(qū)動的 Polars GPU 引擎的速度提速至 CPU 上 Polars 的 13 倍。

PDS-H基準測試規(guī)模系數(shù) 80 | GPU:NVIDIA H100 | CPU:英特爾 Xeon W9-3495X(Sapphire Rapids) | 存儲:本地NVMe。備注:PDS-H 源自 TPC-H,但這些結(jié)果與 TPC-H 的結(jié)果不具有可比性。

由于 Polars GPU 引擎直接內(nèi)置在 Polars Lazy API 中,用戶只需通過 pip 安裝 polars[gpu] 并將 [engine=”gpu”] 發(fā)送至 collect 操作,即可將 GPU 加速應用于他們的工作流。在后臺,Polars 會嘗試首先在 GPU 上執(zhí)行操作,必要時再返回 CPU。這種方法可確保:

通過使用 Polars 的查詢優(yōu)化器,實現(xiàn)高效執(zhí)行和最低內(nèi)存使用

用戶無須修改現(xiàn)有 Polars 代碼,即可訪問 GPU 引擎

完全兼容 Polars 不斷發(fā)展的數(shù)據(jù)可視化、I/O 和機器學習庫生態(tài)系統(tǒng)

pip install polars[gpu] --extra-index-url=https://pypi.nvidia.com
 
import polars as pl
 
(transactions
 .group_by("CUST_ID")
 .agg(pl.col("AMOUNT").sum())
 .sort(by="AMOUNT", descending=True)
 .head()
 .collect(engine="gpu"))

結(jié)語

RAPIDS cuDF 驅(qū)動的 Polars GPU 引擎現(xiàn)已發(fā)布公測版,為各行各業(yè)的數(shù)據(jù)科學家和工程師提供了一種適用于中等規(guī)模數(shù)據(jù)處理的強大工具。該引擎最高能夠?qū)?NVIDIA GPU 上的 Polars 工作流速度提速 13 倍,可以在不產(chǎn)生分布式系統(tǒng)開銷的情況下,高效處理數(shù)億行規(guī)模的數(shù)據(jù)集。Polars GPU 引擎直接內(nèi)置在 Polars API 中,使所有用戶都能輕松訪問。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109716
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135427
  • 引擎
    +關(guān)注

    關(guān)注

    1

    文章

    368

    瀏覽量

    23451

原文標題:RAPIDS cuDF 驅(qū)動的 Polars GPU 引擎發(fā)布公測版

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA在ISC 2025分享最新超級計算進展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網(wǎng)絡和量子技術(shù)實現(xiàn)了飛躍。在 SC25 上展示的加速系統(tǒng)突顯了全球超級計算和 AI 的進展
    的頭像 發(fā)表于 11-25 10:59 ?896次閱讀
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超級<b class='flag-5'>計算</b>進展

    NVIDIA宣布開源Aerial軟件

    NVIDIA 開源其 Aerial 軟件,并將 NVIDIA Sionna 研究套件和 Aerial 測試平臺引入 NVIDIA DGX Spark 平臺,為研究人員提供強大的工具和便
    的頭像 發(fā)表于 11-03 15:14 ?908次閱讀

    NVIDIA IGX Thor 機器人處理器實時物理 AI 引入工業(yè)和醫(yī)療邊緣場景

    年 10 月 28 日—— ?AI 正由數(shù)字世界走向物理世界。在工廠車間和手術(shù)室等場景中,機器正逐步進化為能夠?qū)崟r觀察、感知并作出決策的協(xié)作伙伴。 ? 為加速這一變革,NVIDIA 今日推出
    的頭像 發(fā)表于 10-29 10:31 ?1207次閱讀
    <b class='flag-5'>NVIDIA</b> IGX Thor 機器人處理器<b class='flag-5'>將</b>實時物理 AI <b class='flag-5'>引入</b>工業(yè)和醫(yī)療邊緣場景

    NVIDIA RAPIDS 25.06版本新增多項功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1061次閱讀

    NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載

    NVIDIA RTX 與 NVIDIA TensorRT 現(xiàn)已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現(xiàn)可借助 RTX 和 NVIDIA
    的頭像 發(fā)表于 07-16 09:16 ?2046次閱讀

    NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)

    NVIDIA 宣布與諾和諾德開展合作,借助創(chuàng)新 AI 應用加速藥物研發(fā)。此次合作也支持諾和諾德與丹麥 AI 創(chuàng)新中心 (DCAI) 關(guān)于使用 Gefion AI 超級計算機的協(xié)議落地
    的頭像 發(fā)表于 06-12 15:49 ?1265次閱讀

    高效地擴展Polars GPU Parquet讀取器

    在處理大型數(shù)據(jù)集時,數(shù)據(jù)處理工具的性能至關(guān)重要。Polars 作為一個以速度和效率著稱的開源數(shù)據(jù)處理庫,它提供了由 cuDF 驅(qū)動的 GPU 加速后端,能夠顯著提升性能。
    的頭像 發(fā)表于 04-21 17:12 ?899次閱讀
    高效地擴展<b class='flag-5'>Polars</b> GPU Parquet讀取器

    NVIDIA攜手谷歌云助力企業(yè)引入代理式AI

    谷歌 Gemini 模型即將支持本地部署,可通過搭載 NVIDIA Blackwell 架構(gòu)的基礎設施,在 Google 分布式云上運行 NVIDIA 機密計算
    的頭像 發(fā)表于 04-11 16:32 ?1206次閱讀

    NVIDIA助力解決量子計算領(lǐng)域重大挑戰(zhàn)

    NVIDIA 加速量子研究中心提供了強大的工具,助力解決量子計算領(lǐng)域的重大挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 09:17 ?1259次閱讀

    使用NVIDIA CUDA-X庫加速科學和工程發(fā)展

    NVIDIA GTC 全球 AI 大會上宣布,開發(fā)者現(xiàn)在可以通過 CUDA-X 與新一代超級芯片架構(gòu)的協(xié)同,實現(xiàn) CPU 和 GPU 資源間深度自動化整合與調(diào)度,相較于傳統(tǒng)加速計算架構(gòu),該技術(shù)可使
    的頭像 發(fā)表于 03-25 15:11 ?1530次閱讀

    NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本

    隨著 NVIDIA 推出 Aether 項目,通過采用 NVIDIA 加速的 Apache Spark 企業(yè)得以自動加速其數(shù)據(jù)中心規(guī)模的分析工作負載,從而節(jié)省數(shù)百萬美元。
    的頭像 發(fā)表于 03-25 15:09 ?1157次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>的Apache Spark助力企業(yè)節(jié)省大量成本

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)庫與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA 加速
    的頭像 發(fā)表于 03-21 12:01 ?1425次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)<b class='flag-5'>加速</b>代理式AI推理

    NVIDIA GTC2025 亮點 NVIDIA推出 DGX Spark個人AI計算

    臺式超級計算機由 NVIDIA Grace Blackwell 驅(qū)動,為開發(fā)者、研究人員和數(shù)據(jù)科學家提供加速 AI 功能;系統(tǒng)由頭部計算機制造商(包括華碩、Dell Technolog
    的頭像 發(fā)表于 03-20 18:59 ?1625次閱讀
    <b class='flag-5'>NVIDIA</b> GTC2025 亮點  <b class='flag-5'>NVIDIA</b>推出 DGX Spark個人AI<b class='flag-5'>計算</b>機

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務首次實現(xiàn)集成,以幫助全球企業(yè)組織
    發(fā)表于 03-19 15:24 ?577次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 AI 推理

    NVIDIA 宣布推出 DGX Spark 個人 AI 計算

    臺式超級計算機由 NVIDIA Grace Blackwell 驅(qū)動,為開發(fā)者、研究人員和數(shù)據(jù)科學家提供加速 AI 功能;系統(tǒng)由頭部計算機制造商(包括華碩、Dell Technolog
    發(fā)表于 03-19 09:59 ?775次閱讀
       <b class='flag-5'>NVIDIA</b> 宣布推出 DGX Spark 個人 AI <b class='flag-5'>計算</b>機