国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

二代IPU性能超過GPU且全面支持PyTorch

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2020-12-30 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“不管是在今天 GPU 能夠做的事情上,還是 GPU 不能做的事情上,IPU 都有它的價值點和價值定位。” 日前,在英國 AI 芯片初創公司 Graphcore 中國區的媒體溝通會上,Graphcore 高級副總經理兼中國區總經理盧濤和 Graphcore 中國工程總負責人、AI 算法科學家金琛,就 Graphcore 的新產品性能以及該公司在中國的落地策略向 DeepTech 等媒體進行了同步。

溝通會上,Graphcore 解讀了其于本月公布的大規模系統級產品 IPU-M2000 的應用測試數據。公布數據顯示,在典型 CV 模型 ResNet、基于分組卷積的 ResNeXt、EfficientNet、語音模型、BERT-Large 等自然語言處理模型以及 MCMC 等傳統機器學習模型中,IPU-M2000 在吞吐量、訓練時間和學習結果生成時間方面都有較好表現。比如,在 IPU-M2000 上 EfficientNet 的吞吐量達到 A100 的 18 倍。

bf6a28a2-4a2e-11eb-8b86-12bb97331649.jpg

圖 | IPU-M2000 與 GPU 的吞吐量、訓練及結果生成時間對比(來源:Graphcore)

此前,IPU-M2000 與 Graphcore 第二代 IPU 處理器 GC200 已于今年 7 月 15 日發布。據介紹,GC200 芯片基于臺積電的 7nm 工藝制造,集成 250 TFlops AI-Float 算力和 900MB 處理器內存,相較第一代產品性能提升 8 倍。而對于第三代 IPU,盧濤在此次溝通會上并未透露發布的具體時間表,不過他表示下一代產品正在研發中,將依舊重點解決存儲問題。

支持 PyTorch、TensorFlow,在 IPU 與 GPU 間無縫銜接

另外,Graphcore 還發布了 Poplar SDK 1.4 版本和 PyTorch 的 IPU 版本。

Graphcore 對 Poplar SDK 1.4 版本在易用性和速度上進行了優化,能夠支持模型和數據并行,同時能夠實現模型的橫向擴展 —— 從 1 個 IPU 橫向擴展到 64 個 IPU。金琛表示,下一版本的 Poplar SDK 有望實現橫向擴展到 128 個 IPU。

值得關注的是,除支持 Graphcore 的自研框架 PopART 外,Poplar SDK 1.4 還支持 Facebook 的 PyTorch 框架、以及 Google 的 TensorFlow 框架。

據金琛介紹,Graphcore 在 PyTorch 代碼中引入了 PopTorch 輕量級接口,通過這一接口,用戶可基于當前的 PyTorch 模型進行封裝,以實現 IPU 和 CPU 之間的無障礙銜接。

對于實現這一功能的核心技術,金琛做進一步解釋說,Graphcore 采用 PyTorch 里的 jit.trace 機制對計算圖進行編譯,轉化為 IPU 和 PyTorch 兼容的表達格式,最后用 Graphcore 自研框架 PopART 后端的 audiff 功能自動生成反向圖,便可以實現同一個模型在不同平臺的無差別運行。

目前,PyTorch 因其直觀易懂、靈活易用等優勢受到開發者的廣泛喜愛和應用。Poplar SDK 1.4 增加了對 PyTorch 的支持,策略上是希望用戶在 IPU 上也能體驗 PyTorch,讓用戶多一個轉戰 IPU 的理由。不過目前英偉達的 GPU 已經在 AI 計算領域占據大部分市場,此時 IPU 能夠提供的價值、轉場到 IPU 的成本等,都是用戶所要考慮的問題。

在遷移成本上,盧濤表示,經過幾年來對 Poplar SDK 的打磨,現在從 GPU 到 IPU 的軟硬件遷移難度已經比大家認為的小得多。

金琛補充道,在訓練上,針對一個不太復雜的模型,一般一周可以遷移完成,對于復雜的模型大概需要兩周;在推理上,基本上是 1-2 天的工作量。

談及性能,盧濤表示:“IPU 在訓練推理、語音、圖像模型處理上基本全面超越 GPU。” 不過他也坦言:“不能說 100% 超越了 GPU,因為算法模型確實非常多,比如說語音有不同的語音模型、圖像也是有不同的圖像模型。”

未來:持續優化性能,進一步壓縮遷移成本

IPU 在機器學習性能上的明顯優勢是不可否認的,但前有身強體壯且努力奔跑的巨頭英偉達,Graphcore 更是一刻也不容懈怠。盧濤在溝通會上也多次提到,“目前 Graphcore 面對的壓力最主要還是來自英偉達”。

“重壓” 之下,Graphcore 短期內的計劃是聚焦在數據中心高性能訓練和推理市場上,持續打磨 IPU 和軟件平臺,持續優化性能和提高可用性。盧濤說,“只有在我們聚焦的領域跑得更快,Graphcore 和英偉達之間的距離才會越來越短,甚至在某些領域超過英偉達”。

他還表示,Graphcore 希望未來數年內,能在數據中心的 AI 訓練、推理批量部署、以及發貨和體量上做到除英偉達以外的另一個頭部地位。

為實現該目標,Graphcore 也將從增加 AI 框架支持、以及模型覆蓋兩個維度著手,以期進一步減少用戶的遷移成本。此外,除目前 AI 應用最廣泛的互聯網和云計算兩個場景外,盧濤表示公司明年還將在金融、汽車、智慧醫療、智慧教育、智慧城市和政府服務等領域,至少突破一到兩個比較主流的領域。

原文標題:二代IPU性能超過GPU、全面支持PyTorch,Graphcore接下來將聚焦數據中心的AI訓練和推理部署

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135455
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301413
  • IPU
    IPU
    +關注

    關注

    0

    文章

    35

    瀏覽量

    15962
  • pytorch
    +關注

    關注

    2

    文章

    813

    瀏覽量

    14853

原文標題:二代IPU性能超過GPU、全面支持PyTorch,Graphcore接下來將聚焦數據中心的AI訓練和推理部署

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AMD VEK385評估套件助力快速啟動第二代Versal AI Edge系列設計

    AMD VEK385 評估套件為評估第二代 AMD Versal AI Edge 系列 XC2VE3858 器件提供了一條快速、功能豐富可擴展的途徑。借助異構計算、高性能 I/O、全面
    的頭像 發表于 03-06 09:09 ?355次閱讀

    PyTorch 中RuntimeError分析

    ://download.pytorch.org/whl/cu118 方案3:使用替代上采樣模式 如果你的任務允許,可以將 mode=\'nearest\' 替換為其他已支持 BFloat16 的模式,例如 mode
    發表于 03-06 06:02

    AMD 推出第二代 Kintex UltraScale+ 中端FPGA,助力智能高性能系統

    二代AMD Kintex UltraScale+ FPGA 系列 , 對于依賴中端FPGA 為性能關鍵型系統提供支持的設計人員而言,可謂一項重大進步。 這一全新系列構建在業經驗證的Kintex FPGA 產品組合基礎之上,對
    的頭像 發表于 02-04 16:11 ?5.2w次閱讀
    AMD 推出第<b class='flag-5'>二代</b> Kintex UltraScale+ 中端FPGA,助力智能高<b class='flag-5'>性能</b>系統

    新品 | CoolSiC? MOSFET 650V第二代產品,新增75m?型號

    新品CoolSiCMOSFET650V第二代產品,新增75m?型號CoolSiCMOSFET650V第二代器件基于性能卓越的第一溝槽SiCMOSFET技術打造,通過提升
    的頭像 發表于 01-12 17:03 ?313次閱讀
    新品 | CoolSiC? MOSFET 650V第<b class='flag-5'>二代</b>產品,新增75m?型號

    TeledyneLeCroy發布第二代DisplayPort 2.1 PHY合規測試與調試解決方案

    TeledyneLeCoy(Teledyne子公司)宣布第二代QualiPHY 2自動化合規測試框架現已支持DisplayPort 2.1物理層(PHY)合規性測試。
    的頭像 發表于 12-26 11:04 ?1581次閱讀

    新品 | 采用.XT擴散焊和第二代1200V SiC MOSFET的Easy C系列

    新品采用.XT擴散焊和第二代1200VSiCMOSFET的EasyC系列EasyPACK2C1200V8mΩ三電平模塊、EasyPACK2C1200V8mΩ四單元模塊以及
    的頭像 發表于 11-24 17:05 ?1465次閱讀
    新品 | 采用.XT擴散焊和第<b class='flag-5'>二代</b>1200V SiC MOSFET的Easy C系列

    新品 | 第二代CoolSiC? MOSFET G2 1400V,TO-247PLUS-4回流焊封裝

    系統、工業變頻器等大功率輸出應用的理想選擇。第二代1400VCoolSiCMOSFET前沿技術具有前沿性,可顯著提升熱管理性能、功率密度及系統可靠性。其封裝支持回流
    的頭像 發表于 11-17 17:02 ?1348次閱讀
    新品 | 第<b class='flag-5'>二代</b>CoolSiC? MOSFET G2 1400V,TO-247PLUS-4回流焊封裝

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    是Imagination開發者社區中廣受歡迎的圖形API,因其提供了低開銷、跨平臺訪問現代GPU的能力,幫助開發者在多種設備上最大化性能與效率。其對GPU操作的顯式控制,以及對
    的頭像 發表于 08-14 11:18 ?2293次閱讀
    Imagination <b class='flag-5'>GPU</b> <b class='flag-5'>全面</b><b class='flag-5'>支持</b> Vulkan 1.4 和 Android 16

    最高256細分,支持集成式熱管理系統!納芯微發布第二代步進電機驅動NSD8389-Q1

    納芯微推出第二代車規級高性能步進電機驅動器NSD8389-Q1,具備寬電壓、低內阻、高細分等特性,支持多種配置與保護功能。該產品助力汽車制造商實現高精度電機控制,適用于熱管理、頭燈控制、HUD等場景,推動汽車電氣化和智能化升級。
    的頭像 發表于 06-27 16:32 ?976次閱讀
    最高256細分,<b class='flag-5'>支持</b>集成式熱管理系統!納芯微發布第<b class='flag-5'>二代</b>步進電機驅動NSD8389-Q1

    AMD第二代Versal AI Edge和Versal Prime系列加速量產 為嵌入式系統實現單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產品是對 Versal 產品組合的擴展,可為嵌入式系統實現單芯片智能。
    的頭像 發表于 06-11 09:59 ?1859次閱讀

    恩智浦推出第二代OrangeBox車規級開發平臺

    二代OrangeBox開發平臺集成AI功能、后量子加密技術及內置軟件定義網絡的能力,應對快速演變的信息安全威脅。
    的頭像 發表于 05-27 14:25 ?1387次閱讀

    摩爾線程發布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    支持原生FP8數據類型,支持PyTorch 2.5.0 ,并通過多項針對MUSA計算平臺的性能優化,進一步提升了對AI模型和大規模數據處理的支持
    的頭像 發表于 05-11 16:41 ?1653次閱讀

    二代AMD Versal Premium系列SoC滿足各種CXL應用需求

    二代 AMD Versal Premium 系列自適應 SoC 是一款多功能可配置的平臺,提供全面的 CXL 3.1 子系統。該系列自適應 SoC 旨在滿足從簡單到復雜的各種 CXL 應用需求
    的頭像 發表于 04-24 14:52 ?1259次閱讀
    第<b class='flag-5'>二代</b>AMD Versal Premium系列SoC滿足各種CXL應用需求

    方正微電子推出第二代車規主驅SiC MOS產品

    2025年4月16日,在上海舉行的三電關鍵技術高峰論壇上,方正微電子副總裁彭建華先生正式發布了第二代車規主驅SiC MOS 1200V 13mΩ產品,性能達到國際頭部領先水平。
    的頭像 發表于 04-17 17:06 ?1529次閱讀

    比亞迪二代刀片電池或3月17日發布

    據媒體報道,比亞迪公司將在3月17日召開一場發布會,預計此次的重磅發布會的主題,或將會是外界期待已久的二代刀片電池,比亞迪二代刀片電池或將帶來一系列技術進化。而且這或是比亞迪在打出“全民智駕”這張牌
    的頭像 發表于 03-13 18:16 ?3095次閱讀