国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

PyTorch 1.8發(fā)布,支持AMD ROCm

深度學習自然語言處理 ? 來源:量子位 ? 作者:夢晨 ? 2021-03-08 10:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.8版本中,官方終于加入了對AMD ROCm的支持,可以方便的在原生環(huán)境下運行,不用去配置Docker了。

△AMD ROCm只支持Linux操作系統(tǒng)

1.8版本集合了自2020年10月1.7發(fā)布以來的超過3000次GitHub提交。 此外,本次更新還有諸多亮點:

優(yōu)化代碼,更新編譯器

Python內(nèi)函數(shù)轉(zhuǎn)換

增強分布式訓練

新的移動端教程與演示

新的性能檢測工具

相關的庫TorchCSPRNG, TorchVision, TorchText和TorchAudio也會隨之更新。 要注意的是,自1.6起,Pytorch新特性將分為Stable、Beta、Prototype三種版本。其中Prototype不會包含到穩(wěn)定發(fā)行版中,需要從Nightly版本自行編譯。

Python to Python函數(shù)轉(zhuǎn)換

新增的Beta特性torch.fx可以實現(xiàn)Python到Python的函數(shù)轉(zhuǎn)換,可以方便的加入任何工作流程。

新的API,向NumPy學習!

1.7版本中增加的Beta特性torch.fft已成為正式特性。實現(xiàn)了與Numpy中的np.fft類似的快速傅立葉變換,還增加了硬件加速支持與自動求導,以更好的支持科學計算。 還增加了Beta版NumPy風格的線性代數(shù)模塊torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增強分布式訓練

增加了穩(wěn)定的異步錯誤與超時處理,增加NCCL的可靠性。 增加了Beta版的流水線并行功能*(Pipeline Parallelism)*,可將數(shù)據(jù)拆解成更小的塊以提高并行計算效率。

△Pipeline Parallelism使用4個GPU時的工作示意圖

增加Beta版的DDP通訊鉤子,用于控制如何在workers之間同步梯度。 另外還有一些Prototype版的分布式訓練新特性。ZeroRedundancyOptimizer:用于減少所有參與進程的內(nèi)存占用。Process Group NCCL Send/Recv:讓用戶可在Python而不是C++上進行集合運算。CUDA-support in RPC using TensorPipe:增加對N卡多卡運算的效率。Remote Module:讓用戶像操作本地模塊一樣操作遠程模塊。

移動端新教程

隨本次更新發(fā)布了圖像分割模型DeepLabV3在安卓和IOS上的詳細教程。 以及圖像分割、目標檢測、神經(jīng)機器翻譯等在安卓和IOS上的演示程序,方便大家更快上手。

另外還有PyTorch Mobile Lite Interpreter解釋器,可以減少運行時文件的大小。

原文標題:PyTorch 1.8來了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5677

    瀏覽量

    139664
  • python
    +關注

    關注

    57

    文章

    4869

    瀏覽量

    89880
  • pytorch
    +關注

    關注

    2

    文章

    813

    瀏覽量

    14799

原文標題:PyTorch 1.8來了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Pytorch 與 Visionfive2 兼容嗎?

    Pytorch 與 Visionfive2 兼容嗎? $ pip3 install torch torchvision torchaudio --index-url https
    發(fā)表于 02-06 08:28

    Robotec.ai與AMD Silo AI的合作實踐

    AMD Silo AI 正與領先的機器人應用仿真平臺開發(fā)商 Robotec.ai 合作,優(yōu)化和擴展基于 AMD GPU 和 ROCm 軟件堆棧的下一代汽車和機器人系統(tǒng)的數(shù)字孿生和場景重建工作負載
    的頭像 發(fā)表于 01-28 16:23 ?236次閱讀

    重磅更新 | 先楫半導體HPM_APPS v1.10.1發(fā)布

    重磅更新 | 先楫半導體HPM_APPS v1.10.1發(fā)布
    的頭像 發(fā)表于 12-26 08:33 ?771次閱讀
    重磅更新 | 先楫半導體HPM_APPS v1.10.1<b class='flag-5'>發(fā)布</b>

    AMD Power Design Manager 2025.2版本現(xiàn)已發(fā)布

    AMD Power Design Manager 2025.2 版本現(xiàn)已發(fā)布,并正式支持第二代 AMD Versal AI Edge 系列器件和第二代 Prime 系列器件。
    的頭像 發(fā)表于 12-24 11:08 ?587次閱讀

    AMD Vivado Design Suite 2025.2版本現(xiàn)已發(fā)布

    AMD Vivado Design Suite 2025.2 版本現(xiàn)已發(fā)布,新增對 AMD Versal 自適應 SoC 的設計支持,包含新器件支持
    的頭像 發(fā)表于 12-09 15:11 ?891次閱讀

    ROCm部署PP-StructureV3到AMD GPU上

    作者:AVNET 李鑫杰 我們在上一篇文章中介紹了ROCm+PP-OCRv5,為實現(xiàn)在AMD計算平臺上完成復雜文檔的端到端智能解析,本文基于ROCm軟件棧,提供一套完整的PP-StructureV3
    的頭像 發(fā)表于 11-13 16:56 ?5498次閱讀
    用<b class='flag-5'>ROCm</b>部署PP-StructureV3到<b class='flag-5'>AMD</b> GPU上

    AMD Vitis AI 5.1測試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對 AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡處理單元 (NPU) 的支持。Vitis AI 包含優(yōu)化的 NPU IP、模型編
    的頭像 發(fā)表于 10-31 12:46 ?757次閱讀

    全新升級 | 匠芯創(chuàng)AiUIBuilder V2.0.0發(fā)布

    近日,匠芯創(chuàng)自主研發(fā)的GUI開發(fā)工具AiUIBuilderV2.0.0發(fā)布。作為一款基于LVGL的UI設計工具,AiUIBuilder致力于通過拖拽式操作,加速基于匠芯創(chuàng)嵌入式平臺的圖形應用開發(fā)
    的頭像 發(fā)表于 10-29 10:03 ?858次閱讀
    全新升級 | 匠芯創(chuàng)AiUIBuilder V2.0.0<b class='flag-5'>發(fā)布</b>

    G2發(fā)布最新報告,Splashtop 榮膺多區(qū)域領導者,IT 遠程解決方案獲全球認可

    近日,全球權威軟件評測平臺G2發(fā)布了2025年秋季報告,Splashtop在端點管理、補丁管理、遠程支持和遠程桌面類別中表現(xiàn)亮眼,榮獲多項榮譽。憑借在歐洲、中東和非洲(EMEA)、歐洲、英國和加
    的頭像 發(fā)表于 10-20 17:02 ?1161次閱讀
    G2<b class='flag-5'>發(fā)布</b>最新報告,Splashtop 榮膺多區(qū)域領導者,IT 遠程解決方案獲全球認可

    技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀元

    體驗優(yōu)化,全方位展現(xiàn)技嘉在主板、整機、軟件工具等領域的技術沉淀與產(chǎn)品實力,為全球硬件愛好者呈現(xiàn)一場 “始于需求,忠于體驗” 的科技盛宴。 在技嘉新品發(fā)布會上,行業(yè)巨頭與意見領袖齊聚一堂。英偉達、英特爾和AMD代表共同出席,同時邀
    的頭像 發(fā)表于 09-19 10:07 ?489次閱讀
    技嘉2025<b class='flag-5'>發(fā)布</b>會:“從心出發(fā) 我們的主張”,邁向AI新紀元

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀元!代碼已經(jīng)開源,一起來試試!

    AMD7900xtxonSOPHGOSG2044PCLT團隊傾注心血,精心完成了將ROCm軟件棧適配到SG2044獨特架構的復雜工作。這包括:內(nèi)核級適配:確保ROCm驅(qū)動程序和底層組件能夠與SG
    的頭像 發(fā)表于 07-14 17:04 ?1167次閱讀
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀元!代碼已經(jīng)開源,一起來試試!

    請問CYUSB232開發(fā)板 是否支持1.8V Uart輸入?

    請問CYUSB232開發(fā)板 是否支持1.8V Uart輸入
    發(fā)表于 05-30 06:51

    雷軍官宣小米發(fā)布會:首款SUV將亮相 雷軍官宣小米YU7發(fā)布時間

    雷軍官宣小米YU7發(fā)布時間在22號,雷軍發(fā)文稱:小米戰(zhàn)略新品發(fā)布會,定在5月22日晚7點。 這次重磅新品特別多:手機SoC芯片小米玄戒o1,小米15SPro,小米平板7 Ultra,小米首款SUV
    的頭像 發(fā)表于 05-19 16:42 ?1303次閱讀

    重磅更新 | 先楫半導體HPM_APPS v1.9.0發(fā)布

    重磅更新 | 先楫半導體HPM_APPS v1.9.0發(fā)布
    的頭像 發(fā)表于 05-13 11:29 ?1729次閱讀
    重磅更新 | 先楫半導體HPM_APPS v1.9.0<b class='flag-5'>發(fā)布</b>

    摩爾線程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    近日,摩爾線程正式發(fā)布Torch-MUSA v2.0.0版本,這是其面向PyTorch深度學習框架的MUSA擴展庫的重要升級。新版本基于MUSA Compute Capability 3.1計算架構
    的頭像 發(fā)表于 05-11 16:41 ?1560次閱讀