PyTorch 1.6 nightly增加了一個(gè)子模塊amp,支持自動(dòng)混合精度訓(xùn)練。值得期待。來看看性能如何,相比Nvidia Apex 有哪些優(yōu)勢(shì)?
A developer-friendly guide to mixed precision training with PyTorch
https://spell.run/blog/mixed-precision-training-with-pytorch-Xuk7YBEAACAASJam
即將在 PyTorch 1.6上發(fā)布的 torch.cuda.amp 混合精度訓(xùn)練模塊實(shí)現(xiàn)了它的承諾,只需增加幾行新代碼就可以提高大型模型訓(xùn)練50-60% 的速度。

-
模塊
+關(guān)注
關(guān)注
7文章
2837瀏覽量
53283 -
代碼
+關(guān)注
關(guān)注
30文章
4968瀏覽量
73960 -
pytorch
+關(guān)注
關(guān)注
2文章
813瀏覽量
14850
原文標(biāo)題:訓(xùn)練提速60%!只需5行代碼,PyTorch 1.6即將原生支持自動(dòng)混合精度訓(xùn)練
文章出處:【微信號(hào):cas-ciomp,微信公眾號(hào):中科院長(zhǎng)春光機(jī)所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
基于NVIDIA GPU加速端點(diǎn)使用千問3.5 VLM開發(fā)原生多模態(tài)智能體
進(jìn)迭時(shí)空 Upstream | K3 獲得 Linux 7.0 內(nèi)核原生支持
Pytorch 與 Visionfive2 兼容嗎?
電能質(zhì)量在線監(jiān)測(cè)裝置支持校準(zhǔn)證書自動(dòng)上傳嗎?
如何訓(xùn)練好自動(dòng)駕駛端到端模型?
測(cè)溫精度±0.1℃,無需進(jìn)行校準(zhǔn)的數(shù)字模擬混合信號(hào)溫度傳感芯片
環(huán)旭電子即將推出新一代1.6T光模組產(chǎn)品
【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】 + 04 + 機(jī)器學(xué)習(xí)YOLO體驗(yàn)
請(qǐng)問CYBT-343026-01是否支持AVRCP 1.6?
飛騰軟件支持平臺(tái)即將正式上線AI智能大腦
摩爾線程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0
AI原生架構(gòu)升級(jí):RAKsmart服務(wù)器在超大規(guī)模模型訓(xùn)練中的算力突破
啟明智顯5G CPE再度升級(jí)!全線支持原生0penWrt!
摩爾線程GPU原生FP8計(jì)算助力AI訓(xùn)練
PyTorch 1.6即將原生支持自動(dòng)混合精度訓(xùn)練
評(píng)論