獨(dú)立顧問(wèn) James Reinders 剛剛在 NextPlatform.com 網(wǎng)站上發(fā)表了題為“CERN 采用英特爾深度學(xué)習(xí)加速技術(shù)和 oneAPI 在不影響準(zhǔn)確度的情況下加快推理速度”的文章,詳細(xì)介紹了 CERN 如何使用深度學(xué)習(xí)和英特爾 oneAPI 加速蒙特卡洛模擬 (Monte Carlo simulation),推動(dòng)大型強(qiáng)子對(duì)撞機(jī)研究。
為了幫助滿足全球最大的粒子加速器CERN的LHC(大型強(qiáng)子對(duì)撞機(jī))的未來(lái)需求,CERN,SURFsara和英特爾的研究人員一直在研究提供全新高水平仿真的方法。
Reinders 寫(xiě)到,CERN 研究人員“業(yè)已證明在不影響準(zhǔn)確度的情況下,通過(guò)降低精度,成功將推理速度提升了近兩倍。”此項(xiàng)工作是英特爾通過(guò) CERN openlab 與 CERN 長(zhǎng)期合作的一部分。
CERN 研究人員發(fā)現(xiàn),在名為“生成式對(duì)抗網(wǎng)絡(luò) (GAN)”的特定神經(jīng)網(wǎng)絡(luò) (NN) 中,約一半的計(jì)算可以從 FP32 切換至 INT8 數(shù)值精度,英特爾 深度學(xué)習(xí)加速技術(shù)可以在不影響準(zhǔn)確度的情況下直接支持這種切換。最終,GAN 性能提升了兩倍,且準(zhǔn)確度絲毫不受影響。雖然這項(xiàng)工作由直接支持 INT8 的英特爾 至強(qiáng) 可擴(kuò)展處理器完成,但 Reinders 還在文章中提出了下一個(gè)邏輯跳躍:
“INT 8 的廣泛支持得益于英特爾至強(qiáng)可擴(kuò)展處理器,英特爾 Xe GPU 也支持 INT 8。FPGA 支持 INT8 和其他較低的精度格式。”
通過(guò)完全控制精度權(quán)衡來(lái)實(shí)現(xiàn)量化,從而為推理帶來(lái)了顯著的性能提升
此外,Reinders 還表示:
“執(zhí)行并大幅改進(jìn)此項(xiàng)工作的秘密武器是,oneAPI 支持輕松訪問(wèn)英特爾深度學(xué)習(xí)加速和其他加速技術(shù),無(wú)需將應(yīng)用鎖定到單個(gè)廠商或設(shè)備中。”
值得一提的是,oneAPI 如何讓此類工作更具價(jià)值。所用工具的關(guān)鍵部分,包括 TensorFlow 和 Python 中隱藏的加速,都利用了支持 oneAPI 的庫(kù)。這意味著,它們是公開(kāi)的,可隨時(shí)用于異構(gòu)系統(tǒng),不只針對(duì)于一家廠商或一種產(chǎn)品(比如 GPU)。
oneAPI 是跨行業(yè)、開(kāi)放式、基于標(biāo)準(zhǔn)的統(tǒng)一編程模型,可在所有加速器架構(gòu)中提供統(tǒng)一的開(kāi)發(fā)體驗(yàn)。英特爾幫助創(chuàng)建了 oneAPI,并為其提供各種開(kāi)源編譯器、庫(kù)和其他工具的支持。編程后通過(guò) oneAPI 使用 INT8,這樣文章所述的 CERN 執(zhí)行的此類工作可以使用英特爾 Xe GPU、FPGA 或其他支持 INT8 或其他數(shù)值格式(可以量化)的設(shè)備來(lái)完成。
原文標(biāo)題:神經(jīng)網(wǎng)絡(luò)性能提升兩倍,英特爾?深度學(xué)習(xí)加速技術(shù)和oneAPI推動(dòng)大型強(qiáng)子對(duì)撞機(jī)研究
文章出處:【微信公眾號(hào):FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
FPGA
+關(guān)注
關(guān)注
1660文章
22412瀏覽量
636330 -
英特爾
+關(guān)注
關(guān)注
61文章
10301瀏覽量
180453 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107773
原文標(biāo)題:神經(jīng)網(wǎng)絡(luò)性能提升兩倍,英特爾?深度學(xué)習(xí)加速技術(shù)和oneAPI推動(dòng)大型強(qiáng)子對(duì)撞機(jī)研究
文章出處:【微信號(hào):zhuyandz,微信公眾號(hào):FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
銳寶智聯(lián)入選英特爾首批尊享級(jí)合作伙伴
科通技術(shù)獲評(píng)英特爾首批尊享級(jí)合作伙伴
英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持
主控CPU全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運(yùn)轉(zhuǎn)
英特爾i210網(wǎng)卡參考設(shè)計(jì)
使用英特爾? NPU 插件C++運(yùn)行應(yīng)用程序時(shí)出現(xiàn)錯(cuò)誤:“std::Runtime_error at memory location”怎么解決?
英特爾銳炫Pro B系列,邊緣AI的“智能引擎”
英特爾宣布工程技術(shù)領(lǐng)導(dǎo)層重要任命,加速CEO陳立武轉(zhuǎn)型布局
新思科技與英特爾在EDA和IP領(lǐng)域展開(kāi)深度合作
直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍
直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍
英特爾發(fā)布全新GPU,AI和工作站迎來(lái)新選擇
英特爾宣布裁員20% 或2萬(wàn)人失業(yè)
微星攜英特爾為玩家打造非凡游戲體驗(yàn),兩款泰坦家族新品均搭載全新英特爾酷睿Ultra HX處理器
英特爾借助開(kāi)放生態(tài)系統(tǒng),加速邊緣AI創(chuàng)新
CERN如何使用深度學(xué)習(xí)和英特爾oneAPI加速蒙特卡洛模擬介紹
評(píng)論