国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最新一代深度神經(jīng)網(wǎng)絡(luò)推理裝置xDNN的部分規(guī)格參數(shù)

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-08-31 09:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

繼年初發(fā)布新一代FPGA框架后,F(xiàn)PGA巨頭賽靈思在Hot Chips大會(huì)揭露了最新一代深度神經(jīng)網(wǎng)絡(luò)推理裝置xDNN的部分規(guī)格參數(shù)。隨著更多定制芯片的發(fā)展,現(xiàn)如今AI芯片的戰(zhàn)火已經(jīng)蔓延到推理領(lǐng)域。賽靈思的xDNN可配置、可復(fù)寫,進(jìn)行多任務(wù)處理,還配有Tensor內(nèi)存。

目前來(lái)看,F(xiàn)PGA可能沒有像一些人預(yù)期的那樣在深度學(xué)習(xí)的訓(xùn)練空間中占據(jù)一席之地,但AI推理的低功耗、高頻率需求非常適合可重復(fù)編程硬件的性能曲線。

然而,現(xiàn)在人們?cè)絹?lái)越專注于推理與訓(xùn)練的新體系架構(gòu),F(xiàn)PGA也在努力在定制化硬件領(lǐng)域保持領(lǐng)先,而這要靠一些高級(jí)編程工具來(lái)降低編程的復(fù)雜度。

目前,要判斷通用CPUGPU、FPGA及定制芯片如何才能吸引最廣泛的用戶群還為時(shí)尚早,但基于云的FPGA以及不斷發(fā)展的高級(jí)FPGA集,越來(lái)越多地作為實(shí)驗(yàn)工具使用,讓FPGA在面向推理的任務(wù)中占據(jù)了一席之地。

考慮到所有這些因素,F(xiàn)PGA制造商Xilinx近日在Hot Chips大會(huì)上發(fā)布了Xilinx深度神經(jīng)網(wǎng)絡(luò)推理(xDNN)設(shè)備的一些參數(shù)細(xì)節(jié),公司將在接下來(lái)10月1日舉行的開發(fā)者大會(huì)上發(fā)布更多信息和性能基準(zhǔn)。

就在幾年前,神經(jīng)網(wǎng)絡(luò)訓(xùn)練處理器還是架構(gòu)展上的耀眼明星,但最近,GPU已經(jīng)在與定制化、專門化的ASIC芯片和其他通用硬件展開激烈競(jìng)爭(zhēng),眼下戰(zhàn)火又蔓延到了推理任務(wù)領(lǐng)域。

Xilinx的數(shù)據(jù)中心和IP總監(jiān)Rahul Nimaiyar上周在Hot Chips大會(huì)上表示,用FPGA執(zhí)行推理任務(wù)具備堅(jiān)實(shí)的硬件基礎(chǔ)。FPGA的數(shù)據(jù)處理并行的,并且支持?jǐn)?shù)據(jù)重用、數(shù)據(jù)壓縮,能夠應(yīng)對(duì)數(shù)據(jù)稀疏。

xDNN處理器的2D二維MAC陣列,靈活的高帶寬片載存儲(chǔ)器,支持多種方式訪問,讓數(shù)據(jù)的傳輸和轉(zhuǎn)移更加高效。此外,xDNN還支持靈活的數(shù)據(jù)類型(FP32 / FP16及INT 16/8/4/2等)。

xDNN是一個(gè)可配置、可復(fù)寫的處理器,可以映射到FPGA上而無(wú)需重新編程。Xilinx還提供了深度神經(jīng)網(wǎng)絡(luò)特定指令集(如卷積,最大池化等),可適用于任何網(wǎng)絡(luò)和任何大小的圖像,還可以編譯和運(yùn)行新網(wǎng)絡(luò)。也就是說(shuō),xDNN可以與TensorFlow一起使用,無(wú)需重新編程或更改FPGA。

Virtex硬件可以用于幾種類型的存儲(chǔ)器;從位于DSP模塊旁邊的分布式基礎(chǔ)RAM到UltraRAM,再到高帶寬內(nèi)存和外部DDR4內(nèi)存都可以,從而實(shí)現(xiàn)計(jì)算效率的優(yōu)化和性能提升。

上圖是一個(gè)通道并行脈動(dòng)陣列(channel parallel systolic arrays)的放大示意圖,圖中所示為分布式加權(quán)緩沖區(qū)。處理元件被加權(quán)映射到DSP塊上,具體權(quán)重保存在處理旁邊分布式RAM中,該RAM容量很小,速度很快。換句話說(shuō),這些分布式RAM就是權(quán)重緩存。

xDNN的“Tensor內(nèi)存”位于脈動(dòng)陣列的旁邊,并存儲(chǔ)輸入和輸出的特征映射。該部分也是并行通道,因此該陣列中的每個(gè)行都與一行內(nèi)存相關(guān)聯(lián)。也就是說(shuō),xDNN可以進(jìn)行多任務(wù)處理,在陣列上進(jìn)行計(jì)算,同時(shí)還可以根據(jù)需要引入新的網(wǎng)絡(luò)層。

與其他面向推理任務(wù)的芯片一樣,xDNN也在芯片內(nèi)壓縮了盡量多的內(nèi)置存儲(chǔ)器,以保持芯片的活性。這是一種比較艱難的平衡做法,目的是為了保證計(jì)算效率,從下面的基準(zhǔn)測(cè)試結(jié)果來(lái)看,Xilinx的配置似乎是有效的。

除了硬件之外,提升易用性也是關(guān)鍵問題,無(wú)論是對(duì)于那些使用F1進(jìn)行深度學(xué)習(xí)的人,還是用FPGA編程實(shí)現(xiàn)更精細(xì)的點(diǎn)的人來(lái)說(shuō),編譯器和運(yùn)行時(shí)間都是關(guān)鍵指標(biāo)。

上圖是關(guān)于Xilinx為用戶開發(fā)的機(jī)器學(xué)習(xí)工具套件的更多信息,實(shí)際上,這是一個(gè)允許用戶連接至框架的API,可以更容易地在Tensorflow中獲得經(jīng)過(guò)訓(xùn)練的模型和權(quán)重,例如,將其轉(zhuǎn)換為一個(gè)Xilinx圖,在它到達(dá)編譯器之前通過(guò)一些優(yōu)化,生成所有必要的指令集,以便在xDNN上運(yùn)行該網(wǎng)絡(luò)。

Xilinx還提供了一個(gè)量化器,可以將經(jīng)過(guò)訓(xùn)練的權(quán)重?cái)?shù)據(jù)輸入到一些校準(zhǔn)集中,以找到范圍并快速獲得這些權(quán)重的量化結(jié)果。

Nimaiyar表示,Xilinx已經(jīng)抽取出了產(chǎn)生有效推理的其他元素,包括操作的融合(一旦訪問被激活,這些操作直接作為流程運(yùn)算符執(zhí)行,而不再返回Tensor Memory),當(dāng)特征映射大小超過(guò)片載存儲(chǔ)器空間時(shí),會(huì)進(jìn)行指令級(jí)的并行化處理,和自動(dòng)將映射在層內(nèi)平鋪,這意味著xDNN可以處理任何規(guī)模的特征映射。

上圖的稀疏基準(zhǔn)測(cè)試是Xilinx在其開發(fā)者論壇上發(fā)布的結(jié)果,到目前為止,60-80%的跨框架高效數(shù)據(jù)表現(xiàn)已經(jīng)足夠令人期待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107859
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2129

    瀏覽量

    36798

原文標(biāo)題:【AI芯展開推理戰(zhàn)】賽靈思最新深度神經(jīng)網(wǎng)絡(luò)推理器xDNN參數(shù)曝光

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    面向嵌入式部署的神經(jīng)網(wǎng)絡(luò)優(yōu)化:模型壓縮深度解析

    1.為什么需要神經(jīng)網(wǎng)絡(luò)模型壓縮? 神經(jīng)網(wǎng)絡(luò)已經(jīng)成為解決復(fù)雜機(jī)器學(xué)習(xí)問題的強(qiáng)大工具。然而,這種能力往往伴隨著模型規(guī)模和計(jì)算復(fù)雜度的增加。當(dāng)輸入維度較大(例如長(zhǎng)時(shí)序窗口、高分辨率特征空間)時(shí),模型需要
    的頭像 發(fā)表于 02-24 15:37 ?5070次閱讀
    面向嵌入式部署的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>優(yōu)化:模型壓縮<b class='flag-5'>深度</b>解析

    神經(jīng)網(wǎng)絡(luò)的初步認(rèn)識(shí)

    日常生活中的智能應(yīng)用都離不開深度學(xué)習(xí),而深度學(xué)習(xí)則依賴于神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)。什么是神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)的核心思想是模仿生物
    的頭像 發(fā)表于 12-17 15:05 ?339次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的初步認(rèn)識(shí)

    CNN卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)原理及在MCU200T上仿真測(cè)試

    數(shù)的提出很大程度的解決了BP算法在優(yōu)化深層神經(jīng)網(wǎng)絡(luò)時(shí)的梯度耗散問題。當(dāng)x&gt;0 時(shí),梯度恒為1,無(wú)梯度耗散問題,收斂快;當(dāng)x&lt;0 時(shí),該層的輸出為0。 CNN
    發(fā)表于 10-29 07:49

    NMSIS神經(jīng)網(wǎng)絡(luò)庫(kù)使用介紹

    NMSIS NN 軟件庫(kù)是組高效的神經(jīng)網(wǎng)絡(luò)內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡(luò)的性能并最??大限度地減少其內(nèi)存占用。 該庫(kù)分為多個(gè)功能,每個(gè)功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的些經(jīng)驗(yàn)

    模型。 我們使用MNIST數(shù)據(jù)集,訓(xùn)練個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,用于手寫數(shù)字識(shí)別。旦模型被訓(xùn)練并保存,就可以用于對(duì)新圖像進(jìn)行推理和預(yù)測(cè)。要使用生成的模型進(jìn)行
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作

    在完成神經(jīng)網(wǎng)絡(luò)量化后,需要將神經(jīng)網(wǎng)絡(luò)部署到硬件加速器上。首先需要將所有權(quán)重?cái)?shù)據(jù)以及輸入數(shù)據(jù)導(dǎo)入到存儲(chǔ)器內(nèi)。 在仿真環(huán)境下,可將其存于個(gè)文件,并在 Verilog 代碼中通過(guò) readmemh 函數(shù)
    發(fā)表于 10-20 08:00

    液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)

    1.算法簡(jiǎn)介液態(tài)神經(jīng)網(wǎng)絡(luò)(LiquidNeuralNetworks,LNN)是種新型的神經(jīng)網(wǎng)絡(luò)架構(gòu),其設(shè)計(jì)理念借鑒自生物神經(jīng)系統(tǒng),特別是秀麗隱桿線蟲的
    的頭像 發(fā)表于 09-28 10:03 ?1252次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    神經(jīng)網(wǎng)絡(luò)的并行計(jì)算與加速技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和廣泛的應(yīng)用前景。然而,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和規(guī)模也在不斷增加,這使得傳統(tǒng)的串行計(jì)算方式面臨著巨大的挑戰(zhàn),如計(jì)算速度慢、訓(xùn)練時(shí)間長(zhǎng)等
    的頭像 發(fā)表于 09-17 13:31 ?1143次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的并行計(jì)算與加速技術(shù)

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    圖 1:基于深度學(xué)習(xí)的目標(biāo)檢測(cè)可定位已訓(xùn)練的目標(biāo)類別,并通過(guò)矩形框(邊界框)對(duì)其進(jìn)行標(biāo)識(shí)。 在討論人工智能(AI)或深度學(xué)習(xí)時(shí),經(jīng)常會(huì)出現(xiàn)“神經(jīng)網(wǎng)絡(luò)”、“黑箱”、“標(biāo)注”等術(shù)語(yǔ)。這些概念對(duì)非專業(yè)
    的頭像 發(fā)表于 09-10 17:38 ?911次閱讀
    如何在機(jī)器視覺中部署<b class='flag-5'>深度</b>學(xué)習(xí)<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動(dòng)AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能化等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)智能診斷新范式信而泰
    發(fā)表于 07-16 15:29

    大模型推理顯存和計(jì)算量估計(jì)方法研究

    (如全連接層、卷積層等)確定所需的顯存大小; (3)將各層顯存大小相加,得到模型總的顯存需求。 基于神經(jīng)網(wǎng)絡(luò)剪枝的顯存估計(jì) 神經(jīng)網(wǎng)絡(luò)剪枝是種減少模型參數(shù)數(shù)量的技術(shù),可以降低顯存需求。
    發(fā)表于 07-03 19:43

    無(wú)刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測(cè)方法的研究

    摘要:論文通過(guò)對(duì)無(wú)刷電機(jī)數(shù)學(xué)模型的推導(dǎo),得出轉(zhuǎn)角:與三相相電壓之間存在映射關(guān)系,因此構(gòu)建了個(gè)以三相相電壓為輸人,轉(zhuǎn)角為輸出的小波神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)轉(zhuǎn)角預(yù)測(cè),并采用改進(jìn)遺傳算法來(lái)訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù)
    發(fā)表于 06-25 13:06

    神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)在電機(jī)故障診斷中的應(yīng)用

    的診斷誤差。仿真結(jié)果驗(yàn)證了該算法的有效性。 純分享帖,需要者可點(diǎn)擊附件免費(fèi)獲取完整資料~~~*附件:神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)在電機(jī)故障診斷中的應(yīng)用.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)第
    發(fā)表于 06-16 22:09

    神經(jīng)網(wǎng)絡(luò)RAS在異步電機(jī)轉(zhuǎn)速估計(jì)中的仿真研究

    眾多方法中,由于其結(jié)構(gòu)簡(jiǎn)單,穩(wěn)定性好廣泛受到人們的重視,且已被用于產(chǎn)品開發(fā)。但是MRAS仍存在在低速區(qū)速度估計(jì)精度下降和對(duì)電動(dòng)機(jī)參數(shù)變化非常敏感的問題。本文利用神經(jīng)網(wǎng)絡(luò)的特點(diǎn),使估計(jì)更為簡(jiǎn)單、快速
    發(fā)表于 06-16 21:54

    基于FPGA搭建神經(jīng)網(wǎng)絡(luò)的步驟解析

    本文的目的是在個(gè)神經(jīng)網(wǎng)絡(luò)已經(jīng)通過(guò)python或者M(jìn)ATLAB訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型,將訓(xùn)練好的模型的權(quán)重和偏置文件以TXT文件格式導(dǎo)出,然后通過(guò)python程序?qū)xt文件轉(zhuǎn)化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?1240次閱讀
    基于FPGA搭建<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的步驟解析