国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA在微軟云azure中的應(yīng)用

FPGA之家 ? 來源:FPGA之家 ? 作者:FPGA之家 ? 2022-06-17 09:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著5G通信技術(shù)的發(fā)展,云計(jì)算和邊緣計(jì)算業(yè)務(wù)也將快速增長(zhǎng)。由于云計(jì)算多樣性和邊緣環(huán)境復(fù)雜性的特點(diǎn),將決定了在CPUGPUFPGAASIC中,不會(huì)只有一種芯片存在。所以FPGA一定可以尋找到它的應(yīng)用方向。相較于其它幾種芯片,F(xiàn)PGA具有以下幾種優(yōu)勢(shì):

1 靈活可編程。FPGA是以LUT作為基本結(jié)構(gòu)的器件,可以根據(jù)需求的變化對(duì)其擦除重寫,運(yùn)行新的程序。

2 高帶寬。FPGA芯片有很多高速管腳,可以連接多顆DRAM,產(chǎn)生較高的帶寬。

3 復(fù)雜的數(shù)據(jù)處理能力。FPGA能夠有針對(duì)性的處理邏輯關(guān)系復(fù)雜的程序,這相比于CPU,GPU等依賴指令處理數(shù)據(jù)的芯片有優(yōu)勢(shì),因?yàn)樗軌蜃龅礁偷难舆t。

FPGA也存在以下劣勢(shì)限制了它的發(fā)展:

1 編程復(fù)雜,開發(fā)周期較長(zhǎng)。RTL的開發(fā)包括了架構(gòu)設(shè)計(jì),RTL代碼,仿真驗(yàn)證,上板調(diào)試。一個(gè)項(xiàng)目的周期往往是軟件開發(fā)的幾倍,團(tuán)隊(duì)規(guī)模也較大。這些既提高了開發(fā)成本,又沒法適應(yīng)不斷迭代的產(chǎn)品需求。

2 粗粒度硬件結(jié)構(gòu)導(dǎo)致資源利用率低。FPGA達(dá)不到100%的資源利用率,這是對(duì)資源的一種浪費(fèi),體現(xiàn)在經(jīng)濟(jì)上是提高了成本。

以上兩方面都可以歸結(jié)到成本這一點(diǎn)上,但是如果能夠解決1問題,那么2問題也就迎刃而解了。因?yàn)槿绻鸉PGA的市場(chǎng)應(yīng)用多了,那么其制造成本也會(huì)下降。1問題的解決一直在路上,但是一直沒有解決。HLS等類似軟件編程語(yǔ)言的出現(xiàn)可以提高FPGA的開發(fā)效率,但是相比于純軟件開發(fā)語(yǔ)言還是存在一定復(fù)雜性。而相對(duì)于RTL語(yǔ)言來說,HLS語(yǔ)言的硬件描述性不夠鮮明。所以硬件開發(fā)人員更多的會(huì)選擇硬件描述清晰的verilog,system Verilog等語(yǔ)言。

這些缺點(diǎn)并不意味著我們對(duì)FPGA在未來AI應(yīng)用中抱著悲觀的想法,一個(gè)是未來場(chǎng)景的復(fù)雜性和多樣性,一個(gè)是FPGA也在尋求改進(jìn)和發(fā)展。第一個(gè)決定了FPGA一定能夠在AI中活下去,第二個(gè)決定了FPGA在AI中活的怎么樣。

接下來我們來了解一下FPGA在微軟云azure中的應(yīng)用。

Azure stack edge

微軟在邊緣做了產(chǎn)品布局,依據(jù)邊緣的規(guī)模,提供了兩類產(chǎn)品。一類是針對(duì)計(jì)算任務(wù)繁重的企業(yè)用戶,其提供了基于GPU和FPGA的Pro設(shè)備,能夠?qū)崿F(xiàn)邊緣端的數(shù)據(jù)預(yù)處理,包括聚合數(shù)據(jù),修改數(shù)據(jù)等,以及運(yùn)行ML模型。另外一類是針對(duì)隨時(shí)移動(dòng)的用戶,提供了小而便攜的設(shè)備。這些設(shè)備使用了intel針對(duì)視覺處理專門研發(fā)的VPU芯片。雖然在2024年基于FPGA的pro設(shè)備將停用,而遷移到基于GPU的設(shè)備上。但是VPU芯片的出現(xiàn),反映了在邊緣計(jì)算應(yīng)用中,F(xiàn)PGA所發(fā)生的可能轉(zhuǎn)變。在多變的邊緣目標(biāo)上,小芯片能夠更有針對(duì)性的保留有效的計(jì)算資源,這樣精簡(jiǎn)了結(jié)構(gòu),降低了功耗。Intel VPU是集成了Leon處理器,12個(gè)SHAVE計(jì)算核以及一個(gè)DRAM的SoC結(jié)構(gòu)。SHAVE是一個(gè)向量處理器,能夠進(jìn)行大量的向量運(yùn)算。所以VPU能夠適合運(yùn)行ML模型,以及進(jìn)行一些圖像處理方面的工作。目前VPU能夠支持21種神經(jīng)網(wǎng)絡(luò)算子,包括conv,relu等。這些神經(jīng)網(wǎng)絡(luò)可以通過其編譯器工具NCAPI轉(zhuǎn)化為可以在VPU中執(zhí)行的指令。目前能夠支持inception,mobilenet,googlenet,ssd,alexnet等很多卷積和LSTM網(wǎng)絡(luò)。

5fac2114-edce-11ec-ba43-dac502259ad0.png

超算中心的FPGA

微軟在數(shù)據(jù)中心系統(tǒng)性的構(gòu)建了一個(gè)FPGA集群,這個(gè)FPGA集群能夠?qū)崿F(xiàn)內(nèi)部和外部server的互聯(lián)。在頂層軟件的分配調(diào)度下,可以執(zhí)行多種不同的任務(wù),包括web search ranking, deep neural networks, expensive compression等。

5fc6bbaa-edce-11ec-ba43-dac502259ad0.png

FPGA集群的基本結(jié)構(gòu)如上圖所示:包括了兩塊CPU和一塊altera的FPGA芯片。FPGA通過PCIE和一個(gè)NIC來和兩塊CPU進(jìn)行通信。NIC保證了FPGA可以實(shí)現(xiàn)原位處理網(wǎng)絡(luò)數(shù)據(jù)包。FPGA之間還通過ToR實(shí)現(xiàn)互聯(lián),ToR保證了一個(gè)任務(wù)能夠被分割為多個(gè)子任務(wù),然后分配給多個(gè)FPGA處理。在邏輯層面,F(xiàn)PGA定義了Lightweight Transport Layer(LTL)和Elastic Router(ER)。LTL實(shí)現(xiàn)了不同的FPGA芯片之間的互聯(lián),這樣保證了遠(yuǎn)程FPGA之間的通信,使得整個(gè)FPGA集群處于一個(gè)整體中。ER是用于同一個(gè)FPGA芯片中不同任務(wù)的互聯(lián)。LTL和ER的混合使用能夠靈活的為FPGA分配不同任務(wù),滿足數(shù)據(jù)中心任務(wù)多樣性需求。ToR形成了三層結(jié)構(gòu),L0層連接了24個(gè)FPGA設(shè)備,L1連接了960個(gè)設(shè)備,L2級(jí)可能連接了超過幾百萬的設(shè)備。L0級(jí)的round-trip延時(shí)大概在2.8us,L1級(jí)平均在7.7us,而L2級(jí)在22us。

5fef0a42-edce-11ec-ba43-dac502259ad0.png

FPGA架構(gòu)

微軟的神經(jīng)網(wǎng)絡(luò)加速器主要是針對(duì)單batch低延遲來設(shè)計(jì)的,其所期望的是能夠最大限度的將weight緩存在片上,通過將一個(gè)大的網(wǎng)絡(luò)進(jìn)行分割,分配到多個(gè)FPGA芯片上實(shí)現(xiàn)。其分割的子網(wǎng)絡(luò)的權(quán)重大小可以適配一顆FPGA芯片上weight的緩存空間。架構(gòu)將計(jì)算重點(diǎn)放在矩陣-向量乘法上,這個(gè)也是合理的,因?yàn)長(zhǎng)STM,CNN網(wǎng)絡(luò)大部分計(jì)算量都由矩陣乘法承擔(dān)。其它函數(shù)運(yùn)算,包括向量加法,乘法,sigmoid,tanh等函數(shù),則統(tǒng)一到同一個(gè)多功能函數(shù)模塊中。這樣做的好處是簡(jiǎn)化了FPGA架構(gòu),同時(shí)也簡(jiǎn)化了數(shù)據(jù)流。因此其整個(gè)架構(gòu)中沒有多端口共享的memory,不存在對(duì)多數(shù)據(jù)訪問沖突的處理。同時(shí)也簡(jiǎn)化了指令,消除了對(duì)指令依賴關(guān)系的判斷和檢測(cè)。FPGA架構(gòu)中有對(duì)指令的進(jìn)一步分解和處理,所以軟件端的指令非常簡(jiǎn)單,就是通過C語(yǔ)言的宏定義實(shí)現(xiàn)的。

600c6024-edce-11ec-ba43-dac502259ad0.png

其矩陣向量乘法結(jié)構(gòu)是由多個(gè)dot-product結(jié)構(gòu)組成的,多個(gè)dot-product和累加器形成了一個(gè)tile,然后多個(gè)tile就構(gòu)成了一個(gè)大的矩陣向量乘法。

602429fc-edce-11ec-ba43-dac502259ad0.png

603e6902-edce-11ec-ba43-dac502259ad0.png

軟件結(jié)構(gòu)

神經(jīng)網(wǎng)絡(luò)加速器的工具鏈包括:CNTK(微軟自定義的一個(gè)指令級(jí)描述),tensorflow或者caffe的圖文件作為輸入,然后通過前端轉(zhuǎn)化為IR表示,然后依據(jù)網(wǎng)絡(luò)大小以及FPGA中資源情況對(duì)圖進(jìn)行分割和優(yōu)化,然后產(chǎn)生硬件可執(zhí)行指令。如果網(wǎng)絡(luò)較大,那么網(wǎng)絡(luò)可以被分割成多個(gè)子圖,部署到不同F(xiàn)PGA上。如果一個(gè)矩陣乘法過大,那么可以被分割成多塊來實(shí)現(xiàn)。對(duì)于不可實(shí)現(xiàn)的神經(jīng)網(wǎng)絡(luò)算子,工具鏈可以將多個(gè)不可實(shí)現(xiàn)算子組合成一個(gè)子圖,在CPU上完成。

60564c98-edce-11ec-ba43-dac502259ad0.png

引用

1accelerating artificial intelligence bing whitepaper

2Cloud Scale Acceleration Architecture

3A Configurable Cloud-ScaleDNN Processor for Real-Time AI

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22412

    瀏覽量

    636400
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11279

    瀏覽量

    225024

原文標(biāo)題:FPGA在microsoft azure的應(yīng)用

文章出處:【微信號(hào):zhuyandz,微信公眾號(hào):FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    SD-WAN 專線:為亞馬遜微軟訪問提速的核心邏輯

    前言隨著全球化業(yè)務(wù)的深入推進(jìn),越來越多國(guó)內(nèi)企業(yè)選擇亞馬遜(AWS)、微軟Azure)等國(guó)際公有服務(wù)部署核心業(yè)務(wù)。無論是跨境電商的平臺(tái)
    的頭像 發(fā)表于 03-05 15:00 ?577次閱讀
    SD-WAN 專線:為亞馬遜<b class='flag-5'>云</b>、<b class='flag-5'>微軟</b><b class='flag-5'>云</b>訪問提速的核心邏輯

    微軟Azure數(shù)據(jù)中心國(guó)際版全面對(duì)接NVIDIA Rubin平臺(tái)

    2026年CES大會(huì)見證了NVIDIA Rubin問世,而微軟Azure數(shù)據(jù)中心(國(guó)際版)憑借前瞻戰(zhàn)略已實(shí)現(xiàn)全面對(duì)接。通過散熱與網(wǎng)絡(luò)領(lǐng)域的超前布局,Azure(國(guó)際版)將系統(tǒng)化方法與
    的頭像 發(fā)表于 03-03 09:56 ?258次閱讀

    AMD與微軟與西門子合作加速軟件定義汽車發(fā)展

    AMD 日前宣布推出新功能,旨在依托微軟 Azure平臺(tái)上的云端仿真和數(shù)字孿生技術(shù),支持汽車軟件的前移式開發(fā)。通過采用前移式開發(fā)方法,OEM 廠商和一級(jí)供應(yīng)商能夠提升開發(fā)效率、降低開發(fā)風(fēng)險(xiǎn),并加速軟件定義汽車的上市進(jìn)程。
    的頭像 發(fā)表于 01-23 09:15 ?1975次閱讀

    Azure安全基礎(chǔ)知識(shí):構(gòu)建上防護(hù)體系

    前言計(jì)算為現(xiàn)代企業(yè)帶來了靈活性與效率,同時(shí)也對(duì)安全防護(hù)提出了更高要求。MicrosoftAzure提供了一系列全面的安全基礎(chǔ)服務(wù)與實(shí)踐指南,幫助組織云端構(gòu)建穩(wěn)固的防御體系。一、安全事件響應(yīng)與業(yè)務(wù)
    的頭像 發(fā)表于 01-09 13:23 ?194次閱讀
    <b class='flag-5'>Azure</b>安全基礎(chǔ)知識(shí):構(gòu)建<b class='flag-5'>云</b>上防護(hù)體系

    Arm架構(gòu)助力Azure Cobalt 100虛擬機(jī)工作負(fù)載性能提升

    自從微軟推出基于 Arm 架構(gòu)的 Azure Cobalt 100 虛擬機(jī) (VM) 以來,已有眾多客戶選擇這款新實(shí)例運(yùn)行各類用例。目前,Cobalt 100 虛擬機(jī)已在全球微軟 Azure
    的頭像 發(fā)表于 12-15 14:42 ?660次閱讀
    Arm架構(gòu)助力<b class='flag-5'>Azure</b> Cobalt 100虛擬機(jī)工作負(fù)載性能提升

    微軟全新AI超級(jí)工廠Fairwater亞特蘭大落成

    微軟正式發(fā)布位于美國(guó)喬治亞州亞特蘭大的 Azure AI 數(shù)據(jù)中心 Fairwater 站點(diǎn)。全新的數(shù)據(jù)中心將與威斯康星州的首個(gè) Fairwater 站點(diǎn)、前幾代 AI 超級(jí)計(jì)算機(jī)以及全球 Azure 數(shù)據(jù)中心深度互聯(lián),共同構(gòu)建
    的頭像 發(fā)表于 12-09 17:31 ?734次閱讀

    工業(yè)MQTT上網(wǎng)關(guān)有哪些應(yīng)用場(chǎng)景

    場(chǎng)景描述 :智能制造、能源管理等領(lǐng)域,大量分散的工業(yè)設(shè)備(如PLC、傳感器、數(shù)控機(jī)床)需實(shí)時(shí)數(shù)據(jù)采集與遠(yuǎn)程監(jiān)控。 網(wǎng)關(guān)作用 :通過MQTT協(xié)議,網(wǎng)關(guān)將設(shè)備數(shù)據(jù)高效上傳至平臺(tái)(如阿里、華為
    的頭像 發(fā)表于 11-27 11:22 ?495次閱讀

    行業(yè)觀察 | Azure、RDP、NTLM 均現(xiàn)高危漏洞,微軟發(fā)布2025年8月安全更新

    微軟2025年8月的“補(bǔ)丁星期二”發(fā)布了針對(duì)Windows、Office、SQLServer、Exchange、Azure等產(chǎn)品的107個(gè)漏洞的修復(fù)更新。本月更新包含:?1個(gè)已公開披露的零日漏洞
    的頭像 發(fā)表于 08-25 17:48 ?2356次閱讀
    行業(yè)觀察 | <b class='flag-5'>Azure</b>、RDP、NTLM 均現(xiàn)高危漏洞,<b class='flag-5'>微軟</b>發(fā)布2025年8月安全更新

    奧比光助力2025年國(guó)際詠春拳大賽智能化升級(jí)

    Femto Bolt是奧比光與微軟聯(lián)合打造的先進(jìn)iToF 3D相機(jī),被微軟官方推薦為Azure Kinect DK的理想替代方案,不僅具備與微軟
    的頭像 發(fā)表于 08-15 15:09 ?1438次閱讀

    FPGA機(jī)器學(xué)習(xí)的具體應(yīng)用

    ,越來越多地被應(yīng)用于機(jī)器學(xué)習(xí)任務(wù)。本文將探討 FPGA 機(jī)器學(xué)習(xí)的應(yīng)用,特別是加速神經(jīng)網(wǎng)絡(luò)推理、優(yōu)化算法和提升處理效率方面的優(yōu)勢(shì)。
    的頭像 發(fā)表于 07-16 15:34 ?2900次閱讀

    PLL技術(shù)FPGA的動(dòng)態(tài)調(diào)頻與展頻功能應(yīng)用

    隨著現(xiàn)代電子系統(tǒng)的不斷發(fā)展,時(shí)鐘管理成為影響系統(tǒng)性能、穩(wěn)定性和電磁兼容性(EMI)的關(guān)鍵因素之一。FPGA設(shè)計(jì),PLL因其高精度、靈活性和可編程性而得到廣泛應(yīng)用,本文將深入探討PLL技術(shù)
    的頭像 發(fā)表于 06-20 11:51 ?2637次閱讀
    PLL技術(shù)<b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>中</b>的動(dòng)態(tài)調(diào)頻與展頻功能應(yīng)用

    LanzaJet拓展與微軟的合作關(guān)系,助力全球業(yè)務(wù)增長(zhǎng)

    領(lǐng)先的下一代燃料技術(shù)公司和可持續(xù)燃料生產(chǎn)商LanzaJet, Inc.,今天宣布與微軟達(dá)成新協(xié)議,選用Microsoft Azure作為其首選平臺(tái)。 該協(xié)議標(biāo)志著LanzaJet與微軟
    的頭像 發(fā)表于 06-18 13:52 ?777次閱讀

    微軟 Build 2025大會(huì):筑牢智能體時(shí)代的安全新防線

    微軟Build 2025大會(huì)上,微軟宣布通過Microsoft Azure AI Foundry(國(guó)際版)、Microsoft Purview與Microsoft Defender的
    的頭像 發(fā)表于 06-04 09:44 ?5374次閱讀
    <b class='flag-5'>微軟</b> Build 2025大會(huì):筑牢智能體時(shí)代的安全新防線

    微軟Microsoft Azure AI Foundry國(guó)際版的十大技術(shù)突破

    當(dāng)傳統(tǒng)軟件開發(fā)還在以“季度”為單位迭代時(shí),Microsoft Azure Al Foundry(國(guó)際版)正掀起一場(chǎng)效率革命:通過整合代碼、協(xié)作與的全棧平臺(tái),幫助開發(fā)者幾天內(nèi)完成從創(chuàng)意到生產(chǎn)的全
    的頭像 發(fā)表于 05-29 16:28 ?1757次閱讀

    Arm攜手微軟共筑計(jì)算和PC未來

    計(jì)算平臺(tái)并從中受益。無論是 Microsoft Azure 的云端還是 Windows on Arm PC 的邊緣側(cè),開發(fā)者可以在任何地方加速其應(yīng)用和工作負(fù)載。
    的頭像 發(fā)表于 05-28 14:08 ?948次閱讀