国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

簡述FPGA在microsoft azure的應用

FPGA之家 ? 來源:賽靈思電子科技(北京) ? 作者: moon ? 2021-06-01 11:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著5G通信技術的發展,云計算和邊緣計算業務也將快速增長。由于云計算多樣性和邊緣環境復雜性的特點,將決定了在CPUGPUFPGAASIC中,不會只有一種芯片存在。所以FPGA一定可以尋找到它的應用方向。相較于其它幾種芯片,FPGA具有以下幾種優勢:

1 靈活可編程。FPGA是以LUT作為基本結構的器件,可以根據需求的變化對其擦除重寫,運行新的程序。

2 高帶寬。FPGA芯片有很多高速管腳,可以連接多顆DRAM,產生較高的帶寬。

3 復雜的數據處理能力。FPGA能夠有針對性的處理邏輯關系復雜的程序,這相比于CPU,GPU等依賴指令處理數據的芯片有優勢,因為它能夠做到更低的延遲。

FPGA也存在以下劣勢限制了它的發展:

1 編程復雜,開發周期較長。RTL的開發包括了架構設計,RTL代碼,仿真驗證,上板調試。一個項目的周期往往是軟件開發的幾倍,團隊規模也較大。這些既提高了開發成本,又沒法適應不斷迭代的產品需求。

2 粗粒度硬件結構導致資源利用率低。FPGA達不到100%的資源利用率,這是對資源的一種浪費,體現在經濟上是提高了成本。

以上兩方面都可以歸結到成本這一點上,但是如果能夠解決1問題,那么2問題也就迎刃而解了。因為如果FPGA的市場應用多了,那么其制造成本也會下降。1問題的解決一直在路上,但是一直沒有解決。HLS等類似軟件編程語言的出現可以提高FPGA的開發效率,但是相比于純軟件開發語言還是存在一定復雜性。而相對于RTL語言來說,HLS語言的硬件描述性不夠鮮明。所以硬件開發人員更多的會選擇硬件描述清晰的verilog,system Verilog等語言。

這些缺點并不意味著我們對FPGA在未來AI應用中抱著悲觀的想法,一個是未來場景的復雜性和多樣性,一個是FPGA也在尋求改進和發展。第一個決定了FPGA一定能夠在AI中活下去,第二個決定了FPGA在AI中活的怎么樣。

接下來我們來了解一下FPGA在微軟云azure中的應用。

Azure stack edge

微軟在邊緣做了產品布局,依據邊緣的規模,提供了兩類產品。一類是針對計算任務繁重的企業用戶,其提供了基于GPU和FPGA的Pro設備,能夠實現邊緣端的數據預處理,包括聚合數據,修改數據等,以及運行ML模型。另外一類是針對隨時移動的用戶,提供了小而便攜的設備。這些設備使用了intel針對視覺處理專門研發的VPU芯片。

雖然在2024年基于FPGA的pro設備將停用,而遷移到基于GPU的設備上。但是VPU芯片的出現,反映了在邊緣計算應用中,FPGA所發生的可能轉變。在多變的邊緣目標上,小芯片能夠更有針對性的保留有效的計算資源,這樣精簡了結構,降低了功耗。

Intel VPU是集成了Leon處理器,12個SHAVE計算核以及一個DRAM的SoC結構。SHAVE是一個向量處理器,能夠進行大量的向量運算。所以VPU能夠適合運行ML模型,以及進行一些圖像處理方面的工作。目前VPU能夠支持21種神經網絡算子,包括conv,relu等。這些神經網絡可以通過其編譯器工具NCAPI轉化為可以在VPU中執行的指令。目前能夠支持inception,mobilenet,googlenet,ssd,alexnet等很多卷積和LSTM網絡。

超算中心的FPGA

微軟在數據中心系統性的構建了一個FPGA集群,這個FPGA集群能夠實現內部和外部server的互聯。在頂層軟件的分配調度下,可以執行多種不同的任務,包括web search ranking, deep neural networks, expensive compression等。

FPGA集群的基本結構如上圖所示:包括了兩塊CPU和一塊altera的FPGA芯片。FPGA通過PCIE和一個NIC來和兩塊CPU進行通信。NIC保證了FPGA可以實現原位處理網絡數據包。FPGA之間還通過ToR實現互聯,ToR保證了一個任務能夠被分割為多個子任務,然后分配給多個FPGA處理。

在邏輯層面,FPGA定義了Lightweight Transport Layer(LTL)和Elastic Router(ER)。LTL實現了不同的FPGA芯片之間的互聯,這樣保證了遠程FPGA之間的通信,使得整個FPGA集群處于一個整體中。ER是用于同一個FPGA芯片中不同任務的互聯。LTL和ER的混合使用能夠靈活的為FPGA分配不同任務,滿足數據中心任務多樣性需求。

ToR形成了三層結構,L0層連接了24個FPGA設備,L1連接了960個設備,L2級可能連接了超過幾百萬的設備。L0級的round-trip延時大概在2.8us,L1級平均在7.7us,而L2級在22us。

FPGA架構

微軟的神經網絡加速器主要是針對單batch低延遲來設計的,其所期望的是能夠最大限度的將weight緩存在片上,通過將一個大的網絡進行分割,分配到多個FPGA芯片上實現。其分割的子網絡的權重大小可以適配一顆FPGA芯片上weight的緩存空間。架構將計算重點放在矩陣-向量乘法上,這個也是合理的,因為LSTM,CNN網絡大部分計算量都由矩陣乘法承擔。

其它函數運算,包括向量加法,乘法,sigmoid,tanh等函數,則統一到同一個多功能函數模塊中。這樣做的好處是簡化了FPGA架構,同時也簡化了數據流。因此其整個架構中沒有多端口共享的memory,不存在對多數據訪問沖突的處理。同時也簡化了指令,消除了對指令依賴關系的判斷和檢測。FPGA架構中有對指令的進一步分解和處理,所以軟件端的指令非常簡單,就是通過C語言的宏定義實現的。

其矩陣向量乘法結構是由多個dot-product結構組成的,多個dot-product和累加器形成了一個tile,然后多個tile就構成了一個大的矩陣向量乘法。

軟件結構

神經網絡加速器的工具鏈包括:CNTK(微軟自定義的一個指令級描述),tensorflow或者caffe的圖文件作為輸入,然后通過前端轉化為IR表示,然后依據網絡大小以及FPGA中資源情況對圖進行分割和優化,然后產生硬件可執行指令。如果網絡較大,那么網絡可以被分割成多個子圖,部署到不同FPGA上。如果一個矩陣乘法過大,那么可以被分割成多塊來實現。對于不可實現的神經網絡算子,工具鏈可以將多個不可實現算子組合成一個子圖,在CPU上完成。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22412

    瀏覽量

    636335
  • 云計算
    +關注

    關注

    39

    文章

    8021

    瀏覽量

    144413
  • 高帶寬
    +關注

    關注

    0

    文章

    49

    瀏覽量

    7945
  • 邊緣計算
    +關注

    關注

    22

    文章

    3527

    瀏覽量

    53453

原文標題:FPGA在microsoft azure的應用

文章出處:【微信號:zhuyandz,微信公眾號:FPGA之家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    微軟Azure數據中心國際版全面對接NVIDIA Rubin平臺

    2026年CES大會見證了NVIDIA Rubin問世,而微軟Azure數據中心(國際版)憑借前瞻戰略已實現全面對接。通過散熱與網絡領域的超前布局,Azure(國際版)將系統化方法與Rubin架構
    的頭像 發表于 03-03 09:56 ?249次閱讀

    微軟Microsoft Copilot Studio智能體平臺全面升級

    近期,微軟lgnite大會重磅宣布Microsoft Copilot Studio全面升級,集成智能體構建、自動化與治理,支持多模型和跨平臺集成,強化安全與可控性。企業可一站式打造高效、合規,且可擴展的智能體系統,推動流程重塑與創新,加速AI技術價值實際業務中的落地轉化
    的頭像 發表于 12-09 17:36 ?1305次閱讀

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構建高性能AI應用

    Microsoft Ignite 2025 大會上,隨著 Microsoft SQL Server 2025 的發布,AI 就緒型企業數據庫愿景成為現實,為開發者提供強大的新工具,例如內置向量
    的頭像 發表于 12-01 09:31 ?799次閱讀
    使用NVIDIA Nemotron RAG和<b class='flag-5'>Microsoft</b> SQL Server 2025構建高性能AI應用

    Microsoft Azure Cobalt 200 開啟AI時代Arm架構計算新紀元

    人工智能 (AI) 時代,行業已從通用型現成系統向定制化基礎設施發生顯著轉型。從傳統網絡服務到可擴展數據分析,再到大規模模型推理,各類工作負載如今均已融入 AI 驅動的智能處理鏈路中。現代
    的頭像 發表于 11-29 20:12 ?1855次閱讀

    Esri推出適用于Microsoft Fabric的最新ArcGIS集成功能

    加州雷德蘭茲--位置智能領域的全球領導者Esri今日宣布,ArcGIS GeoAnalytics for Microsoft Fabric正式全面可用。同時進入公開預覽階段的還有ArcGIS
    的頭像 發表于 11-20 16:01 ?1118次閱讀

    如何利用Verilog HDLFPGA上實現SRAM的讀寫測試

    本篇將詳細介紹如何利用Verilog HDLFPGA上實現SRAM的讀寫測試。SRAM是一種非易失性存儲器,具有高速讀取和寫入的特點。FPGA中實現SRAM讀寫測試,包括設計SRA
    的頭像 發表于 10-22 17:21 ?4345次閱讀
    如何利用Verilog HDL<b class='flag-5'>在</b><b class='flag-5'>FPGA</b>上實現SRAM的讀寫測試

    如何使用 NuMaker 板和 Mbed OS 上的連接字符串連接到 Azure IoT?

    使用 NuMaker 板和 Mbed OS 上的連接字符串連接到 Azure IoT
    發表于 09-04 07:46

    舵機原理簡述!

    舵機原理簡述 舵機是一種高精度的位置伺服執行機構,廣泛應用于機器人關節、無人機舵面控制、航模操控等場景,其核心功能是通過接收控制信號,精確驅動輸出軸旋轉到指定角度并保持穩定。以下從結構組成、控制
    的頭像 發表于 08-22 10:57 ?1886次閱讀

    微軟正式發布Microsoft行星計算機專業版

    地理空間數據雖賦能能源、農業、零售等多領域,卻因復雜性與數據孤島問題長期局限于專家群體。微軟正式發布Microsoft行星計算機專業版,通過Microsoft Azure(國際版)整合AI技術分析能力,實現海量數據從采集、處理到
    的頭像 發表于 08-19 14:31 ?1151次閱讀

    Microsoft Edge瀏覽器iOS端插件功能上線

    最新發布的 139 版本中,Microsoft Edge 瀏覽器 iOS 端正式支持插件功能!與此同時,Microsoft Edge 安卓端的插件數量已躍升至近 30 款。廣告攔截、雙語翻譯、資源下載……你的手機瀏覽器,也能擁
    的頭像 發表于 08-19 14:29 ?1762次閱讀

    PLL技術FPGA中的動態調頻與展頻功能應用

    隨著現代電子系統的不斷發展,時鐘管理成為影響系統性能、穩定性和電磁兼容性(EMI)的關鍵因素之一。FPGA設計中,PLL因其高精度、靈活性和可編程性而得到廣泛應用,本文將深入探討PLL技術
    的頭像 發表于 06-20 11:51 ?2630次閱讀
    PLL技術<b class='flag-5'>在</b><b class='flag-5'>FPGA</b>中的動態調頻與展頻功能應用

    微軟 Build 2025大會:筑牢智能體時代的安全新防線

    微軟Build 2025大會上,微軟宣布通過Microsoft Azure AI Foundry(國際版)、Microsoft Purview與M
    的頭像 發表于 06-04 09:44 ?5365次閱讀
    微軟 Build 2025大會:筑牢智能體時代的安全新防線

    微軟Microsoft Azure AI Foundry國際版的十大技術突破

    當傳統軟件開發還在以“季度”為單位迭代時,Microsoft Azure Al Foundry(國際版)正掀起一場效率革命:通過整合代碼、協作與云的全棧平臺,幫助開發者幾天內完成從創意到生產的全
    的頭像 發表于 05-29 16:28 ?1751次閱讀

    如何從 Microsoft Visual C++ 應用程序 (CyAPI.h) 訪問 CYUSB3014 芯片組的 i2c 接口?

    1. 如何從 Microsoft Visual C++ 應用程序 (CyAPI.h) 訪問 CYUSB3014 芯片組的 i2c 接口? 我定制相機中使用 CYUSB3014。 當我開發我的相機
    發表于 05-19 07:21

    DXC攜手SAP與Microsoft,簡化并加速企業轉型

    DXC Complete攜手SAP與Microsoft,助力企業Microsoft Azure上部署RISE with SAP、GROW with SAP和SAP Business
    的頭像 發表于 05-09 15:04 ?677次閱讀
    DXC攜手SAP與<b class='flag-5'>Microsoft</b>,簡化并加速企業轉型