国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Achronix新一代嵌入式FPGA IP為AI/ML和網絡硬件加速應用帶來更高性能

獨愛72H ? 來源:劉林華 ? 作者:電子發燒友 ? 2018-12-23 16:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2016年,Achronix推出的Speedcore成為首款向客戶出貨的嵌入式FPGA(eFPGA)IP,使客戶將FPGA功能集成到他們的SoC中成為可能。由于Speedcore IP是專為計算和網絡加速應用而設計的,并基于Speedster22i FPGA系列相同的高性能架構,采用Speedcore作為硬件加速器的方案被廣泛應用到數據中心通信基礎設施等領域。據了解,eFPGA IP授權業務在過去兩年間快速增長,2017年,已經占到Achronix FPGA整體營收的20%,而2018年,憑借其顯著的功耗和成本優勢,eFPGA IP授權業務比重進一步提高。

本月,Achronix宣布推出第四代嵌入式FPGA產品Speedcore Gen4 eFPGA IP。較前代產品,Speedcore Gen4將性能提高了60%、功耗降低了50%、芯片面積減少65%,同時保留了原有的Speedcore eFPGA IP的功能,即可將可編程硬件加速功能引入廣泛的計算、網絡和存儲應用,實現接口協議橋接/轉換、算法加速和數據包處理。

圖:Speedcore 7t較前代產品性能顯著提升

據Achronix市場營銷副總裁Steve Mensor介紹,創新的架構使這些性能提升成為可能。與上一代Speedcore產品相比,新的Speedcore Gen4架構實現了多項創新,從而可將系統整體性能提高60%。其中查找表的所有方面都得到了增強,以支持使用最少的資源來實現各種功能,從而可縮減面積和功耗并提高性能。其中的更改包括將ALU的大小加倍、將每個LUT的寄存器數量加倍、支持7位函數和一些8位函數、以及為移位寄存器提供的專用高速連接。

圖:Achronix市場營銷副總裁Steve Mensor

Speedcore Gen4的路由架構也借由一種獨立的專用總線路由結構得到了增強。此外,在該路由結構中還有專用的總線多路復用器,可有效地創建分布式的、運行時可配置的交換網絡。這為高帶寬和低延遲應用提供了最佳的解決方案,并在業界首次實現了將網絡優化應用于FPGA互連。

圖:Speedcore Gen4架構為高性能總線提供了專用路由

易用性也是eFPGA的特色之一,降低了客戶集成FPGA加速器的門檻??蛻敉ㄟ^定制其邏輯、RAMDSP資源需求,Achronix接下來就會為其配置滿足其需求的Speedcore IP,Speedcore查找表(LUT)、RAM單元模塊和DSP64單元模塊可以像樂高積木一樣進行組合,以便為特定的應用創建優化的可編程功能。

根據艾瑞咨詢的數據,2020年全球人工智能市場規模約1190億人民幣,未來10年,人工智能將會是一個2000億美元的市場,空間非常巨大。

在人工智能領域,傳統的芯片計算架構已無法支撐深度學習等大規模并行計算的需求,這就需要新的底層硬件來更好地儲備數據、加速計算過程。其中,FPGA等用于性能加速的硬件、神經網絡芯片、傳感器與中間件,則是支撐人工智能的前提。新的Speedcore Gen4可謂最佳的人工智能/機器學習加速器。Achronix機器學習處理器(MLP)利用了人工智能/機器學習處理的特定屬性,并將這些應用的性能提高了300%。這是通過多種架構性創新來實現的,這些創新可以同時提高每個時鐘周期的性能和操作次數。

MLP是一個完整的人工智能/機器學習計算引擎,支持定點和多個浮點數格式和精度。每個機器學習處理器包括一個循環寄存器文件,它用來存儲重用的權重或數據。各個機器學習處理器與相鄰的機器學習處理器單元模塊和更大的存儲單元模塊緊密耦合,以提供最高的處理性能、每秒最高的操作次數和最低的功率分集。這些機器學習處理器支持各種定點和浮點格式,包括Bfloat16、16位、半精度、24位和單元塊浮點。用戶可以通過為其應用選擇最佳精度來實現精度和性能的均衡。

為了補充機器學習處理器并提高人工智能/機器學習的計算密度,Speedcore Gen4查找表(LUT)可以實現比任何獨立FPGA芯片產品高出兩倍的乘法器。領先的獨立FPGA芯片在21個查找表可以中實現6x6乘法器,而Speedcore Gen4僅需在11個LUT中就可實現相同的功能,并可在1 GHz的速率上工作。

GSMA智庫發布的最新的全球物聯網市場報告顯示,包括連接、應用、平臺與服務,到2025年全球物聯網市場規模將達到1.1萬億美元。數十億物聯網設備的出現,將給傳統網絡和計算基礎設施帶來壓力。固定和無線網絡帶寬的急劇增加,加上處理能力向邊緣等進行重新分配。這種新的處理范式意味著每秒將有數十億到數萬億次的運算。傳統云和企業數據中心計算資源和通信基礎設施無法跟上數據速率的指數級增長、快速變化的安全協議、以及許多新的網絡和連接要求。傳統的多核CPU和SoC無法在沒有輔助的情況下獨立滿足這些要求,因而它們需要硬件加速器,通常是可重新編程的硬件加速器,用來預處理和卸載計算,以便提高系統的整體計算性能。經過優化后的Speedcore Gen4 eFPGA已經可以滿足這些應用需求。

Steve Mensor告訴21IC記者,現有已量產的Speedcore架構,Achronix可在6周內為客戶配置并提供Speedcore eFPGA IP和支持文件。而最新采用臺積電7nm工藝節點的Speedcore Gen4將于2019年上半年投入量產,芯片設計企業現已可以聯系Achronix,以獲得支持其特定需求的Speedcore Gen4實例。此外Achronix還將于2019年下半年提供用于臺積電16nm和12nm工藝節點的Speedcore Gen4 eFPGA IP。據Steve Mensor預測,憑借Speedcore Gen4 eFPGA的功耗和成本優勢,人工智能/機器學習和高數據帶寬應用的爆炸式需求將推動其在邊緣計算、5G、網絡加速和計算加速等領域被廣泛采納,2019年,eFPGA IP授權業務有望達到Achronix FPGA整體營收的50%甚至更多。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22411

    瀏覽量

    636279
  • 硬件加速
    +關注

    關注

    0

    文章

    33

    瀏覽量

    11426
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    FPGA硬件加速卡設計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高卡, XCKU115, 光纖采集卡, 信號計算板, 硬件加速
    的頭像 發表于 02-12 09:52 ?386次閱讀
    <b class='flag-5'>FPGA</b><b class='flag-5'>硬件加速</b>卡設計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速</b>卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    文掌握瑞芯微RK系列NPU算子支持全景:覆蓋6大平臺,新增硬件加速算子,嵌入式AI開發不踩坑

    嵌入式 AI 領域,瑞芯微(Rockchip)RK 系列 NPU 憑借低功耗、高兼容性的特性,廣泛應用于智能監控、邊緣計算、物聯網設備等場景。近期發布的《RKNN Compiler Support
    的頭像 發表于 02-06 16:33 ?1033次閱讀
    <b class='flag-5'>一</b>文掌握瑞芯微RK系列NPU算子支持全景:覆蓋6大平臺,新增<b class='flag-5'>硬件加速</b>算子,<b class='flag-5'>嵌入式</b><b class='flag-5'>AI</b>開發不踩坑

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標準嵌入式開發板

    LLM-8850KitLLM-8850Kit是款面向邊緣AI嵌入式計算場景的高性能AI加速
    的頭像 發表于 01-30 16:11 ?1029次閱讀
    新品 | LLM-8850 Kit,<b class='flag-5'>高性能</b><b class='flag-5'>AI</b><b class='flag-5'>加速</b>卡套件 DinMeter v1.1,1/32DIN標準<b class='flag-5'>嵌入式</b>開發板

    arm嵌入式主板優缺點

    設備里面做控制、數據處理使用的CPU板。般作為工控主板使用。   ARM處理器是種16/32位的嵌入式RISC微處理器,具有低成本、高性能、低功耗的特點。ARM9系列微處理器具有
    發表于 01-08 07:08

    重磅合作!Quintauris 聯手 SiFive,加速 RISC-V 在嵌入式AI 領域落地

    據科技區角報道半導體解決方案提供商 Quintauris 最近宣布和 RISC-V 處理器 IP 領域的頭部廠商 SiFive 達成戰略合作,目標直接瞄準加速 RISC-V 在嵌入式、AI
    發表于 12-18 12:01

    嵌入式硬件設計解析

    、高可靠性的無線通信模塊;在人工智能應用中,需要設計高性能、低功耗的神經網絡加速器;在5G應用中,需要設計高速、低延遲的數據處理電路等。 總之,嵌入式
    發表于 12-02 08:22

    嵌入式FPGA的區別

    嵌入式軟件開發,主要與嵌入式cao作系統、應用軟件等有關。第二是嵌入式硬件開發,需要掌握硬件
    發表于 11-20 07:12

    嵌入式FPGA的區別

    ,FPGA憑借硬件并行處理能力,能夠實現納秒級響應,遠優于微秒級的嵌入式系統。 功耗效率上,嵌入式系統針對特定應用優化后能效比很高,而FPGA
    發表于 11-19 06:55

    常用硬件加速的方法

    之前總結了些常用硬件加速方法 1)面積換速度:也就是串轉并運算,可以多個模塊同時計算; 2)時間換空間:時序收斂下通過頻率提高性能,雖然面積可能稍微加大點; 3)流水線操作:流水線以面積換
    發表于 10-29 06:20

    硬件加速模塊的時鐘設計

    硬件加速模塊的每層涉及到多位數定點數乘法的運算需要調用dsp這個ip核,dsp處理數據的時鐘信號為clk_c,dsp輸出數據需要四個clk_c的時鐘周期。 clk_n : clk_n
    發表于 10-23 07:28

    新一代嵌入式開發平臺 AMD嵌入式軟件和工具2025.1版現已推出

    AMD 2025.1 版嵌入式軟件和工具是面向新一代嵌入式系統開發而打造的綜合平臺,全面加速概念構想到部署落地。 2025.1 版嵌入式軟件
    的頭像 發表于 08-20 09:15 ?3976次閱讀

    AMD 2025.1版嵌入式軟件和工具的新增功能

    AMD 2025.1 版嵌入式軟件和工具是面向新一代嵌入式系統開發而打造的綜合平臺,全面加速概念構想到部署落地。
    的頭像 發表于 08-15 15:32 ?1265次閱讀

    適用于數據中心和AI時代的800G網絡

    持續優化800G網絡解決方案,一代1.6T數據中心鋪平道路,助力數據中心迎接更高性能、更智能化的時代挑戰。 ? *文章來源于飛速(FS)社區 ?
    發表于 03-25 17:35

    Banana Pi 發布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    RZ/V2N——近期在嵌入式世界2025上新發布, AI 計算、嵌入式系統及工自動化提供強大支持。這款全新的計算平臺旨在滿足開發者和企業用戶對高性
    發表于 03-19 17:54

    嵌入式AI加速器DRP-AI 詳細介紹

    深度神經網絡中使用的人工智能(AI)已經IT領域提供了新的價值。雖然很多人期望用AI來實現嵌入式應用,但
    的頭像 發表于 03-15 16:13 ?1804次閱讀
    <b class='flag-5'>嵌入式</b><b class='flag-5'>AI</b><b class='flag-5'>加速</b>器DRP-<b class='flag-5'>AI</b> 詳細介紹