作為加速云數據中心的重要組件,FPGA已經開始了它在數據中心領域的廣泛使用。除了像微軟、亞馬遜這樣的大型云服務提供商之外,FPGA也逐漸開始進入其他類型和規模的數據中心,并在大數據處理、AI、網絡功能加速等領域扮演者重要的角色。
(圖片來自英特爾)
在這些基于大數據浪潮的全新應用中,FPGA廠商也在不斷的探索和嘗試新的FPGA推廣方法。他們的最終目的非常簡單,就是讓更多的用戶使用自己的FPGA產品。但在這個過程中,我們可以發現一個重要的發展趨勢,那就是FPGA廠商正在逐漸的從單純的芯片提供商,轉變為系統級解決方案提供商。
回首過去,在傳統的FPGA業務模型里,FPGA廠商通常只負責賣給客戶兩樣東西:一個是FPGA芯片,另外一個是FPGA的開發工具。兩件東西一旦售出,客戶開發何種應用就與廠商無關。雖然廠商也會提供詳盡的技術支持,但主要的開發過程往往還是由客戶完成。
如今,FPGA廠商更傾向于提供給客戶一個完整的系統級解決方案。兩大FPGA廠商英特爾和賽靈思目前紛紛推出的各類FPGA加速卡,就是這個趨勢的典型代表。
總體而言,FPGA廠商在硬件層面已經不單單提供芯片級的產品,而是進一步提供板卡級的產品組合。與開發板不同,FPGA加速卡是針對特定領域和應用的專業板卡,通常以PCIe擴展卡的方式進行部署。板卡上設計有豐富的高速I/O接口與存儲資源,但往往不會配備太多開發板上常見的調試功能與資源,例如通用I/O等。
在軟件層面,FPGA廠商除了提供傳統的開發套件之外,現在還會提供與FPGA加速卡配套的驅動、各類軟件庫、編程接口(API),甚至還有下文會提到的完整的軟件開發棧以及軟硬件參考設計。
通過提供這些完整的開發環境,大大簡化了FPGA的開發難度,使得軟件開發人員也能在短時間內完成算法模型的FPGA實現。FPGA廠商的主要目的,是在不斷提供原廠軟硬件解決方案的同時,也在不斷吸收第三方的IP與應用,從而構建一個完整的FPGA生態系統。
同時我們也注意到,除了FPGA原廠的加速卡方案之外,很多第三方廠家,比如華為、浪潮和Mellanox等,也相繼推出了各自的FPGA加速卡產品。這些第三方加速卡雖然采用的都是英特爾或賽靈思的FPGA芯片,但都針對各自的細分領域做了優化設計,以適應目標應用的需要。
在下文中,我將詳細介紹一下當前在市場上主要的FPGA加速卡產品,以及各個廠商基于加速卡的FPGA生態系統布局。
英特爾的FPGA加速卡布局
早在2017年10月,英特爾就官宣了旗下的首款FPGA加速卡產品,名為“Programmable Acceleration Card”,簡稱PAC。同時發布的,還有與之配套的軟硬件開發框架與加速棧系統。這不僅是英特爾FPGA的首款通用FPGA加速卡產品,也是當時市場上的首款面向大數據、AI、高新能計算等新興領域的數據中心FPGA加速卡,因此PAC的意義非同小可。
(圖片來自英特爾)
在硬件規格方面,PAC使用了英特爾的Arria10 GX FPGA,它基于英特爾的20納米工藝制造,擁有115萬個可編程邏輯單元,是當時性能和容量最強大的英特爾FPGA。PAC集成了8GB的DDR4內存和128MB閃存,有一個QSFP+接口,能滿足最高40Gbps的網絡連接帶寬,同時有PCIe Gen3 x8接口與主機CPU互聯。

(圖片來自英特爾)
值得注意的是,PAC的板級功耗約為45W~60W,因此得以采用了被動散熱設計,從而將板卡的尺寸控制在了半高半長,方便在各類服務器的部署。
PAC的主要應用場景是加速數據中心的各類應用,作為英特爾的原廠產品,PAC在數據中心里有著得天獨厚的優勢。它天生可以作為英特爾Xeon處理器的硬件加速單元,用于卸載和加速原本在CPU上實現的各類應用,從而構成英特爾CPU+FPGA的高性能數據處理組合。
作為生態系統構建的重要組成部分,英特爾還發布了面向Xeon和FPGA的加速堆棧(Acceleration Stack),見下圖。這個加速堆棧本質上是一個軟件開發框架,包含了FPGA板卡的驅動、API、接口管理、軟件庫與開發工具等,從而為CPU與FPGA的聯合開發提供了通用的編程接口,簡化了開發流程,縮短了開發時間。

(圖片來自英特爾)
為了向軟件開發者進一步抽象底層的FPGA硬件資源,英特爾開源了名為“開放可編程加速引擎(Open Programmable Acceleration Engine - OPAE)”的技術。OPAE是一個層次化模型,提供了一系列標準的軟件接口,以及常見硬件功能的FPGA實現,比如各類寄存器與內存分配邏輯等等。同時,也提供了很多操作系統內核空間的FPGA支持,使得開發者可以專注于用戶空間的應用開發。

(圖片來自英特爾)
PAC發布一年后,英特爾在2018年10月發布了另一款基于Statix10 SX FPGA的加速卡。相比前一代產品,這款加速卡在硬件性能上有了質的飛越。Stratix10作為英特爾的高端FPGA系列,基于英特爾的14納米工藝制造,并采用了3D系統級封裝技術,有著更高的集成度。在這款PAC采用的Stratix10 FPGA上,有280萬可編程邏輯單元,244Mb片上內存以及高達26Gbps的串行收發器。
(圖片來自英特爾)
板上資源方面,這款PAC包含32GB DDR4內存、兩個最高支持100Gbps網絡帶寬的QSFP28接口,以及PCIe Gen3 x16接口。由于這個板卡面向更高性能的數據中心應用,因此在功耗和尺寸方面都有所增加,其中板級功耗約為225W,尺寸為全高、3/4長的雙槽設計。
(圖片來自英特爾)
在2019年MWC大會的第一天,英特爾又推出了一款針對5G應用的FPGA加速卡PAC N3000,見下圖。這款加速卡可以實現高達100Gbps的網絡流量的加速處理,同時支持9GB DDR4和144MB QDR IV板上內存。
(圖片來自英特爾)
對于英特爾的FPGA加速卡產品而言,它們最大的優勢之一就是英特爾在數據中心處理器領域的核心支配地位。由于英特爾Xeon處理器占據了數據中心市場的x86處理器的絕大部分市場份額,因此無論何家的FPGA加速卡都必須針對Xeon處理器做大量的兼容性設計和優化,而英特爾FPGA在這方面有著先天的血統優勢。這也使得英特爾成為目前唯一一個能夠提供全棧式數據中心解決方案的公司。
此外,英特爾與各大服務器制造商保持著良好的合作關系,因此包括戴爾、HPE、富士通等服務器制造商會很自然的在自家的服務器產品中加入并銷售基于英特爾FPGA的加速卡。然而,這對于其他FPGA廠商而言就沒有那么水到渠成,他們往往很難說服服務器廠商或者客戶在已經內置了FPGA的服務器中,再花費額外的成本,并冒著兼容性的風險去添加其他的FPGA加速器。
-
英特爾
+關注
關注
61文章
10301瀏覽量
180470 -
FPGA芯片
+關注
關注
4文章
250瀏覽量
41008
原文標題:【歷史】從芯片到系統:FPGA加速卡的發展歷程與展望
文章出處:【微信號:TechSugar,微信公眾號:TechSugar】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
愛立信攜手蘋果和聯發科技加速構建6G生態系統
FPGA硬件加速卡設計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片
吉方工控亮相2025英特爾技術創新與產業生態大會
創芯賦能智能生態!匯頂科技亮相2025英特爾技術創新與產業生態大會
硬件與應用同頻共振,英特爾Day 0適配騰訊開源混元大模型
主控CPU全能選手,英特爾至強6助力AI系統高效運轉
英特爾發布全新GPU,AI和工作站迎來新選擇
英特爾以系統級代工模式促進生態協同,助力客戶創新
英特爾持續推進核心制程和先進封裝技術創新,分享最新進展
英特爾代工:明確重點廣合作,服務客戶鑄信任
Intel-Altera FPGA:通信行業的加速引擎,開啟高速互聯新時代
英特爾先進封裝:助力AI芯片高效集成的技術力量
英特爾借助開放生態系統,加速邊緣AI創新
英特爾基于加速卡的FPGA生態系統布局
評論