10月16日,XDF(賽靈思開發者大會)在北京國際飯店舉行。作為業界最權威、最具深度的FPGA交流大會之一,Xilinx把行業最頂尖的FPGA專家和企業匯聚一堂,集思廣益,分享和交流FPGA產品開發經驗與應用方案。
Xilinx CEOVictor Peng 、華為IT智能計算業務副總裁張小華、阿里云FPGA異構計算研發總監張振祥等業內領袖出席。同時,在會上,賽靈思推出了業界首款自適應計算加速平臺Versal和加速器Alveo。
作為Xilinx在中國智能汽車電子領域唯一的Certified member,深圳市自行科技有限公司(簡稱:自行科技)受邀參加,公司聯合創始人兼CTO諶璟博士在現場分享了“基于FPGA的計算機視覺系統設計與開發”的主題演講。諶璟博士結合其多年的深度學習與FPGA開發經驗,從性能、成本、開發難度等多個維度出發,提出一套系統化的FPGA深度神經網絡優化流程。
圖:自行科技聯合創始人兼CTO諶璟博士做主題演講
諶博認為,CNN與FPGA的結合可以組合利用多種算法模塊,充分發揮FPGA在計算速度、功耗、成本等方面的優勢,降低開發難度與周期,減少開發成本。但是CNN中存在大量冗余計算,因此如何在FPGA中實現CNN加速設計就尤為重要。
圖:諶璟博士演講獲得現場嘉賓觀眾好評
自行科技通過多年CNN與FPGA自主研發經驗,開發出業內領先性價比的FPGA加速設計方案。會中,她表示,FPGA加速設計需要算法工程師和FPGA工程師共同參與。
一方面,通過剪枝壓縮、權值壓縮等方法對網絡壓縮算法進行優化,以減少網絡冗余計算,釋放可用資源。例如,我們可以僅僅將少數“重要”的卷積核量化為8bit權值,其余卷積核用1bit權值表示,構造混合精度網絡,在確保網絡檢測性能的基礎上大幅度提高計算效率。
另一方面,不同的FPGA架構需要適配對應的CNN網絡結構,因此需要有針對性地進行并行化和結構化設計,讓計算模塊得到充分利用,避免大量計算資源閑置。同時,在進行網絡設計時還要充分利用FPGA片內資源,避免DSP計算資源與邏輯資源的浪費。
以SSD網絡為例,在不考慮其他操作帶來的時延(DDR時延、FSM狀態轉移時延~等)的情況下,Xilinx zynq7020在CNN計算幀率最高可達5.7fps;但是,自行科技通過權值壓縮、并行化設計等CNN網絡加速設計和算法優化后,計算幀率提升了4-5倍,大大提高了芯片的運行效率。
最后,諶博總結到:“FPGA與CNN的結合具備廣泛的應用前景,但是在開發的過程中也需要我們不斷克服困難和挑戰。當前FPGA平臺技術與工具不斷迭代更新,這就需要我們時刻關注世界最前沿的技術。今天我非常高興在現場見證了業界首款自適應計算加速平臺Versal ACAP以及新一代FPGA加速器卡Alveo。這不僅可以加快公司軟硬件迭代創新進程,還為我們探索更優秀的FPGA加速方案提供了思路。未來,隨著CNN的計算量不斷上升,數據吞吐量也會顯著增大,這就需要不斷提高FPGA片內BRAM資源利用效率,深入研究CNN模型壓縮算法,優化基于FPGA的CNN框架,這也需要行業共同的努力!”
目前,該方案已經成功應用于公司的三大產品:前向ADAS系統、駕駛員監控(DMS)系統和智能環視影像系統,產品都已順利實現量產。基于FPGA平臺與CNN算法的深度結合,自行科技率先開發出國內首款基于深度學習技術的駕駛員監控(DMS)系統,打造出業內功能最全面、性價比最高的駕駛員監控(DMS)系統,成為國內駕駛員監控系統標桿企業。
除此之外,自行科技前向ADAS系統與智能環視影像系統以其可靠的目標檢測準確性和語義分割精度獲得國內眾多傳統車廠(乘用車與商用車)、新能源和互聯網造車公司和Tier1汽車零部件供應商的高度認可。相信隨著FPGA開發技術的不斷成熟,CNN加速設計將獲得更廣泛的應用。
更多自行科技的 ADAS解決方案信息:www.autocruis.com
附:賽靈思發布7nm 自適應計算加速平臺Versal及新一代FPGA加速器Alveo
2018年10月16日,FPGA大廠賽靈思(Xilinx)在北京召開了一年一度的“Xilinx開發者大會 ”(XDF) 。在本次會議上,賽靈思發布了全球首款自適應計算加速平臺 (Adaptive Compute Acceleration Platform ,ACAP)芯片系列Versal。與此同時,賽靈思還針對云端和本地數據中心市場還發布了一款功能強大的加速器卡——Alveo。

-
加速器
+關注
關注
2文章
839瀏覽量
40106 -
賽靈思
+關注
關注
33文章
1798瀏覽量
133435 -
深度學習
+關注
關注
73文章
5599瀏覽量
124398
原文標題:自行科技CTO諶璟博士出席賽靈思開發者大會,推出FPGA CNN加速設計方案
文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
AMD Alveo MA35D加速器:開啟大規模交互式流媒體新時代
工業級-專業液晶圖形顯示加速器RA8889ML3N簡介+顯示方案選型參考表
邊緣計算中的AI加速器類型與應用
AMD Versal自適應SoC內置自校準的工作原理
高壓放大器驅動:基于FPGA的SPGD自適應光學控制平臺的探索
創客總部加入MathWorks加速器計劃
Arm神經技術是業界首創在 Arm GPU 上增添專用神經加速器的技術,移動設備上實現PC級別的AI圖形性能
Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴展 NVMe? RAID 存儲解決方案
粒子加速器?——?科技前沿的核心裝置
AMD第二代Versal AI Edge和Versal Prime系列加速量產 為嵌入式系統實現單芯片智能
利用AMD VERSAL自適應SoC的設計基線策略
Versal 600G DCMAC Subsystem LogiCORE IP產品指南
第二代AMD Versal Premium系列SoC滿足各種CXL應用需求
面向AI與機器學習應用的開發平臺 AMD/Xilinx Versal? AI Edge VEK280
小型加速器中子源監測系統解決方案
賽靈思推出了業界首款自適應計算加速平臺Versal和加速器Alveo
評論