前言背景
近期,經過龍芯中科與NCNN社區的共同努力,在NCNN中使用龍架構(LoongArch)向量優化實現了大部分算子,得益于龍架構向量的高效實現,優化后NCNN在平臺上各項性能測試比通用實現普遍提升一倍以上。

基于龍架構向量優化開啟前后的NCNN各項性能對比
(豎軸為耗時高度,越高耗時越久,性能越低)
NCNN作為業界首個為移動端優化的神經網絡前向計算框架,在2017年首次開源,是騰訊優圖實驗室第一次對外公開深度學習的研究成果。目前多應用在圖像方面,例如人像自動美顏,照片風格化,超分辨率,物體識別等等。NCNN計算框架,因其高性能、無第三方依賴、跨平臺支持大部分常見CNN網絡的特點,是許多開發者在移動端、嵌入式設備上部署深度學習算法的首選框架。

龍架構向量優化加入NCNN生態社區
本次優化共產出3萬多行代碼,成果將應用于龍芯AI邊緣計算場景,完成基于龍架構平臺的特征識別、圖像處理、人臉識別等模型的部署和推理,如門禁系統、手勢識別、口罩檢測等等。依托于NCNN計算框架優秀的低耦結構,開發者只需關注算子在龍架構平臺上的高效實現,無需考慮整個系統結構問題,實現更高效的開發與部署工作。前期,NCNN與龍芯CPU進行了較為全面的適配和性能優化,共同打通了AI應用和國產CPU硬件間的壁壘。
可搭載NCNN框架的龍芯AI邊緣計算場景
龍芯中科將與NCNN社區保持密切合作,繼續根據龍架構平臺向量特點不斷優化算子,推進龍架構生態成果落地更多場景、服務更多領域、歡迎社區廣大開發者與龍芯中科一道共建自主開放的龍架構生態體系。
審核編輯:湯梓紅
-
神經網絡
+關注
關注
42文章
4838瀏覽量
107770 -
AI
+關注
關注
91文章
39793瀏覽量
301407 -
龍芯中科
+關注
關注
0文章
366瀏覽量
8543
原文標題:龍架構向量創新賦能AI圖像識別計算,促進NCNN神經網絡前向計算框架性能翻倍
文章出處:【微信號:gh_53fadbdbd4d4,微信公眾號:龍芯中科】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
龍架構向量創新賦能AI圖像識別計算,促進NCNN神經網絡前向計算框架性能翻倍
評論