前言
為什么說(shuō)邊緣計(jì)算帶來(lái)了數(shù)據(jù)、計(jì)算的根本變化?
邊緣AI是邊緣計(jì)算最重要的應(yīng)用之一,它的挑戰(zhàn)是什么?
一個(gè)用于邊緣計(jì)算場(chǎng)景的新型AI服務(wù)部署平臺(tái)——Astraea是如何誕生的?
如何通過(guò)Astraea一鍵化部署邊緣AI服務(wù)?
近日,阿里云邊緣計(jì)算團(tuán)隊(duì)博士后付哲的論文《Astraea: Deploy AI Services at the Edge in Elegant Ways》入選2020年IEEE邊緣計(jì)算國(guó)際會(huì)議(IEEE International Conference on Edge Computing),并在大會(huì)上進(jìn)行了宣講。他和他的團(tuán)隊(duì)如何看待以上問(wèn)題,本文將為您解答。
邊緣計(jì)算:5G時(shí)代對(duì)云網(wǎng)融合的挑戰(zhàn)
近年來(lái),邊緣計(jì)算已經(jīng)成為信息和通信技術(shù)中最熱門(mén)的研究領(lǐng)域之一。隨著5G時(shí)代的到來(lái),越來(lái)越多的設(shè)備連接到互聯(lián)網(wǎng)上,伴隨著視頻直播、云游戲、VR/AR、自動(dòng)駕駛等帶寬消耗和延遲敏感的應(yīng)用,給云計(jì)算帶來(lái)了巨大的挑戰(zhàn)。
邊緣計(jì)算支持分布式計(jì)算模式,將計(jì)算和數(shù)據(jù)資源轉(zhuǎn)移到靠近最終用戶(hù)的邊緣節(jié)點(diǎn),從而為新時(shí)代的創(chuàng)新應(yīng)用提供高帶寬、低延遲和大規(guī)模連接能力。
邊緣計(jì)算帶來(lái)了數(shù)據(jù)、計(jì)算分布的根本變化。5G有以下特性:eMBB(增強(qiáng)型移動(dòng)寬帶)、uRLLC(超可靠低延遲通信)、mMTC(大規(guī)模機(jī)器類(lèi)型通信)。這些特性驅(qū)動(dòng)著越來(lái)越多的數(shù)據(jù)和計(jì)算從云端轉(zhuǎn)移到邊緣。有行業(yè)報(bào)告表示:在5G時(shí)代,80%數(shù)據(jù)和計(jì)算將發(fā)生在邊緣。
邊緣 AI 是邊緣計(jì)算的重要應(yīng)用之一
與此同時(shí),邊緣人工智能越來(lái)越受到人們的關(guān)注。Gartner去年的一份報(bào)告顯示,Edge-AI正從其幼年期走向頂峰,預(yù)計(jì)將在2-5年內(nèi)達(dá)到成熟期。我們時(shí)常在媒體報(bào)道中看到如下說(shuō)法:邊緣人工智能是下一波人工智能,人工智能是邊緣計(jì)算中最常見(jiàn)的負(fù)載,人工智能是邊緣計(jì)算的殺手級(jí)應(yīng)用,等等。
人工智能的思維方式與人類(lèi)的思維方式非常相似。一個(gè)人從過(guò)去發(fā)生的事情中吸取教訓(xùn),從而得到終身的教訓(xùn),如果有新的問(wèn)題,他/她可能會(huì)從他/她以前學(xué)到的教訓(xùn)中得到解決辦法。就像人類(lèi)所做的一樣,人工智能模型是從訓(xùn)練數(shù)據(jù)中訓(xùn)練出來(lái)的,如果有新的數(shù)據(jù),模型就會(huì)輸出結(jié)果。第一階段稱(chēng)為訓(xùn)練,第二階段稱(chēng)為推理。訓(xùn)練和推理是人工智能的兩個(gè)主要階段。
訓(xùn)練階段需要大量的計(jì)算能力,因?yàn)樗枰罅康木仃嚦朔ê偷壹词故褂?a href="http://www.3532n.com/tags/gpu/" target="_blank">GPU這樣的硬件加速,對(duì)于復(fù)雜的模型通常也需要幾個(gè)小時(shí)或幾天的時(shí)間。推理階段需要相對(duì)較低的響應(yīng)時(shí)間,特別是對(duì)于某些對(duì)延遲敏感的應(yīng)用程序,如自動(dòng)駕駛等等。推理的整個(gè)過(guò)程應(yīng)該在不到1秒甚至更短的時(shí)間內(nèi)完成。隨著神經(jīng)網(wǎng)絡(luò)越來(lái)越深入和復(fù)雜,海量的計(jì)算資源需求爆發(fā),在移動(dòng)設(shè)備上進(jìn)行人工智能推理變得越來(lái)越困難。
云-邊-端計(jì)算任務(wù)卸載與協(xié)作
新興的邊緣計(jì)算范式帶來(lái)了一個(gè)更好的解決方案,將人工智能服務(wù)的部分計(jì)算遷移到邊緣,以緩解延遲和帶寬瓶頸。這存在兩個(gè)關(guān)鍵問(wèn)題:第一個(gè)問(wèn)題是是否將任務(wù)從云或終端設(shè)備卸載到邊緣,第二個(gè)問(wèn)題是如何以適當(dāng)?shù)姆绞綄⑷蝿?wù)分配給云、邊緣和終端設(shè)備。
我們?cè)O(shè)P為終端設(shè)備、邊緣服務(wù)器和云服務(wù)器的處理能力,C為計(jì)算任務(wù)量,D為需要傳輸?shù)臄?shù)據(jù),B為終端設(shè)備與邊緣節(jié)點(diǎn)或中心云之間的帶寬。如果等式(1)成立,將計(jì)算從終端設(shè)備遷移到邊緣服務(wù)器可以減少響應(yīng)時(shí)間。如果等式(2)成立,則將計(jì)算遷移到邊緣服務(wù)器后的性能優(yōu)于遷移到中心云。
但是,邊緣AI依舊存在痛點(diǎn)和難點(diǎn)。主要包含以下三個(gè)方面:
難部署
AI框架種類(lèi)眾多,算法模型難以直接部署到生產(chǎn)環(huán)境,提供服務(wù)調(diào)用接口
邊緣資源類(lèi)型異構(gòu),不同AI服務(wù)對(duì)資源需求不同
難運(yùn)維
生產(chǎn)環(huán)境的 AI 服務(wù)需要支持服務(wù)生命全周期管理,包括版本升級(jí)、灰度發(fā)布、狀態(tài)監(jiān)測(cè)、自動(dòng)擴(kuò)縮容等等
難調(diào)度
邊緣計(jì)算是典型的分布式系統(tǒng),需要為終端用戶(hù)選擇合適的邊緣資源提供邊緣AI服務(wù),同時(shí)在用戶(hù)體驗(yàn)、算力成本和流量成本上做到最優(yōu)權(quán)衡
人工智能模型的開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家通常不知道或不太關(guān)心他們的模型在生產(chǎn)環(huán)境中是如何服務(wù)的。例如,在邊緣部署模型時(shí),必須考慮到不同框架的AI模型需要不同的部署方式,同時(shí)也需要一個(gè)API服務(wù)器將AI模型對(duì)外提供給終端用戶(hù)。此外,邊緣人工智能服務(wù)還需要全生命周期管理的能力,包括版本升級(jí)、灰度發(fā)布、自動(dòng)縮放等,以及靈活的調(diào)度能力,以?xún)?yōu)化用戶(hù)體驗(yàn)、計(jì)算成本和流量成本之間的權(quán)衡。
Astraea的誕生
因此,阿里云邊緣計(jì)算團(tuán)隊(duì)提出了Astraea — 一個(gè)適用于邊緣計(jì)算場(chǎng)景的新型AI服務(wù)部署平臺(tái),它簡(jiǎn)化了部署階段,同時(shí)充分利用了邊緣計(jì)算的優(yōu)勢(shì)。一個(gè)AI服務(wù)開(kāi)發(fā)者只需提交模型、相關(guān)調(diào)用腳本和邊緣資源需求,Astraea負(fù)責(zé)鏡像構(gòu)建、資源分配、模型服務(wù)和狀態(tài)監(jiān)測(cè)等全過(guò)程,最終提供標(biāo)準(zhǔn)的Restful API供終端設(shè)備使用。
Astraea具有以下優(yōu)點(diǎn)。首先,Astraea的用戶(hù)只需要提交不到10行的模板配置,Astraea能夠在1分鐘時(shí)間內(nèi)構(gòu)建映像,在5分鐘時(shí)間內(nèi)完成服務(wù)邊緣部署。其次,Astraea支持Scikit learn、TensorFlow、Pythorch、ONNX等多個(gè)人工智能框架,可以一鍵化為AI服務(wù)自動(dòng)生成Restful API。借助Astraea以及阿里云邊緣節(jié)點(diǎn)服務(wù),AI服務(wù)可以下沉到距離用戶(hù)10公里的范圍內(nèi)。同時(shí),Astraea基于阿里云邊緣節(jié)點(diǎn)服務(wù)能力實(shí)現(xiàn)運(yùn)維自動(dòng)化。
如何通過(guò)Astraea一鍵化部署邊緣AI服務(wù)
左側(cè)對(duì)圖像進(jìn)行分類(lèi)的推理示例,右側(cè)邊緣資源需求示例文件。用戶(hù)只需輸入astraea build和astraea deploy命令,這個(gè)AI服務(wù)就自動(dòng)部署在指定的邊緣節(jié)點(diǎn)上,并為用戶(hù)提供可被調(diào)用的Restful API。用戶(hù)可以方便地調(diào)用這個(gè)API來(lái)對(duì)圖像進(jìn)行分類(lèi)。
基于Astraea,可以實(shí)現(xiàn)另外一項(xiàng)邊緣AI服務(wù):實(shí)時(shí)車(chē)牌檢測(cè)服務(wù)。
使用Raspberry Pi 4和相適配的攝像頭作為終端設(shè)備,利用5G CPE提供網(wǎng)絡(luò)連接,并使用Astraea部署邊緣AI服務(wù)。由視頻可以看到,通過(guò)將推理轉(zhuǎn)移到邊緣節(jié)點(diǎn),我們?cè)赗aspberry Pi 4上能夠?qū)崿F(xiàn)幾乎實(shí)時(shí)的車(chē)牌識(shí)別能力。
Astraea項(xiàng)目設(shè)計(jì)和架構(gòu)
模型開(kāi)發(fā)人員只需要提交三項(xiàng)文件:第一個(gè)文件是AI模型,無(wú)論它依賴(lài)于哪個(gè)機(jī)器學(xué)習(xí)框架;第二個(gè)文件是用來(lái)表示如何調(diào)用模型以及返回的輸出數(shù)據(jù)格式的腳本文件;第三個(gè)文件用來(lái)表示AI服務(wù)的元信息(包括名稱(chēng)、版本、API端口等)和邊緣計(jì)算資源的需求,包括CPU、GPU、內(nèi)存大小和AI服務(wù)要覆蓋的地理區(qū)域。
Astraea能夠自動(dòng)分析提交的文件,封裝模型并提供Restful API調(diào)用能力,構(gòu)建容器映像并將其推送到邊緣容器倉(cāng)庫(kù)。Astraea同時(shí)解析資源需求,并相應(yīng)地在指定的邊緣節(jié)點(diǎn)中運(yùn)行邊緣AI服務(wù)。
Astraea基于邊緣節(jié)點(diǎn)服務(wù)平臺(tái)實(shí)現(xiàn)以下能力:
鏡像倉(cāng)庫(kù):作為邊緣AI鏡像的儲(chǔ)存?zhèn)}庫(kù),并提供鏡像分發(fā)加速能力
應(yīng)用發(fā)布:提供邊緣AI服務(wù)的一鍵部署和灰度發(fā)布功能
監(jiān)測(cè)運(yùn)維:負(fù)責(zé)邊緣AI容器狀態(tài)監(jiān)測(cè)和相關(guān)日志服務(wù)
關(guān)于Astraea的實(shí)驗(yàn)測(cè)評(píng)
阿里云邊緣計(jì)算團(tuán)隊(duì)通過(guò)在低性能終端設(shè)備上實(shí)現(xiàn)實(shí)時(shí)對(duì)象識(shí)別服務(wù)來(lái)評(píng)估Astraea。在實(shí)驗(yàn)中,選擇Raspberry Pi 4作為終端設(shè)備,YOLOv3模型來(lái)識(shí)別圖像或視頻中的物體。模型的權(quán)重是在云中預(yù)先訓(xùn)練的,因?yàn)榕c邊緣節(jié)點(diǎn)或終端設(shè)備相比,中心云數(shù)據(jù)中心有更大的能力來(lái)訓(xùn)練模型。同時(shí),在實(shí)驗(yàn)中,選擇了位于中國(guó)杭州的邊緣節(jié)點(diǎn)(配有Tesla V100 GPU)。
實(shí)驗(yàn)架構(gòu):

實(shí)驗(yàn)過(guò)程中,終端設(shè)備(Raspberry Pi)捕獲圖像,調(diào)用Astraea提供的web服務(wù)API來(lái)獲得識(shí)別結(jié)果,最后將結(jié)果顯示在原始圖像上。作為比較,在第二個(gè)實(shí)驗(yàn)中,我們?cè)诮K端設(shè)備處理所有目標(biāo)識(shí)別的任務(wù)。
實(shí)驗(yàn)中測(cè)試了不同大小、不同分辨率下的檢測(cè)性能。如圖所示,在Raspberry Pi 4上的目標(biāo)識(shí)別時(shí)間平均為20秒左右,這對(duì)于實(shí)時(shí)目標(biāo)識(shí)別來(lái)說(shuō)是無(wú)法接受的。如果使用Astraea在邊緣節(jié)點(diǎn)部署目標(biāo)識(shí)別服務(wù),推理時(shí)間平均小于0.1秒。即使算上從終端設(shè)備到邊緣節(jié)點(diǎn)的網(wǎng)絡(luò)傳輸時(shí)間,該方案平均可以節(jié)省98.5%的時(shí)間。因此,當(dāng)目標(biāo)識(shí)別任務(wù)中的推理階段被卸載到邊緣節(jié)點(diǎn)時(shí),終端用戶(hù)感覺(jué)到識(shí)別速度比終端設(shè)備單機(jī)方案快25~110倍。此外,我們還測(cè)試了視頻中的實(shí)時(shí)目標(biāo)識(shí)別,結(jié)論是相比Raspberry Pi本身處理幀速率提升了50倍。

結(jié)論
在本項(xiàng)工作中,阿里云邊緣計(jì)算團(tuán)隊(duì)提出了邊緣 AI 部署項(xiàng)目 Astraea,提供從 AI 算法模型到邊緣云部署的一站式解決方案,解決模型開(kāi)發(fā)者“算法落地”和“部署運(yùn)維”兩方面的難題。Astraea 能夠自動(dòng)化地完成 AI 服務(wù)在邊緣節(jié)點(diǎn)的部署,將 AI 模型的推理過(guò)程轉(zhuǎn)化為 Restful API 接口供終端用戶(hù)調(diào)用,提供低時(shí)延、省帶寬、廣覆蓋、易運(yùn)維的邊緣 AI 服務(wù)。實(shí)驗(yàn)結(jié)果表明,通過(guò)計(jì)算任務(wù)的卸載和協(xié)同,邊緣AI服務(wù)相較于傳統(tǒng)方法能夠得到25倍至110倍的性能提升。
原文標(biāo)題:IEEE EDGE 2020論文:Astraea — 以?xún)?yōu)雅的方式在邊緣部署AI服務(wù)
文章出處:【微信公眾號(hào):中山市物聯(lián)網(wǎng)協(xié)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301349 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265261 -
5G
+關(guān)注
關(guān)注
1367文章
49148瀏覽量
616233 -
邊緣計(jì)算
+關(guān)注
關(guān)注
22文章
3527瀏覽量
53432
原文標(biāo)題:IEEE EDGE 2020論文:Astraea — 以?xún)?yōu)雅的方式在邊緣部署AI服務(wù)
文章出處:【微信號(hào):ZS-IOT,微信公眾號(hào):中山市物聯(lián)網(wǎng)協(xié)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Helm包管理與模板化部署實(shí)戰(zhàn)
結(jié)合AI算法的邊緣計(jì)算服務(wù)器,在城市管理場(chǎng)景有什么作用?
工業(yè)視覺(jué)網(wǎng)關(guān):RK3576賦能多路檢測(cè)與邊緣AI
告別多設(shè)備!揭秘QM系列閃測(cè)儀如何一鍵搞定多元檢測(cè)
AI 邊緣計(jì)算網(wǎng)關(guān):開(kāi)啟智能新時(shí)代的鑰匙?—龍興物聯(lián)
為何邊緣設(shè)備正成為AI的新重心
邊緣AI實(shí)現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署
邊緣AI實(shí)現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署
ESP8266燒錄與機(jī)智云一鍵配網(wǎng)教程
全新上線IPC精彩時(shí)刻!配套On-App AI視頻剪輯模板+全天候一鍵抓拍
一鍵自動(dòng)升降,DZ-TGA201開(kāi)啟熱重分析智能化
如何通過(guò)Astraea一鍵化部署邊緣AI服務(wù)?
評(píng)論