摘 要 :為實(shí)現(xiàn)電梯困人故障的應(yīng)急處置快速響應(yīng),縮短現(xiàn)場(chǎng)故障原因排查時(shí)間,促進(jìn)排障模式由人工經(jīng)驗(yàn)向數(shù)據(jù)支撐下的智能診斷轉(zhuǎn)變,利用梯度提升樹算法(GBDT)建立電梯故障原因預(yù)測(cè)模型。經(jīng)過(guò)數(shù)據(jù)清洗和特征提取,以 2015—2020 年南京市累積電梯故障數(shù)據(jù)進(jìn)行模型訓(xùn)練。與真實(shí)值對(duì)比后的預(yù)測(cè)結(jié)果表明,前三位故障原因?qū)崟r(shí)預(yù)測(cè)準(zhǔn)確率可達(dá) 81%,評(píng)估指標(biāo)優(yōu)于同類型機(jī)器學(xué)習(xí)算法。GBDT 模型預(yù)測(cè)性可適用于電梯困人故障數(shù)據(jù)稀疏、特征量不明顯的預(yù)測(cè)問(wèn)題。
0 引 言
電梯與人們的日常出行緊密關(guān)聯(lián),已成為特種設(shè)備安全工作的著力重點(diǎn)和關(guān)鍵一環(huán) [1]。如何在降低設(shè)備故障停梯率的同時(shí)高效應(yīng)對(duì)故障,是電梯安全監(jiān)管和應(yīng)急處置中亟須解決的核心問(wèn)題。大數(shù)據(jù)浪潮下,金融、工業(yè)、公共服務(wù)等領(lǐng)域已有大量成功應(yīng)用案例 [2-5]。大數(shù)據(jù)在特種設(shè)備安全監(jiān)管與應(yīng)急救援中的應(yīng)用場(chǎng)景十分豐富 [6],如救援路徑規(guī)劃、救援站點(diǎn)布局優(yōu)化、易發(fā)故障電梯屬性歸納等。對(duì)特種設(shè)備故障大數(shù)據(jù)進(jìn)行挖掘分析,可以盡早發(fā)現(xiàn)設(shè)備故障隱患,排查治理甚至預(yù)測(cè)故障發(fā)生概率,進(jìn)而為故障處置和監(jiān)管決策供參考。
目前,關(guān)于電梯故障原因預(yù)測(cè)的研究多集中于部件特定故障的診斷 [7-10],主要基于少樣本(數(shù)百臺(tái))設(shè)備的物聯(lián)網(wǎng)監(jiān)測(cè)數(shù)據(jù)。王麗園 [11] 建立了多種電梯運(yùn)行數(shù)據(jù)分析模型,用異常分類模型實(shí)時(shí)監(jiān)控電梯狀態(tài)。沈志鵬 [12] 將循環(huán)神經(jīng)網(wǎng)絡(luò)和擴(kuò)張因果卷積網(wǎng)絡(luò)相結(jié)合,提出一種新的時(shí)間序列預(yù)測(cè)模型,預(yù)測(cè)電梯部件未來(lái)是否發(fā)生異常。朱明等 [13] 建立了電梯故障率受環(huán)境溫度、濕度影響的 GM(1,N)預(yù)測(cè)模型。
支猛等 [14] 提出了一種基于 BP 神經(jīng)網(wǎng)絡(luò)和遺傳算法的預(yù)測(cè)模型,對(duì)電梯門系統(tǒng)故障進(jìn)行預(yù)測(cè)。姜宇迪等 [15] 提出了基于長(zhǎng)短期記憶網(wǎng)絡(luò)自編碼器和時(shí)間序列回歸模型的電梯制動(dòng)器監(jiān)測(cè)和故障預(yù)警方法。胡海博 [16] 基于社區(qū)電梯系統(tǒng)歷史維保數(shù)據(jù),利用粒子群聚類預(yù)測(cè)模型,實(shí)現(xiàn)了電梯小樣本數(shù)據(jù)故障預(yù)測(cè)。
自 2015 年起,在南京、杭州、廣州等地的示范帶動(dòng)下,電梯應(yīng)急處置服務(wù)平臺(tái)在全國(guó)范圍內(nèi)推廣建設(shè)。在履行科學(xué)調(diào)度、快速解救的首要職能之外,平臺(tái)積累了大量設(shè)備的困人故障數(shù)據(jù),蘊(yùn)藏了豐富故障特征,具有數(shù)據(jù)分析的基礎(chǔ)和挖掘價(jià)值。本文基于南京市 2015—2020 年 41 414 起電梯困人故障數(shù)據(jù),構(gòu)建故障特征數(shù)據(jù)集,利用梯度提升樹算法(GBDT)建立電梯故障原因預(yù)測(cè)模型,以 CART 決策樹為基學(xué)習(xí)器,預(yù)測(cè)下一次故障時(shí)最可能的故障原因,并與其他集成學(xué)習(xí)方法進(jìn)行對(duì)比,驗(yàn)證方法的效果與優(yōu)勢(shì)。
1 預(yù)測(cè)模型構(gòu)建流程及數(shù)據(jù)預(yù)處理
電梯故障原因數(shù)據(jù)屬性為標(biāo)稱數(shù)據(jù),其預(yù)測(cè)可認(rèn)為是一個(gè)分類問(wèn)題。電梯故障原因預(yù)測(cè)模型流程如圖 1 所示。模型包括 :電梯故障初數(shù)據(jù)集數(shù)據(jù)預(yù)處理 ;基于預(yù)處理后數(shù)據(jù),提取電梯故障相關(guān)特征 ;選取分類算法,進(jìn)行訓(xùn)練建立模型 ;評(píng)估模型性能 ;保存最優(yōu)模型 ;當(dāng)電梯再次出現(xiàn)故障時(shí),提取相關(guān)數(shù)據(jù)特征輸入最優(yōu)模型,預(yù)測(cè)故障原因。

數(shù)據(jù)預(yù)處理包括處理缺失數(shù)據(jù)、歸一化數(shù)值類特征、集中篩選初數(shù)據(jù)集中可能指向故障原因的數(shù)據(jù)項(xiàng)。對(duì)缺失數(shù)據(jù),標(biāo)稱屬性和數(shù)值屬性兩種不同數(shù)據(jù)屬性采取的預(yù)處理方式不同 :標(biāo)稱屬性,缺失數(shù)據(jù)用值“無(wú)”補(bǔ)全 ;數(shù)值屬性,如電梯速度,缺失數(shù)據(jù)用該數(shù)據(jù)屬性值的均值表示,并進(jìn)行歸一化處理。
41 414 起電梯困人故障初數(shù)據(jù)集包含 25 個(gè)應(yīng)急調(diào)度數(shù)據(jù)項(xiàng)和 10 個(gè)電梯基本數(shù)據(jù)項(xiàng)。初步剔除接警響應(yīng)時(shí)間、救援完成時(shí)間、電梯檔案號(hào)、設(shè)備注冊(cè)登記號(hào)等明顯非關(guān)聯(lián)項(xiàng)后,保留 19 個(gè)與電梯故障原因相關(guān)的數(shù)據(jù)項(xiàng),形成的故障特征數(shù)據(jù)集見表 1 所列。

2 梯度提升樹預(yù)測(cè)模型構(gòu)建
2.1 梯度提升算法框架
梯度提升(Gradient Boosting)分類算法,是一種集成學(xué)習(xí)思想,由 Friedman[17] 于 1999 年提出,梯度提升假設(shè)模型形式為 :

式中:P 為模型參數(shù);h(x; αm) 為基學(xué)習(xí)器;αm 為弱學(xué)習(xí)器參數(shù);M 為迭代次數(shù);βm 為每個(gè)基學(xué)習(xí)器權(quán)重。
模型損失函數(shù)的數(shù)學(xué)期望為 :

在已有包含 N 個(gè)樣本點(diǎn)的訓(xùn)練數(shù)據(jù)集 {(x1, y1), ..., (xN,yN)} 上計(jì)算模型的損失函數(shù)值,并使損失函數(shù)值最小,可得最優(yōu)參數(shù) P 為 :

采用前向分步算法,每一步學(xué)習(xí)一個(gè)基學(xué)習(xí)器及其權(quán)重值,逐漸逼近式(3)的最優(yōu)解。假設(shè)當(dāng)前模型為 Fm-1,則在第 m 次迭代學(xué)習(xí)的基學(xué)習(xí)器 fm,由擬合損失函數(shù)的負(fù)梯度在當(dāng)前模型 Fm-1 的值所得。即第 m 次迭代學(xué)習(xí)的參數(shù) {βm,αm} 能夠使 fm 的方向是 Fm-1 損失函數(shù)下降最快的方向。對(duì)每一個(gè)數(shù)據(jù)點(diǎn) xi 都可以得到一個(gè)梯度下降方向 gm(xi),見式(4),和一個(gè)完整的梯度下降方向,見式(5):

為使 fm 能夠在梯度下降的方向上使用最小二乘法,分別由式(6)、式(7)得到最優(yōu) αm 和 βm :

最終合并至模型中,可得 :

梯度提升算法框架如下所示 :算法 1 :數(shù)據(jù)項(xiàng)框架
輸入 :訓(xùn)練數(shù)據(jù)集 {(x1, y1), ..., (xN, yN)},損失函數(shù) L(y,F(x)),迭代次數(shù) M。
輸出 :模型 F(x)。
1. 初始化模型 :
2. 對(duì) m = 1, ..., M :
(1)計(jì)算負(fù)梯度方向
(2) 學(xué)習(xí)一個(gè)基學(xué)習(xí)器 hm(x; αm), 其 中 :
(3) 計(jì)算最優(yōu)梯度下降步長(zhǎng), 其 中 :
(4)更新模型 :
3 :輸出模型 F(x)。
2.2 梯度提升決策樹算法
梯度提升本質(zhì)為一個(gè)算法框架,放入已有分類或回歸算法后,可進(jìn)行更復(fù)雜的決策分類計(jì)算。本文在梯度提升框架下,提出以梯度提升樹(Gradient Boosting Decision Tree,GBDT)構(gòu)造電梯故障預(yù)測(cè)模型。GBDT 引入決策樹作為梯度提升框架中的基模型(即基學(xué)習(xí)器),算法中所有決策樹的運(yùn)算結(jié)論累加即為最終結(jié)果。這種不斷迭代的決策樹算法,比單一決策樹具有可區(qū)分多種不同特征和特征組合的天然優(yōu)勢(shì),魯棒性好,易并行化,是可擬合復(fù)雜非線性函數(shù)的有力工具。
CART 決策樹 [18](Classification and Regression Trees,CART)同時(shí)支持連續(xù)值和缺失值的處理,適用于不同屬性的電梯故障數(shù)據(jù)。本文利用回歸 CART 決策樹作為梯度提升算法的弱分類器,基于平方誤差最小化準(zhǔn)則實(shí)現(xiàn)特征選擇,生成二叉樹,表現(xiàn)形式為 :

式中:J 為 CART 決策樹的葉節(jié)點(diǎn)數(shù)目;{bj}1J 為決策樹葉子節(jié)點(diǎn)的值或類標(biāo)簽;Rj 為第 j 個(gè)葉節(jié)點(diǎn);{Rj}1J 為決策樹中不重疊的區(qū)域,這些區(qū)域覆蓋整個(gè)樣本集;I(x∈Rj) 為指示函數(shù)。
若輸入數(shù)據(jù) x 屬于葉節(jié)點(diǎn) Rj,則返回 1,否則返回 0。在梯度提升算法框架中,用式(9)替換使式(4)更新模型步驟中的 h(x; αm),可得 :

式中,{Rjm}1J為第 m 次迭代得到的 CART 決策樹中第 j 個(gè)節(jié)點(diǎn)。
令 rjm=βmbjm,式(10)可改寫為 :

經(jīng)式(12)優(yōu)化,可得 rjm 最優(yōu)值 :

決策樹每個(gè)葉節(jié)點(diǎn)包含的樣本數(shù)據(jù)不重疊,則 rjm 可用式(13)優(yōu)化 :

由此將 CART 決策樹作為梯度提升框架中的基學(xué)習(xí)器,可迭代完成分類預(yù)測(cè)算法模型構(gòu)建。
3 預(yù)測(cè)模型計(jì)算實(shí)驗(yàn)
3.1 模型訓(xùn)練
41 414 條電梯故障工單初始數(shù)據(jù)包含 6 類歷史困人故障原因,分別是安全保護(hù)裝置、門系統(tǒng)、曳引系統(tǒng)、控制系統(tǒng)、電氣系統(tǒng)和外部原因(停電、機(jī)房溫度過(guò)高等)。故障預(yù)測(cè)模型以初始數(shù)據(jù)訓(xùn)練預(yù)測(cè)模型,針對(duì)故障電梯求解 6 類原因的分類問(wèn)題。
實(shí)驗(yàn)使用 XGBoost 工具 [19] 10 折交叉驗(yàn)證的方式訓(xùn)練模型,迭代中設(shè)置 early stopping 的方式 [20] 防止過(guò)擬合。在 Ubuntu 14.04LTS 操作系統(tǒng)的 Intel(R) i7-370 3.40 GHzCPU,4 GB 內(nèi)存的 PC 機(jī)上運(yùn)行算法,測(cè)得模型訓(xùn)練迭代至最優(yōu)預(yù)測(cè)模型耗時(shí) 6.17 s,通過(guò)最優(yōu)模型預(yù)測(cè)一個(gè)新樣本耗時(shí) 0.011 s,可知模型能夠滿足在應(yīng)急狀況下的實(shí)時(shí)快速預(yù)測(cè)要求。GBDT 算法迭代 100 次,每次迭代后交叉驗(yàn)證結(jié)果如圖 2 所示,迭代至 70 次時(shí)訓(xùn)練結(jié)果達(dá)到最優(yōu),模型準(zhǔn)確率為 42.04%。

3.2 模型評(píng)估
采用精確率(precision)、準(zhǔn)確率(accuracy)、召回率(recall)和 F1 值等常用評(píng)價(jià)指標(biāo) [21] 評(píng)估算法模型的可靠性與準(zhǔn)確性。以機(jī)器學(xué)習(xí)中 3 種經(jīng)典分類算法CART決策樹算法、支持向量機(jī)(SVM)算法[22] 和隨機(jī)森林(Randomforests)算法 [23] 為對(duì)比算法,分別構(gòu)建分類器,各算法的評(píng)價(jià)指標(biāo)見表 2 所列。以 CART 決策樹為弱分類器的 GBDT 算法所構(gòu)建的電梯故障原因預(yù)測(cè)模型,精確率、準(zhǔn)確率、召回率、F1值指標(biāo)均好于其他分類算法。

3.3 模型預(yù)測(cè)
模型訓(xùn)練中交叉驗(yàn)證后,GBDT 算法模型首位原因預(yù)測(cè)準(zhǔn)確率約為 42%。而現(xiàn)實(shí)場(chǎng)景中,模型預(yù)測(cè)的結(jié)果可在應(yīng)急調(diào)度時(shí)提前告知救援人員最有可能的幾個(gè)原因(從首位原因開始按可能性大小排列),引導(dǎo)現(xiàn)場(chǎng)排障。因此,預(yù)測(cè)模型可設(shè)置為,如果預(yù)測(cè)出最有可能的 k 個(gè)原因(Top-k)包含實(shí)際的故障原因時(shí),則表示預(yù)測(cè)準(zhǔn)確。根據(jù) 2013—2018 年南京市故障數(shù)據(jù),預(yù)測(cè) 2019 年 7 月電梯故障原因,以同時(shí)間626 條實(shí)際故障原因?yàn)轭A(yù)測(cè)準(zhǔn)確率基準(zhǔn),驗(yàn)證模型準(zhǔn)確性。
圖 3 所示為 k=1 ~ 6 時(shí)的預(yù)測(cè)準(zhǔn)確率。其中,k=1 時(shí)準(zhǔn)確率為 42.04%,說(shuō)明僅給出 1 項(xiàng)最有可能原因時(shí)準(zhǔn)確率不足50% ;隨著 k 增大,準(zhǔn)確率會(huì)不斷增高,在 k=3 時(shí)準(zhǔn)確率最高達(dá) 81%,即預(yù)測(cè)可給出最有可能的 3 類故障原因,此時(shí)基本可鎖定真實(shí)故障原因。在當(dāng)前初始數(shù)據(jù)量并不十分充分的訓(xùn)練條件下,使用 GBDT 算法可明確排除一半以上的故障原因,證實(shí)了方法的有效性。

4 結(jié) 語(yǔ)
(1)清洗電梯應(yīng)急處置場(chǎng)景下的原始故障缺失數(shù)據(jù),預(yù)處理可分為數(shù)值屬性和標(biāo)稱屬性,所有數(shù)值類屬性數(shù)據(jù)需進(jìn)行歸一化處理。
(2)CART 算法生成的決策樹模型是二叉樹,運(yùn)算效率較多叉樹高,作為需要不斷迭代多棵樹的 GBDT 算法的基學(xué)習(xí)器,二者結(jié)合可保證精度并兼顧效率,適合處理目標(biāo)變量(電梯故障原因)為標(biāo)稱屬性的離散型分類問(wèn)題。
(3)GBDT 集成學(xué)習(xí)算法對(duì)電梯故障原因預(yù)測(cè)有效可行,模型評(píng)估效果好于其他常見機(jī)器學(xué)習(xí)分類算法。其通過(guò)迭代獲得殘差來(lái)不斷逼近真實(shí)預(yù)測(cè)值的特點(diǎn),能夠獲得滿意預(yù)測(cè)結(jié)果(尤其在推薦 Top-k 個(gè)預(yù)測(cè)結(jié)果時(shí)),可為應(yīng)急處置時(shí)快速鎖定故障部位提供參考。
(4)4 萬(wàn)左右的故障初始數(shù)據(jù)數(shù)量尚不能認(rèn)為是真正意義的大數(shù)據(jù)量級(jí)。有效提升首位故障原因的預(yù)測(cè)準(zhǔn)確率,仍需在更廣地域范圍和更大時(shí)間跨度內(nèi)進(jìn)一步匯集數(shù)據(jù),富集數(shù)據(jù)池,并添加構(gòu)建更合理的故障特征。
審核編輯 :李倩
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107794 -
電梯
+關(guān)注
關(guān)注
3文章
530瀏覽量
24253 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8553瀏覽量
136956
原文標(biāo)題:基于機(jī)器學(xué)習(xí)的城市電梯困人故障原因預(yù)測(cè)方法研究
文章出處:【微信號(hào):iotmag,微信公眾號(hào):iotmag】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
電梯變頻器故障解決實(shí)例
機(jī)器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法
pcm設(shè)備故障及處理方法
提高條件分支指令預(yù)測(cè)正確率的方法
偉邦科技電梯無(wú)線五方對(duì)講系統(tǒng):告別布線困擾,用黑科技守護(hù)每一趟電梯安全!
無(wú)刷直流電機(jī)逆變器故障診斷仿真研究
大模型推理顯存和計(jì)算量估計(jì)方法研究
電機(jī)常見故障分析及解決方法
變頻器相同的故障原因不同的故障代碼分類
市政電纜局放監(jiān)測(cè)系統(tǒng):城市電網(wǎng)的“安全守護(hù)神”
智慧樓宇新標(biāo)配:電梯IP網(wǎng)關(guān)如何賦能電梯遠(yuǎn)程監(jiān)控與運(yùn)維
電梯物聯(lián)網(wǎng):重塑城市出行安全的“智慧大腦”
變頻器軟故障的原因及兩大解決方法
基于機(jī)器學(xué)習(xí)的城市電梯困人故障原因預(yù)測(cè)方法研究
評(píng)論