當下企業(yè)很多都熱衷于建設(shè)運維自動化、智能化,通過技術(shù)革新代替繁雜的手工運維,提高生產(chǎn)效率的同時最大程度的減少人為失誤。但是如何建設(shè)自動化運維,在不同的企業(yè)有著不同的建設(shè)方法和技術(shù)棧,雖然大多是以Python為主。一般說來,企業(yè)的運維發(fā)展由起步到成熟,大致要經(jīng)過三個大階段:運維無序化、運維標準化和流程化、運維自動化。

運維無序化主要表現(xiàn)在運維工作無規(guī)范統(tǒng)一,更多是團隊成員依賴自身技術(shù)各自為戰(zhàn),著重于眼前運維工作,過多處于被迫接受和疲憊應付工作的狀態(tài)。運維無序階段提升工作效率主要依賴加人和加班,而且此階段運維工作效率低下,人為失誤較多,故障排除難度較大。長時間的運維無序化,對內(nèi)團隊成員極度疲憊和不自信,對外主要表現(xiàn)為不再被各業(yè)務(wù)部門和其他IT兄弟團隊所信任。一般創(chuàng)業(yè)初期的IT運維處于無序化較多,如何解決結(jié)束無序化的苦惱,解放生產(chǎn)力呢?答案更多被提及的是運維自動化。然而面對眾說紛紜的運維自動化平臺,如何結(jié)合自身條件進行落地實現(xiàn)呢?答案很多,有購買商業(yè)產(chǎn)品(價格真的不便宜),有自主研發(fā),結(jié)合本人推行運維自動化的實際經(jīng)驗提醒各位,不管哪種方式,運維標準化和流程化一定是首先要做的,否則運維自動化只能是空中樓閣,欲求不得。
什么是運維標準化和流程化呢?如果非要給出定義的話,那么我的定義是兩個字:文檔。
運維的標準化和流程化首先要以文檔的形式進行展示,并且能夠指導日常運維工作。國有國法,家有家規(guī),冰箱洗衣機都有說明書,運維標準化流程化就是運維工作的國法家規(guī),運維工作如何進行的說明書。相比開發(fā)、測試等其他崗位,運維工作直面生產(chǎn)環(huán)境,每一步運維操作與生產(chǎn)系統(tǒng)能否正常運行息息相關(guān),稍有不慎就易產(chǎn)生生產(chǎn)事故。并且運維自動化的落地實施也是要基于運維的標準化和流程化,所以作為運維管理的第一步,不可忽略。
標準化和流程化的建設(shè)思路一般是包括三大部分:日常工作梳理、標準化和流程化制定、日常工作標準化和流程化執(zhí)行。
一、運維工作梳理
運維工作相對比較繁雜,結(jié)合實際運維工作,不同的公司又不同的劃分方法,以某公司為例,大致分為數(shù)據(jù)中心(DC)運維、IT資源運維、服務(wù)運維、事件管理四個部分。

● 數(shù)據(jù)中心運維主要因為有自建IDC機房和部分托管在其他IDC機房的服務(wù)器,所以日常運維工作中有關(guān)于數(shù)據(jù)中心相關(guān)的工作,例如數(shù)據(jù)中心的設(shè)計和建設(shè)工作,數(shù)據(jù)中心日常巡檢,數(shù)據(jù)中心權(quán)限管理、備件梳理管理、設(shè)備上下架等管理。如果是部署在云端的企業(yè),對于數(shù)據(jù)中心的運維工作會少一些。
● IT資源運維主要是指計算、存儲、網(wǎng)絡(luò)和安全四大基礎(chǔ)資源的運維工作。計算資源包括物理服務(wù)器的管理,如開關(guān)機、配置修改、資源增加等;存儲資源管理一般包括自建分部署存儲、商業(yè)存儲、NAS等相關(guān)存儲資源的賬戶權(quán)限管理、容量管理、監(jiān)控等;網(wǎng)絡(luò)資源運維管理工作主要包括網(wǎng)絡(luò)權(quán)限管理、設(shè)備配置變更等等;安全資源運維管理主要日常與安全相關(guān)的規(guī)章制度和策略以及安全設(shè)備具體操作等。IT資源運維工作涉及日常運維工作基礎(chǔ)資源,是整個運維工作的重點,基礎(chǔ)資源的保障好壞,關(guān)系著上層應用服務(wù)的健康運行情況。
● 系統(tǒng)運維的日常大多是與服務(wù)運維相關(guān)。運維服務(wù)部署(如:Nginx部署、JDK、Tomcat的部署等)、服務(wù)的配置變更和服務(wù)發(fā)布、服務(wù)變更等。服務(wù)運維設(shè)計的標準和規(guī)范指導日常服務(wù)運維工作的進行,并且為自動化運維做鋪墊,這要求在日常運維工作中,對于重復的手工運維工作盡量通過腳本或是其他變成語言實現(xiàn)自動化。
● 事件管理針對日常運維工作中出現(xiàn)的運維事件進行處理指導和提出管理方案。主要包括對事件進行分類、事件處理流程、如何匯報事件以及事件的總結(jié)等。
通過對日常運維工作所涉及的內(nèi)容進行分類整理,并且加工提煉最后形成運維的標準和規(guī)范,將一些流程化的工作進行固化,并且逐步實現(xiàn)運維自動化,提高運維效率。
二、運維標準化流程化文檔
通過上一節(jié)對運維工作進行梳理,接下來進行運維標準護額和流程化文檔的提煉。當然所做這一切都是基于公司自身的實際情況進行,切勿脫離實際,直接摘抄。另外一點,在制定運維標準流程之前,必須制定好文檔編寫得規(guī)范和標準,這樣整體的規(guī)范流程文檔的風格統(tǒng)一整齊。一般來講,文檔要盡量簡潔,設(shè)計流程相關(guān)要圖文并茂,著重對流程圖的流程說明和關(guān)鍵點備注。
● 數(shù)據(jù)中心運維標準化和流程化
首先是數(shù)據(jù)中心運維相關(guān)標準流程規(guī)范。數(shù)據(jù)中心的建立在國內(nèi)網(wǎng)以及不同行業(yè)都有相對比較同意的規(guī)范標準可供參考設(shè)置。一般對于自建數(shù)據(jù)中心的企業(yè),對于數(shù)據(jù)中心的標準建立參考遵循國際標準、國家標準和行業(yè)規(guī)定即可。如《GB50174-2017 數(shù)據(jù)中心設(shè)計規(guī)范》、《GB 50462-2015 數(shù)據(jù)中心基礎(chǔ)設(shè)施施工及驗收規(guī)范》、TIA-942 標準等。建立完成之后,還涉及到日常運維巡檢流程、對數(shù)據(jù)中心的備件管理中的備件申請流程、數(shù)據(jù)中心故障處理流程及其數(shù)據(jù)中心日常管理規(guī)范等。

● IT資源運維標準化和流程化
IT資源運維主要對涵蓋系統(tǒng)基礎(chǔ)設(shè)施的計算、存儲、網(wǎng)絡(luò)、安全四個基礎(chǔ)部分的運維其中著重偏向于硬件以及硬件配置相關(guān)運維工作。這其中涉及的規(guī)范和流程如下:


● 服務(wù)運維標準化和流程化
對于日常運維服務(wù)相關(guān)的標準化和流程化主要是標準化部署、配置以及流程化的處理如發(fā)布、變更等,這其中還包括數(shù)據(jù)庫的數(shù)據(jù)處理流程、生產(chǎn)賬號管理流程、以及備份和監(jiān)控的標準規(guī)范等。


● 事件管理標準化和流程化
針對日常運維過程中出現(xiàn)的事件進行規(guī)范化和流程化管理與指導,使工程師在處理運維事件的時候有章可循,以達到事件通知上通下達、規(guī)范化處理、快速高效處理的目的。

三、標準流程化執(zhí)行落地
通過運維工作梳理,進行運維標準化、流程化文檔的編寫之后,接下來就是最重要的落地執(zhí)行。有了規(guī)范標準和流程,那么在日常運維工作中就不應該出現(xiàn)隨心所欲、按照自己習慣進行運維工作的現(xiàn)象。
其實在標準化和流程化落地的初始階段,往往會給工程師帶來各種不方便和諸多不適應。典型的例子如下:標準化、流程化給工程師帶來的感覺是事情變得復雜繁瑣,自己的手腳被束縛,本來很簡單的一個事情,幾條命令幾秒鐘就可以搞定,但在執(zhí)行標準化和流程化之后,變得需要涉及多人或崗位,同時也需要幾十分鐘甚至幾個小時才能搞定,而最后實際操作的可能也就一開始的那幾條命令。這是標準化初期的普遍現(xiàn)象,對于出現(xiàn)這種問題要積極溝通解決,讓工程師們盡快度過這種看似繁瑣、效率低下的初期階段。解決方法有三:
●首先是對工程師以及流程干系人進行標準化和流程化意義的普及。讓大家了解知道進行標準化和流程化的意義,標準和流程得進行運維工作,可以大大減少人為失誤,同時讓大家在同一標準下工作,減少交流成本,相互之間的配合也會更加緊密。團隊協(xié)作流程化處理問題最大程度的減少相互之間的影響。最后,標準化和流程化是最運維自動化最基礎(chǔ)準備。
●加快運維自動化的建立。盡快將固化的標準和流程進行自動化的編碼開發(fā),大大減少人為操作,提高運維效率,這樣運維工程師的日常工作因為大大減少人工操作,較以往會更加輕松。
●優(yōu)化標準化和流程化。標準化和流程化的制定是基于實際的日常運維工作的,在實際執(zhí)行過程中,應該根據(jù)實際情況,進行不斷的優(yōu)化調(diào)整,以達到最優(yōu)。
通過以上三步,減少工程師在執(zhí)行運維標準化、流程化的煩惱,讓大家積極參與進來,推動標準和流程的實施,以快速實現(xiàn)運維的自動化。
標準化和流程化的落地,往往還會伴隨著對已存在的系統(tǒng)部署方式進行遷移至標準化的操作。這其實要求我們在執(zhí)行標準化和流程化以后的所有運維操作完全按照運維的標準和流程進行,對于執(zhí)行以前的運維工作要進行遷移,目的是要實現(xiàn)所有系統(tǒng)和運維的標準、流程化。對于遷移,一般比較好的方案是:首先保留已存在非標準化系統(tǒng),同時搭建標準化環(huán)境,進行已存在系統(tǒng)的部署并進行測試,測試無誤后,與已存在非標準化系統(tǒng)并行運行,同時提供對外服務(wù)一段時間后,在評估,最后將已存在非標準化系統(tǒng)進行下線,以達到系統(tǒng)平滑得由非標準化遷移至標準化的目的。
四、總結(jié)
標準化和流程化作為運維管理體系的基石和運維自動化的第一步,在進行運維管理工作中必不可少,而且要實現(xiàn)徹底的標準統(tǒng)一。在進行落地的過程中,要適當?shù)呐c運維自動化并行,加快自動化的腳步,只有這樣才能最大程度的減少人為失誤,減少人力成本,提高運維的效率和質(zhì)量。
-
python
+關(guān)注
關(guān)注
57文章
4876瀏覽量
90022 -
運維
+關(guān)注
關(guān)注
1文章
282瀏覽量
8622
原文標題:運維標準化與流程化建設(shè)深度指南
文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
搞好IT運維管理中人、事、物、流程標準系統(tǒng),工作高枕無憂
普及從跑腿到云一體化IT運維管理的常識
銳捷助互聯(lián)網(wǎng)數(shù)據(jù)中心網(wǎng)絡(luò)自動化、可視化運維
學習Linux運維發(fā)展方向
能云盈和智能運維助力實現(xiàn)配電運維智能化、精細化
虛擬化故障怎么辦?虛擬化運維怎么解決?
廣凌運維管理平臺:全程線上化!工作效率提升80%
智能化運維新標桿:訊維運維管理平臺深度解讀
光伏電站運維管理系統(tǒng)實現(xiàn)光伏智能化運維管理
光伏電站輔助決策及運維管理平臺,構(gòu)建系統(tǒng)化運維管理模式
Python腳本實現(xiàn)運維工作自動化案例
容器化NPB + Ansible:自動化運維方案
什么是運維標準化和流程化呢?運維工作梳理
評論