IT服務及管理(lǐ)
您現在的(de)位置:首頁>IT服務及管理(lǐ)>

IT自(zì)動化運維

發布時間:2018-9-11 浏覽次數:524

所謂IT運維管理(lǐ)的(de)自(zì)動化是指通過将日常IT運維中大量的(de)重複性工作,小到簡單的(de)日常檢查、配置變更和(hé)軟件安裝,大到整個變更流程的(de)組織調度,由過去(qù)的(de)手工執行轉為(wèi)自(zì)動化操作,從而減少乃至消除運維中的(de)延遲,實現“零延時”的(de)IT運維。簡單的(de)說,IT運維自(zì)動化是指基于流程化的(de)框架,将事件與IT流程相關聯,一(yī)旦被監控系統發生性能超标或宕機,會觸發相關事件以及事先定義好的(de)流程,可(kě)自(zì)動啓動故障響應和(hé)恢複機制。自(zì)動化工作平台還可(kě)幫助IT運維人員完成日常的(de)重複性工作(如(rú)備份,殺毒等),提高(gāo)IT運維效率。同時,IT運維的(de)自(zì)動化還要求能夠預測故障、在故障發生前能夠報警,讓IT運維人員把故障消除在發生前,将所産生損失減到最低(dī)。
 
運維應包括:
環境定義:開發環境、測試環境、類生産環境、生産環境等。
部署:能夠将部署包有效的(de)部署到不同的(de)環境。
監控:能夠監控部署後的(de)系統和(hé)應用。
告警:出現問題時的(de)響應和(hé)處理(lǐ)機制。
性能優化:系統各個服務如(rú)Nginx/Java/PHP/DB/網絡的(de)優化。
SLA保障:通常要和(hé)業務相關部門讨論确定。
 
運維與開發的(de)關系:
 
管理(lǐ)具體內(nèi)容:
IT運維已經在風風雨雨中走過了十幾個春秋,如(rú)今它正以一(yī)種全新的(de)姿态擺在我們面前--自(zì)動化,這是IT技術發展的(de)必然結果。現在IT系統的(de)複雜性已經客觀上要求IT運維必須能夠實現數字化、自(zì)動化維護。所謂IT運維管理(lǐ)的(de)自(zì)動化是指通過将日常IT運維中大量的(de)重複性工作(小到簡單的(de)日常檢查、配置變更和(hé)軟件安裝,大到整個變更流程的(de)組織調度)由過去(qù)的(de)手工執行轉為(wèi)自(zì)動化操作,從而減少乃至消除運維中的(de)延遲,實現“零延時”的(de)IT運維。
簡單的(de)說,IT運維自(zì)動化是指基于流程化的(de)框架,将事件與IT流程相關聯,一(yī)旦被監控系統發生性能超标或宕機,會觸發相關事件以及事先定義好的(de)流程,可(kě)自(zì)動啓動故障響應和(hé)恢複機制。自(zì)動化工作平台還可(kě)幫助IT運維人員完成日常的(de)重複性工作(如(rú)備份、殺毒等),提高(gāo)IT運維效率。同時,IT運維的(de)自(zì)動化還要求能夠預測故障、在故障發生前能夠報警,讓IT運維人員把故障消除在發生前,将所産生損失減到最低(dī)。
 
工具:
對于企業來說,要特别關注兩類自(zì)動化工具:一(yī)是IT運維監控和(hé)診斷優化工具;二是運維流程自(zì)動化工具。這兩類工具主要應用于:
監控自(zì)動化,是指對重要的(de)IT設備實施主動式監控,如(rú)路由器、交換機、防火牆等;
配置變更檢測自(zì)動化,是指IT設備配置參數一(yī)旦發生變化,将觸發變更流程轉給相關技術人員進行确認,通過自(zì)動檢測協助IT運維人員發現和(hé)維護配置。
維護事件提醒自(zì)動化,是指通過對IT設備和(hé)應用活動的(de)時時監控,當發生異常事件時系統自(zì)動啓動報警和(hé)響應機制,第一(yī)時間通知相關責任人。
系統健康檢測自(zì)動化,是指定期自(zì)動地(dì)對IT設備硬件和(hé)應用系統進行健康巡檢,配合IT運維團隊實施對系統的(de)健康檢查和(hé)監控。
維護報告生成自(zì)動化,是指定期自(zì)動的(de)對系統做(zuò)日志的(de)收集分析,記錄系統運行狀況,并通過階段性的(de)監控、分析和(hé)總結,定時提供IT運維的(de)可(kě)用性、性能、系統資源利用狀況分析報告。
 
建立管理(lǐ)步驟:
 
(1)建立自(zì)動化運維管理(lǐ)平台
IT運維自(zì)動化管理(lǐ)建設的(de)第一(yī)步是要先建立IT運維的(de)自(zì)動化監控和(hé)管理(lǐ)平台。通過監控工具實現對用戶操作規範的(de)約束和(hé)對IT資源進行實時監控,包括服務器、數據庫、中間件、存儲備份、網絡、安全、機房、業務應用和(hé)客戶端等內(nèi)容,通過自(zì)動監控管理(lǐ)平台實現故障或問題綜合處理(lǐ)和(hé)集中管理(lǐ)。例如(rú),在自(zì)定義周期內(nèi)進行自(zì)動觸發完成對IT運維的(de)例行巡檢,形成檢查報告。包括自(zì)動運行維護,以完成對系統補丁的(de)同步分發與升級、數據備份、病毒查殺等工作。
 
(2)建立故障事件自(zì)動觸發流程,提高(gāo)故障處理(lǐ)效率
所有IT設備在遇到問題時要會自(zì)動報警,無論是系統自(zì)動報警還是使用人員報的(de)故障,應以紅(hóng)色标識顯示在運維屏幕上。然後IT運維人員隻需要按照相關知識庫的(de)數據,一(yī)步一(yī)步操作就可(kě)以。因此,企業需要事先建立自(zì)動工單式流程管理(lǐ),當設備或軟件發生異常或超出預警指标時會觸發相關的(de)事件,同時觸發相關工單處理(lǐ)流程給相關IT運維人員。IT運維人員必須在指定時間內(nèi)完成流程所規定的(de)環節與工作,以提高(gāo)IT運維響應問題的(de)效率。
 
(3)建立規範的(de)事件跟蹤流程,強化運維執行力度
IT運維自(zì)動化管理(lǐ)建設時,首先需要建立故障和(hé)事件處理(lǐ)跟蹤流程,利用表格工具等記錄故障及其處理(lǐ)情況,以建立運維日志,并定期回顧從中辨識和(hé)發現問題的(de)線索和(hé)根源。事實上許多實踐也證明,建立每種事件的(de)規範化處理(lǐ)和(hé)跟蹤指南,可(kě)以減少IT運維操作的(de)随意性和(hé)強化運維的(de)執行力度,在很大程度上可(kě)降低(dī)故障發生的(de)概率。同時,用戶還應可(kě)以通過自(zì)助服務台、電話服務台等随時追蹤該故障請求的(de)處理(lǐ)狀态。
 
(4)設立IT運維關鍵流程,引入優先處理(lǐ)原則
設立IT運維關鍵流程,引入優先處理(lǐ)原則是指要求CIO定義出IT運維的(de)每個關鍵流程,不僅僅是定義流程是什麽,還包括要指出每個關鍵流程對企業有什麽影響和(hé)意義。同時,在設置自(zì)動化流程時還需要引入優先處理(lǐ)原則,例行的(de)事按常規處理(lǐ),特别事件要按優先級次序處理(lǐ),也就是把事件細分為(wèi)例行事件和(hé)例外關鍵事件。
 
總之,實現IT運維的(de)自(zì)動化管理(lǐ)是指通過将IT運維中日常的(de)、大量的(de)重複性工作自(zì)動化,把過去(qù)的(de)手工執行轉為(wèi)自(zì)動化操作。自(zì)動化是IT運維工作的(de)升華,IT運維自(zì)動化不單純是一(yī)個維護過程,更是一(yī)個管理(lǐ)的(de)提升過程,是IT運維的(de)最高(gāo)層次,也是未來的(de)發展趨勢。
地(dì)址:陝西省西安市高(gāo)新區科技四路南側心橋佳苑第1幢2單元23層22304室
聯系人:任經理(lǐ) 136-5921-0883
遼甯金華澤信息技術服務有限公司 版權所有