前言:尋找寫作靈感?中文期刊網(wǎng)用心挑選的測試信息系統(tǒng)自動化運(yùn)維探討,希望能為您的閱讀和創(chuàng)作帶來靈感,歡迎大家閱讀并分享。
摘要:隨著信息化建設(shè)的不斷深入,日常的工作對信息系統(tǒng)的依賴程度也越來越高,信息系統(tǒng)的任何波動都會對業(yè)務(wù)造成影響。為保證信息系統(tǒng)的安全與穩(wěn)定,需要進(jìn)行運(yùn)維管理。測試運(yùn)維工作包括操作系統(tǒng)、網(wǎng)絡(luò)管理、各專業(yè)應(yīng)用系統(tǒng)及數(shù)據(jù)庫的運(yùn)行及維護(hù)全過程,涉及大量設(shè)備和平臺。文中闡述了自動化運(yùn)維基本原理,更深層的進(jìn)行實際工作的全局分析,將自動化運(yùn)維技術(shù)應(yīng)用到測試生產(chǎn)實際,關(guān)注當(dāng)前條件下如何實現(xiàn)性能與服務(wù)最優(yōu)化。
關(guān)鍵詞:運(yùn)維;自動化;效率
0引言
測試分公司的經(jīng)過多年的信息系統(tǒng)建設(shè),現(xiàn)有計算機(jī)設(shè)備1443臺、24h在線運(yùn)行設(shè)備12臺,部署在不同的基層單位。在網(wǎng)絡(luò)傳輸上現(xiàn)使用光纖長度150km,21個C類IP地址,可管理交換機(jī)等網(wǎng)絡(luò)設(shè)備128臺套。在數(shù)據(jù)庫配置上配備中心數(shù)據(jù)庫一套,部署在11個生產(chǎn)單位的測試專業(yè)數(shù)據(jù)庫33套。累計保存近50余萬井層次測試數(shù)據(jù)(300GB),年增長4萬井層次(15GB)。信息系統(tǒng)已經(jīng)成為日常工作必不可少的工具。面對基礎(chǔ)設(shè)施資源多,網(wǎng)絡(luò)覆蓋范圍大、網(wǎng)段分散,數(shù)據(jù)庫中數(shù)據(jù)量大等問題,日常運(yùn)維管理也越來越復(fù)雜。目前測試分公司的運(yùn)維已經(jīng)實現(xiàn)從人工運(yùn)維到計算機(jī)管理,但運(yùn)維管理還只是處在“半自動化”的狀態(tài)。運(yùn)維方式仍然是等到故障出現(xiàn)后再由運(yùn)維人員采取相應(yīng)的補(bǔ)救措施。這些傳統(tǒng)的被動、孤立、半自動式的運(yùn)維管理模式經(jīng)常讓運(yùn)維人員疲憊不堪,讓運(yùn)維工作陷入被動,沒有流程設(shè)置,周而復(fù)始就形成了連鎖的惡性循環(huán)反應(yīng)。即使加班加點(diǎn)地維護(hù)、部署、管理也經(jīng)常會出現(xiàn)故障而導(dǎo)致業(yè)務(wù)的中斷,影響生產(chǎn)。隨著計算機(jī)軟硬件技術(shù)的不斷發(fā)展,自動化運(yùn)維技術(shù)給我們提供了極佳的解決方案。
1自動化運(yùn)維的意義
1.1什么是自動化運(yùn)維
自動化運(yùn)維就是把周期性、重復(fù)性、規(guī)律性的工作都交給工具去做,由過去的手工執(zhí)行轉(zhuǎn)為自動化操作,從而減少乃至消除運(yùn)維中的延遲、實現(xiàn)“零延時”的運(yùn)維,最終達(dá)到提升運(yùn)維效率的目的。自動化運(yùn)維是一種基于流程化的框架,將運(yùn)維與操作流程相關(guān)聯(lián),—旦被監(jiān)控系統(tǒng)發(fā)現(xiàn)性能超標(biāo),會觸發(fā)相關(guān)事件以及事先定義好的流程,可自動啟動故障響應(yīng)和恢復(fù)機(jī)制。面對越來越復(fù)雜的業(yè)務(wù),越來越多樣化的用戶需求,不斷擴(kuò)展的應(yīng)用需要合理的運(yùn)維來保障服務(wù)。
1.2為什么要使用自動化運(yùn)維
如果測試分公司的整個,運(yùn)維管理做得不好,那么建立起來的信息系統(tǒng)功能再好再強(qiáng)也沒有用,因為業(yè)務(wù)部門根本無法順利使用。自動化運(yùn)維首先帶來的是運(yùn)維效率的提高:可幫助運(yùn)維人員完成日常的重復(fù)性工作(如備份)。其次是保障安全:在運(yùn)維管理過程中,一旦發(fā)現(xiàn)安全隱患,運(yùn)維管理系統(tǒng)會及時預(yù)警,同時提前修復(fù),避免系統(tǒng)危機(jī)。最后是維持穩(wěn)定:通過監(jiān)控最大程度地保障系統(tǒng)的穩(wěn)定和運(yùn)行質(zhì)量。即使出現(xiàn)問題,也能夠快速發(fā)現(xiàn)、快速響應(yīng)、快速恢復(fù),合理的運(yùn)維方式能夠有效保護(hù)數(shù)據(jù)。如圖1所示,運(yùn)維自動化的實現(xiàn)可以減輕對人工操作的依賴,實現(xiàn)運(yùn)維思路的變更。
1.3自動化運(yùn)維如何實現(xiàn)
1.3.1以監(jiān)控為中心
監(jiān)控自動化是運(yùn)維自動化的起點(diǎn)之一。對服務(wù)運(yùn)行的狀態(tài)進(jìn)行實時的監(jiān)控,隨時發(fā)現(xiàn)服務(wù)的運(yùn)行異常和資源消耗情況;輸出重要的日常服務(wù)運(yùn)行報表以評估業(yè)務(wù)整體運(yùn)行狀況,發(fā)現(xiàn)隱患。運(yùn)維人員把握監(jiān)控的覆蓋程度。雖然針對生產(chǎn)系統(tǒng)的各層次都部署了監(jiān)控工具,需要有管理員去配置。靠管理員主觀能動性去讓監(jiān)控實現(xiàn)對某個生產(chǎn)系統(tǒng)所有運(yùn)行狀態(tài)進(jìn)行實時監(jiān)控還比較困難,所以需要讓運(yùn)維人員明確知道監(jiān)控覆蓋面的及格線。例如:磁盤占用空間大于設(shè)定數(shù)值時,監(jiān)控功能自動預(yù)警通過微信等功能告知相應(yīng)的處理人員。
1.3.2建立運(yùn)維手冊
模板化部署系統(tǒng)環(huán)境。建立每種事件的規(guī)范化處理和跟蹤指南,可以減少運(yùn)維操作的隨意性和強(qiáng)化運(yùn)維的執(zhí)行力度,在很大程度上可降低故障發(fā)生的概率。運(yùn)維手冊是運(yùn)維標(biāo)準(zhǔn)化最基本的工作項之一,但由于運(yùn)維涉及的問題很多,運(yùn)維文檔也演變成一個越來越復(fù)雜的文檔,當(dāng)文檔復(fù)雜到一定程度時就會變成一個負(fù)擔(dān),很難保文檔的及時更新。在這里以運(yùn)維手冊簡單化為原則。
1.3.3服務(wù)流程自動化
監(jiān)控自動化發(fā)現(xiàn)了問題就應(yīng)該接入相應(yīng)的流程進(jìn)行處理,這時候故障事件自動觸發(fā)問題處理跟蹤流程,并利用運(yùn)維文檔完成整體故障處理。通過監(jiān)控工具實現(xiàn)對用戶操作規(guī)范的約束和對資源進(jìn)行實時監(jiān)控。在自定義周期內(nèi)進(jìn)行自動觸發(fā)完成對運(yùn)維的例行巡檢,形成檢查報告。運(yùn)維自動化管理建設(shè)不是一次性建好,要以實用為主分階段的解決自身實際問題,最終建立完善的運(yùn)維的自動化監(jiān)控和管理平臺。
2應(yīng)用情況
2.1用于試井解釋平臺日常運(yùn)維
建立試井運(yùn)維手冊,形成文檔管理。按照文檔要求記錄下問題原因以及解決的步驟,并定期回顧文檔從中整理出的共性問題。例如:多次發(fā)生在軟件可以正常解釋井的情況下,但點(diǎn)擊入庫按鈕無響應(yīng)。初期選擇重新安裝軟件,恢復(fù)使用。后期通過篩查運(yùn)維手冊,研究問題機(jī)器的共性。定位到具體的丟失文件,查到丟失原因、發(fā)現(xiàn)問題根源。避免了同類問題的發(fā)生,提高了軟件使用者的滿意度。規(guī)范化處理可以減少運(yùn)維操作的隨意性和強(qiáng)化運(yùn)維的執(zhí)行力度,可降低故障發(fā)生的概率減少運(yùn)維工作量。
2.2實現(xiàn)測試成果數(shù)據(jù)自動備份
測試分公司平均每年入庫近四萬井層次的測試數(shù)據(jù),已經(jīng)積累了五十多萬井層次,300多GB的數(shù)據(jù)量。這些數(shù)據(jù)是油田重要的數(shù)據(jù)資產(chǎn),需要進(jìn)行安全管理,保證數(shù)據(jù)資產(chǎn)安全最重要的手段就是備份。面對日益增長的測試數(shù)據(jù)資料,由于屬地原因分布在所屬采油廠的各個基層測試大隊30個節(jié)點(diǎn)上,人工重復(fù)登錄各個節(jié)點(diǎn),進(jìn)行賬戶認(rèn)證,檢查存儲空間,執(zhí)行數(shù)據(jù)庫的導(dǎo)出命令,對導(dǎo)出文件進(jìn)行壓縮,進(jìn)行規(guī)范命名,通過網(wǎng)絡(luò)拷貝到備份服務(wù)器,刪除本地冗余備份,檢查備份服務(wù)器存儲空間,刪除備份服務(wù)器冗余備份,整個備份過程繁瑣冗雜,容易產(chǎn)生誤操作,效率低下。編制批處理文件,根據(jù)各個節(jié)點(diǎn)上數(shù)據(jù)量大小,規(guī)劃備份執(zhí)行具體時間,通過操作系統(tǒng)計劃任務(wù)定時完成備份工作,整個備份過程在網(wǎng)絡(luò)上部署,在分布式各個節(jié)點(diǎn)上,分布各個時間節(jié)點(diǎn)周期自動定時運(yùn)行。沒有人為因素,測試專業(yè)數(shù)據(jù)庫自動完成備份工作,保證數(shù)據(jù)安全。
2.3驗證測試井入庫信息質(zhì)量
大慶油田現(xiàn)今有21個油氣開發(fā)、研究單位、工程服務(wù)單位通過成果平臺應(yīng)用測試資料。生產(chǎn)測試解釋信息入庫成為了生產(chǎn)的重要環(huán)節(jié)。生產(chǎn)數(shù)據(jù)入庫的準(zhǔn)確性、及時性就越來越重要。編寫軟件進(jìn)行數(shù)據(jù)庫數(shù)據(jù)信息的對比。保障測試生產(chǎn)數(shù)據(jù)入庫的準(zhǔn)確性、及時性。在測試井成果數(shù)據(jù)傳輸中,設(shè)立重點(diǎn)監(jiān)控,進(jìn)行測試數(shù)據(jù)質(zhì)量檢查。及時發(fā)現(xiàn)解釋外報卻未入庫的井次,規(guī)范數(shù)據(jù)入庫情況,進(jìn)行數(shù)據(jù)檢查核對,并公示考核,分析總結(jié)影響數(shù)據(jù)入庫的因素,提高數(shù)據(jù)庫入庫質(zhì)量。設(shè)定監(jiān)控點(diǎn),監(jiān)控外報數(shù)據(jù)與成果數(shù)據(jù)庫中的數(shù)據(jù)差異。節(jié)約時間成本,可以很快的發(fā)現(xiàn)差異井次、及時改正,大幅提高了工作效率。并且,提高精準(zhǔn)度可以明確展示數(shù)據(jù)間具體差異。
3結(jié)語
隨著測試分公司信息化建設(shè)的持續(xù)深入,基礎(chǔ)設(shè)備的不斷增加以及各個專業(yè)平臺的推廣使用,測試信息運(yùn)維工作量勢必越來越大,運(yùn)維管理的自動化已經(jīng)是大勢所趨。真正實現(xiàn)測試信息工作完全自動化運(yùn)維是一項復(fù)雜的系統(tǒng)工程,首先要將工作中最耗時間的事情自動化,如此迭代往復(fù)最終建立一個信息化自動化運(yùn)維平臺,簡化工作流程、提高工作效率、提升服務(wù)質(zhì)量。可以將運(yùn)維人員從繁瑣的、例行、容易發(fā)生人為事故的工作中脫離出來,做更有價值的運(yùn)維工作。
參考文獻(xiàn):
[1]JanvanBon,章斌譯.基于ITIL的全球最佳實踐[J].清華大學(xué)出版社,2010,1:8~14
[2]王敏.淺談運(yùn)維自動化[J]運(yùn)維派,2017,5.
作者:夏薇 單位:大慶油田有限責(zé)任公司測試技術(shù)服務(wù)分公司