系統(tǒng)癱瘓考驗(yàn)應(yīng)急管理
■ 本報(bào)實(shí)習(xí)記者 丁常彥 閆婷
中國(guó)航空信息系統(tǒng)再度故障,全國(guó)范圍內(nèi)航空旅客滯留一小時(shí),“部分文件損壞”成為事件發(fā)生的始作俑者。那么,非突發(fā)性因素成為突發(fā)性事件的根本原因何在?
10月10日13時(shí)28分,中國(guó)民航信息網(wǎng)絡(luò)股份有限公司(以下簡(jiǎn)稱“中航信”)離港系統(tǒng)主機(jī)發(fā)生故障,包括北京、上海、廣州在內(nèi)的眾多機(jī)場(chǎng)的離港系統(tǒng)整體性癱瘓,多個(gè)航班被迫延誤,在時(shí)隔50分鐘之后,14時(shí)18分中航信離港系統(tǒng)恢復(fù)正常,各機(jī)場(chǎng)航班也相繼恢復(fù)起降秩序。
如此大面積的系統(tǒng)癱瘓事件,無(wú)疑再一次給民航的應(yīng)急管理敲響了警鐘,因?yàn)?,這已經(jīng)不是中航信第一次發(fā)生類似問(wèn)題。就在今年1月11日上午10時(shí)30分,中航信北京總部服務(wù)器出現(xiàn)故障,導(dǎo)致系統(tǒng)死機(jī)長(zhǎng)達(dá)20分鐘,成都雙流機(jī)場(chǎng)受害最大,40分鐘后系統(tǒng)才恢復(fù)正常 ,上千名旅客因此而延誤了行程。如果這是一次長(zhǎng)時(shí)間的系統(tǒng)癱瘓,損失將非常嚴(yán)重,在計(jì)算機(jī)系統(tǒng)應(yīng)用越來(lái)越廣泛的今天,加強(qiáng)應(yīng)急管理,建立相應(yīng)的備份系統(tǒng),也由此更顯得重要。
備份系統(tǒng)存有缺陷
據(jù)中航信運(yùn)行部工作人員透露,在此次大面積機(jī)場(chǎng)癱瘓之前,中航信曾經(jīng)做過(guò)一個(gè)針對(duì)紙質(zhì)客票的備份系統(tǒng),廣州、上海等地的機(jī)場(chǎng)都擁有這一系統(tǒng),所以,在10月10日的故障發(fā)生后,白云機(jī)場(chǎng)啟用備份系統(tǒng)降低了損失,而沒(méi)有建立備份系統(tǒng)的機(jī)場(chǎng)則應(yīng)急能力明顯偏低,事故中癱瘓了將近一個(gè)小時(shí)。
在事故發(fā)生后,各方面在總結(jié)原因時(shí),仍然沒(méi)有對(duì)危害的重要性有所深刻認(rèn)識(shí)?!按舜坞x港系統(tǒng)癱瘓并沒(méi)有給我們?cè)斐商蟮挠绊?,在上海的浦東和虹橋兩大機(jī)場(chǎng),都擁有相應(yīng)的備份系統(tǒng)?!睎|方航空公司總經(jīng)理助理夏毅在接受記者采訪時(shí)說(shuō),“系統(tǒng)癱瘓后,我們及時(shí)啟動(dòng)了備份系統(tǒng),很快就恢復(fù)了正常工作?!钡珜?duì)于系統(tǒng)為何癱瘓,他表示并不知情。
廣州白云機(jī)場(chǎng)的一位工作人員向記者證實(shí),白云機(jī)場(chǎng)的備份系統(tǒng)在這次事故中發(fā)揮了不小的作用。但他們同時(shí)也表示,雖然備份系統(tǒng)可以暫時(shí)替代原有系統(tǒng),但它在工作效率上比起原來(lái)的系統(tǒng)還有不少差距,許多人工操作過(guò)于煩瑣。
雖然對(duì)于擁有相應(yīng)備份系統(tǒng)的機(jī)場(chǎng),這樣一個(gè)事故并不會(huì)造成太大的影響,但對(duì)于那些沒(méi)有備份系統(tǒng)的機(jī)場(chǎng)來(lái)說(shuō),就沒(méi)那么樂(lè)觀了。中航信工作人員表示,對(duì)于那些沒(méi)有備份系統(tǒng)的機(jī)場(chǎng),只能改為人工執(zhí)機(jī),由執(zhí)機(jī)人員手工打出旅客的訂票信息,并核對(duì)其身份證號(hào)。這樣一來(lái),工作效率將會(huì)大大降低,嚴(yán)重影響了乘客的登機(jī)時(shí)間,也會(huì)造成更長(zhǎng)時(shí)間的航班延誤。
中國(guó)民航離港系統(tǒng)建設(shè)于1988年,是引進(jìn)美國(guó)Unisys公司的USAS產(chǎn)品,屬于為航空公司和機(jī)場(chǎng)旅客服務(wù)的大型網(wǎng)絡(luò)系統(tǒng)。中航信通過(guò)其全球分銷系統(tǒng)(GDS)、離港控制系統(tǒng)和客位控制系統(tǒng)向國(guó)內(nèi)各地區(qū)航空公司、旅行社和機(jī)場(chǎng)提供可靠、高效的旅行代理、機(jī)場(chǎng)登機(jī)手續(xù)辦理和航空公司定位服務(wù),系統(tǒng)規(guī)模列世界前5位,每天處理超過(guò)50萬(wàn)人次旅客的訂座和離港操作。有統(tǒng)計(jì)數(shù)據(jù)表明,中航信訂座系統(tǒng)和離港系統(tǒng)的每秒最高交易處理量近5年來(lái)呈持續(xù)大幅增長(zhǎng)態(tài)勢(shì)。
據(jù)中航信技術(shù)人員介紹,目前中航信的生產(chǎn)系統(tǒng)是dorado 280主機(jī)和Unisys的CS7802主機(jī),正是Unisys的CS7802主機(jī)上面運(yùn)行著ICS(Inventory Control System,訂座系統(tǒng))和DCS(Departure Control System,離港系統(tǒng))。因此,全國(guó)各大機(jī)場(chǎng)的離港系統(tǒng)都依賴這臺(tái)CS7802主機(jī),由于離港系統(tǒng)對(duì)實(shí)時(shí)性和安全性的較高要求,所以全國(guó)各大機(jī)場(chǎng)幾乎所有的離港系統(tǒng)都由中航信來(lái)集中提供。
鑒于這次事故,中航信運(yùn)行部的這位工作人員透露,明年中航信將會(huì)籌備一個(gè)新的項(xiàng)目,主要就是針對(duì)電子客票的本地備份,以避免類似的問(wèn)題再度發(fā)生。
信息系統(tǒng)非常重要
有專家表示,信息管理統(tǒng)一化能給行業(yè)和企業(yè)帶來(lái)便利,使得信息管理更加方便,更容易降低運(yùn)營(yíng)成本; 但同時(shí),過(guò)度集中的信息管理模式也可能帶來(lái)過(guò)高風(fēng)險(xiǎn)。一旦系統(tǒng)的某一節(jié)點(diǎn)或環(huán)節(jié)出現(xiàn)故障,很容易引發(fā)“多米諾骨牌”效應(yīng),導(dǎo)致大面積甚至全局系統(tǒng)癱瘓。
但即使如此,信息化集成已經(jīng)成為全球趨勢(shì),專家也認(rèn)為,不能因?yàn)轱L(fēng)險(xiǎn)存在就“因噎廢食”,不必在信息管理統(tǒng)一化上過(guò)于躊躇。廈門航空的信息部總經(jīng)理王洪建也認(rèn)為,系統(tǒng)的癱瘓大大降低了工作效率,這讓許多已經(jīng)習(xí)慣了使用計(jì)算機(jī)系統(tǒng)的員工非常不適應(yīng),利用信息系統(tǒng)的優(yōu)勢(shì)由此體現(xiàn)得非常明顯。
廣州新白云國(guó)際機(jī)場(chǎng)于2004年8月5日正式投入運(yùn)營(yíng),新機(jī)場(chǎng)目前的年旅客吞吐量達(dá)到2500萬(wàn),停機(jī)坪空間可以停放66架飛機(jī),每年的貨物吞吐量達(dá)到110萬(wàn)噸。目前的機(jī)場(chǎng)一般要運(yùn)行400多套系統(tǒng),機(jī)場(chǎng)內(nèi)的業(yè)務(wù)流程甚至超過(guò)500個(gè),而且這些系統(tǒng)和業(yè)務(wù)流程之間不能進(jìn)行互操作。廣州新白云國(guó)際機(jī)場(chǎng)的情況卻非如此,借助中航信的信息系統(tǒng)集成了來(lái)自機(jī)場(chǎng)各個(gè)角落的信息流,然后把這些數(shù)據(jù)保存在機(jī)場(chǎng)中央數(shù)據(jù)庫(kù)內(nèi),并向機(jī)場(chǎng)各部門提供信息。該系統(tǒng)還將為未來(lái)的協(xié)調(diào)規(guī)劃、日常運(yùn)營(yíng)控制、集中計(jì)費(fèi)和報(bào)表功能提供便利。10月10的離港系統(tǒng)癱瘓也是新白云機(jī)場(chǎng)投入使用后,第一次出現(xiàn)大型的系統(tǒng)故障問(wèn)題。
據(jù)南航廣州白云機(jī)場(chǎng)的一位工作人員介紹,如今在白云機(jī)場(chǎng)登機(jī)的乘客已經(jīng)有70%以上的使用了電子機(jī)票。截至2005年,我國(guó)境內(nèi)民用航空定期航班通航機(jī)場(chǎng)135個(gè)(不含香港和澳門),其中絕大部分都在使用中航信的離港系統(tǒng)。雖然也有航空公司自行研發(fā)的離港系統(tǒng),但由于銷售系統(tǒng)由中航信提供,離港系統(tǒng)中很多旅客信息由銷售系統(tǒng)采集獲取,因此很難將銷售系統(tǒng)和自建的離港系統(tǒng)統(tǒng)一起來(lái)。
面對(duì)這種情況,再加上備份系統(tǒng)一時(shí)還無(wú)法建立起來(lái),東方航空公司總經(jīng)理助理夏毅表示,對(duì)技術(shù)的依賴已經(jīng)開始造成手工操作的不熟練,而這將導(dǎo)致機(jī)場(chǎng)在應(yīng)對(duì)緊急情況時(shí),缺乏足夠效率。為了應(yīng)對(duì)這種突發(fā)情況,東方航空公司一直保持對(duì)相關(guān)人員進(jìn)行緊急事務(wù)應(yīng)對(duì)培訓(xùn),以使工作人員能在系統(tǒng)癱瘓時(shí),快速有效地為乘客辦理離港業(yè)務(wù)。
盡快完善備份系統(tǒng)
據(jù)IDC研究報(bào)告預(yù)測(cè),中國(guó)未來(lái)5年的IT外包服務(wù)市場(chǎng)復(fù)合年增長(zhǎng)率達(dá)到39.9%,而涉及災(zāi)難備份領(lǐng)域的基礎(chǔ)設(shè)施服務(wù)、業(yè)務(wù)持續(xù)性服務(wù)和系統(tǒng)管理服務(wù)的復(fù)合年增長(zhǎng)率更是高達(dá)52.1%,是IT外包服務(wù)中增長(zhǎng)最快的。災(zāi)難備份,特別是集中式關(guān)鍵業(yè)務(wù)的備份,已經(jīng)成為關(guān)鍵業(yè)務(wù)執(zhí)行部門的統(tǒng)一認(rèn)識(shí)。
IT業(yè)界在尋覓優(yōu)化“業(yè)務(wù)持續(xù)”方案的努力已經(jīng)曙光漸露。作為中航信的合作伙伴,Unisys通過(guò)在分立存儲(chǔ)陣列提供數(shù)據(jù)備份及自動(dòng)化故障切換支持,以便使得企業(yè)的“業(yè)務(wù)持續(xù)”方案在距離、速度及成本方面三全其美?!斑^(guò)往業(yè)務(wù)持續(xù)領(lǐng)域有一個(gè)眾所周知的瓶頸,就是企業(yè)必需在三個(gè)條件中做出取舍,一是數(shù)據(jù)中心與災(zāi)難恢復(fù)站點(diǎn)之間的距離; 二是從災(zāi)難時(shí)間中恢復(fù)過(guò)來(lái)的所需時(shí)間; 三是企業(yè)愿意支出多少成本。企業(yè)最多只能選擇做好其中兩個(gè)條件,例如原有系統(tǒng)與應(yīng)變?cè)O(shè)備距離越遠(yuǎn),恢復(fù)速度就較慢。如果需要快速的恢復(fù)速度,企業(yè)便要做出更大的投入?!盪nisys大中華區(qū)系統(tǒng)與科技事業(yè)部銷售總監(jiān)張和平解釋說(shuō)。
但張和平的解釋,仍然無(wú)法幫助中航信在系統(tǒng)癱瘓時(shí)脫離窘境,而全國(guó)范圍內(nèi)的航班及乘客延誤,也已經(jīng)發(fā)生。“這不是成本投入的問(wèn)題,而是平時(shí)是否積極研究如何應(yīng)對(duì)危機(jī)狀況了,有關(guān)部門這方面的工作,顯然沒(méi)有做好,否則就不會(huì)出現(xiàn)如此大面積的癱瘓了?!庇性u(píng)論稱。
在日前記者向中航信詢問(wèn)事故原因時(shí),該人士解釋說(shuō),由于離港系統(tǒng)龐大,涉及的各方面因素也比較多,任何一方面出現(xiàn)問(wèn)題,都有可能導(dǎo)致整個(gè)系統(tǒng)的癱瘓。不但前后端產(chǎn)品出現(xiàn)問(wèn)題,如果整個(gè)系統(tǒng)日常維護(hù)做得不好,或者操作人員進(jìn)行了誤操作,都有可能出現(xiàn)系統(tǒng)癱瘓的情況。因?yàn)樵撓到y(tǒng)處于24小時(shí)不停機(jī)狀態(tài),所以要在不停工的情況下查出問(wèn)題所在需要很長(zhǎng)一段時(shí)間。中航信表示,致使離港系統(tǒng)癱瘓的原因是主機(jī)文件損壞所致,而對(duì)于為何主機(jī)文件出現(xiàn)損壞,或者出現(xiàn)損壞后為何沒(méi)有立即查出,中航信則沒(méi)有做出說(shuō)明。
鑒于如今民航系統(tǒng)性強(qiáng)、信息化程度高的現(xiàn)狀,必須盡快加強(qiáng)應(yīng)急管理,建立起快速處理故障的保障體系。而這,可能是避免中航信信息化危機(jī)再度出現(xiàn)最好的方法。
(計(jì)算機(jī)世界報(bào) 2006年10月16日 第40期 A19)
聯(lián)系客服