在計(jì)算機(jī)產(chǎn)業(yè),數(shù)字常會(huì)被夸大,而且海量數(shù)據(jù)已不是個(gè)新問(wèn)題。但今日信息的組成成分和來(lái)源已與過(guò)往不可同日而語(yǔ),如來(lái)自網(wǎng)絡(luò)日志(Blog)、Wiki)、即時(shí)通信(IM)、電子郵件、電子表單、無(wú)線射頻識(shí)別(RFID)標(biāo)簽、視頻、電子商務(wù)交易、技術(shù)支援、供應(yīng)鏈等各方面的數(shù)據(jù)都大得驚人。IDC預(yù)計(jì),今年產(chǎn)生的數(shù)字信息將首次超過(guò)存儲(chǔ)容量。“當(dāng)數(shù)據(jù)容量的威脅已達(dá)到駭人聽(tīng)聞的程度時(shí),我們就該有所行動(dòng)了。”IDC分析師蘇珊-費(fèi)爾德曼(Susan Feldman)認(rèn)為。
這種威脅在于過(guò)量的信息會(huì)超出公司的信息管理能力,更別提怎樣去利用它了。對(duì)此,商業(yè)科技管理者都有充分的認(rèn)識(shí)。根據(jù)《InformationWeek》“展望2007”調(diào)研顯示,網(wǎng)站門戶、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)分析工具都位列首席信息官(CIO)們2007年計(jì)劃表的首要任務(wù)里,遠(yuǎn)超過(guò)對(duì)業(yè)務(wù)應(yīng)用上的投資。在各種商業(yè)創(chuàng)新中,創(chuàng)建支持實(shí)時(shí)業(yè)務(wù)信息流程是關(guān)鍵目標(biāo),受關(guān)注程度只低于優(yōu)化業(yè)務(wù)流程。
信息管理是個(gè)總稱,目標(biāo)任務(wù)是處理不同的數(shù)據(jù)來(lái)源,它包括了好幾項(xiàng)彼此有重疊的技術(shù)領(lǐng)域:數(shù)據(jù)庫(kù)和內(nèi)容管理系統(tǒng);網(wǎng)絡(luò)存儲(chǔ)系統(tǒng);管理主數(shù)據(jù)和非結(jié)構(gòu)化內(nèi)容的服務(wù)器;提供數(shù)據(jù)概要、清理、整合的服務(wù)器;存放經(jīng)上述整理改進(jìn)了的數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù);分析內(nèi)在邏輯的商業(yè)智能工具;還有能進(jìn)行數(shù)據(jù)查詢的搜索引擎等等。
對(duì)企業(yè)而言,最重要的是如何從流入公司信息系統(tǒng)的海量信息和互聯(lián)網(wǎng)上的龐雜信息中,提取真正有用的知識(shí),并把它轉(zhuǎn)化為公司的競(jìng)爭(zhēng)優(yōu)勢(shì)。
師傅領(lǐng)入門:組織內(nèi)的應(yīng)用
摩托羅拉公司(Motorola,下稱摩托羅拉)使用一套名為“指南針”(Compass)的系統(tǒng)來(lái)管理自己的網(wǎng)站內(nèi)容,而這些內(nèi)容每隔12~14個(gè)月就會(huì)增加一倍,負(fù)責(zé)摩托羅拉企業(yè)內(nèi)容與協(xié)作平臺(tái)的高級(jí)經(jīng)理布拉德-波斯利(Brad Bosley)表示。這個(gè)數(shù)字現(xiàn)在為37TB(TeraByte,1Tera等于10的12次冪),這包括4,400個(gè)Blog、180萬(wàn)份文檔,以及客戶與合作伙伴需要訪問(wèn)的幾千個(gè)外網(wǎng)站點(diǎn)。摩托羅拉也會(huì)經(jīng)常歸檔過(guò)期的數(shù)據(jù),但新增的數(shù)據(jù)增長(zhǎng)迅猛:波斯利說(shuō)光3月就增加了2.6TB的數(shù)據(jù)。
指南針系統(tǒng)是基于Open Text公司的Livelink企業(yè)級(jí)內(nèi)容管理系統(tǒng),它的前身是一套微軟公司(Microsoft,下稱微軟)的Office文檔管理系統(tǒng)。這套系統(tǒng)已運(yùn)行超過(guò)10年,使用者為摩托羅拉的7萬(wàn)多名員工。波斯利認(rèn)為指南針的最大挑戰(zhàn)并非技術(shù)問(wèn)題,而是員工們?nèi)绾卫盟?。這套系統(tǒng)由波斯利和一個(gè)6人小組運(yùn)作管理。但摩托羅拉還網(wǎng)羅了150名諳熟網(wǎng)絡(luò)的志愿者,作為IT、會(huì)計(jì)、市場(chǎng)等部門的代表,出任“知識(shí)管理倡導(dǎo)者。”他們幫助管理自己部門在指南針上的內(nèi)容,并教會(huì)其他員工如何使用它。“我們致力于使這些專家在前臺(tái)發(fā)揮作用,這樣我們就獲得底層的參與和業(yè)務(wù)精英們的推廣和幫忙。”波斯利表示。
實(shí)時(shí)有多實(shí)時(shí)?
問(wèn)題是,實(shí)時(shí)數(shù)據(jù)訪問(wèn)究竟有多“實(shí)時(shí)”呢?有23家連鎖店的美國(guó)夢(mèng)幻渡假村集團(tuán)(MGM Mirage)有一套客戶回饋程序系統(tǒng),使用的數(shù)據(jù)比實(shí)時(shí)晚12小時(shí)。他們編制這套程序的出發(fā)點(diǎn)在于:如果客戶離開(kāi)拉斯維加斯一周后,才通知他們下次消費(fèi)可用的獲贈(zèng)點(diǎn)數(shù),就沒(méi)有什么意義了。
在一天內(nèi),客戶可能會(huì)使用不同的信用卡和身份證,走入多家在拉斯維加斯賭場(chǎng)地帶的Mirage飯店、酒吧、戲院和賭場(chǎng)。而使用來(lái)自國(guó)際商業(yè)機(jī)器公司(IBM)的數(shù)據(jù)集成軟件、微軟公司(Microsoft)的SQL Server數(shù)據(jù)庫(kù)和Acxiom公司(Acxiom Corporation)的數(shù)據(jù)聚合服務(wù),MGM Mirage集團(tuán)得以在隔夜后就把不同的身份整合統(tǒng)一起來(lái),到第二天自動(dòng)更新客戶賬號(hào)上獲贈(zèng)的積分點(diǎn)數(shù)。
“你得在信息處理速度和愿意支付的投資之間進(jìn)行權(quán)衡。”首席技術(shù)官(CTO)湯姆-派克(Tom Peck)分析說(shuō),“在我們的例子里,接近實(shí)時(shí)就已足夠好了。”
2年前IBM以11億美元購(gòu)并Ascential軟件公司(Ascential Software),MGM Mirage集團(tuán)使用的數(shù)據(jù)集成技術(shù)正是來(lái)自Ascential軟件公司。在過(guò)去2年里,IBM還購(gòu)并了許多信息管理領(lǐng)域的其他公司,包括以16億美元購(gòu)并FileNet公司及其內(nèi)容管理系統(tǒng);元數(shù)據(jù)管理供應(yīng)商Unicorn公司;自然語(yǔ)言搜索供應(yīng)商iPhrase公司;客戶數(shù)據(jù)集成供應(yīng)商DWL公司和身份識(shí)別供應(yīng)商SRD公司。
這些技術(shù),尤其是IBM購(gòu)并Ascential軟件公司和Unicorn公司所獲得的技術(shù),將成為IBM最新產(chǎn)品——信息服務(wù)器(Information Server)的一部分,IBM信息服務(wù)器軟件包涵蓋了多種WebSphere應(yīng)用服務(wù)器產(chǎn)品,用于處理各種數(shù)據(jù)集成任務(wù),如數(shù)據(jù)源分析(WebSphere Information Analyzer),核對(duì)重復(fù)記錄(WebSphere QualityStage)和從一個(gè)數(shù)據(jù)源到另一個(gè)數(shù)據(jù)源的數(shù)據(jù)提取、轉(zhuǎn)換與加載(WebSphere DataStage)。信息服務(wù)器是IBM信息隨需應(yīng)變(Information On Demand)策略中的旗艦產(chǎn)品。隨需應(yīng)變部門總經(jīng)理安布吉-戈雅(Ambuj Goyal)表示,“我們依托信息服務(wù)器開(kāi)創(chuàng)了一個(gè)新領(lǐng)域,相信以后人人都會(huì)跟進(jìn)的。”
IBM繼續(xù)豐富它在信息管理上的產(chǎn)品組合。3月,它發(fā)布了OmniFind Analytics Edition,用于合并及分析非結(jié)構(gòu)化數(shù)據(jù)源。該軟件作為IBM最近剛升級(jí)的DB2數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)模塊發(fā)布,而DB2數(shù)據(jù)倉(cāng)庫(kù)則經(jīng)常與信息服務(wù)器打包在一起。IBM的信息管理技術(shù)可不便宜:對(duì)一個(gè)大公司來(lái)說(shuō),這些組合可能要花上好幾十萬(wàn)美元甚或更多。
堅(jiān)定的信徒
另一位在信息管理領(lǐng)域孜孜探索追求的IBM資深人士就是在2004年加入EMC公司的CTO杰夫-尼克(Jeff Nick)。尼克從上世紀(jì)80年代起就在IBM工作,并擁有50多項(xiàng)美國(guó)專利。他是IBM網(wǎng)格運(yùn)算(Grid Computing)技術(shù)的總設(shè)計(jì)師,在離職前,是他領(lǐng)導(dǎo)制訂IBM的按需計(jì)算策略。
尼克對(duì)信息管理技術(shù)充滿熱情。他覺(jué)得隨著信息共享程度的提高,信息管理技術(shù)的確可以改變世界,他繼續(xù)解釋道:“蘊(yùn)藏在這些信息里的很可能就是未知的新發(fā)現(xiàn)、絕癥的治療方法、我們來(lái)自哪里和將往何方等宇宙謎團(tuán)的答案。”一陣沉思后,他又補(bǔ)充說(shuō):“當(dāng)然,商業(yè)上的需求沒(méi)那么重的哲學(xué)味。”
杰夫-尼克說(shuō),我們來(lái)自哪里,我們將往何方?這還是個(gè)謎。在過(guò)去2年半里,尼克幫助EMC制訂了雄心勃勃的收購(gòu)策略,使這家公司從一個(gè)存儲(chǔ)硬件廠商變成了信息管理軟件和系統(tǒng)的領(lǐng)跑者。這幾年來(lái)EMC公司一直在兜售它的信息生命周期管理系統(tǒng)。
根據(jù)IDC的資料顯示,隨著EMC在2003年以17億美元購(gòu)并文檔管理軟件廠商Documentum公司和2005年以2.75億美元購(gòu)并數(shù)據(jù)輸入軟件廠商Captiva軟件公司(Captiva Software),EMC已成為內(nèi)容管理系統(tǒng)領(lǐng)域里首屈一指的軟件商。對(duì)那些質(zhì)疑它于一年前以21億購(gòu)并RSA安全公司(RSA Security)之后,如何把這家公司融入信息管理布局,尼克覺(jué)得答案顯而易見(jiàn):一家宣稱提供一攬子信息管理平臺(tái)的技術(shù)廠商,怎么可能不提供整合的安全呢?
EMC新增的產(chǎn)品無(wú)疑豐富了它的信息管理產(chǎn)品組合,最終達(dá)到和IBM相類似的水平:Centera和Symmetrix用于數(shù)據(jù)存儲(chǔ)和訪問(wèn)、Documentum和Captiva用于數(shù)據(jù)管理、RSA使它更安全,還有上萬(wàn)名員工的服務(wù)團(tuán)隊(duì)提供業(yè)務(wù)幫助。尼克表示,EMC將通過(guò)自主研發(fā)和收購(gòu)的方式,繼續(xù)擴(kuò)張自己的信息管理產(chǎn)品組合。
對(duì)大型信息管理供應(yīng)商來(lái)說(shuō),要說(shuō)缺少什么技術(shù)的話,可能就是企業(yè)級(jí)搜索了。由霍華德-休斯(Howard Hughes)創(chuàng)建的位于馬里蘭州的霍華德-休斯醫(yī)學(xué)中心(Howard Hughes Medical Center)管理著近1 PB(PetaByte,即1,000TB,1Peta等于10的15次冪)的研究信息。科學(xué)計(jì)算經(jīng)理斯科特·柯林斯(Scott Collins)說(shuō),它使用了EMC的存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)和用于文件共享的網(wǎng)絡(luò)附加存儲(chǔ)(NAS)軟件。然而,搜索特定的研究數(shù)據(jù)卻絕非易事。科學(xué)家們經(jīng)常使用PubMed,這是一個(gè)由美國(guó)國(guó)立醫(yī)學(xué)圖書館(U.S. National Library of Medicine)發(fā)布的在線醫(yī)學(xué)研究摘要和引用數(shù)據(jù)庫(kù)??铝炙菇忉屨f(shuō),因?yàn)樯虡I(yè)產(chǎn)品不能滿足該應(yīng)用特定的搜索需求,該中心正在開(kāi)發(fā)自己的搜索引擎。
然而,這些都還處于展望階段,因?yàn)镺racle正努力通過(guò)Fusion Web 、服務(wù),把這些收購(gòu)來(lái)的軟件整合到一起,讓它們協(xié)同工作。這意味著以后基于Fusion版的PeopleSoft和Stellent軟件可以非常方便地搭配使用,但前提是需要進(jìn)行更多的整合工作。
Oracle已在著手改進(jìn)的一個(gè)領(lǐng)域是自己的數(shù)據(jù)庫(kù)技術(shù),這家公司耗費(fèi)了大量的工作,以使它的數(shù)據(jù)庫(kù)查詢支持自然語(yǔ)言查詢,也就是語(yǔ)義描述方式。辛普表示,預(yù)期在Oracle 11G數(shù)據(jù)庫(kù)在今年夏天發(fā)布的時(shí)候,會(huì)提供更多的語(yǔ)義功能。
成本問(wèn)題
最近,微軟在信息管理上做了一個(gè)大動(dòng)作。這家公司最近發(fā)布的SharePoint Server 2007,它的前身SharePoint Portal 2003的定位是協(xié)同軟件,而新版本的功能則包括如企業(yè)級(jí)搜索、內(nèi)容管理和商業(yè)智能。3月,微軟在圣地亞哥舉辦的一次會(huì)議上,首席執(zhí)行官(CEO)史蒂夫-鮑爾默(Steve Ballmer)把SharePoint 2007稱為“中間層的終極操作系統(tǒng)或平臺(tái)。”
微軟SharePoint業(yè)務(wù)總裁湯姆-里茲(Tom Rizzo)解釋說(shuō),鮑爾默的意思是,信息服務(wù)器可以作為用戶桌面端信息請(qǐng)求與包含信息的網(wǎng)絡(luò)數(shù)據(jù)源之間的信息代理,這些數(shù)據(jù)源包括非結(jié)構(gòu)化內(nèi)容、數(shù)據(jù)庫(kù)、各廠商的ERP和客戶關(guān)系管理(CRM)應(yīng)用程序,當(dāng)然也包括微軟自己的Dynamics系列產(chǎn)品線。里茲認(rèn)為,“這樣信息就得到了解放,而SharePoint正是突破口。”根據(jù)SharePoint服務(wù)器從電子郵件或ERP應(yīng)用里提取出來(lái)的數(shù)字,用戶借助分析工具能分析出銷售增長(zhǎng)率的趨勢(shì)。
與往常相似,微軟最有力的競(jìng)爭(zhēng)優(yōu)勢(shì)仍是成本,它不需要在如商業(yè)智能工具、內(nèi)容管理服務(wù)器、數(shù)據(jù)集成軟件等信息管理軟件包上投入巨資,這些產(chǎn)品原本可能需要向不同廠商購(gòu)買,而且即使買回來(lái)也不能很好地協(xié)同工作。“有許多單一領(lǐng)域的廠商各自為政。”里茲總結(jié)道,“而SharePoint卻可以作為統(tǒng)一的平臺(tái),完成在公司內(nèi)部各種與效率有關(guān)的任務(wù)。”SharePoint Server 2007的定價(jià)取決于你要選購(gòu)哪些模塊,只提供企業(yè)級(jí)搜索的版本定價(jià)為5.8萬(wàn)美元。
但并非人人都認(rèn)同這點(diǎn)。安全防衛(wèi)承包商BAE系統(tǒng)公司(BAE Systems)采用Autonomy公司的Idol Server實(shí)現(xiàn)企業(yè)級(jí)搜索,它可以從多種數(shù)據(jù)源抓取信息,其中包括SharePoint 2003 服務(wù)器。BAE系統(tǒng)公司知識(shí)工程師斯科特?佩特里(Scott Petri)認(rèn)為,即使是升級(jí)版的SharePoint Server也過(guò)于專用了,不太適于做企業(yè)搜索引擎。“Autonomy公司的搜索引擎對(duì)多數(shù)據(jù)庫(kù)提供更好的訪問(wèn)。”他指出,“我們要找的產(chǎn)品得有更好的功能,要比SharePoint覆蓋更多類型的數(shù)據(jù)庫(kù)。”
企業(yè)搜索是信息管理至關(guān)重要的因素,但是它依然被企業(yè)忽視了。BAE系統(tǒng)公司采用Autonomy技術(shù)已經(jīng)18個(gè)月了,佩特里說(shuō),整個(gè)公司的員工都通過(guò)它搜索Office文檔和PDF文件、RSS種子文件、HTML頁(yè)面和在公司網(wǎng)絡(luò)上共享的文件。佩特里表示,他也很贊賞Autonomy技術(shù)在用戶授權(quán)和加密上的安全性。
佩特里認(rèn)為,唯一真正的挑戰(zhàn)是,要讓員工把Autonomy看成一個(gè)概念搜索引擎(Conceptual Search Engine),它有別于使用Google時(shí)基于一兩個(gè)關(guān)鍵字的搜索。在概念搜索方式里,用戶給系統(tǒng)提供的信息越多,獲得的結(jié)果就越準(zhǔn)確。
在公司的信息管理策略里,企業(yè)文化問(wèn)題也不可小覷。麻省理工學(xué)院(MIT)的IT教授斯圖爾特-馬德尼克(Stuart Madnick)認(rèn)為,最大的危險(xiǎn)在于,海量信息排山倒海而來(lái)時(shí),人們卻還熟視無(wú)睹、麻痹大意。“很可能有些高層就簡(jiǎn)單粗暴地把這個(gè)問(wèn)題拒之門外。”他表示,“這會(huì)錯(cuò)失良機(jī)。”
商業(yè)機(jī)會(huì)可以溜走,但不斷攀升的數(shù)字信息卻不會(huì)自己消失。(譯/朱筱丹)
聯(lián)系客服