一位年輕人因患某種相對(duì)罕見(jiàn)的流感而到醫(yī)院就診。這是檢查醫(yī)師本周遇到的第三個(gè)相似的病例,他需要更多的信息。困惑不解的醫(yī)師取了血樣并安排了其他一些程序。然后,他坐在計(jì)算機(jī)前面,(通過(guò)一個(gè)簡(jiǎn)單的圖形用戶(hù)界面)申請(qǐng)了一系列血樣分析項(xiàng)目,并將結(jié)果與世界各地具有相似癥狀的患者進(jìn)行比較。他還請(qǐng)求檢索與該年輕人情況相似的患者的診斷、治療和結(jié)果記錄。然后,醫(yī)師向疾病控制與預(yù)防中心(CDC)請(qǐng)求獲得該病癥發(fā)展的相關(guān)信息。幾分鐘后,醫(yī)師就為其他患者找到了這種不尋常流感的治療方法,該流感近期在污染程度較為嚴(yán)重的一些城市流行。
這種情景能在今日成為可能嗎?有可能(假如我們已擁有正確的科學(xué)分析和仿真工具包),但要為此支付高級(jí)應(yīng)用發(fā)展和系統(tǒng)配置所需的費(fèi)用。數(shù)據(jù)管理早已發(fā)生變革以使類(lèi)似情景切實(shí)可行:系統(tǒng)在更快、集成度更高、更易使用的同時(shí)增強(qiáng)功能、可擴(kuò)展性和分布性。
本文中,我將介紹數(shù)據(jù)管理行業(yè)今后幾年醞釀的產(chǎn)品以及推進(jìn)DB2優(yōu)先發(fā)展的動(dòng)力。
當(dāng)今的公司正面臨不斷增加的數(shù)據(jù)管理工作的挑戰(zhàn)。越來(lái)越多的商務(wù)程序?qū)崿F(xiàn)了自動(dòng)化;更多的歷史記錄和分析工作被捕獲并保存下來(lái);新的規(guī)章制度正在改變商業(yè)模式。簡(jiǎn)言之,數(shù)據(jù)量在不斷增加。用于處理孤立程序的專(zhuān)用系統(tǒng)必須連接起來(lái)以生成報(bào)表。例如,兼并和收購(gòu)迫使商務(wù)程序(風(fēng)險(xiǎn)分析)和數(shù)據(jù)(客戶(hù)信息)進(jìn)行集成。不同的商業(yè)單位必須共享信息以獲得新的收入增長(zhǎng)點(diǎn),而公司也必須與商業(yè)伙伴、供應(yīng)商和客戶(hù)交流信息。全球商務(wù)意味著管理分布式數(shù)據(jù)庫(kù)并提供全天候的可用性。成本居高不下、經(jīng)濟(jì)停滯、競(jìng)爭(zhēng)壓力增加迫使企業(yè)提高運(yùn)行效率,這通常意味著員工數(shù)量減少,同時(shí)管理的數(shù)據(jù)維護(hù)及訪問(wèn)任務(wù)的復(fù)雜性日益增加。
當(dāng)數(shù)據(jù)管理所帶來(lái)的挑戰(zhàn)日益增加時(shí),信息的重要性就被提升到前所未有的高度。各種形式的信息——數(shù)據(jù)庫(kù)、電子數(shù)據(jù)表、文檔管理系統(tǒng)、文本文件、網(wǎng)頁(yè)、圖表和圖像——就成為企業(yè)共同的財(cái)富。因此,對(duì)數(shù)據(jù)庫(kù)和其他各種來(lái)源的數(shù)據(jù)進(jìn)行管理的需求,以及為非IT專(zhuān)家的商業(yè)用戶(hù)提供更便捷的方式訪問(wèn)這些數(shù)據(jù)的需求都在日益增加。
更多的數(shù)據(jù)需要存儲(chǔ)、更多的業(yè)務(wù)需要處理、更多的分析需要完成,而且沒(méi)有喘息時(shí)間,這些都期待著所有的數(shù)據(jù)管理要素繼續(xù)改進(jìn)。
載入和檢索速度。研究具有更快的載入和檢索速度的存儲(chǔ)方法仍將打頭陣。快速數(shù)據(jù)訪問(wèn)研究包括新型索引(例如,能夠迅速適應(yīng)新數(shù)據(jù)類(lèi)型的通用索引結(jié)構(gòu))。采用多維聚簇加速訪問(wèn)多維數(shù)據(jù),該技術(shù)已在 DB2 Universal Database (UDB) v.8.1中應(yīng)用并將在后續(xù)的版本中繼續(xù)使用。IBM 不斷研發(fā)不同的存儲(chǔ)方案以增加數(shù)據(jù)聚簇速度并加強(qiáng)對(duì)大對(duì)象的控制能力。
對(duì)大量數(shù)據(jù)的高效查詢(xún)。解決海量業(yè)務(wù)數(shù)據(jù)高效處理和復(fù)雜查詢(xún)的工作也正在進(jìn)行中。例如,IBM Almaden 研究中心開(kāi)發(fā)了一種新方法,它通過(guò)采樣獲得數(shù)據(jù)的隨機(jī)子集并根據(jù)該樣本估計(jì)或外推解答,使系統(tǒng)能夠更快地為復(fù)雜查詢(xún)提供近似解答。該技術(shù)已應(yīng)用在DB2 UDB v.8.1 測(cè)試基礎(chǔ)版中。采樣將以更快的速度獲得更好的統(tǒng)計(jì)信息,幫助優(yōu)化和不同的設(shè)計(jì)顧問(wèn)。此外,為提高帶有大量子查詢(xún)和復(fù)雜操作內(nèi)容(例如和外部關(guān)聯(lián)和反關(guān)聯(lián))的查詢(xún)性能所做的相關(guān)改進(jìn)工作也在進(jìn)行中,有望在某些類(lèi)型的查詢(xún)上取得重大飛躍。
用以?xún)?chǔ)存針對(duì)高頻次查詢(xún)的預(yù)先計(jì)算解答的具體化查詢(xún)列表(MQT)可能被更廣泛地采納。目前 MQT 已經(jīng)可用,并且正在擴(kuò)展以?xún)?chǔ)存更多的一般性查詢(xún)解答。例如,DB2 v.8.1 能夠儲(chǔ)存關(guān)聯(lián)結(jié)果,即使查詢(xún)中并無(wú)集合體。查詢(xún)引擎能夠更好地自主決定何時(shí)使用 MQT 解答當(dāng)前查詢(xún)。用于提示系統(tǒng)何時(shí)創(chuàng)建 MQT 可能奏效的工具已出現(xiàn)。將來(lái),數(shù)據(jù)庫(kù)系統(tǒng)能夠自主創(chuàng)建 MQT,并用于索引(如關(guān)聯(lián)檢索)和常用結(jié)果緩存中。當(dāng)用于連接遠(yuǎn)程數(shù)據(jù)時(shí)(v.8.1已采用),MQT 將發(fā)揮更大的作用。
在大共享內(nèi)存和非共享多處理器中,你將獲得更多的分割數(shù)據(jù)(分區(qū))選擇和處理查詢(xún)的新算法。
提高可用性。業(yè)務(wù)壓力要求適應(yīng)更多環(huán)境的高可用性。熱備用系統(tǒng)瞬時(shí)切換已成為高端配置的標(biāo)準(zhǔn),并將更為普及。總之,用戶(hù)可以從一系列的“服務(wù)質(zhì)量”承諾中選擇在性能、可用性以及費(fèi)用之間所需的權(quán)衡。同時(shí),通過(guò)使用減少冗余硬件和備份信息,研究和開(kāi)發(fā)人員將使那些權(quán)衡更容易實(shí)現(xiàn)。IBM 還在研究對(duì)存在的問(wèn)題進(jìn)行早期探測(cè)和自動(dòng)更正。
關(guān)于電子商務(wù)的需要已有很多著述。如今,越來(lái)越多的公司使用Web服務(wù)器、應(yīng)用、J2EE、.NET 和 XML 的復(fù)雜混合體在網(wǎng)上從事商務(wù)活動(dòng)。在該環(huán)境內(nèi)外獲取數(shù)據(jù)通常需要通過(guò)諸如 JDBC 這樣的接口實(shí)現(xiàn)數(shù)據(jù)訪問(wèn),并將結(jié)果轉(zhuǎn)換為 XML,然后將 XML 打包作為Web服務(wù)響應(yīng)。目前,可以這種方式轉(zhuǎn)移數(shù)據(jù),但這確實(shí)有些令人乏味。將來(lái),數(shù)據(jù)庫(kù)會(huì)被更加直接地植入Web,使其成為Web應(yīng)用基礎(chǔ)架構(gòu)的無(wú)縫元件。
數(shù)據(jù)管理和Web服務(wù)。數(shù)據(jù)庫(kù)早已成為Web服務(wù)供應(yīng)商,通過(guò)Web服務(wù)接口應(yīng)答請(qǐng)求。不久它也將成為Web服務(wù)的消費(fèi)者。也就是說(shuō),在查詢(xún)過(guò)程中,它能夠調(diào)用Web服務(wù)以返回所需信息。例如,在一次單步查詢(xún)中,用戶(hù)可以查找一個(gè)包含本地儲(chǔ)存狀況描述、首選供應(yīng)商(從不同的本地列表)、可用性及價(jià)格信息的零件(通過(guò)Web服務(wù)發(fā)出向供應(yīng)商的請(qǐng)求并返回當(dāng)前信息)。DB2 早已顯示出這種能力。目前,你不得不通過(guò)用戶(hù)定義的函數(shù)在 SQL 語(yǔ)句中明確地調(diào)用Web服務(wù),照此發(fā)展,你甚至可以將Web服務(wù)視為列表的別名從而能夠透明地訪問(wèn)。應(yīng)用開(kāi)發(fā)和部署工具將隨技術(shù)而發(fā)展。
XML支持。數(shù)據(jù)及處理集成的基礎(chǔ)即是對(duì) XML 的穩(wěn)定性支持,包括支持 XML 作為基本的數(shù)據(jù)類(lèi)型。XML Extender 允許用戶(hù)保存和檢索 XML數(shù)據(jù),通過(guò)它DB2能夠支持 XML。將來(lái),IBM 會(huì)在引擎中引入更多的這種支持以?xún)?yōu)化訪問(wèn)。目前,通過(guò)對(duì)SQL 語(yǔ)言(SQL/XML) 的標(biāo)準(zhǔn)化擴(kuò)展,可以將關(guān)系數(shù)據(jù)以 XML 文件的形式返回。由此,可將數(shù)據(jù)以電子商務(wù)業(yè)務(wù)中數(shù)據(jù)交換所需的類(lèi)型返回,所交換的文檔可在 RDBMS 中安全儲(chǔ)存。
雙語(yǔ)數(shù)據(jù)庫(kù)。盡管 XML 顯然將成為電子商務(wù)數(shù)據(jù)交換的標(biāo)準(zhǔn),關(guān)系數(shù)據(jù)庫(kù)并不會(huì)從此消失。僅支持 XML 的數(shù)據(jù)庫(kù)并不能代替無(wú)處不在的關(guān)系系統(tǒng),一部分原因是將全部數(shù)據(jù)進(jìn)行轉(zhuǎn)換所需的費(fèi)用,另一部分原因是比 XML 數(shù)據(jù)庫(kù)更為成熟的關(guān)系技術(shù)的出現(xiàn)。相反,未來(lái)的數(shù)據(jù)庫(kù)能夠?yàn)?/span> XML 提供全面的關(guān)系能力和真正的本地支持。它們將在引擎中構(gòu)建支持 XML 的存儲(chǔ)管理和檢索工具,而且既可使用 XML 語(yǔ)言查詢(xún)即XQuery 又可使用 SQL。這種雙語(yǔ)數(shù)據(jù)庫(kù)可使用戶(hù)按需要同時(shí)利用關(guān)系和 XML 的優(yōu)勢(shì),以實(shí)施其最佳應(yīng)用。IBM Xperanto 團(tuán)隊(duì)正在從事此項(xiàng)工作。
你已經(jīng)了解到 XML 和 Web 服務(wù)是如何幫助你處理復(fù)雜的分布式商務(wù)模型。它們提供了一種分布式數(shù)據(jù)的集成方法:在不同的應(yīng)用或企業(yè)之間交換數(shù)據(jù)。不過(guò),有時(shí)卻需要更為精細(xì)的數(shù)據(jù)集成。
如今的企業(yè)通常是高度分布的,某個(gè)職能部門(mén)可能分散于好幾個(gè)地點(diǎn)。某大型制藥公司可能在幾個(gè)不同國(guó)家都有研究實(shí)驗(yàn)室,實(shí)驗(yàn)室里的科學(xué)家們則需要共享實(shí)驗(yàn)和仿真信息。IBM 的數(shù)據(jù)管理開(kāi)發(fā)團(tuán)隊(duì)就分布在四個(gè)國(guó)家的七個(gè)地點(diǎn),并在世界各地其他一些地方也有相關(guān)的研究機(jī)構(gòu)。開(kāi)發(fā)者需要在這些不同工作地點(diǎn)之間共享所需的技術(shù)規(guī)范、代碼、狀態(tài)和信息。
獨(dú)立的機(jī)構(gòu)會(huì)選擇不同的基礎(chǔ)架構(gòu)。在某些盛行兼并和收購(gòu)的行業(yè)里,功能相同的部門(mén)卻擁有完全不同的 IT 基礎(chǔ)架構(gòu),這并不少見(jiàn)。業(yè)務(wù)運(yùn)轉(zhuǎn)通常仍需在這些不同的地區(qū)和系統(tǒng)間共享信息。
信息集成有多種機(jī)制,包括:
基于應(yīng)用的集成。最常用的信息集成方法可能是:通過(guò)使用專(zhuān)門(mén)的應(yīng)用實(shí)現(xiàn)對(duì)感興趣的資源的硬連接訪問(wèn),然后手動(dòng)合并查詢(xún)結(jié)果。應(yīng)用集成框架、業(yè)務(wù)流程集成工作流程系統(tǒng)以及Web服務(wù)都為程序員提供高級(jí)提取服務(wù),使其能夠方便地從額外的來(lái)源獲取數(shù)據(jù)。當(dāng)然,合并數(shù)據(jù)(即執(zhí)行關(guān)聯(lián))仍需手動(dòng)編程。
集中化的數(shù)據(jù)倉(cāng)庫(kù)對(duì)于那些需要復(fù)雜分析的應(yīng)用,許多公司選擇將需要的數(shù)據(jù)“拉入”(從數(shù)據(jù)來(lái)源處復(fù)制)單獨(dú)的數(shù)據(jù)倉(cāng)庫(kù)(數(shù)據(jù)中心)。這樣做可以使SQL “全身心”地投入到分析中,并且也無(wú)需通過(guò)應(yīng)用處理分散的數(shù)據(jù)。
數(shù)據(jù)聯(lián)合造就虛擬數(shù)據(jù)庫(kù)并不是所有的數(shù)據(jù)都能進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)。有時(shí)數(shù)據(jù)變化太快,有時(shí)該數(shù)據(jù)不為本企業(yè)所有(如歸其商業(yè)伙伴或某一信息服務(wù)機(jī)構(gòu)所有),有時(shí)該數(shù)據(jù)的格式不對(duì),不能存貯到關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)中或被其搜索到。這時(shí) DB2 數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)中心就可大顯其道,IBM 杰出的技術(shù)可將那些各自為政的異構(gòu)型分布數(shù)據(jù)源聯(lián)合起來(lái)。數(shù)據(jù)聯(lián)合讓用戶(hù)查詢(xún)分布式數(shù)據(jù)時(shí)更為簡(jiǎn)便,就好像這些數(shù)據(jù)存貯在單一數(shù)據(jù)庫(kù)中,同時(shí)應(yīng)用也變得更簡(jiǎn)易并且擁有單一數(shù)據(jù)庫(kù)的功能,而無(wú)需復(fù)制與維護(hù)成本。通過(guò)數(shù)據(jù)聯(lián)合,應(yīng)用可將底層數(shù)據(jù)存放到查詢(xún)中,使這些功能不被再次執(zhí)行(如果數(shù)據(jù)實(shí)際移動(dòng),這些功能會(huì)執(zhí)行)。
數(shù)據(jù)聯(lián)合在客戶(hù)機(jī)應(yīng)用與數(shù)據(jù)之間增加了一個(gè)部件——層,這個(gè)特殊的層使得性能達(dá)到平衡。在查詢(xún)過(guò)程中,數(shù)據(jù)存貯在不同點(diǎn)(沒(méi)有合并)將可能產(chǎn)生網(wǎng)絡(luò)延遲。借超級(jí)優(yōu)化功能之東風(fēng),數(shù)據(jù)聯(lián)合使得多種應(yīng)用間的數(shù)據(jù)集成更為高效簡(jiǎn)捷。
未來(lái)各種模型的融合信息集成很有可能成為大多數(shù)公司追逐的熱點(diǎn),你也許可以看見(jiàn)不同的技術(shù)成熟并且融合。某一特定集成問(wèn)題的解決方案將涉及到數(shù)據(jù)倉(cāng)庫(kù)(用于可以存貯于關(guān)系型系統(tǒng)的關(guān)鍵數(shù)據(jù))與數(shù)據(jù)聯(lián)合(用于集成不適合數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù))之間的集成。豐富的元數(shù)據(jù)設(shè)施簡(jiǎn)化了從不同的數(shù)據(jù)源中映射、清除數(shù)據(jù),同時(shí)簡(jiǎn)化了將數(shù)據(jù)關(guān)聯(lián)在一起的過(guò)程。它們將得到其它類(lèi)型集成的補(bǔ)充(如上面提到的那些),并且這些集成之間能夠協(xié)同工作。挖掘工具、應(yīng)用將與整個(gè)虛擬數(shù)據(jù)庫(kù)共同工作,而不用考慮數(shù)據(jù)是在本地還是來(lái)自外部數(shù)據(jù)源。緩存與查詢(xún)處理得以加強(qiáng),消除了性能之間的差異,使得用戶(hù)真正受益。
最大限度地利用分布式數(shù)據(jù)的發(fā)展動(dòng)向,加上處理大型計(jì)算任務(wù)的需求及重新利用現(xiàn)有軟硬件資源之渴望,完美的網(wǎng)絡(luò)計(jì)算環(huán)境將出現(xiàn)在你面前。網(wǎng)絡(luò)計(jì)算可以實(shí)現(xiàn)各自獨(dú)立的異構(gòu)軟硬件資源之間的共享,同時(shí)降低總擁有成本并提供更加出色的性能、伸縮性,還支持?jǐn)?shù)據(jù)共享與協(xié)作。當(dāng)急需提高功能時(shí),你可以使一個(gè)節(jié)點(diǎn)在線,你就會(huì)想到強(qiáng)大的網(wǎng)絡(luò)計(jì)算。
科學(xué)界一直利用網(wǎng)絡(luò)計(jì)算處理“極具挑戰(zhàn)的”難題,如蛋白質(zhì)合成、天氣預(yù)報(bào)、基因組分析及粒子物理等?,F(xiàn)在,各個(gè)行業(yè)中的企業(yè)也都在探索網(wǎng)絡(luò)計(jì)算。網(wǎng)絡(luò)計(jì)算的優(yōu)勢(shì)在于削減了處理時(shí)間并優(yōu)化了資源的使用。同時(shí),它也為隨需應(yīng)變的計(jì)算理念提供了堅(jiān)實(shí)的基礎(chǔ)架構(gòu)。網(wǎng)絡(luò)計(jì)算的一個(gè)顯著特點(diǎn)就是可以從不同的資源(計(jì)算機(jī)、數(shù)據(jù)庫(kù)、存貯系統(tǒng)等)請(qǐng)求特定的服務(wù)。這種特點(diǎn)成就了e-公用設(shè)施,它能夠提供電子商務(wù)所需的復(fù)雜服務(wù)。網(wǎng)絡(luò)計(jì)算還可為協(xié)作提供基礎(chǔ)架構(gòu)(如在企業(yè)內(nèi)大規(guī)模地集成信息),這在以前是不可能的。由于在不同的節(jié)點(diǎn)多次復(fù)制數(shù)據(jù),網(wǎng)絡(luò)計(jì)算也提供了強(qiáng)大的伸縮性。
數(shù)據(jù)管理在網(wǎng)絡(luò)計(jì)算中承擔(dān)什么角色呢?網(wǎng)絡(luò)計(jì)算實(shí)際上提供了一個(gè)虛擬計(jì)算機(jī),以供應(yīng)用運(yùn)行。在網(wǎng)絡(luò)中單獨(dú)的數(shù)據(jù)庫(kù)系統(tǒng)可作為共享資源。然而,數(shù)據(jù)管理的作用更為廣泛。我提到的聯(lián)合數(shù)據(jù)庫(kù)系列能夠?yàn)樘摂M計(jì)算機(jī)提供單獨(dú)的虛擬數(shù)據(jù)庫(kù),因此通過(guò)標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)編程界面編寫(xiě)標(biāo)準(zhǔn)的數(shù)據(jù)庫(kù)應(yīng)用,應(yīng)用就可以盡量利用網(wǎng)絡(luò)的功能。數(shù)據(jù)聯(lián)合將發(fā)現(xiàn)并查詢(xún)相關(guān)的數(shù)據(jù)源,并進(jìn)行大規(guī)模的集成。通過(guò)將不同的數(shù)據(jù)源作為非共享并行處理器中的節(jié)點(diǎn),網(wǎng)絡(luò)可使查詢(xún)與數(shù)據(jù)計(jì)算進(jìn)行得更快。
在網(wǎng)絡(luò)環(huán)境中,需要對(duì)數(shù)據(jù)管理技術(shù)進(jìn)行擴(kuò)展。網(wǎng)絡(luò)具有動(dòng)態(tài)的特性,新的數(shù)據(jù)源可在任何時(shí)候來(lái)去自如。這種特性以及網(wǎng)絡(luò)的規(guī)模,就意味著用戶(hù)不知道在何處找到所需的數(shù)據(jù)。這樣就需要一些通過(guò)對(duì)所需進(jìn)行內(nèi)容進(jìn)行描述來(lái)查找數(shù)據(jù)的方式。找到數(shù)據(jù)源后,數(shù)據(jù)庫(kù)聯(lián)合應(yīng)該能夠自我配置,以便訪問(wèn)該數(shù)據(jù)源。數(shù)據(jù)動(dòng)態(tài)自動(dòng)復(fù)制特性,能夠應(yīng)對(duì)負(fù)載失衡、停機(jī)及性能等一些問(wèn)題,為網(wǎng)絡(luò)用戶(hù)提供更好的伸縮性、靈活性及性能。
人體是自主系統(tǒng)最生動(dòng)的實(shí)例,它可以自身調(diào)節(jié)以適應(yīng)外部環(huán)境。如果溫度過(guò)高,人體會(huì)出汗降溫。如果運(yùn)動(dòng)需要更多的氧氣,人體就加快呼吸頻率和心率。
自我恢復(fù)、自我調(diào)整、自我配置系統(tǒng)對(duì)網(wǎng)絡(luò)必不可少;但“普通”的IT環(huán)境也會(huì)從此類(lèi)系統(tǒng)中受益。人力成本占數(shù)據(jù)庫(kù)系統(tǒng)擁有成本的大部分。DBA的工作職責(zé)繁重,包括數(shù)據(jù)邏輯設(shè)計(jì)、物理數(shù)據(jù)布局、物理訪問(wèn)結(jié)構(gòu)決策、內(nèi)存分配和性能調(diào)整、監(jiān)控和調(diào)節(jié)。隨著數(shù)據(jù)庫(kù)自主功能增強(qiáng),DBA能夠?qū)W⒂诟訌?fù)雜和感興趣的問(wèn)題,同時(shí)節(jié)省員工的時(shí)間和費(fèi)用。
盡管這聽(tīng)起來(lái)像科學(xué)幻想,但已經(jīng)邁出了第一步。例如,DB2 UDB Configuration Advisor(數(shù)據(jù)庫(kù)配置顧問(wèn))可減少甚至消除單調(diào)費(fèi)時(shí)的系統(tǒng)配置任務(wù),可滿足希望的性能目標(biāo),并且無(wú)需頻繁手工調(diào)整與性能有關(guān)的配置參數(shù)。Health Center(健康中心)自動(dòng)評(píng)估DB2 UDB系統(tǒng)的狀態(tài),提醒DBA系統(tǒng)的日志空間或內(nèi)存可能將耗盡。系統(tǒng)可自動(dòng)采取措施,增加空間和內(nèi)存以保持?jǐn)?shù)據(jù)庫(kù)正常運(yùn)行,并且無(wú)需DBA的干預(yù)。除了這些神奇的技術(shù),IBM研究院還研發(fā)了知識(shí)優(yōu)化器(LEO),可利用執(zhí)行查詢(xún)得出的經(jīng)驗(yàn)性結(jié)果驗(yàn)證統(tǒng)計(jì)和假設(shè)。LEO能夠向用戶(hù)提出運(yùn)行消耗資源的“RUNSTATS”的時(shí)機(jī)和方式建議(如果探測(cè)到統(tǒng)計(jì)數(shù)據(jù)過(guò)時(shí)),或收集統(tǒng)計(jì)或其它查詢(xún),以修正不理想的結(jié)果。憑借這些準(zhǔn)確的統(tǒng)計(jì),系統(tǒng)能夠節(jié)省成本,下次按照優(yōu)化器制定的最佳方案執(zhí)行查詢(xún)。最終結(jié)果是:方案優(yōu)化,系統(tǒng)管理工作減輕,熱線求助時(shí)間縮短。
我在文章開(kāi)始提到的醫(yī)院采用了以上許多技術(shù):
1. 醫(yī)生可通過(guò)網(wǎng)格訪問(wèn)全美聯(lián)網(wǎng)的醫(yī)院,雖然這些醫(yī)院可能無(wú)法隨時(shí)保持連接,但是網(wǎng)格能節(jié)點(diǎn)處的常用信息自動(dòng)復(fù)制和存儲(chǔ)到醫(yī)生的本地?cái)?shù)據(jù)庫(kù)中。
2. 醫(yī)生所用的應(yīng)用將查詢(xún)提交本地的聯(lián)合數(shù)據(jù)庫(kù),應(yīng)用產(chǎn)生的單個(gè)查詢(xún)對(duì)病歷進(jìn)行分析,查找類(lèi)似癥狀和化驗(yàn)結(jié)果的患者,并將其診斷與CDC數(shù)據(jù)庫(kù)結(jié)合,按出現(xiàn)的頻率檢索信息。
3. 查詢(xún)調(diào)用外部產(chǎn)品對(duì)病歷進(jìn)行分析,然后將結(jié)果與國(guó)內(nèi)各數(shù)據(jù)庫(kù)中找到的類(lèi)似患者數(shù)據(jù)進(jìn)行合并。
4. 每個(gè)不同的診斷再添加到CDC的數(shù)據(jù)庫(kù)中。當(dāng)Web服務(wù)發(fā)出請(qǐng)求(仍作為相同查詢(xún)的一部分)時(shí),CDC即開(kāi)始查找,其結(jié)果生成一個(gè)描述病情的XML文件。
5. 經(jīng)過(guò)處理之后,這些文件中的關(guān)鍵信息則生成一份簡(jiǎn)明的表式報(bào)告返回給醫(yī)生。查詢(xún)結(jié)果迅速返回,因?yàn)楸镜財(cái)?shù)據(jù)庫(kù)發(fā)現(xiàn)只有少數(shù)其他醫(yī)院發(fā)現(xiàn)類(lèi)似情況的患者。數(shù)據(jù)庫(kù)還“察覺(jué)”好幾個(gè)此類(lèi)數(shù)據(jù)庫(kù)經(jīng)常不可用或超負(fù)荷,因而將患者數(shù)據(jù)文件復(fù)制到本地以便查詢(xún)。
此例有賴(lài)于網(wǎng)絡(luò)(計(jì)算)、自主復(fù)制、信息源語(yǔ)義顯示、信息集成技術(shù)(包括聯(lián)合并使用查詢(xún)中的Web服務(wù))以及 XML 作為交換格式。當(dāng)然,根據(jù)實(shí)際癥狀和檢查結(jié)果,可能包含大量數(shù)據(jù)。由于網(wǎng)絡(luò)上的許多數(shù)據(jù)庫(kù)都含有相關(guān)信息,需要并行網(wǎng)絡(luò)和高速分布式聯(lián)合方法。
未來(lái)的數(shù)據(jù)管理系統(tǒng)將更快更強(qiáng)大。通過(guò)開(kāi)放協(xié)議、Web服務(wù)、網(wǎng)絡(luò)(計(jì)算)和 XML,它們能夠?qū)Χ鄠€(gè)異構(gòu)資源進(jìn)行集成數(shù)據(jù)并通過(guò)應(yīng)用和數(shù)據(jù)庫(kù)交互。它們將成為自我管理、自我協(xié)調(diào)、高度自主的系統(tǒng)。
盡管全面的開(kāi)發(fā)和部署將是尚需時(shí)日,為實(shí)現(xiàn)這些特性的首要步驟目前已經(jīng)是顯而易見(jiàn)的。
聯(lián)系客服