Now ,a great deal of raw data are stored in the database of GIS ,but we often find that we have
more information than we know what to do with. So we solve the problem with the technology of Spatial
Data Mining. The paper put forward 3 integration modes between GIS and SDM. In the end , the paper
set forth what kind of information could be mined and pointed out the significance of the studying on
integration between GIS and SDM.
Keywords GIS; Spatial Data Mining ;integration
作者簡介:張瑞菊,女,1979 年生,碩士生,研究方向為現(xiàn)代測繪理
論與測量數(shù)據(jù)處理。
收稿日期:2002 - 11 - 04
1 GIS 目前需要解決的問題
地理信息系統(tǒng)是綜合分析空間數(shù)據(jù)的一種技術(shù)系統(tǒng),它包括空間數(shù)據(jù)的采集、存儲、管理和分析。多年以來,人們僅僅認識到它是一個管理空間數(shù)據(jù)的系統(tǒng),而忽略了它還是包括信息量十分
龐大的數(shù)據(jù)庫。數(shù)據(jù)是地理信息系統(tǒng)的重要組成部分,地理信息系統(tǒng)中的數(shù)據(jù)包括空間數(shù)據(jù)和非
空間數(shù)據(jù)。空間數(shù)據(jù)是與空間地理位置相關(guān)的數(shù)據(jù),包括遙感平臺獲得并經(jīng)處理的遙感圖像、電子地圖、CAD 圖形等以及任何經(jīng)過Geo - Reference的實體。地球上85 %的數(shù)據(jù)可以歸類為空間數(shù)據(jù)。空間數(shù)據(jù)具有空間性、基礎(chǔ)性、非結(jié)構(gòu)性特征,空間數(shù)據(jù)是最主要的信息載體。
隨著衛(wèi)星和遙感技術(shù)以及其他自動數(shù)據(jù)獲取設(shè)備的迅速發(fā)展,極大提高了社會經(jīng)濟各部門生產(chǎn)、收集、存儲和處理數(shù)據(jù)的能力,日益豐富的空間和非空間數(shù)據(jù)收集存儲于大空間數(shù)據(jù)庫中,而
且由于地學(xué)現(xiàn)象的復(fù)雜性和地理過程的不確定性,完全定量方法獲取的空間數(shù)據(jù)的數(shù)量、大小和
復(fù)雜性都在飛快地增長,已經(jīng)遠遠超出了人的解譯能力。作為經(jīng)驗和教訓(xùn)的積累,數(shù)據(jù)庫無異于
一個巨大的寶藏,當(dāng)其積累到一定程度時,必然會反映出某些規(guī)律??墒?目前的空間數(shù)據(jù)庫系統(tǒng)
可以高效地實現(xiàn)數(shù)據(jù)的錄入、修改、統(tǒng)計、查詢等功能,卻無法發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的關(guān)系、規(guī)則和發(fā)展趨勢等知識。同時,人們對信息的需求水平越來越高,希望能夠?qū)ζ溥M行更高層次的分析和利用。地理信息系統(tǒng)(GIS) 是空間數(shù)據(jù)庫發(fā)展的主體,隨著GIS 技術(shù)發(fā)展和應(yīng)用的深入,新的需求推動著GIS 從數(shù)據(jù)庫型轉(zhuǎn)入分析型階段。目前GIS 的分析功能還很弱且不靈活,GIS 所提供的分析功能只局限于一些圖形操作,如疊置分析、緩沖區(qū)分析、網(wǎng)絡(luò)分析等,無法析取隱含模式和規(guī)律,它的邏輯結(jié)構(gòu)和智能層次不能滿足解決復(fù)雜空間決策問題的需要,特別是那些非結(jié)構(gòu)化的問題,而這一些遠遠趕不上GIS 發(fā)展的速度,滿足不了廣大GIS 用戶的需求,促使人們探討新的技術(shù)手段去解決現(xiàn)在面臨的問題。
2 GIS 與空間數(shù)據(jù)挖掘技術(shù)集成的必要性
數(shù)據(jù)庫系統(tǒng)最新的數(shù)據(jù)挖掘技術(shù)為GIS 組織、管理海量空間和非空間數(shù)據(jù)提供了新的思路。
GIS 中含有大量的空間和屬性數(shù)據(jù),有著比一般關(guān)系數(shù)據(jù)庫和事務(wù)數(shù)據(jù)庫更加豐富和復(fù)雜的語義
信息,所以我們把GIS 數(shù)據(jù)庫與空間數(shù)據(jù)庫等同起來,并認為從GIS 數(shù)據(jù)庫中發(fā)現(xiàn)知識與空間數(shù)
據(jù)挖掘(SDM) 有相同的內(nèi)涵。GIS 吸收數(shù)據(jù)倉庫的思想,將空間分析和空間數(shù)據(jù)挖掘方法緊密集成,充分利用GIS 數(shù)據(jù)存儲、管理空間數(shù)據(jù)的功能,使海量的地理空間數(shù)據(jù)變成無限的知識,使
GIS 成為智能的信息系統(tǒng)。
空間數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)挖掘技術(shù)的分支,是數(shù)據(jù)挖掘的主要研究內(nèi)容之一??臻g數(shù)據(jù)挖掘,或稱“從空間數(shù)據(jù)庫中發(fā)現(xiàn)知識”,是指從空間數(shù)據(jù)庫中提取用戶感興趣的空間模式與特征、空
間與非空間數(shù)據(jù)的普遍關(guān)系及其它一些隱含在數(shù)據(jù)庫中的普遍的數(shù)據(jù)特征,它是KDD 技術(shù)在空間數(shù)據(jù)庫方面應(yīng)用的延伸??臻g數(shù)據(jù)挖掘技術(shù)的應(yīng)用,一方面可使GIS 查詢和分析技術(shù)提高到發(fā)現(xiàn)知識的新階段,另一方面從中發(fā)現(xiàn)的知識可構(gòu)成知識庫用于建立智能化的GIS 系統(tǒng),因為單純專家系統(tǒng)技術(shù)的引入使GIS 具有一定的自動性及智能性,但是它遠不能稱為一個真正的“智能”系統(tǒng)(因為專家系統(tǒng)不具備自動學(xué)習(xí)的能力,GIS 中的專家系統(tǒng)僅能利用已有的知識進行推導(dǎo)) ,而空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術(shù)的引入,將使系統(tǒng)具有自動學(xué)習(xí)的功能,能使系統(tǒng)自動獲取知識,使GIS有可能成為真正的“智能”系統(tǒng)??梢哉f,專家系統(tǒng)與GIS 的結(jié)合,使GIS 成為一種空間咨詢和決策支持系統(tǒng),而KDD 與GIS 的結(jié)合,會使GIS 成為真正的智能空間信息系統(tǒng),而且也將促進GPS、DPS、RS、GIS 與ES 等技術(shù)的完整集成。
3 GIS 與空間數(shù)據(jù)挖掘的集成模式
GIS 的對象是地理實體,GIS 的操作對象是地理實體的數(shù)據(jù)。GIS 的技術(shù)優(yōu)勢在于它的混合數(shù)
據(jù)結(jié)構(gòu)和有效的數(shù)據(jù)集成、獨特的地理空間分析能力、快速的空間定位搜索和復(fù)雜的查詢功能等,其中,通過地理空間分析可以產(chǎn)生常規(guī)方法難以獲得的重要信息,實現(xiàn)在系統(tǒng)支持下的地理過程
動態(tài)模擬和決策支持。然而,通用GIS 的數(shù)據(jù)管
理、查詢和空間分析功能對于大多數(shù)的應(yīng)用問題
是遠遠不夠的。我們應(yīng)根據(jù)某種應(yīng)用目標和任務(wù)
要求,從相應(yīng)專業(yè)或?qū)W科出發(fā),對客觀世界進行深
入分析研究,GIS 與空間數(shù)據(jù)挖掘集成技術(shù)的研
究是重點研究的方向之一。
GIS數(shù)據(jù)庫中存儲的數(shù)據(jù)包含空間數(shù)據(jù)和屬
性數(shù)據(jù),它們之間具有密切的聯(lián)系,為解決兩者之
間的聯(lián)接、查詢和管理的問題,解決的方法主要有
三種方式:混合式、擴展式和開放式。我們在研究
GIS 與空間數(shù)據(jù)挖掘集成的問題時也應(yīng)分別對待。
GIS與空間數(shù)據(jù)挖掘技術(shù)集成主要是利用空
間數(shù)據(jù)挖掘技術(shù)提取隱含在存儲于GIS 數(shù)據(jù)庫中
的龐大數(shù)據(jù)量的空間數(shù)據(jù)和屬性數(shù)據(jù)之后的知識,
因此集成問題的關(guān)鍵是如何共享GIS 中的數(shù)據(jù)。
GIS 與空間數(shù)據(jù)挖掘集成的模式主要有三種:
1) 松散耦合式,也稱外部空間數(shù)據(jù)挖掘模式。
這種模式基本上將GIS 當(dāng)作一個空間數(shù)據(jù)庫看
待,在GIS 環(huán)境外部借助其它軟件或計算機語言
進行空間數(shù)據(jù)挖掘,其與GIS 之間采用數(shù)據(jù)通訊
的方式聯(lián)系。圖1 為基于擴展式數(shù)據(jù)庫管理GIS
與空間數(shù)據(jù)挖掘技術(shù)集成的框架圖。
此主題相關(guān)圖片如下:
2) 嵌入式,又稱內(nèi)部空間數(shù)據(jù)挖掘模式。即
在GIS 中將空間數(shù)據(jù)挖掘技術(shù)融合到空間分析功
能中去。圖2 為仍基于擴展式數(shù)據(jù)庫管理的GIS
與空間數(shù)據(jù)挖掘技術(shù)嵌入式集成模式框架圖。
此主題相關(guān)圖片如下:
3) 混合型空間模型法,是前兩種方法的結(jié)合。
即盡可能利用GIS 提供的功能,最大限度的減少
用戶自行開發(fā)的工作量和難度,又保持外部空間
數(shù)據(jù)挖掘模式的靈活性。
4 空間數(shù)據(jù)挖掘技術(shù)在GIS 中的應(yīng)用
由于GIS 數(shù)據(jù)庫是空間數(shù)據(jù)庫的主要類型,
并且從GIS 數(shù)據(jù)庫中發(fā)現(xiàn)的知識類型及知識發(fā)現(xiàn)
方法可以涵蓋其它類型的空間數(shù)據(jù)庫。借鑒DM
和KDD 技術(shù)的成果,針對空間數(shù)據(jù)的特點,從GIS
數(shù)據(jù)庫可以發(fā)現(xiàn)的主要知識類型有:
1) 普遍的幾何知識。普遍的幾何知識是指某
類目標的數(shù)量、大小、形態(tài)特征等的普遍的幾何特
征。計算和統(tǒng)計出空間目標幾何特征量的最小
值、最大值、均值、方差、眾數(shù)等,還可統(tǒng)計出特征
量的直方圖。在足夠樣本的情況下,直方圖數(shù)據(jù)
可轉(zhuǎn)換為先驗概率使用。在此基礎(chǔ)上,可根據(jù)背
景知識歸納出高水平的普遍幾何知識。
2) 空間分布規(guī)律??臻g分布規(guī)律是指目標在
地理空間的分布規(guī)律,分成在垂直向、水平向以及
垂直向和水平向的聯(lián)合分布規(guī)律。垂直向分布即
地物沿高程帶的分布,如植被沿高程帶分布規(guī)律、
植被沿坡度坡向分布規(guī)律等;水平向分布指地物
在平面區(qū)域的分布規(guī)律,如不同區(qū)域農(nóng)作物的差
異、公用設(shè)施的城鄉(xiāng)差異等;垂直向和水平向的聯(lián)
合分布即不同的區(qū)域中地物沿高程分布規(guī)律。
3) 空間關(guān)聯(lián)規(guī)律。它是指空間目標間相鄰、
項鏈、共生、包含等空間關(guān)聯(lián)規(guī)則。例如,村落與
道路相連,道路與河流的交叉處是橋梁等。
4) 空間聚類規(guī)則??臻g聚類規(guī)則,或空間分
類規(guī)則,是指特征相近的空間目標聚類成上一級
類的規(guī)則,可用于GIS 的空間概括和綜合。例如,
將距離很近的散布的居民點聚類成居民區(qū)。
5) 空間特征規(guī)則。它是指某類或幾類空間目
標的幾何和屬性的普遍特征,即共性的描述。普
遍的幾何知識屬于空間特征的一類,作用十分重
要。由于它在遙感影像解譯中,所以分離出來的
單獨作為一類知識。
6) 空間區(qū)分規(guī)則。它指兩類或多類目標間幾
何的或?qū)傩缘牟煌卣?即可以區(qū)分不同目標的
特征。
7) 空間演變規(guī)則。若GIS 數(shù)據(jù)庫指時空數(shù)據(jù)
庫或GIS 數(shù)據(jù)庫中存有同一地區(qū)多個時間數(shù)據(jù)的
快照(Snapshot) ,則可以發(fā)現(xiàn)空間演變規(guī)則。空間
演變規(guī)則指空間目標依時間的變化規(guī)則,即哪些
地區(qū)易變,哪些地區(qū)不易變,哪些目標易變及怎么
變,哪些目標固定不變。
從GIS 數(shù)據(jù)庫中發(fā)現(xiàn)的知識,可有下面兩大
方面的應(yīng)用:
1) GIS 智能化分析。SDM獲取的知識同現(xiàn)有
GIS 分析工具獲取的信息相比更加概括、精練,并
可發(fā)現(xiàn)現(xiàn)有GIS 分析工具無法獲取的隱含的模式
和規(guī)律,因此SDM 本身就是GIS 智能化分析工
具,也是構(gòu)成GIS 專家系統(tǒng)和決策支持系統(tǒng)的重
要工具。
2) 在遙感影像解譯中的應(yīng)用。用于遙感影像
解譯中的約束、輔助、引導(dǎo),解決同物異譜、同譜異
物問題,減少分類識別的疑義度,提高解譯的可靠
性、精度和速度。SDM 是建立遙感影像理解專家
系統(tǒng)知識獲取的重要技術(shù)手段和工具,遙感影像
解譯的結(jié)果又可更新GIS 數(shù)據(jù)庫。因此,SDM 技
術(shù)將會促進遙感與GIS 的智能化集成。
5 結(jié)論
從符號智能轉(zhuǎn)向計算智能是人工智能新的發(fā)
展方向,數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的研究正在為地學(xué)
領(lǐng)域的人工智能應(yīng)用注入新的活力。從數(shù)據(jù)挖掘
的角度看,空間分析領(lǐng)域中所提到的基于數(shù)據(jù)的
分析(DataExploratory) 原本就可以理解為空間數(shù)據(jù)
挖掘的工具,而模型可以理解為數(shù)據(jù)挖掘的一種
特殊方法。在地學(xué)數(shù)據(jù)分析領(lǐng)域引入數(shù)據(jù)挖掘與
知識發(fā)現(xiàn)的概念、模式和方法,探討適合地學(xué)數(shù)據(jù)
挖掘的新方法,并與GIS 緊密集成,充分利用GIS
存儲、管理空間數(shù)據(jù)的功能,同時使得GIS 中的有
限數(shù)據(jù)變成無限的知識,對于有效地處理海量地
學(xué)數(shù)據(jù)、提高地學(xué)分析的自動化和智能化水平、為
全球變化和區(qū)域可持續(xù)發(fā)展提供有力的分析工具
具有重要的意義。因此,對于數(shù)據(jù)挖掘技術(shù)的分
支———空間數(shù)據(jù)挖掘技術(shù)及其與GIS 集成的研
究,是非常有社會和現(xiàn)實意義的研究課題。
參考文獻
1 郭仁忠. 空間分析. 武漢:武漢測繪科技大學(xué)出版社,
1997
2 周海燕,王家耀等. 空間數(shù)據(jù)挖掘技術(shù)及其應(yīng)用. 測繪
通報,2002 , (2)
3 李德仁,王樹良,李德毅,王新洲. 論空間數(shù)據(jù)挖掘和
知識發(fā)現(xiàn)的理論與方法. 武漢大學(xué)學(xué)報(信息科學(xué)版) ,
2002 , (3)
4 徐銘杰. 空間數(shù)據(jù)挖掘模式和方法研究. 河南紡織高
等??茖W(xué)校學(xué)報,2002 , (1)
5 李德仁,王樹良,史文中,王新洲. 論空間數(shù)據(jù)挖掘和
知識發(fā)現(xiàn). 武漢大學(xué)學(xué)報(信息科學(xué)版) ,2001 , (6)
6 劉宇,曲波,朱仲英等. 空間數(shù)據(jù)挖掘理論與方法的研
究. 微型電腦應(yīng)用,2000 , (8)
7 李丹,高麗. 空間數(shù)據(jù)挖掘技術(shù). 湖北汽車工業(yè)學(xué)院學(xué)
報,1999 , (3)
8 李德仁. 論RS、GIS 與GPS 集成的定義、理論與關(guān)鍵技
術(shù). 遙感學(xué)報,1997 , (4)
9 李德仁. 關(guān)于地理信息系統(tǒng)理論的若干思考. 武漢測
繪科技大學(xué)學(xué)報,1997 , (6)