學(xué)習(xí)如何用SQL Server的XML特征為你的數(shù)據(jù)庫提供新的功能。
如果你在IT業(yè)工作,那么你很可能聽說過XML;但如果你的工作主要與SQL Server有關(guān),那么你可能并沒有直接運用過XML。XML已經(jīng)是Web編程環(huán)境中的普遍的數(shù)據(jù)格式了,而且它也是.NET Framework中主要的底層技術(shù)之一。SQL Server以兩種方式來支持XML:通過SQL Server本身的功能,以及通過發(fā)布稱為SQLXML的額外的功能。SQLXML擴展了SQL Server,并提供了XML兼容性。在本月的專欄中,我將講述SQL Server對XML的內(nèi)置的支持,并講述通過發(fā)布SQLXML而增加的一些功能(見 圖1)。SQL Server支持XML就意味著,我們可以更有效地更新和讀取數(shù)據(jù)了;我們不再需要將XML數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)庫可以理解的另一種格式,或?qū)ML數(shù)據(jù)從數(shù)據(jù)庫轉(zhuǎn)換成XML。而且,可供開發(fā)人員選擇的方法也更多了,就是說,他們在訪問數(shù)據(jù)方面更靈活了。
對XML的宣傳已經(jīng)有很多了,所以重要的一點是要意識到它只是一門簡單的技術(shù)。本質(zhì)上,它是用來描述數(shù)據(jù)的一個標(biāo)準(zhǔn)的文件格式。(有關(guān)XML基礎(chǔ)知識的更多的信息,請參閱工具條“XML 101”。)從發(fā)布SQL Server 2000的最初版本以來,對XML的支持就已經(jīng)是SQL Server的一部分了。SQL Server不是通過提供一個方法保存XML文件來支持XML的,而是提供了一個到關(guān)系數(shù)據(jù)的接口,使你可以在表和其它數(shù)據(jù)庫對象中讀寫XML數(shù)據(jù)。SQL Server所固有的XML功能包括:可以通過HTTP、模板查詢、FOR XML子句和OPENXML()函數(shù)來訪問SQL Server。接下來,我將講述這些功能是如何運作的,以及它們可以如何使你的企業(yè)受益。
圖1. 提供 XML支持
要通過HTTP訪問一個SQL Server數(shù)據(jù)庫,你必須首先設(shè)置一個虛擬目錄。這個虛擬目錄在HTTP協(xié)議和一個特定的數(shù)據(jù)庫之間提供了一個鏈接。設(shè)置虛擬目錄時,我們需要用“Configure SQL XML Support In IIS”菜單條目,你可以在Window的Start菜單中的SQL Server菜單條目找到該項。通過該菜單條目,你就可以指定虛擬目錄的名稱、物理路徑、服務(wù)器名稱、數(shù)據(jù)庫名稱和注冊信息。一旦你創(chuàng)建了一個虛擬目錄,你就可以通過一個URL將查詢發(fā)送到數(shù)據(jù)庫了。如果你設(shè)置了一個叫做Northwind的虛擬目錄,并在瀏覽器中輸入了查詢
http://localhost/Northwind?sql=SELECT+*+FROM+Shippers+FOR+XML+AUTO,ELEMENTS+&root=Shippers,它就會返回類似于“XML 101”工具條中的Shippers例子中的XML數(shù)據(jù)。與運用ADO或其它任何技術(shù)相比,HTTP查詢會讓我們更容易地來訪問網(wǎng)站或Web應(yīng)用程序的數(shù)據(jù)。 對于一個簡單的查詢語句來說,HTTP查詢會很好,但對于一個更復(fù)雜的查詢來說,這種格式就會變得難以理解并很難管理了。這種方法也不安全,因為查詢源代碼是暴露給用戶的。另外一種可選方法是在HTTP上調(diào)用一個模板查詢。一個模板查詢就是一個包含SQL查詢的XML文件。模板作為文件保存在服務(wù)器上。因此,如果你在一個叫做GetShippers.xml的模板中封裝了Shippers SELECT查詢,那么URL查詢的形式就會是:
http://localhost/Northwind/templates/GetShippers.xml。模板也可以帶有參數(shù),當(dāng)你的模板調(diào)用一個存儲過程時,該功能會很有用。在URL查詢和模板查詢中,如果你想從查詢返回一個HTML頁面,那么你可以指定一個XSLT樣式表,將它用于XML。模板查詢是讀取數(shù)據(jù)的一個更安全的方法,它可以被緩存以得到更好的性能。
你也可以用FOR XML子句將數(shù)據(jù)讀取成XML格式,該方法從SQL Server表中返回數(shù)據(jù),你可以把它們看做是XML數(shù)據(jù)。你可以在一個SELECT語句中運用FOR XML子句,它有三種模式可以以不同的格式來返回XML:RAW、AUTO和EXPLICIT。RAW模式將結(jié)果中的每個記錄作為一個普通的行元素來返回,它被包含在一個<row/>標(biāo)簽中,并將每個列的值作為一個屬性。AUTO模式將每個記錄作為行元素返回,根據(jù)源表或視圖對它進(jìn)行命名。如果查詢從一個表返回多個列,那么每個列的值就會被作為表元素的屬性來返回。但最重要的是,如果你的SELECT語句執(zhí)行了合并操作,那么AUTO模式就代表的是子行,它們作為元素嵌套在父行下。EXPLICIT模式有幾個參數(shù),你可以通過這些參數(shù)完全定義返回的XML的樣式。你可以為每個元素定義標(biāo)簽,明確確定數(shù)據(jù)是如何嵌套的。FOR XML語句使我們不必再返回一個rowset,然后在客戶端或中間層將它轉(zhuǎn)換成XML了。
OPENXML函數(shù)可以讓你像操作一個表那樣來運用XML數(shù)據(jù),可以將它們轉(zhuǎn)換成內(nèi)存中的一個rowset。要運用OPENXML,首先要調(diào)用sp_xml_preparedocument存儲過程,實際上,它將XML解析成一個數(shù)據(jù)樹,并將那個數(shù)據(jù)的句柄傳遞到OPENXML函數(shù)。然后你就可以操作那個數(shù)據(jù)了:進(jìn)行查詢、將它插入到表中、等等。OPENXML函數(shù)可以帶有三個參數(shù):用于XML文檔內(nèi)部顯示的句柄、一個rowpattern參數(shù)和一個flags參數(shù)。Rowpattern參數(shù)指定了應(yīng)該返回原始的XML文檔中的哪些節(jié)點。Flags參數(shù)指定了以屬性為中心的映射(結(jié)果集中列名符合屬性名)或以元素為中心的映射(結(jié)果集中列名符合元素名)。在處理完XML數(shù)據(jù)后,我們可以調(diào)用sp_xml_removedocument將XML數(shù)據(jù)從內(nèi)存中刪除。
通過SQLXML得到更多的支持
通過發(fā)布SQLXML(也被稱為Web版),Microsoft也在SQL Server中提供了更多的XML支持。已經(jīng)有三個SQLXML的版本了,它們包含的一些額外的功能有updategram和XML Bulk Load。你可以在線下載最新的版本SQLXML 3.0(見資源)。你可以通過基于XML的模板,運用updategram來插入、更新或刪除表中的數(shù)據(jù)。該模板有一個before block,它描述了記錄更新前的當(dāng)前狀態(tài);還有一個after block,它描述了記錄的變化。下面就是updategram的一個例子,它修改了Shippers表中的一個公司的Phone字段:
<updg:sync >
<updg:before>
<Shippers ShipperID="3" />
</updg:before>
<updg:after>
<Shippers Phone="(503) 555-0108" />
</updg:after>
</updg:sync>
在缺省情況下,updategrams認(rèn)為before block和after block中的字段指的是表和列。但updategrams也可以用一個mapping schema。Mapping schema將一個XML文檔中的元素與一個表中的元素關(guān)聯(lián)了起來。如果在上面的模板中,你引用屬性名SID,而不是ShipperID,那么mapping schema就會將SID映射到ShipperID列。你可以通過HTTP(同模板查詢一樣)或通過ADO將updategrams發(fā)送到SQL Server。它們也可以被參數(shù)化,帶有輸入值。Updategrams提供了一個方法,使我們可以直接從XML更新SQL Server數(shù)據(jù),這樣就不用從XML文檔得到數(shù)據(jù),然后再用一個記錄集或調(diào)用一個存儲過程了。Updategrams只是可以簡單地插入、更新或刪除數(shù)據(jù),所以如果你需要查看一個值是否存在、或在更新前查看一些商業(yè)規(guī)則,那么你就應(yīng)該用OPENXML。
雖然你可以用OPENXML函數(shù)和updategrams來插入數(shù)據(jù),但對于加載大量的XML數(shù)據(jù)來說,這兩種方法都不實用。你應(yīng)該用XML Bulk Load將大量的XML數(shù)據(jù)插入到SQL Server表中。實際上,我們是用SQLXMLBulkLoad組件來加載數(shù)據(jù)的,你可以從一個客戶端應(yīng)用程序來調(diào)用這個組件。在建立到數(shù)據(jù)庫的連接后,bulk load組件需要一個路徑來訪問mapping schema,從而將XML屬性和元素映射到數(shù)據(jù)庫對象,而且還需要路徑來訪問一個XML文檔或一個XML流。在Bulk Load組件中,你可以指定是否執(zhí)行數(shù)據(jù)表檢查約束(check constraint)、是否忽略通過復(fù)制鍵添加的記錄、當(dāng)插入數(shù)據(jù)時,是否應(yīng)該鎖定數(shù)據(jù)表,等等。
缺省情況下,大量加載不是事務(wù)處理型(transactional)的,所以如果出現(xiàn)錯誤,截止到錯誤點前插入的數(shù)據(jù)就會保留在數(shù)據(jù)庫中。你可以指定所有加載的數(shù)據(jù)都是在一個單獨的事務(wù)處理過程中的,因此該過程要么會十分成功,要么會回滾。如果你用了事務(wù)處理,所有的數(shù)據(jù)在插入前都會被寫進(jìn)一個臨時的文件。這就意味著,你需要足夠的磁盤空間來保存臨時文件,而且加載數(shù)據(jù)可能會相當(dāng)慢。XML Bulk Load給我們提供了一個很好的方法,使我們可以將大量的數(shù)據(jù)寫到SQL Server中;否則,你就必須提取數(shù)據(jù),然后用另外的方法將它加載到你的數(shù)據(jù)庫中。
你也可以配置SQL Server來緩存XSLT樣式表、模板和mapping schema,從而得到更好的性能。根據(jù)具體實現(xiàn)情況,你可以在Web應(yīng)用程序中用通過HTTP和XSLT的XML查詢來替代標(biāo)準(zhǔn)的ASP/ADO數(shù)據(jù)訪問,從而得到HTML輸出結(jié)果,這種方法可以極大地提高性能。
以上就是SQL Server對XML的一些高級支持。不管我們對它的宣傳有多少,XML的功能就這么多了。因為XML是用來顯示數(shù)據(jù)的一個標(biāo)準(zhǔn),也是用于.NET的數(shù)據(jù)傳輸技術(shù),因此,XML與SQL Server的集成能力就會是企業(yè)需要解決的一個重要的問題。