- XML
- 介紹:XML 和 DOM
- libxml
- 介紹
- 數(shù)據(jù)類型 — xmlChar
- 數(shù)據(jù)結(jié)構(gòu)
- 創(chuàng)建 XML 文檔
- 解析 XML 文檔
- 修改 xml 文檔
- 數(shù)據(jù)類型 — xmlChar
- 介紹
- Xpath — 處理大型 XML 文檔
- libxml2 庫函數(shù)
- 要注意的函數(shù)
- 讀取 xml 文件
- xml 操作基本結(jié)構(gòu)及其指針類型
- 根節(jié)點(diǎn)相關(guān)函數(shù)
- 創(chuàng)建子節(jié)點(diǎn)相關(guān)函數(shù)
- 添加子節(jié)點(diǎn)相關(guān)函數(shù)
- 屬性相關(guān)函數(shù)
- 讀取 xml 文件
- 要注意的函數(shù)
參考
- http://xmlsoft.org/
- http://www.miidoo.cn/info_detail-204.html
- http://www.blogjava.net/wxb_nudt/archive/2007/11/28/161340.html
- http://www.ibm.com/developerworks/cn/aix/library/au-libxml2.html
- http://www.cppblog.com/lymons/archive/2009/03/30/37553.html
- XPath 教程
XML
介紹:XML 和 DOM
XML是eXtensible Markup Language的縮寫,它是一種可擴(kuò)展性標(biāo)識語言, 能夠讓你自己創(chuàng)造標(biāo)識,標(biāo)識你所表示的內(nèi)容。DOM全稱是Document Object Model(文檔對象模型),定義了一組與平臺和語言無關(guān)的接口,以便程序和腳本能夠動態(tài)訪問和修改XML文檔內(nèi)容、結(jié)構(gòu)及樣式。XML創(chuàng)建了標(biāo)識,而 DOM的作用就是告訴程序如何操作和顯示這些標(biāo)識。
XML將數(shù)據(jù)組織成為一棵樹,DOM通過解析XML文檔,為XML文檔在邏輯上建立一個樹模型,樹的節(jié)點(diǎn)是一個個的對象。這樣通過操作這棵樹和這些對象就可以完成對XML文檔的操作,為處理文檔的所有方面提供了一個完美的概念性框架。
XML 中共有12種節(jié)點(diǎn)類型,其中最常見的節(jié)點(diǎn)類型有5種:
- 元素
- 元素是 XML 的基本組成單元。,描述XML的基本信息。
- 屬性
- 屬性節(jié)點(diǎn)包含關(guān)于元素節(jié)點(diǎn)的信息,通常包含在元素里面,描述元素的屬性。
- 文本
- 包含許多文本信息或者只是空白。
- 文檔
- 文檔節(jié)點(diǎn)是整個文檔中所有其它節(jié)點(diǎn)的父節(jié)點(diǎn)。
- 注釋
- 注釋是對相關(guān)的信息進(jìn)行描述、注釋。
libxml
介紹
本文所介紹的 libxml 是針對 C 語言的一套 API 接口。其他如 ruby,python 亦有對應(yīng)的基于 libxml 開發(fā)的綁定庫接口。
數(shù)據(jù)類型 — xmlChar
在 libXml 中用 xmlChar 替代 char , XML 使用 UTF-8 編碼的一字節(jié)字符串。如果你的數(shù)據(jù)使用其它編碼,它必須被轉(zhuǎn)換到 UTF-8 才能使用libxml的函數(shù)。
如同標(biāo)準(zhǔn) C 中的 char 類型一樣, xmlChar 也有動態(tài)內(nèi)存分配、字符串操作等相關(guān)函數(shù)。例如 xmlMalloc 是動態(tài)分配內(nèi)存的函數(shù); xmlFree 是配套的釋放內(nèi)存函數(shù); xmlStrcmp 是字符串比較函數(shù)等等。基本上 xmlChar 字符串相關(guān)函數(shù)都在xmlstring.h 中定義;而動態(tài)內(nèi)存分配函數(shù)在 xmlmemory.h 中定義。另外要注意,因?yàn)榭偸且?xmlChar* 和 char* 之間進(jìn)行類型轉(zhuǎn)換,所以定義了一個宏 BAD_CAST ,其定義如下: xmlstring.h
#define BAD_CAST (xmlChar *)
原則上來說, unsigned char 和 char 之間進(jìn)行強(qiáng)制類型轉(zhuǎn)換是沒有問題的。
數(shù)據(jù)結(jié)構(gòu)
- xmlDoc
- 代表DOM結(jié)構(gòu)中的文檔類型。包含由解析文檔建立的樹結(jié)構(gòu), xmlDocPtr 是指向這個結(jié)構(gòu)的指針。
- xmlNode
- 代表DOM結(jié)構(gòu)中的除文檔類型類型外的其它節(jié)點(diǎn)類型。包含單一結(jié)點(diǎn)的結(jié)構(gòu), xmlNodePtr 是指向這個結(jié)構(gòu)的指針,它被用于遍歷文檔樹。節(jié)點(diǎn)應(yīng)該是xml中最重要的元素了, xmlNode 代表了xml文檔中的一個節(jié)點(diǎn),實(shí)現(xiàn)為一個 struct ,內(nèi)容很豐富: tree.h
1: typedef struct _xmlNode xmlNode; 2: typedef xmlNode *xmlNodePtr; 3: struct _xmlNode { 4: void *_private;/* application data */ 5: xmlElementType type; /* type number, must be second ! */ 6: const xmlChar *name; /* the name of the node, or the entity */ 7: struct _xmlNode *children; /* parent->childs link */ 8: struct _xmlNode *last; /* last child link */ 9: struct _xmlNode *parent;/* child->parent link */ 10: struct _xmlNode *next; /* next sibling link */ 11: struct _xmlNode *prev; /* previous sibling link */ 12: struct _xmlDoc *doc;/* the containing document */ 13: /* End of common part */ 14: xmlNs *ns; /* pointer to the associated namespace */ 15: xmlChar *content; /* the content */ 16: struct _xmlAttr *properties;/* properties list */ 17: xmlNs *nsDef; /* namespace definitions on this node */ 18: void *psvi;/* for type/PSVI informations */ 19: unsigned short line; /* line number */ 20: unsigned short extra; /* extra data for XPath/XSLT */ 21: }; 22:
可以看到,節(jié)點(diǎn)之間是以鏈表和樹兩種方式同時組織起來的,next和prev指針可以組成鏈表,而parent和children可以組織為樹。所有節(jié)點(diǎn)都是文檔 xmlDoc 節(jié)點(diǎn)的直接或間接子節(jié)點(diǎn)。同時還有以下重要元素:
- 節(jié)點(diǎn)中的文字內(nèi)容: content ;
- 節(jié)點(diǎn)所屬文檔: doc ;
- 節(jié)點(diǎn)名字: name ;
- 節(jié)點(diǎn)的 namespace: ns ;
- 節(jié)點(diǎn)屬性列表: properties ;
xml 文檔的操作其根本原理就是在節(jié)點(diǎn)之間移動、查詢節(jié)點(diǎn)的各項(xiàng)信息,并進(jìn)行增加、刪除、修改的操作。 xmlDocSetRootElement 函數(shù)可以將一個節(jié)點(diǎn)設(shè)置為某個文檔的根節(jié)點(diǎn),這是將文檔與節(jié)點(diǎn)連接起來的重要手段,當(dāng)有了根結(jié)點(diǎn)以后,所有子節(jié)點(diǎn)就可以依次連接上根節(jié)點(diǎn),從而組織成為一個 xml 樹。
創(chuàng)建 XML 文檔
創(chuàng)建一個 XML 文檔流程如下:
- 用 xmlNewDoc 函數(shù)創(chuàng)建一個文檔指針 doc;
- 用 xmlNewNode 函數(shù)創(chuàng)建一個節(jié)點(diǎn)指針 root_node;
- 用 xmlDocSetRootElement 將 root_node 設(shè)置為 doc 的根節(jié)點(diǎn);
- 給 root_node 添加一系列子節(jié)點(diǎn),并設(shè)置字節(jié)點(diǎn)的內(nèi)容和屬性;
- 用 xmlSaveFile 保存 xml 到文件;
- 用 xmlFreeDoc 函數(shù)關(guān)閉文檔指針,清除內(nèi)存。
示例
下面用一個例子說明一些函數(shù)的使用,和創(chuàng)建一個 XML 文檔的大致步驟:
1: #include <stdio.h> 2: #include <stdlib.h> 3: #include <libxml/parser.h> 4: #include <libxml/tree.h> 5: 6: int main (int argc, char **argv) 7: { 8: xmlDocPtr pdoc = NULL; 9: xmlNodePtr proot_node = NULL,pnode = NULL,pnode1 = NULL; 10: 11: // 創(chuàng)建一個新文檔并設(shè)置 root 節(jié)點(diǎn) 12: // 一個 XML 文件只有一個 root 節(jié)點(diǎn) 13: pdoc = xmlNewDoc (BAD_CAST "1.0"); 14: proot_node = xmlNewNode (NULL, BAD_CAST "根節(jié)點(diǎn)"); 15: xmlNewProp (proot_node, BAD_CAST "版本", BAD_CAST "1.0"); 16: xmlDocSetRootElement (pdoc, proot_node); 17: 18: pnode = xmlNewNode (NULL, BAD_CAST "子節(jié)點(diǎn)1"); 19: // 創(chuàng)建上面 pnode 的子節(jié)點(diǎn) 20: xmlNewChild (pnode, NULL, BAD_CAST "子子節(jié)點(diǎn)1", BAD_CAST "信息"); 21: // 添加子節(jié)點(diǎn)到 root 節(jié)點(diǎn) 22: xmlAddChild (proot_node, pnode); 23: 24: pnode1 = xmlNewNode (NULL, BAD_CAST "子子節(jié)點(diǎn)1"); 25: xmlAddChild (pnode, pnode1); 26: xmlAddChild (pnode1,xmlNewText (BAD_CAST "這是更低的節(jié)點(diǎn),子子子節(jié)點(diǎn)1")); 27: 28: // 還可以這樣直接創(chuàng)建一個子節(jié)點(diǎn)到 root 節(jié)點(diǎn)上 29: xmlNewTextChild (proot_node, NULL, BAD_CAST "子節(jié)點(diǎn)2", BAD_CAST "子節(jié)點(diǎn)2的內(nèi)容"); 30: xmlNewTextChild (proot_node, NULL, BAD_CAST "子節(jié)點(diǎn)3", BAD_CAST "子節(jié)點(diǎn)3的內(nèi)容"); 31: 32: // 保存 xml 為文件,如果沒有給出文件名參數(shù),就輸出到標(biāo)準(zhǔn)輸出 33: xmlSaveFormatFileEnc (argc > 1 ? argv[1]:"-", pdoc, "UTF-8", 1); 34: 35: // 釋放資源 36: xmlFreeDoc (pdoc); 37: xmlCleanupParser (); 38: xmlMemoryDump (); 39: return 0; 40: } 41:
編譯這個例子,先看看系統(tǒng)里面的 libxml2 庫的 pkgconfig 信息:
root@jianlee:~/lab/xml# cat /usr/lib/pkgconfig/libxml-2.0.pcprefix=/usrexec_prefix=${prefix}libdir=${exec_prefix}/libincludedir=${prefix}/includemodules=1Name: libXMLVersion: 2.6.32Description: libXML library version2.Requires:Libs: -L${libdir} -lxml2Libs.private: -lz -lmCflags: -I${includedir}/libxml2root@jianlee:~/lab/xml# pkg-config libxml-2.0 --cflags --libs-I/usr/include/libxml2 -lxml2
編譯:
root@jianlee:~/lab/xml# gcc -Wall `pkg-config libxml-2.0 --cflags --libs` create_xml.c
如果沒有修改源程序,輸出應(yīng)該是這樣:
root@jianlee:~/lab/xml# ./a.out<?xml version="1.0" encoding="UTF-8"?><根節(jié)點(diǎn) 版本="1.0"><子節(jié)點(diǎn)1><子子節(jié)點(diǎn)1>信息</子子節(jié)點(diǎn)1><子子節(jié)點(diǎn)1>這是更低的節(jié)點(diǎn),子子子節(jié)點(diǎn)1</子子節(jié)點(diǎn)1></子節(jié)點(diǎn)1><子節(jié)點(diǎn)2>子節(jié)點(diǎn)2的內(nèi)容</子節(jié)點(diǎn)2><子節(jié)點(diǎn)3>子節(jié)點(diǎn)3的內(nèi)容</子節(jié)點(diǎn)3></根節(jié)點(diǎn)>
示例補(bǔ)充說明
輸出的各節(jié)點(diǎn)不要在一行
上面使用下面方式保存 xml 文檔,輸出的文件各子節(jié)點(diǎn)間自動加入回車:
// 保存 xml 為文件,如果沒有給出文件名參數(shù),就輸出到標(biāo)準(zhǔn)輸出xmlSaveFormatFileEnc (argc > 1 ? argv[1]:"-", pdoc, "UTF-8", 1);
如果把上面的 1 換成 0 ,輸出格式是放在一行。
用到的函數(shù)說明
上面涉及幾個函數(shù)和類型定義,不過意思很明了,下面解釋一個(重要的是自己動手寫程序,反復(fù)實(shí)驗(yàn),所謂熟能生巧)。
- xmlDocPtr
- 指向 XML 文檔對象的指針
- xmlNodePtr
- 指向 XML 文檔對象中的節(jié)點(diǎn)對象(根節(jié)點(diǎn)和子節(jié)點(diǎn)都是一樣的)
- xmlNewDoc
- 創(chuàng)建一個 XML 文檔對象
- xmlNewNode
- 創(chuàng)建一個 XML 文檔的指針對象
- xmlNewProp
- 給一個節(jié)點(diǎn)增加屬性信息,包括在 <> 中,如:
xmlNewProp (proot_node, BAD_CAST "版本", BAD_CAST "1.0");
最后顯示是這個樣子:
<根節(jié)點(diǎn) 版本="1.0">
- xmlDocSetRootElement
- 設(shè)置 XML 文檔對象的根節(jié)點(diǎn),只有一個根節(jié)點(diǎn)
- xmlNewChild
- 指定一個節(jié)點(diǎn),會創(chuàng)建這個節(jié)點(diǎn)的子節(jié)點(diǎn)。這樣不需要使用 xmlNewNode 創(chuàng)建一個節(jié)點(diǎn),再使用 xmlAddChild 添加到其父節(jié)點(diǎn)中。
- xmlAddChild
- 把一個節(jié)點(diǎn)設(shè)置為另外一個節(jié)點(diǎn)的子節(jié)點(diǎn)。
- xmlNewText
- 創(chuàng)建一個描述節(jié)點(diǎn),沒有 <> 符號,需要添加到其他節(jié)點(diǎn)上。比如上例中的:
xmlAddChild (pnode1,xmlNewText (BAD_CAST "這是更低的節(jié)點(diǎn),子子子節(jié)點(diǎn)1"));
會出現(xiàn)下面的結(jié)果:
<子子節(jié)點(diǎn)1>這是更低的節(jié)點(diǎn),子子子節(jié)點(diǎn)1</子子節(jié)點(diǎn)1>
- xmlNewTextChild
- 和 xmlNewText 的區(qū)別如同 xmlNewNodeChild 和 xmlNewNode 的區(qū)別一樣!
- xmlSaveFormatFileEnc
- 保存 xml 對象為文件。
- xmlFreeDoc
- 釋放 xml 對象
- xmlCleanupParser
- 清理
- xmlMemoryDump
- 清理
解析 XML 文檔
解析一個xml文檔,從中取出想要的信息,例如節(jié)點(diǎn)中包含的文字,或者某個節(jié)點(diǎn)的屬性,其流程如下:
- 用 xmlReadFile 函數(shù)讀出一個文檔指針 doc ;
- 用 xmlDocGetRootElement 函數(shù)得到根節(jié)點(diǎn) curNode ;
- curNode->xmlChildrenNode 就是根節(jié)點(diǎn)的子節(jié)點(diǎn)集合 ;
- 輪詢子節(jié)點(diǎn)集合,找到所需的節(jié)點(diǎn),用 xmlNodeGetContent 取出其內(nèi)容 ;
- 用 xmlHasProp 查找含有某個屬性的節(jié)點(diǎn) ;
- 取出該節(jié)點(diǎn)的屬性集合,用 xmlGetProp 取出其屬性值 ;
- 用 xmlFreeDoc 函數(shù)關(guān)閉文檔指針,并清除本文檔中所有節(jié)點(diǎn)動態(tài)申請的內(nèi)存。
注意: 節(jié)點(diǎn)列表的指針依然是 xmlNodePtr ,屬性列表的指針也是 xmlAttrPtr ,并沒有 xmlNodeList 或者 xmlAttrList 這樣的類型 ??醋髁斜淼臅r候使用它們的 next 和 prev 鏈表指針來進(jìn)行輪詢 。只有在 Xpath 中有 xmlNodeSet 這種類型。
示例
1: #include <stdio.h> 2: #include <stdlib.h> 3: #include <libxml/parser.h> 4: #include <libxml/tree.h> 5: 6: 7: int main (int argc , char **argv) 8: { 9: xmlDocPtr pdoc = NULL; 10: xmlNodePtr proot = NULL, curNode = NULL; 11: char *psfilename; 12: 13: if (argc < 1) 14: { 15: printf ("用法: %s xml文件名\n", argv[0]); 16: exit (1); 17: } 18: 19: psfilename = argv[1]; 20: // 打開 xml 文檔 21: //xmlKeepBlanksDefault(0); 22: pdoc = xmlReadFile (psfilename, "UTF-8", XML_PARSE_RECOVER); 23: 24: if (pdoc == NULL) 25: { 26: printf ("打開文件 %s 出錯!\n", psfilename); 27: exit (1); 28: } 29: 30: // 獲取 xml 文檔對象的根節(jié)對象 31: proot = xmlDocGetRootElement (pdoc); 32: 33: if (proot == NULL) 34: { 35: printf("錯: %s 是空文檔(沒有root節(jié)點(diǎn))!\n", psfilename); 36: exit (1); 37: } 38: 39: /* 我使用上面程序創(chuàng)建的 xml 文檔,它的根節(jié)點(diǎn)是“根節(jié)點(diǎn)”,這里比較是否 40: 正確。*/ 41: if (xmlStrcmp (proot->name, BAD_CAST "根節(jié)點(diǎn)") != 0) 42: { 43: printf ("錯誤文檔" ); 44: exit (1); 45: } 46: 47: /* 如果打開的 xml 對象有 version 屬性,那么就輸出它的值。 */ 48: if (xmlHasProp (proot, BAD_CAST "版本")) 49: { 50: xmlChar *szAttr = xmlGetProp (proot, BAD_CAST "版本"); 51: printf ("版本: %s \n根節(jié)點(diǎn):%s\n" , szAttr, proot->name); 52: } 53: else 54: { 55: printf (" xml 文檔沒有版本信息\n"); 56: } 57: 58: curNode = proot->xmlChildrenNode; 59: 60: char n=0; 61: while (curNode != NULL) 62: { 63: if (curNode->name != BAD_CAST "text") 64: { 65: printf ("子節(jié)點(diǎn)%d: %s\n", n++,curNode->name); 66: } 67: curNode = curNode->next; 68: } 69: 70: /* 關(guān)閉和清理 */ 71: xmlFreeDoc (pdoc); 72: xmlCleanupParser (); 73: return 0; 74: } 75:
編譯運(yùn)行(使用上例創(chuàng)建的 my.xml 文件):
root@jianlee:~/lab/xml# cat my.xml<?xml version="1.0" encoding="UTF-8"?><根節(jié)點(diǎn) 版本="1.0"><子節(jié)點(diǎn)1><子子節(jié)點(diǎn)1>信息</子子節(jié)點(diǎn)1><子子節(jié)點(diǎn)1>這是更低的節(jié)點(diǎn),子子子節(jié)點(diǎn)1</子子節(jié)點(diǎn)1></子節(jié)點(diǎn)1><子節(jié)點(diǎn)2>子節(jié)點(diǎn)2的內(nèi)容</子節(jié)點(diǎn)2><子節(jié)點(diǎn)3>子節(jié)點(diǎn)3的內(nèi)容</子節(jié)點(diǎn)3></根節(jié)點(diǎn)>root@jianlee:~/lab/xml# gcc -Wall `pkg-config libxml-2.0 --cflags --libs` read_xml.croot@jianlee:~/lab/xml# ./a.out my.xml版本: 1.0根節(jié)點(diǎn):根節(jié)點(diǎn)子節(jié)點(diǎn)0: text子節(jié)點(diǎn)1: 子節(jié)點(diǎn)1子節(jié)點(diǎn)2: text子節(jié)點(diǎn)3: 子節(jié)點(diǎn)2子節(jié)點(diǎn)4: text子節(jié)點(diǎn)5: 子節(jié)點(diǎn)3子節(jié)點(diǎn)6: text
為什么 my.xml 文件中顯示只有 ”子節(jié)點(diǎn)1“、 ”子節(jié)點(diǎn)2“和 “子節(jié)點(diǎn)3”三個子節(jié)點(diǎn),而程序顯示有 7 個子節(jié)點(diǎn)呢?!而且 0、2、4、6 都是 text 名字?
這是因?yàn)槠渌膫€分別是元素前后的空白文本符號,而 XML 把它們也當(dāng)做一個 Node !元素是 Node 的一種類型。XML 文檔對象模型 (DOM) 定義了幾種不同的 Nodes 類型,包括 Elements(如 files 或者 age)、Attributes(如 units)和 Text(如 root 或者 10)。元素可以具有子節(jié)點(diǎn)。
在打開 xml 文檔之前加上一句(取消上面程序中的此句注釋就可以):
xmlKeepBlanksDefault(0);
或者使用下面參數(shù)讀取 xml 文檔:
//讀取xml文件時忽略空格doc = xmlReadFile(docname, NULL, XML_PARSE_NOBLANKS);
這樣就可以按我們所想的運(yùn)行了:
root@jianlee:~/lab/xml# gcc -Wall `pkg-config libxml-2.0 --cflags --libs` read_xml.croot@jianlee:~/lab/xml# ./a.out my.xml版本: 1.0根節(jié)點(diǎn):根節(jié)點(diǎn)子節(jié)點(diǎn)0: 子節(jié)點(diǎn)1子節(jié)點(diǎn)1: 子節(jié)點(diǎn)2子節(jié)點(diǎn)2: 子節(jié)點(diǎn)3
還有一點(diǎn)注意: my.xml 文件中的子節(jié)點(diǎn)名字一次是 “子節(jié)點(diǎn)1”、“子節(jié)點(diǎn)2”、 “子節(jié)點(diǎn)3”。程序中的 n 值確是從 0 開始計(jì)算。從 0 還是 1 是個人喜好。我有時候喜好從 0 開始,有時候喜好從 1 開始。
- xmlFreeDoc
- 釋放文檔指針。特別注意,當(dāng)你調(diào)用 xmlFreeDoc 時,該文檔所有包含的節(jié)點(diǎn)內(nèi)存都被釋放,所以一般來說不需要手動調(diào)用 xmlFreeNode 或者 xmlFreeNodeList 來釋放動態(tài)分配的節(jié)點(diǎn)內(nèi)存,除非你把該節(jié)點(diǎn)從文檔中移除了。一般來說,一個文檔中所有節(jié)點(diǎn)都應(yīng)該動態(tài)分配,然后加入文檔,最后調(diào)用 xmlFreeDoc 一次釋放所有節(jié)點(diǎn)申請的動態(tài)內(nèi)存,這也是為什么我們很少看見 xmlNodeFree 的原因。
- xmlSaveFile
- 將文檔以默認(rèn)方式存入一個文件。
- xmlSaveFormatFileEnc
- 可將文檔以某種編碼/格式存入一個文件中,創(chuàng)建 xml 文檔是的示例中用到
修改 xml 文檔
首先打開一個已經(jīng)存在的xml文檔,順著根結(jié)點(diǎn)找到需要添加、刪除、修改的地方,調(diào)用相應(yīng)的xml函數(shù)對節(jié)點(diǎn)進(jìn)行增、刪、改操作。
刪除節(jié)點(diǎn)
刪除節(jié)點(diǎn)使用下面方法:
1: if (!xmlStrcmp(curNode->name, BAD_CAST "newNode1")) 2: { 3: xmlNodePtr tempNode; 4: tempNode = curNode->next; 5: xmlUnlinkNode(curNode); 6: xmlFreeNode(curNode); 7: curNode = tempNode; 8: continue; 9: } 10:
即將當(dāng)前節(jié)點(diǎn)從文檔中斷鏈(unlink),這樣本文檔就不會再包含這個子節(jié)點(diǎn)。這樣做需要使用一個臨時變量來存儲斷鏈節(jié)點(diǎn)的后續(xù)節(jié)點(diǎn),并記得要手動刪除斷鏈節(jié)點(diǎn)的內(nèi)存。
示例
1: #include <stdio.h> 2: #include <stdlib.h> 3: #include <libxml/parser.h> 4: 5: int main(int argc, char* argv[]) 6: { 7: xmlDocPtr doc; //定義解析文檔指針 8: xmlNodePtr curNode; //定義結(jié)點(diǎn)指針(你需要它為了在各個結(jié)點(diǎn)間移動) 9: char *szDocName; 10: 11: if (argc <= 1) 12: { 13: printf("Usage: %s docname\n", argv[0]); 14: return(0); 15: } 16: 17: szDocName = argv[1]; 18: xmlKeepBlanksDefault(0); 19: doc = xmlReadFile(szDocName,"UTF-8",XML_PARSE_RECOVER); //解析文件 20: 21: if (NULL == doc) 22: { 23: fprintf(stderr,"Document not parsed successfully. \n"); 24: return -1; 25: } 26: 27: curNode = xmlDocGetRootElement(doc); 28: 29: /*檢查確認(rèn)當(dāng)前文檔中包含內(nèi)容*/ 30: if (NULL == curNode) 31: { 32: fprintf(stderr,"empty document\n"); 33: xmlFreeDoc(doc); 34: return -1; 35: } 36: 37: curNode = curNode->children; 38: while (NULL != curNode) 39: { 40: //刪除 "子節(jié)點(diǎn)1" 41: if (!xmlStrcmp(curNode->name, BAD_CAST "子節(jié)點(diǎn)1")) 42: { 43: xmlNodePtr tempNode; 44: tempNode = curNode->next; 45: xmlUnlinkNode(curNode); 46: xmlFreeNode(curNode); 47: curNode = tempNode; 48: continue; 49: } 50: 51: //修改 "子節(jié)點(diǎn)2" 的屬性值 52: if (!xmlStrcmp(curNode->name, BAD_CAST "子節(jié)點(diǎn)2")) 53: { 54: xmlSetProp(curNode,BAD_CAST "屬性1", BAD_CAST "設(shè)置"); 55: } 56: 57: //修改 “子節(jié)點(diǎn)2” 的內(nèi)容 58: if (!xmlStrcmp(curNode->name, BAD_CAST "子節(jié)點(diǎn)2")) 59: { 60: xmlNodeSetContent(curNode, BAD_CAST "內(nèi)容變了"); 61: } 62: 63: //增加一個屬性 64: if (!xmlStrcmp(curNode->name, BAD_CAST "子節(jié)點(diǎn)3")) 65: { 66: xmlNewProp(curNode, BAD_CAST "新屬性", BAD_CAST "有"); 67: } 68: 69: //增加 "子節(jié)點(diǎn)4" 70: if (!xmlStrcmp(curNode->name, BAD_CAST "子節(jié)點(diǎn)3")) 71: { 72: xmlNewTextChild(curNode, NULL, BAD_CAST "新子子節(jié)點(diǎn)1", BAD_CAST "新內(nèi)容"); 73: } 74: 75: curNode = curNode->next; 76: } 77: 78: // 保存文件 79: xmlSaveFormatFileEnc (szDocName, doc,"UTF-8",1); 80: 81: xmlFreeDoc (doc); 82: xmlCleanupParser (); 83: xmlMemoryDump (); 84: return 0; 85: } 86:
編譯運(yùn)行:
root@jianlee:~/lab/xml# cat my.xml<?xml version="1.0" encoding="UTF-8"?><根節(jié)點(diǎn) 版本="1.0"><子節(jié)點(diǎn)1><子子節(jié)點(diǎn)1>信息</子子節(jié)點(diǎn)1><子子節(jié)點(diǎn)1>這是更低的節(jié)點(diǎn),子子子節(jié)點(diǎn)1</子子節(jié)點(diǎn)1></子節(jié)點(diǎn)1><子節(jié)點(diǎn)2>子節(jié)點(diǎn)2的內(nèi)容</子節(jié)點(diǎn)2><子節(jié)點(diǎn)3>子節(jié)點(diǎn)3的內(nèi)容</子節(jié)點(diǎn)3></根節(jié)點(diǎn)>root@jianlee:~/lab/xml# gcc -Wall `pkg-config libxml-2.0 --cflags --libs` modify_xml.croot@jianlee:~/lab/xml# ./a.out my.xmlroot@jianlee:~/lab/xml# cat my.xml<?xml version="1.0" encoding="UTF-8"?><根節(jié)點(diǎn) 版本="1.0"><子節(jié)點(diǎn)2 屬性1="設(shè)置">內(nèi)容變了</子節(jié)點(diǎn)2><子節(jié)點(diǎn)3 新屬性="有">子節(jié)點(diǎn)3的內(nèi)容<新子子節(jié)點(diǎn)1>新內(nèi)容</新子子節(jié)點(diǎn)1></子節(jié)點(diǎn)3></根節(jié)點(diǎn)>root@jianlee:~/lab/xml# ./a.out my.xml # 看看再運(yùn)行一次的結(jié)果!root@jianlee:~/lab/xml# cat my.xml<?xml version="1.0" encoding="UTF-8"?><根節(jié)點(diǎn) 版本="1.0"><子節(jié)點(diǎn)2 屬性1="設(shè)置">內(nèi)容變了</子節(jié)點(diǎn)2><子節(jié)點(diǎn)3 新屬性="有" 新屬性="有">子節(jié)點(diǎn)3的內(nèi)容<新子子節(jié)點(diǎn)1>新內(nèi)容</新子子節(jié)點(diǎn)1><新子子節(jié)點(diǎn)1>新內(nèi)容</新子子節(jié)點(diǎn)1></子節(jié)點(diǎn)3></根節(jié)點(diǎn)>
Xpath — 處理大型 XML 文檔
libxml2 庫函數(shù)
要注意的函數(shù)
xmlKeepBlanksDefault
int xmlKeepBlanksDefault (int val)
設(shè)置是否忽略空白節(jié)點(diǎn),比如空格,在分析前必須調(diào)用,默認(rèn)值是0,最好設(shè)置成1.
xmlKeepBlanksDefault(0) 除了在讀入xml文件時忽略空白之外,還會在寫出xml 文件時在每行前面放置縮進(jìn)(indent)。如果使用xmlKeepBlanksDefault(1) 則你會發(fā)現(xiàn)每行前面的縮進(jìn)就沒有了,但不會影響回車換行。
xmlSaveFormatFile
// 保存 xml 為文件,如果沒有給出文件名參數(shù),就輸出到標(biāo)準(zhǔn)輸出xmlSaveFormatFileEnc (argc > 1 ? argv[1]:"-", pdoc, "UTF-8", 1);
xmlSaveFormatFile 的 format 參數(shù)設(shè)置成 0,保存后的 xml 文檔里是會把所有的結(jié)點(diǎn)都放到一行里顯示。設(shè)置為 1,就可以自動添加回車。
讀取 xml 文件
xmlParseFile
xmlDocPtr xmlParseFile (const char * filename)
以默認(rèn)方式讀入一個 UTF-8 格式的 xml 文檔, 并返回一個文檔對象指針 <libxml/tree.h>
xmlReadFile
指定編碼讀取一個 xml 文檔,返回指針。
xml 操作基本結(jié)構(gòu)及其指針類型
xmlDoc, xmlDocPtr
文檔對象的結(jié)構(gòu)體及其指針
xmlNode, xmlNodePtr
節(jié)點(diǎn)對象的結(jié)構(gòu)體及其指針
xmlAttr, xmlAttrPtr
節(jié)點(diǎn)屬性的結(jié)構(gòu)體及其指針
xmlNs, xmlNsPtr
節(jié)點(diǎn)命名空間的結(jié)構(gòu)及其指針
根節(jié)點(diǎn)相關(guān)函數(shù)
xmlDocGetRootElement
xmlNodePtr xmlDocGetRootElement (xmlDocPtr doc)獲取文檔根節(jié)點(diǎn)
xmlDocSetRootElement
xmlNodePtr xmlDocSetRootElement (xmlDocPtr doc, xmlNodePtr root)設(shè)置文檔根節(jié)點(diǎn)
創(chuàng)建子節(jié)點(diǎn)相關(guān)函數(shù)
xmlNewNode
xmlNodePtr xmlNewNode (xmlNsPtr ns, const xmlChar * name)創(chuàng)建新節(jié)點(diǎn)
xmlNewChild
xmlNodePtr xmlNewChild (xmlNodePtr parent, xmlNsPtr ns, const xmlChar * name, const xmlChar * content)創(chuàng)建新的子節(jié)點(diǎn)
xmlCopyNode
xmlNodePtr xmlCopyNode (const xmlNodePtr node, int extended)復(fù)制當(dāng)前節(jié)點(diǎn)
添加子節(jié)點(diǎn)相關(guān)函數(shù)
xmlAddChild
xmlNodePtr xmlAddChild (xmlNodePtr parent, xmlNodePtr cur)給指定節(jié)點(diǎn)添加子節(jié)點(diǎn)
xmlAddNextSibling
xmlNodePtr xmlAddNextSibling (xmlNodePtr cur, xmlNodePtr elem)添加后一個兄弟節(jié)點(diǎn)
xmlAddPrevSibling
xmlNodePtr xmlAddPrevSibling (xmlNodePtr cur, xmlNodePtr elem)添加前一個兄弟節(jié)點(diǎn)
xmlAddSibling
xmlNodePtr xmlAddSibling (xmlNodePtr cur, xmlNodePtr elem)添加兄弟節(jié)點(diǎn)
屬性相關(guān)函數(shù)
xmlNewProp
xmlAttrPtr xmlNewProp (xmlNodePtr node, const xmlChar * name, const xmlChar * value)創(chuàng)建新節(jié)點(diǎn)屬性
xmlGetProp
xmlChar * xmlGetProp (xmlNodePtr node, const xmlChar * name)讀取節(jié)點(diǎn)屬性
xmlSetProp
xmlAttrPtr xmlSetProp (xmlNodePtr node, const xmlChar * name, const xmlChar * value)設(shè)置節(jié)點(diǎn)屬性