pugixml的简单使用
一、简介
pugixml的官方主页为:http://pugixml.org/
pugixml是一个很棒的XML操作库,
- 它很轻量,只有三个文件(pugiconfig.hpp pugixml.cpp pugixml.hpp )
- 支持Unicode
- 支持XPATH解析
- 速度快,仅比RapidXml慢一些
- 跨平台(windows/linux)
- 面向对象
Xml库解析性能比较表
(表格来自:http://rapidxml.sourceforge.net/manual.html)
2016.12.22更新:
pugixml官网上有了新的性能对比图:
http://pugixml.org/benchmark.html
目前速度上已经比rapid_xml更快。(但我没亲自测试过)
二、配置
pugixml的三个文件,可以只include头文件pugixml.hpp,CPP文件不用放到项目中,
方法是,在pugiconfig.hpp中:
// Uncomment this to switch to header-only version #define PUGIXML_HEADER_ONLY #include "pugixml.cpp"
将这两行的注释去掉就可以了。
另外,如果项目使用的是Unicode设置,则可以在pugiconfig.hpp中:
// Uncomment this to enable wchar_t mode #define PUGIXML_WCHAR_MODE
将wchar模式打开即可。
三、使用
XML文件:
<?xml version="1.0" encoding="GBK"?> <root> <ip>192.168.1.1</ip> <root>
C++:
void SaveToConfig( const wchar_t* xml_file, const wchar_t* ip ) { using namespace pugi; xml_document doc; xml_parse_result result = doc.load_file( xml_file ); if (result.status != status_ok) return; if (!doc.child( L"root" )) doc.append_child( L"root" ); xml_node node = doc.child( L"root" ).child( L"ip" ); if (!node) doc.child( L"root" ).append_child( L"ip" ) node.text().set( ip ); doc.save_file( xml_file ); }
这里需要注意的是,ip节点的内容是一个pcdata类型的节点,这个节点的内容才是ip字符串,所以这里用text()来读写IP节点内容。
如果要用.value()方法得到ip字符串的话,需要这样用:
wstring ip = node.first_child().value(); node.first_child().set_value(L"10.10.10.10");
另外,node.text().set()方法也不错,提供了常用的数据类型写入XML的重载方法:
// Set text (returns false if object is empty or there is not enough memory) bool set(const char_t* rhs); // Set text with type conversion (numbers are converted to strings, boolean is converted to "true"/"false") bool set(int rhs); bool set(unsigned int rhs); bool set(double rhs); bool set(bool rhs); #ifdef PUGIXML_HAS_LONG_LONG bool set(long long rhs); bool set(unsigned long long rhs); #endif
而node.text().as_xxx()方法可以按需要直接从XML文件中读取出指定类型的数据:
// Get text, or "" if object is empty const char_t* get() const; // Get text, or the default value if object is empty const char_t* as_string(const char_t* def = PUGIXML_TEXT("")) const; // Get text as a number, or the default value if conversion did not succeed or object is empty int as_int(int def = 0) const; unsigned int as_uint(unsigned int def = 0) const; double as_double(double def = 0) const; float as_float(float def = 0) const; #ifdef PUGIXML_HAS_LONG_LONG long long as_llong(long long def = 0) const; unsigned long long as_ullong(unsigned long long def = 0) const; #endif
实际上node.text()返回的是xml_text对象实例,上面的set()和as_xxx()是由xml_text实现的。
如果IP节点有属性的话,可以遍历属性:
for (pugi::xml_attribute attr = node.first_attribute(); attr; attr = attr.next_attribute()) { std::cout << " " << attr.name() << "=" << attr.value(); }
C++11:
for (pugi::xml_attribute attr : node.attributes()) { std::cout << " " << attr.name() << "=" << attr.value(); }
作为读取配置文件用,上面这些也差不多了,其它接口看看源码就能明白怎样用,pugixml提供了些高级用法,可以看他官网上提供的例子。
四、注意事项
除了上面提到的<ip>节点内容为pcdata节点外,
关于中文的问题,clever101曾在pugixml库的一个使用心得中提到,要用
std::locale::global(std::locale("chs")); const std::wstring strFilePath = _T(“c:\\ xgconsole.xml”); std::wifstream stream(strFilePath.c_str()); pugi::xml_document doc; doc.load(stream);
这种load stream的方式读取,其实不必如此,只要保证文件保存时编码为GB2312并且XML文件头的声明encoding="gb2312“就可以了。
<?xml version="1.0" encoding="gb2312"?>