一、简介
expat是一个由C语言编写的XML解析库。James Clark创建了这个库,现在是制定XML标准的W3组织的技术leader。现在的版本是2.0。2.0开始就由Clark Cooper领导的开发组在sourceforge.net负责开发。
expat是一个基于SAX模型的、非验证(默认,v1.2开始提供验证接口,需要用户手动处理)的轻量级XML解释器。目前XML的解析主要有两大模型:SAX和DOM。其中SAX(Simple API for XML)是基于事件的解析方法。基本工作原理是分析XML文档,通过触发事件来通知用户解析的结果。这种方式占用内存少,速度快,但用户程序相应得会比较复杂。而DOM(DocumentObject Model),则是一次性将整个XML文档进行分析,在内存中以树结构保存解析结果。同时,向用户提供一系列的接口来访问和编辑该树结构。这种方式占用内存大,速度往往慢于SAX,但可以给用户提供一个面向对象的访问接口,对用户更为友好。
对于一个特定的XML文档而言,其正确性分为两个层次。首先是其格式应该符合XML的基本格式要求,比如第一行要有声明,标签的嵌套层次必须前后一致等等,符合这些要求的文件,就是一个合格的XML文件,称作well-formatted。但除此之外,一个XML文档因其内容的不同还必须在语义上符合相应的标准,这些标准由相应的DTD文件或者Schema文件来定义,符合了这些定义要求的XML文件,称作valid。
因此,解析器也分为验证和非验证两种。是验证的会跟据XML文件中的声明,用相应的DTD文件对XML文件进行校验,检查它是否满足DTD文件的要求。非验证性的则忽略DTD文件,只要基本格式正确,就可以进行解析。常见XML解析库总结如下:
参考:http://www.xml.com/pub/a/1999/09/expat/index.html
二、实例
示例1:example1.c
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include "xmlparse.h"
4
5 void startElement (void *userData, const char *name, const char **atts)
6 {
7 int i;
8 int *depthPtr = userData;
9 for (i = 0; i < *depthPtr; i++)
10 printf("\t");
11 puts (name);
12
13 for (i = 0; atts[i]; i += 2)
14 {
15 printf("\t%s='%s'", atts[i], atts[i + 1]);
16 }
17
18 printf("\n");
19 *depthPtr += 1;
20 }
21
22 void endElement (void *userData, const char *name)
23 {
24 int *depthPtr = userData;
25 *depthPtr -= 1;
26 }
27
28 int main (int argc, char *argv[])
29 {
30 char buf[BUFSIZ];
31 XML_Parser parser = XML_ParserCreate (NULL);
32 int done;
33 int depth = 0;
34 FILE *fp;
35
36 if (argc != 2)
37 {
38 printf("Usage: %s filename\n", argv[0]);
39 exit(0);
40
41 }
42 if ((fp = fopen(argv[1], "r")) == NULL)
43 {
44 printf("Can't open %s\n", argv[1]);
45 exit(1);
46
47 }
48
49 XML_SetUserData (parser, &depth);
50 XML_SetElementHandler (parser, startElement, endElement);
51 do
52 {
53 size_t len = fread (buf, 1, sizeof (buf), fp);
54 // done = len < sizeof(buf);
55 done = feof (fp);
56 if (!XML_Parse (parser, buf, len, done))
57 {
58 fprintf (stderr, "%s at line %d\n", XML_ErrorString (XML_GetErrorCode (parser)), XML_GetCurrentLineNumber (parser));
59 return 1;
60 }
61 }
62 while (!done);
63 XML_ParserFree (parser);
64 return 0;
65 }
编译
gcc -g -o example1 example1.c -I/root/srcpkg/expat-1.2/xmlparse -L/root/srcpkg/expat-1.2/xmlparse -static -lexpat
运行