通过NSXMLParser来解析XML
NSXMLParser 使用 delegate 模型来解析 XML 内容的。下面我们来创建一个 XML 文 件,文件中包含如下内容(在工程中保存为 MyXML.xml):
<?xml version="1.0" encoding="UTF-8"?> <root> <person id="1"> <firstName>zhang</firstName> <lastName>san</lastName> <age>51</age> </person> <person id="2"> <firstName>li</firstName> <lastName>si</lastName> <age>61</age> </person> </root>
#import <UIKit/UIKit.h> @interface AppDelegate : UIResponder <UIApplicationDelegate,NSXMLParserDelegate> @property (strong, nonatomic) UIWindow *window; @property (nonatomic, strong) NSXMLParser *xmlParser; @end
可以看到,我定义了一个XML parser app delegate,并且尊循NSXMLParserDelegate协 议,该协议是作为 NSXMLParser 解析 xml 需要用到的 delegate。现在从磁盘中读取 MyXML.xml 文件,并将其传递给 XML 解析器:
- (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launchOptions { //找到文件路径 NSString *xmlFilePath = [[NSBundle mainBundle]pathForResource:@"MyXML" ofType:@"xml"]; NSData *xml = [[NSData alloc]initWithContentsOfFile:xmlFilePath]; self.xmlParser = [[NSXMLParser alloc]initWithData:xml]; self.xmlParser.delegate = self; if ([self.xmlParser parse]) { NSLog(@"The XML is parsed"); }else{ NSLog(@"Failed to parse the XML"); } return YES; }
首先把文件内容读取到一个 NSData 实例对象中,然后使用 initWithData:来初始化我们 的 XML parser,并把我们从 xml 文件中读取出来的数据传递进去。之后我们可以调用 XML parser 的 parse 方法来开始解析处理。这个方法会阻塞当前线程,直至解析处理结束。如果 你需要解析的 XML 文件非常大,强烈建议使用一个全局的 dispatch 队列来进行解析。
为了解析 XML 文件,我们需要了解定义在 NSXMLParserDelegate 协议中的代理方法和它们的职责:
parserDidStartDocument:
解析开始的时候调用该方法。
parserDidEndDocument:
解析结束的时候调用该方法。
parser:didStartElement:namespaceURI:qualifiedName:attributes:
在 XML document 中,当解析器在解析的时候遇到了一个新的 element 时会被调用该方法。
parser:didEndElement:namespaceURI:qualifiedName:
当前节点结束之后会调用。
parser:foundCharacters:
当解析器在解析文档内容的时候被调用。
在使用这些 delegate 方法的时候,我们可以为 XML 对象创建一个对象模型。下面我们定义一个对象来代表 XML element,类名叫做 XMLElement,代码如下:
#import <Foundation/Foundation.h> @interface XMLElement : NSObject @property (nonatomic, strong)NSString *name; @property (nonatomic, strong)NSString *text; @property (nonatomic, strong)NSDictionary *attributes; @property (nonatomic, strong)NSMutableArray *subElements; @property (nonatomic, weak) XMLElement *parent; @end
.m
#import "XMLElement.h" @implementation XMLElement - (NSMutableArray *)subElements{ //get方法 懒加载 if (_subElements == nil) { _subElements = [[NSMutableArray alloc]init]; } return _subElements; } @end
我只想当访问 subElements 数组的时候,如果该数组是 nil,才进行初始化。因此我把这个属性的内存分配和初始化代码放到了它的getter方法中。如果说一个XML element没有子 elements,那么我们永远都不会使用到这个属性,因此这里也就不会为那个 element 分配内存和进行初始化工作。这种技术叫做 lazy allocation。 (懒加载)
现在我们定义一个 XMLElement 实例,叫做 rootElement。我们的计划是开始解析处 理,向下获取 XML 文件内容并使用 delegate 方法进行解析,直至成功解析完整个文件。
#import <UIKit/UIKit.h> @class XMLElement; @interface AppDelegate : UIResponder <UIApplicationDelegate,NSXMLParserDelegate> @property (strong, nonatomic) UIWindow *window; @property (nonatomic, strong) NSXMLParser *xmlParser; @property (nonatomic, strong) XMLElement *rootElement; @property (nonatomic, strong) XMLElement *currentElementPointer; @end
开始解析处理。我们想要关注的第一个方法就是 parserDidStartDocument:方 法。在这个方法中,我们简单的重置一切:
//开始解析,重置 - (void)parserDidStartDocument:(NSXMLParser *)parser{ self.rootElement = nil; self.currentElementPointer = nil; }
下一个方法就是 parser:didStartElement:namespaceURI:qualifiedName:attributes:方法。在 这个方法中,如果root element没有被创建,会被创建,并且开始解析一个新的element,我 们会计算它在 XML 结构中的位置,并在当前 element 中添加一个新的 element。
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName attributes:(NSDictionary *)attributeDict{ if (self.rootElement == nil) { self.rootElement = [[XMLElement alloc]init]; self.currentElementPointer = self.rootElement; }else{ XMLElement *newElement = [[XMLElement alloc]init]; newElement.parent = self.currentElementPointer; [self.currentElementPointer.subElements addObject:newElement]; self.currentElementPointer = newElement; } self.currentElementPointer.name = elementName; self.currentElementPointer.attributes = attributeDict; }
下一步,就是 parser:foundCharacters: 这个方法了。这个方法将会在解析 element 的时 候调用多次,因此我们需要确保已经为多次进入该方法做好了准备。例如,如果一个 element 的文本有 4000 个字符长度,解析器在第一次解析时,最多只能解析 1000 个字符, 之后在解析当前 element 时,调用 parser:foundCharacters:方法,每次都是 1000,因此需要 4 次:
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string{ if ([self.currentElementPointer.text length] > 0) { self.currentElementPointer.text = [self.currentElementPointer.text stringByAppendingString:string]; }else{ self.currentElementPointer.text = string; } }
下一个需要关注的方法就是 parser:didEndElement:namespaceURI:qualifiedName:方法,当 解析至某个 element 尾部时,会调用该方法。在这里,我们只需要把当前 element 指针指向 当前 element 的上一级:
- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName{ self.currentElementPointer = self.currentElementPointer.parent; }
最终,我们需要处理 parserDidEndDocument 这个方法。我们需要 dispose currentElementPointe 属性。
- (void)parserDidEndDocument:(NSXMLParser *)parser{ self.currentElementPointer = nil; }
上面就是所有的实现内容,现在你就可以使用 rootElement 属性来遍历 XML 结构了