C# XDocument解析带有命名空间的 xml格式文件

 1 <?xml version="1.0" encoding="UTF-8"?>
 2 <entry xmlns="http://www.w3.org/2005/Atom" xmlns:db="http://www.douban.com/xmlns/" xmlns:gd="http://schemas.google.com/g/2005"xmlns:opensearch="http://a9.com/-/spec/opensearchrss/1.0/">
 3   <id>http://api.douban.com/event/10069638</id>
 4   <title>Debugging the Web </title>
 5   <category scheme="http://www.douban.com/2007#kind" term="http://www.douban.com/2007#event.salon"/>
 6   <author>
 7     <link href="http://api.douban.com/people/1057620" rel="self"/>
 8     <link href="http://www.douban.com/people/aka/" rel="alternate"/>
 9     <link href="http://t.douban.com/icon/u1057620-16.jpg" rel="icon"/>
10 
11     <name>王胖子</name>
12     <uri>http://api.douban.com/people/1057620</uri>
13 </author>
14 </entry>

<db:attribute name="invite_only">no</db:attribute>

看到这么多www就不想看直接跳过，然后看到熟悉的<author> </author>, 果断套用上面例子的程序，一运行却啥都得不到，问题到底出在哪？C#提供一大堆的XML类，XDocument, XReader, XPath, XmlDocument，是不是我现在用的这种类不给力啊?
（1）看下面这里<entry xmlns="http://www.w3.org/2005/Atom" ，xmlns就是xml namespace的意思。
（2）再往后看，xmlns:db="http://www.douban.com/xmlns/" ，结合<db:attribute name="invite_only">no</db:attribute>这句话，可以理解了，
db是一个namespace的简称，方便写在元素的名字前面，这样<db:attribute> 和 <attribute>, <gd:attribute>就不一样了。
（3）这种简称可以在一个文档里面区别变量，但是对大量的文档还是不行，所以namespace还有一个全称，就是这里的http://www.douban.com/xmlns/。这个全称其实写什么内容都行，对XML Parser来说都是当做字符串来处理的，但一来想名字比较麻烦，二来可以顺道做个广告，所以大家一般都用的网址。

http://www.w3.org/2005/Atom到底是个啥啊，连解析带有命名空间xmlns的xml文件 (XML解析中的namespace初探)个简称都没有？
哎，意识到这个就对了，他的简称就是””,空串。这东西被称为default namespace，那些看上去没有前缀的都是在这个namespace下的。所以那个<author>不是裸的啊，人家其实是 <”http://www.w3.org/2005/Atom” ： author> 所以裸的程序当然是解析不了的了。

那么该如何解析呢？这里提供一个样例程序，希望对大家有帮助。这个代码可以在WP7上运行。

 1 string file = @"C:\Users\v-menlin\Documents\Visual Studio 2010\Projects\test\test\test.xml";
 2             XDocument doc = XDocument.Load( file );
 3             //use following code to parse a string 
 4             //XDocument doc = XDocument.Parse( string );
 5 
 6             //对于XML文件中所有的没加类似db:这种的元素，用下列方法
 7             XNamespace d = @"http://www.w3.org/2005/Atom";
 8             foreach ( XElement element in doc.Descendants( d + "title" ) )
 9             {
10                 Console.WriteLine( element.Value );
11             }
12             //<author>下面包含了<link>,以下的例子还示例了如何读取属性。
13             foreach ( XElement element in doc.Descendants( d + "author" ) )
14             {
15                 foreach ( XElement inelement in element.Descendants( d + "link" ) )
16                 {
17                     Console.WriteLine( inelement.Attribute( "href" ).Value );
18                     Console.WriteLine( inelement.Attribute( "rel" ).Value );
19                 }
20             }
21 
22             Console.WriteLine();
23             //对于加了冒号前缀的元素，使用下列代码
24             XNamespace db = @"http://www.douban.com/xmlns/";
25             foreach ( XElement element in doc.Descendants( db + "attribute" ) )
26             {
27                 Console.WriteLine( element.Attribute( "name" ).Value );
28                 Console.WriteLine( element.Value );
29             }
30             //其实只是NameSpace的头部换了一下。
31 
32             //下面列出其他几个常用头部，直接换用。
33             XNamespace gd = @"http://schemas.google.com/g/2005";
34             XNamespace opensearch = @"http://a9.com/-/spec/opensearchrss/1.0/";

posted @ 2020-04-01 22:56 Mr웃ZHANG 阅读(1075) 评论(0) 收藏举报

刷新页面返回顶部

Mr.ZHANG

C# XDocument解析带有命名空间的 xml格式文件

公告