今天在做rss解析的时候碰到一个奇怪的难题
经过一周的研究,终于可以解析rss2.0,1.0,0.92,Atom0.3格式,今天在继续测试的时候让我又遭受一次挫折,
在碰到GBK编码的rss文件会抛出异常!
比如 :http://club.sohu.com/rss.shtml
这个页的rss.
在用
XmlDocument doc = new XmlDocument();
doc.Load(url);
XmlTextWriter writer = new XmlTextWriter("data.xml",Encoding.Default);
doc.Load(url);
XmlTextWriter writer = new XmlTextWriter("data.xml",Encoding.Default);
就抛出一个异常,我后来用WebClient获取xml文件保存下来仍然没成功,存下来总会有几个字变成乱码,然后那个xml文件就变成一个无效xml文件!
希望各位能给指点下,感激!
新浪微博:http://t.sina.com.cn/sunli1223