HtmlAgilityPack 加载中文页面时出现在乱码的最终解决方案
摘要:
前几天我在博客园转载了一篇"net HtmlParser初步使用研究"的文章,之后看过文章评论才知道原来现在已经有HtmlAgilityPack这个类库可以更方便地对HTML内容进行分析和提取。因此今天特别学习和实践了一下HtmlAgilityPack和XPath,并作下笔记。HtmlAgilityPack是用C#写的开源Html Parser。不过可能在某些方面设计不尽完善,或者是对中文的支持并不是很好,例如,抓取中文页面时就出现乱码.我的代码如下:HtmlWebhw=newHtmlWeb();HtmlDocumentdoc=hw.Load("http://ww 阅读全文