摘要: 利用HtmlAgilityPack抓取页面很方便,但是当页面是gb2312编码时候就会出现乱码,上网查了一下说是默认的获取页面方法不够成熟,具体什么的我也不知道,姑且就认为是不够成熟吧。HtmlWeb htmlWeb = new HtmlWeb();HtmlDocument htmlDocument = htmlWeb.Load(@url);解决方法如下:新建一个方法来获取 HtmlDocument,传进来的是抓取页面的地址 private static HtmlDocument GetHtmlDocument(string url) { Htt... 阅读全文
posted @ 2013-06-13 15:21 馨语随风 阅读(3100) 评论(5) 推荐(0) 编辑