摘要: 近两天一直在搞页面抓取,先开始是想从正则式下手,然后轻而易举的写了个抓取总页数的正则,并且成功抓到,后来抓取table里的数据真发愁了,因为table里的数据有图片属性,有td值,很不好抓,幸好找了个好插件htmlAgilitypack转换xml,废话不多说,开始总结,这这之前请先学一下xpath语法。引入using HtmlAgilityPack;和dll一:装载页面HtmlWeb web = new HtmlWeb();web.OverrideEncoding = Encoding.GetEncoding("gb2312");HtmlDocument doc = web 阅读全文
posted @ 2013-05-09 16:07 树形图 阅读(513) 评论(0) 推荐(0) 编辑