摘要: 通过HtmlAgilityPack实现网页信息抓取。2012-2-16 08:24| 发布者: benben| 查看: 4823| 评论: 0摘要: 1. 下载Html Agility Pack,解压保存到本地 下载地址:http://htmlagilitypack.codeplex.com/ 1 void caijisoufun() 2 { 3 try 4 { 5 6 HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); 7 ...1. 下载Html Agility Pack,解压保存到本地 下载地址:h 阅读全文
posted @ 2013-04-22 18:50 iammackong 阅读(652) 评论(0) 推荐(0) 编辑
摘要: 1.下载HtmlAgilityPack.dll并将其添加引用到项目中,然后在代码中声明引用。下载地址:http://www.codeplex.com/htmlagilitypack引用:usingHtmlAgilityPack;2.下载获取HTML页面的步骤和我上篇文章里介绍的差不多,都是先用WebClient或者WebRequest类来下载HTML页面然后处理成字符串。3.与上次不同的是,这里分析和抓取HTML节点中的数据不再是之前那种STRING字符串操作的方式,而是封装成一个HtmlDocument对象,通过HtmlDocument中的方法来索引你需要抓取HTML节点,进而取出节点中的值 阅读全文
posted @ 2013-04-22 18:35 iammackong 阅读(742) 评论(0) 推荐(0) 编辑