摘要: 基本语法和函数可以参见:http://www.w3school.com.cn/xpath/index.asp//td[contains(text(),'行业')] 模糊查询/following::*[1] 选取当前元素的下一个同胞元素 阅读全文
posted @ 2011-05-24 16:19 潇客的技术博客 阅读(1677) 评论(0) 推荐(0) 编辑
摘要: HTML解析器有很多种,最常用的是HtmlAgilityPack和SgmlReader(http://sourceforge.net/projects/dekiwiki/files/SgmlReader/)。这里使用的是HtmlAgilityPack:下载地址:http://htmlagilitypack.codeplex.com同时官网提供了一个自动生成xpath路径的工具HAP Explorer。关于XPATH表达式以及相关教程参见:XPath表达式精选[更新中...] 获取HTML的方式有很多种:1.通过HttpWebRequest类可实现模拟登录并获取页面信息2.用第三方控件模拟登录, 阅读全文
posted @ 2011-05-24 15:25 潇客的技术博客 阅读(3520) 评论(0) 推荐(1) 编辑