2009年4月6日

摘要: 版本:v2.3 (2008-4-13) 作者:deerchao 转自 http://www.unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm#ad 目录 跳过目录 本文目标如何使用本教程正则表达式到底是什么东西?入门测试正则表达式元字符字符转义重复字符类分枝条件反义分组后向引用零宽断言负向零宽断言注释贪婪与懒惰处理选项平衡组/递归... 阅读全文

posted @ 2009-04-06 14:46 hesen 阅读(251) 评论(0) 推荐(0) 编辑

摘要: 通过程序自动的读取其它网站网页显示的信息,类似于爬虫程序。比方说我们有一个系统,要提取BaiDu网站上歌曲搜索排名。分析系统在根据得到的数据进行数据分析。为业务提供参考数据。 为了完成以上的需求,我们就需要模拟浏览器浏览网页,得到页面的数据在进行分析,最后把分析的结构,即整理好的数据写入数据库。那么我们的思路就是: 1、发送HttpRequest请求。 2、接收HttpResponse... 阅读全文

posted @ 2009-04-06 14:44 hesen 阅读(417) 评论(0) 推荐(0) 编辑

摘要: 通过程序自动的读取其它网站网页显示的信息,类似于爬虫程序。比方说我们有一个系统,要提取BaiDu网站上歌曲搜索排名。分析系统在根据得到的数据进行数据分析。为业务提供参考数据。 为了完成以上的需求,我们就需要模拟浏览器浏览网页,得到页面的数据在进行分析,最后把分析的结构,即整理好的数据写入数据库。那么我们的思路就是: 1、发送HttpRequest请求。 2、接收HttpResponse... 阅读全文

posted @ 2009-04-06 00:29 hesen 阅读(1292) 评论(1) 推荐(0) 编辑

摘要: 抓取和分析网页的类。主要功能有:1、提取网页的纯文本,去所有html标签和javascript代码2、提取网页的链接,包括href和frame及iframe3、提取网页的title等(其它的标签可依此类推,正则是一样的)4、可以实现简单的表单提交及cookie保存 using System; using System.Data; using System.Configuration; using ... 阅读全文

posted @ 2009-04-06 00:16 hesen 阅读(698) 评论(0) 推荐(0) 编辑