摘要: 通过程序自动的读取其它网站网页显示的信息,类似于爬虫程序。为了完成以上的需求,我们就需要模拟浏览器浏览网页,得到页面的数据在进行分析,最后把分析的结构,即整理好的数据写入数据库。那么我们的思路就是: 1、发送HttpRequest请求。 2、接收HttpResponse返回的结果。得到特定页面的html源文件。 3、取出包含数据的那一部分源码。 4、根据html源码生成HtmlDocument,循环取出数据。 5、写入数据库。 程序如下: 1 //根据Url地址得到网页的html源码 2 private string GetWebContent(string Url) ... 阅读全文
posted @ 2013-08-06 22:38 蓝默小筑 阅读(483) 评论(0) 推荐(0) 编辑