2013 年 8月 6 日随笔档案 - 蓝默小筑

2013年8月6日

摘要：通过程序自动的读取其它网站网页显示的信息，类似于爬虫程序。为了完成以上的需求，我们就需要模拟浏览器浏览网页，得到页面的数据在进行分析，最后把分析的结构，即整理好的数据写入数据库。那么我们的思路就是： 1、发送HttpRequest请求。 2、接收HttpResponse返回的结果。得到特定页面的html源文件。 3、取出包含数据的那一部分源码。 4、根据html源码生成HtmlDocument，循环取出数据。 5、写入数据库。程序如下： 1 //根据Url地址得到网页的html源码 2 private string GetWebContent(string Url) ... 阅读全文

posted @ 2013-08-06 22:38 蓝默小筑阅读(483) 评论(0) 推荐(0) 编辑

蓝默小筑

公告