2007年9月12日
摘要: 为了完成以上的需求,我们就需要模拟浏览器浏览网页,得到页面的数据在进行分析,最后把分析的结构,即整理好的数据写入数据库。那么我们的思路就是:   1、发送HttpRequest请求。   2、接收HttpResponse返回的结果。得到特定页面的html源文件。   3、取出包含数据的那一部分源码。   4、根据html源码生成HtmlDocument,循环取出数据。   5、写入数据库。 阅读全文
posted @ 2007-09-12 11:15 rex.ying 阅读(1455) 评论(0) 推荐(0) 编辑