会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
rexying·拒绝拖延·马上行动
今天,你应该活到最好、做到最好、想到最好、因为,今天正是明天可信赖的准备。
博客园
首页
新随笔
联系
订阅
管理
2007年9月12日
抓取网页并获取指定内容段
摘要: 为了完成以上的需求,我们就需要模拟浏览器浏览网页,得到页面的数据在进行分析,最后把分析的结构,即整理好的数据写入数据库。那么我们的思路就是: 1、发送HttpRequest请求。 2、接收HttpResponse返回的结果。得到特定页面的html源文件。 3、取出包含数据的那一部分源码。 4、根据html源码生成HtmlDocument,循环取出数据。 5、写入数据库。
阅读全文
posted @ 2007-09-12 11:15 rex.ying
阅读(1455)
评论(0)
推荐(0)
编辑