会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
打怪升级中
每件事到最后都是好事,如果不是好事,说明还没有到最后
博客园
首页
联系
订阅
管理
2013年9月15日
关于网络爬虫和网站数据采集的一些总结
摘要: 由于公司这段时间比较缺人手,这段时间上游戏厂商的专题活动也较为频繁,不得不做一个新闻采集的小软件,采集别人站点的一些新闻到我们平台上。 自己总结了下,新闻采集主要有几点: 1、通过模拟http请求,请求页面内容 2、通过正则表达式,把页面内容进行过滤,取出想要的部分。 3、把数据给整合成符合我们需要...
阅读全文
posted @ 2013-09-15 21:58 keepnode
阅读(2035)
评论(0)
推荐(0)
编辑
公告