会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
薛定谔的猫
事无巨细,都要记录一下,于细节处成就自我。
我只希望,我所做的一切,能给人们的生活带来一些改变
博客园
首页
新随笔
订阅
管理
2015年1月14日
Nodejs书写爬虫工具
摘要: 看了几天的nodejs,的确是好用,全当是练手了,就写了一个爬虫工具。爬虫思路都是一致的,先抓取页面数据,然后分析页面,获取到所需要的数据,最后获得这些数据,是写入到硬盘,还是显示到网页,自己看着办。其中最难的是分析页面,如果不用其他工具,那就只能用正则表达式来分析了。这里采用cheerio这个模块...
阅读全文
posted @ 2015-01-14 13:15 薛定谔的猫_
阅读(2206)
评论(7)
推荐(1)
编辑
公告