随笔分类 -  八爪鱼采集器

八爪鱼采集器,最好用的网页数据采集工具
摘要:随着大数据和社交网络的火爆发展,社交网络上产生的数据也越来越有价值,特别是微博微信作为时下最火热的社交平台,如果能对这两个平台上的数据进行深入分析挖掘,那么价值将非常巨大, 要采集的数据为指定城市的所有微博用户的相关信息。比如微博名称,微博地址,微博数量,粉丝数量,名片等等,进入正题,看看具体一步一步怎么操作来实现的。打开八爪鱼采集器,新建一个任务之后,如下图选择分组:新浪微博,这里其实随便什么分组都可以,我是把新浪微博专门放了一个分组,以便管理采集微博的多个任务。任务名称,这里按照自己的情况输入即可,我这里采集的是沈阳的微博信息。然后输入备注。然后就到了设计采集流程的界面,这个界面看起来复杂 阅读全文
posted @ 2013-11-28 23:51 流浪的军刀 阅读(6334) 评论(5) 推荐(1) 编辑
摘要:经常看到一些朋友在讨论如何采集flash中的数据,讨论来讨论区,结论就是:flash不能采集,其实也不总是这样。本篇就跟大家分享如何采集flash中的数据。在开始之前,先说明一下:一般来说flash中的数据是不能被现有技术很容易采集到的,但是也不能谈flash色变,要具体问题具体分析,有些flash是可以通过一些分析发现背后的数据。然后采集就变得很容易了。具体案例:搜房房价走势采集。先看看房价走势页面:http://baolishangcheng.soufun.com/house/2810932360/fangjia.htm可以看出,这是个flash的,还有很多鼠标移动上去显示的数据。右键点击 阅读全文
posted @ 2013-11-13 09:38 流浪的军刀 阅读(4853) 评论(1) 推荐(0) 编辑
摘要:又是很久没写博文了,不是不想写,是很想,只是太忙,先给大家看看最近在忙的一个东西,这个不止是我一个人的心血,也是我们团队努力的结晶,请大家赐教:稍后再给大家分享视频背后的故事。 阅读全文
posted @ 2013-11-02 00:02 流浪的军刀 阅读(813) 评论(1) 推荐(1) 编辑

点击右上角即可分享
微信分享提示