欢迎来到Felix的博客

Do the right things! And talk is cheap,show me your code!
摘要: scrapy部署神器-scrapyd --》GitHub地址 --》官方文档 一:安装scrapyd 安装:pip3 install scrapyd 这里我在另外一台ubuntu linux虚拟机中同样安装scrapy以及scrapyd等包,保证所要运行的爬虫需要的包都完成安装. 在这里有个小问题需 阅读全文
posted @ 2018-04-12 18:27 寂静的天空 阅读(452) 评论(0) 推荐(0) 编辑
摘要: 一:scrapy工作流程 scrapy单机架构: 单主机爬虫架构: 分布式爬虫架构: 这里重要的就是我的队列通过什么维护?这里一般我们通过Redis为维护,Redis,非关系型数据库,Key-Value形式存储,结构灵活。并且redis是内存中的数据结构存储系统,处理速度快,提供队列集合等多种存储结 阅读全文
posted @ 2018-04-12 16:58 寂静的天空 阅读(399) 评论(0) 推荐(0) 编辑
摘要: 一:安装 --》官方教程 二:启动服务: 第三步:连接 客户端连接成功 第四步: 阅读全文
posted @ 2018-04-12 16:32 寂静的天空 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 打开软件和更新:如下图 选择一个自己喜欢的镜像。 然后执行 sudo apt-get update 更新源。 结束 1、原文件备份 sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak 2、编辑源列表文件 sudo vim /etc/apt/ 阅读全文
posted @ 2018-04-12 15:20 寂静的天空 阅读(5774) 评论(1) 推荐(1) 编辑
摘要: 1、前言 Redis是常用基于内存的Key-Value数据库,比Memcache更先进,支持多种数据结构,高效,快速。用Redis可以很轻松解决高并发的数据访问问题;做为时时监控信号处理也非常不错。 2、安装 安装完成后,Redis服务器会自动启动,我们检查Redis服务器程序 可以看到: 显示: 阅读全文
posted @ 2018-04-12 15:16 寂静的天空 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 一:爬取思路 首先我们应该找到一个账号,这个账号被关注的人和关注的人都相对比较多的,就是下图中金字塔顶端的人,然后通过爬取这个账号的信息后,再爬取他关注的人和被关注的人的账号信息,然后爬取被关注人的账号信息和被关注信息的关注列表,爬取这些用户的信息,通过这种递归的方式从而爬取整个知乎的所有的账户信息 阅读全文
posted @ 2018-04-12 13:25 寂静的天空 阅读(1102) 评论(0) 推荐(0) 编辑
个人感悟: 一个人最好的镜子就是自己,你眼中的你和别人眼中的你,不是一回事。有人夸你,别信;有人骂你,别听。一根稻草,扔街上就是垃圾;捆上白菜就是白菜价;捆上大闸蟹就是大闸蟹的价。 一个人,不狂是没有出息的,但一直狂,肯定是没有出息的。雨打残花风卷流云,剑影刀光闪过后,你满脸冷酷的站在珠峰顶端,傲视苍生无比英武,此时我问你:你怎么下去? 改变自己就是改变自己的心态,该沉的时候沉下去,该浮的时候浮上来;不争名夺利,不投机取巧,不尔虞我诈;少说、多听、多行动。人每所谓穷通寿夭为命所系,岂不知造物之报施,全视人之自取。 座佑铭:每一个不曾起舞的日子,都是对生命的辜负。