2018 年 4月 12 日随笔档案 - 寂静的天空

2018年4月12日

摘要： scrapy部署神器-scrapyd --》GitHub地址 --》官方文档一：安装scrapyd 安装：pip3 install scrapyd 这里我在另外一台ubuntu linux虚拟机中同样安装scrapy以及scrapyd等包，保证所要运行的爬虫需要的包都完成安装. 在这里有个小问题需阅读全文

posted @ 2018-04-12 18:27 寂静的天空阅读(452) 评论(0) 推荐(0) 编辑

爬虫（十七）：scrapy分布式原理

摘要：一：scrapy工作流程 scrapy单机架构：单主机爬虫架构：分布式爬虫架构：这里重要的就是我的队列通过什么维护？这里一般我们通过Redis为维护，Redis，非关系型数据库，Key-Value形式存储，结构灵活。并且redis是内存中的数据结构存储系统，处理速度快，提供队列集合等多种存储结阅读全文

posted @ 2018-04-12 16:58 寂静的天空阅读(399) 评论(0) 推荐(0) 编辑

Ubuntu安装配置mongodb

摘要：一：安装 --》官方教程二：启动服务：第三步：连接客户端连接成功第四步：阅读全文

posted @ 2018-04-12 16:32 寂静的天空阅读(251) 评论(0) 推荐(0) 编辑

修改Ubuntu国内镜像

摘要：打开软件和更新：如下图选择一个自己喜欢的镜像。然后执行 sudo apt-get update 更新源。结束 1、原文件备份 sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak 2、编辑源列表文件 sudo vim /etc/apt/ 阅读全文

posted @ 2018-04-12 15:20 寂静的天空阅读(5774) 评论(1) 推荐(1) 编辑

redis安装和配置

摘要： 1、前言 Redis是常用基于内存的Key-Value数据库，比Memcache更先进，支持多种数据结构，高效，快速。用Redis可以很轻松解决高并发的数据访问问题；做为时时监控信号处理也非常不错。 2、安装安装完成后，Redis服务器会自动启动，我们检查Redis服务器程序可以看到: 显示: 阅读全文

posted @ 2018-04-12 15:16 寂静的天空阅读(247) 评论(0) 推荐(0) 编辑

爬虫（十六）：scrapy爬取知乎用户信息

摘要：一：爬取思路首先我们应该找到一个账号，这个账号被关注的人和关注的人都相对比较多的，就是下图中金字塔顶端的人，然后通过爬取这个账号的信息后，再爬取他关注的人和被关注的人的账号信息，然后爬取被关注人的账号信息和被关注信息的关注列表，爬取这些用户的信息，通过这种递归的方式从而爬取整个知乎的所有的账户信息阅读全文

posted @ 2018-04-12 13:25 寂静的天空阅读(1102) 评论(0) 推荐(0) 编辑

Felix Wang

Do the right things! Talk is cheap,Show me the code!

公告