Python_scrapyRedis零散

1.

# Redis

1.解压,配环境变量

2.win上设置自启动

    redis-server --service-install D:\redis\redis.windows.conf --loglevel verbose

3.启动redis

    redis-server E:\redis\redis-latest\redis.windows.conf

4.进入数据库,另起一个cmd框

    redis-cli -h 127.0.0.1 -p 6379

5.在 redis.windows.conf 中解注 “requirepass foobared”   将foobared改为密码;注:不能有空格

6.重开始登陆 

    redis-cli -h 127.0.0.1 -p 6379 -a 123456
---

## 1.非关系型数据库 Nosql(not noly sql)不是典型数据库 / Key-Values存储系统

- momgoDB 的优势:支持多种查询和支持创建索引
- Redis 速度极快,价格高;持久化和热备时候消耗大量带宽和运力  → 5种数据类型的几种常用方法,默认不支持查询,可以在键上设置

注:memcached 是sql中继器,不算Nosql

redis的字符类型

1.string

2.hash

3.lsit

4.set

---
十大算法 快速排序、
多进程多线程

---
购物车 以前是session,现在是redis
功能:

    商品展示
    购物车操作
    添加删除商品
    结算
    ...

---
## scrapy

### 1.解释scrapy的工作流程

### 2.scrapy的优势

    scrapy自带多进程,能执行整站采集,自动调度器

### 3.多主机爬虫架构

    待整理:...
    一个起始spider(共享主队列)
    一个主机多个从机
    分布式进程

### 在scrapy中使用redis,,去重

    “指纹”:当前对象的唯一标示
    redis每次执行前检查指纹是否存在,再进行添加任务

### 分布式防止终端

### 如何实现架构?

    scrapy自带框架

## scrapy-redis 的分布式实现

    master  主机
    slave    副机
    可移植性好
    
## 

 

posted @ 2018-05-16 16:15  Leq123  阅读(240)  评论(0编辑  收藏  举报