NoSQL之Redis学习笔记

一、NoSQL与Redis

1、什么是NoSQL?

NoSQL=Not Only SQL ,泛指非关系型数据库。随着互联网的兴起,传统的关系型数据库已经暴露了很多问题,NoSQL数据库的产生就是为了解决超大规模数据带来的应用难题。

2、NoSQL有哪些优势

1>. 易扩展

NoSQL数据库种类繁多,但都有一个共同特点就是去掉了关系型数据库的关系型特性。数据之间无关系,这样就非常容易扩展。也无形之间,在架构的层面上带来了可扩展能力。

2>.高性能

NoSQL数据库都具有非常高的读写性能,尤其在大数据量下,同样表现优秀。这得益于它的无关系性,数据库结构简单。一般MySQL使用Query Cache,每次表的更新Cache就失败,是一种大粒度的Cache,性能不高,而NoSQL是记录级的,是一种细粒度的Cache。

3、NoSQL数据库的四大分类

  • KV键值  memcache redis
  • 文档型数据库  mongoDB
  • 列式存储    HBase
  • 图关系数据库    Neo4J

4、分布式存储系统的CAP原则

C:Consistency  强一致性

A:Availability  高可用性

P:Partition tolerance 分区容错性

CAP理论是指在分布式存储系统中,最多只能实现上面两点,而由于当前的网络问题肯定会出现延迟丢包等问题,所以分区容错性是必须要保证的,我们只能在一致性和可用性之间进行权衡,没有NoSQL系统能同时保证这三点。

5、什么是Redis

Redis即 Remote Dictionary Server(远程字典服务器),是一个开源的高性能Key/Value式分布式内存数据库,是当前最热门的NoSQL数据库之一。

Redis支持数据的持久化,可将内存数据保存到磁盘中,重启时可再次加载

Redis不仅仅支持简单的Key-Value类型的数据,同时还支持list,set,zset,hash等数据类型

Redis支持主从模式的数据备份

6、如何安装?

1>下载 wget http://download.redis.io/releases/redis-5.0.3.tar.gz

2>解压 tar zxvf redis-5.0.3.tar.gz

3>make & make install

4>启动 ./redis-server [redis.conf路径]

5>关闭 ./redis-cli shutdown

7、使用前需要了解的基础知识

  • 默认16个数据库,下标从零开始,默认使用零号库,select命令切换数据库
  • dbsize 查看当前数据库key的数量
  • flushdb 清空当前库
  • flushall 清空所有库
  • 默认端口6379

二、Redis的数据类型 

Redis命令参考  http://redisdoc.com/

0、Key(键)

1、String(字符串)

string是redis最基本的类型,一个key对应一个value。string类型是二进制安全的,可以包含任何数据如jpg图片或序列化对象。一个redis字符串的value最大512M

2、List(列表)

list是简单的字符串列表,底层采用链表实现,可以添加一个元素到列表的头部或者尾部。

3、Set(集合)

Set是string类型的无序集合,它是通过HashTable来实现的。

4、Zset(有序集合)

Zset每个元素都会关联一个double类型的分数,通过分数进行从小到大的排序,zset成员是唯一的但是分数可以重复。

5、Hash(哈希)

 Hash是一个键值对集合,是一个string类型的filed和value的映射表,hash特别适合存储对象。

三、解析配置文件 redis.conf

 

1. Redis默认不是以守护进程的方式运行,可以通过该配置项修改,使用yes启用守护进程
daemonize no
2. 当Redis以守护进程方式运行时,Redis默认会把pid写入/var/run/redis.pid文件,可以通过pidfile指定
pidfile /var/run/redis.pid
3. 指定Redis监听端口,默认端口为6379,作者在自己的一篇博文中解释了为什么选用6379作为默认端口,因为6379在手机按键上MERZ对应的号码,而MERZ取自意大利歌女Alessia Merz的名字
port 6379
4. 绑定的主机地址
bind 127.0.0.1
5.当 客户端闲置多长时间后关闭连接,如果指定为0,表示关闭该功能
timeout 300
6. 指定日志记录级别,Redis总共支持四个级别:debug、verbose、notice、warning,默认为verbose
loglevel verbose
7. 日志记录方式,默认为标准输出,如果配置Redis为守护进程方式运行,而这里又配置为日志记录方式为标准输出,则日志将会发送给/dev/null
logfile stdout
8. 设置数据库的数量,默认数据库为0,可以使用SELECT <dbid>命令在连接上指定数据库id
databases 16
9. 指定在多长时间内,有多少次更新操作,就将数据同步到数据文件,可以多个条件配合
save <seconds> <changes>
Redis默认配置文件中提供了三个条件:
save 900 1
save 300 10
save 60 10000
分别表示900秒(15分钟)内有1个更改,300秒(5分钟)内有10个更改以及60秒内有10000个更改。

10. 指定存储至本地数据库时是否压缩数据,默认为yes,Redis采用LZF压缩,如果为了节省CPU时间,可以关闭该选项,但会导致数据库文件变的巨大
rdbcompression yes
11. 指定本地数据库文件名,默认值为dump.rdb
dbfilename dump.rdb
12. 指定本地数据库存放目录
dir ./
13. 设置当本机为slav服务时,设置master服务的IP地址及端口,在Redis启动时,它会自动从master进行数据同步
slaveof <masterip> <masterport>
14. 当master服务设置了密码保护时,slav服务连接master的密码
masterauth <master-password>
15. 设置Redis连接密码,如果配置了连接密码,客户端在连接Redis时需要通过AUTH <password>命令提供密码,默认关闭
requirepass foobared
16. 设置同一时间最大客户端连接数,默认无限制,Redis可以同时打开的客户端连接数为Redis进程可以打开的最大文件描述符数,如果设置 maxclients 0,表示不作限制。当客户端连接数到达限制时,Redis会关闭新的连接并向客户端返回max number of clients reached错误信息
maxclients 128
17. 指定Redis最大内存限制,Redis在启动时会把数据加载到内存中,达到最大内存后,Redis会先尝试清除已到期或即将到期的Key,当此方法处理 后,仍然到达最大内存设置,将无法再进行写入操作,但仍然可以进行读取操作。Redis新的vm机制,会把Key存放内存,Value会存放在swap区
maxmemory <bytes>
18. 指定是否在每次更新操作后进行日志记录,Redis在默认情况下是异步的把数据写入磁盘,如果不开启,可能会在断电时导致一段时间内的数据丢失。因为 redis本身同步数据文件是按上面save条件来同步的,所以有的数据会在一段时间内只存在于内存中。默认为no
appendonly no 
19. 指定更新日志文件名,默认为appendonly.aof
appendfilename appendonly.aof
20. 指定更新日志条件,共有3个可选值:
no:表示等操作系统进行数据缓存同步到磁盘(快)
always:表示每次更新操作后手动调用fsync()将数据写到磁盘(慢,安全)
everysec:表示每秒同步一次(折衷,默认值)
appendfsync everysec

21. 指定是否启用虚拟内存机制,默认值为no,简单的介绍一下,VM机制将数据分页存放,由Redis将访问量较少的页即冷数据swap到磁盘上,访问多的页面由磁盘自动换出到内存中(在后面的文章我会仔细分析Redis的VM机制)
vm-enabled no
22. 虚拟内存文件路径,默认值为/tmp/redis.swap,不可多个Redis实例共享
vm-swap-file /tmp/redis.swap
23. 将所有大于vm-max-memory的数据存入虚拟内存,无论vm-max-memory设置多小,所有索引数据都是内存存储的(Redis的索引数据 就是keys),也就是说,当vm-max-memory设置为0的时候,其实是所有value都存在于磁盘。默认值为0
vm-max-memory 0
24. Redis swap文件分成了很多的page,一个对象可以保存在多个page上面,但一个page上不能被多个对象共享,vm-page-size是要根据存储的 数据大小来设定的,作者建议如果存储很多小对象,page大小最好设置为32或者64bytes;如果存储很大大对象,则可以使用更大的page,如果不 确定,就使用默认值
vm-page-size 32
25. 设置swap文件中的page数量,由于页表(一种表示页面空闲或使用的bitmap)是在放在内存中的,,在磁盘上每8个pages将消耗1byte的内存。
vm-pages 134217728
26. 设置访问swap文件的线程数,最好不要超过机器的核数,如果设置为0,那么所有对swap文件的操作都是串行的,可能会造成比较长时间的延迟。默认值为4
vm-max-threads 4
27. 设置在向客户端应答时,是否把较小的包合并为一个包发送,默认为开启
glueoutputbuf yes
28. 指定在超过一定的数量或者最大的元素超过某一临界值时,采用一种特殊的哈希算法
hash-max-zipmap-entries 64
hash-max-zipmap-value 512
29. 指定是否激活重置哈希,默认为开启(后面在介绍Redis的哈希算法时具体介绍)
activerehashing yes
30. 指定包含其它的配置文件,可以在同一主机上多个Redis实例之间使用同一份配置文件,而同时各个实例又拥有自己的特定配置文件
include /path/to/local.conf

四、Redis的持久化

1.RDB

  在指定的时间间隔内将内存中的数据集快照写入磁盘,恢复时直接将快照文件读到内存中。Redis会通过Fork复制一个与当前进程一样的进程。新进程的所有数据都和原进程一样,并作为原进程的子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程结束了,再用这个临时文件替换上次持久化的文件。整个过程中主进程是不进行任何IO操作的,这就确保了极高的性能。如果要进行大规模的数据恢复,且对数据恢复的完成性不是很敏感,那RDB方式比AOF方式更加的高效。RDB的缺点就是最后一次持久化后的数据可能丢失。

1>RDB的配置

  save <seconds> <changes>

  给定时间范围内发生给定次数的写操作将会出发RDB,示例

  #save 900 1
  #save 300 10
  #save 60 10000

  stop-writes-on-bgsave-error yes 后台备份出错就停止redis写操作,如果配置成no,表示你不在乎数据不一致或者有其他的手段发现和控制

  rdbcompression yes  对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果是的话,redis会采用LZF算法进行压缩。如果你不想消耗CPU来进行压缩的话,可以设置为关闭此功能

   rdbchecksum yes 在存储快照后,还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能

  dbfilename 文件名称

  dir 工作目录

2>如何触发RDB

  • 配置文件中默认的快照配置
  • save/bgsave命令 save时全部阻塞,bgsave通过lastsave命令获取最后一次成功执行快照的时间
  • 执行flushall命令  dump文件里面是空的,无意义

RDB的缺点 

  1.Fork时内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑

  2.redis意外down机,最后一次备份之后的数据将会丢失

2.AOF

  以日志的形式来记录每个操作,读操作不记录,redis启动之初会读取这个文件重新构建数据。

1>AOF的配置

  appendonly no  aof开关

  appendfilename 文件名称

  appendfsync 

    always:同步持久化 每次发生数据变更会被立即记录到磁盘  性能较差但数据完整性比较好

    everysec:出厂默认推荐,异步操作,每秒记录   如果一秒内宕机,有数据丢失

    no : ...

  no-appendfsync-on-rewrite  

  auto-aof-rewrite-min-size 64m 最小触发的文件大小

  auto-aof-rewrite-percentage   100  文件大小翻倍时触发

2>AOF的恢复

  redis-check-aof --fix  恢复写坏的AOF

3>Rewrite

  AOF文件持续增长超过所设定的阈值时,会fork出一条新进程来将文件重写,只保留可恢复数据的最小指令集,可使用命令bgrewriteaof手动触发。

  重写AOF文件的操作,并没有读取旧的AOF,而是和快照相似,将整个内存中的数据库内容用命令的方式重写了一个新的AOF文件。

AOF的缺点

  相同数据集的数据而言aof文件要远大于rdb,恢复速度慢于rdb,aof运行效率要慢于rdb

 

五、Redis的事务

  可以一次执行多个命令,本质是一组命令的集合。一个事务中的所有命令都会序列化,按顺序地串行化执行而不会被其它命令插入

1.常用命令

2.使用方式

  开启:以MULTI开始一个事务

  入队:将多个命令入队到事务中,接到这些命令并不会立即执行,而是放到等待执行的事务队列里面

  执行:由EXEC命令触发事务

3.redis事务的特性

  单独的隔离操作:事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中,不会被其他客户端发送来的命令请求所打断。

  没有隔离级别的概念:队列中的命令没有提交之前都不会实际的被执行,因为事务提交前任何指令都不会被实际执行

  不保证原子性:redis同一个事务中如果有一条命令执行失败,其后的命令仍然会被执行,没有回滚

六、Redis的发布订阅

是进程间的一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息。

可以一次性订阅多个,SUBSCRIBE c1 c2 c3   通配符*, PSUBSCRIBE new*

消息发布,PUBLISH c2 hello-redis

七、Redis主从复制

1.如何配置

从库配置:slaveof 主库IP 主库端口   每次与master断开之后,都需要重新连接,除非你配置进redis.conf文件

2.配置方式

  1>一主二仆 

  一个Master两个Slave

  2>薪火相传 

  上一个Slave可以是下一个slave的Master,Slave同样可以接收其他slaves的连接和同步请求,那么该slave作为了链条中下一个的master,可以有效减轻master的写压力

3.反客为主

  1>手动执行 slaveof no one 使当前数据库停止与其他数据库的同步,转成主数据库

  2>哨兵模式(sentinel)

  配置sentinel.conf     sentinel monitor 被监控数据库名字(自己起名字) 127.0.0.1 6379 1

  启动哨兵   redis-sentinel sentinel.conf

posted @ 2019-02-23 22:21  量化未来  阅读(399)  评论(0编辑  收藏  举报