Redis(一)-- 基础
一、Redis 简介
Redis 是完全开源免费的,是一个高性能的key-value数据库。
Redis 与其他 key - value 缓存产品有以下三个特点:
Redis支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用。
Redis不仅仅支持简单的key-value类型的数据,同时还提供list,set,zset,hash等数据结构的存储。
Redis支持数据的备份,即master-slave模式的数据备份。
性能极高 – Redis能读的速度是110000次/s,写的速度是81000次/s。
二、Redis的安装
1.下载到/usr/java/redis:wget http://download.redis.io/releases/redis-3.2.4.tar.gz
2.解压:tar –-zxvf redis-stable.tar.gz 解压
3.make 编译
4.编译成功后,进入src文件夹,执行make install进行Redis安装:
make install --> /usr/local/bin目录下有:redis-server,redis-cli,redis-check-aof,redis-check-dump
5.redis-server -v 检查是否安装成功
6.修改redis.conf中的 daemonize 改为 yes(修改为以后台程序启动),pidfile 改为 /usr/java/redisFile/redis.pid,bind 改为 IP地址,port 改为 6379,logfile 改为 /usr/java/redis/redisFile/redis.log,loglevel 改为 debug
7.启动:redis-server redis.conf
8.客户端连接:redis-cli -h IP -p PORT
三、redis配置文件
1. Redis默认不是以守护进程的方式运行,可以通过该配置项修改,使用yes启用守护进程
daemonize yes
2. 当Redis以守护进程方式运行时,Redis默认会把pid写入/var/run/redis.pid文件,可以通过pidfile指定
pidfile /var/run/redis.pid
3. 指定Redis监听端口,默认端口为6379,作者在自己的一篇博文中解释了为什么选用6379作为默认端口,因为6379在手机按键上MERZ对应的号码,而MERZ取自意大利歌女Alessia Merz的名字
port 6379
4. 绑定的主机地址
bind 127.0.0.1 这个Ip要设置成你服务器的Ip
5.当 客户端闲置多长时间后关闭连接,如果指定为0,表示关闭该功能
timeout 300
6. 指定日志记录级别,Redis总共支持四个级别:debug、verbose、notice、warning,默认为verbose
loglevel verbose
7. 日志记录方式,默认为标准输出,如果配置Redis为守护进程方式运行,而这里又配置为日志记录方式为标准输出,则日志将会发送给/dev/null
logfile stdout
8. 设置数据库的数量,默认数据库为0,可以使用SELECT <dbid>命令在连接上指定数据库id
databases 16
9. 指定在多长时间内,有多少次更新操作,就将数据同步到数据文件,可以多个条件配合
save <seconds> <changes>
Redis默认配置文件中提供了三个条件:
save 900 1
save 300 10
save 60 10000
分别表示900秒(15分钟)内有1个更改,300秒(5分钟)内有10个更改以及60秒内有10000个更改。
10. 指定存储至本地数据库时是否压缩数据,默认为yes,Redis采用LZF压缩,如果为了节省CPU时间,可以关闭该选项,但会导致数据库文件变的巨大
rdbcompression yes
11. 指定本地数据库文件名,默认值为dump.rdb
dbfilename dump.rdb
12. 指定本地数据库存放目录
dir ./
13. 设置当本机为slav服务时,设置master服务的IP地址及端口,在Redis启动时,它会自动从master进行数据同步
slaveof <masterip> <masterport>
14. 当master服务设置了密码保护时,slav服务连接master的密码
masterauth <master-password>
15. 设置Redis连接密码,如果配置了连接密码,客户端在连接Redis时需要通过AUTH <password>命令提供密码,默认关闭
requirepass foobared
16. 设置同一时间最大客户端连接数,默认无限制,Redis可以同时打开的客户端连接数为Redis进程可以打开的最大文件描述符数,如果设置 maxclients 0,表示不作限制。当客户端连接数到达限制时,Redis会关闭新的连接并向客户端返回max number of clients reached错误信息
maxclients 128
17. 指定Redis最大内存限制,Redis在启动时会把数据加载到内存中,达到最大内存后,Redis会先尝试清除已到期或即将到期的Key,当此方法处理 后,仍然到达最大内存设置,将无法再进行写入操作,但仍然可以进行读取操作。Redis新的vm机制,会把Key存放内存,Value会存放在swap区
maxmemory <bytes>
18. 指定是否在每次更新操作后进行日志记录,Redis在默认情况下是异步的把数据写入磁盘,如果不开启,可能会在断电时导致一段时间内的数据丢失。因为 redis本身同步数据文件是按上面save条件来同步的,所以有的数据会在一段时间内只存在于内存中。默认为no
appendonly no
19. 指定更新日志文件名,默认为appendonly.aof
appendfilename appendonly.aof
20. 指定更新日志条件,共有3个可选值:
no:表示等操作系统进行数据缓存同步到磁盘(快)
always:表示每次更新操作后手动调用fsync()将数据写到磁盘(慢,安全)
everysec:表示每秒同步一次(折衷,默认值)
appendfsync everysec
21. 指定是否启用虚拟内存机制,默认值为no,简单的介绍一下,VM机制将数据分页存放,由Redis将访问量较少的页即冷数据swap到磁盘上,访问多的页面由磁盘自动换出到内存中(在后面的文章我会仔细分析Redis的VM机制)
vm-enabled no
22. 虚拟内存文件路径,默认值为/tmp/redis.swap,不可多个Redis实例共享
vm-swap-file /tmp/redis.swap
23. 将所有大于vm-max-memory的数据存入虚拟内存,无论vm-max-memory设置多小,所有索引数据都是内存存储的(Redis的索引数据 就是keys),也就是说,当vm-max-memory设置为0的时候,其实是所有value都存在于磁盘。默认值为0
vm-max-memory 0
24. Redis swap文件分成了很多的page,一个对象可以保存在多个page上面,但一个page上不能被多个对象共享,vm-page-size是要根据存储的 数据大小来设定的,作者建议如果存储很多小对象,page大小最好设置为32或者64bytes;如果存储很大大对象,则可以使用更大的page,如果不 确定,就使用默认值
vm-page-size 32
25. 设置swap文件中的page数量,由于页表(一种表示页面空闲或使用的bitmap)是在放在内存中的,,在磁盘上每8个pages将消耗1byte的内存。
vm-pages 134217728
26. 设置访问swap文件的线程数,最好不要超过机器的核数,如果设置为0,那么所有对swap文件的操作都是串行的,可能会造成比较长时间的延迟。默认值为4
vm-max-threads 4
27. 设置在向客户端应答时,是否把较小的包合并为一个包发送,默认为开启
glueoutputbuf yes
28. 指定在超过一定的数量或者最大的元素超过某一临界值时,采用一种特殊的哈希算法
hash-max-zipmap-entries 64
hash-max-zipmap-value 512
29. 指定是否激活重置哈希,默认为开启(后面在介绍Redis的哈希算法时具体介绍)
activerehashing yes
30. 指定包含其它的配置文件,可以在同一主机上多个Redis实例之间使用同一份配置文件,而同时各个实例又拥有自己的特定配置文件
include /path/to/local.conf
注意:protected-mode参数是为了禁止外网访问redis,如果需要外网访问,需要设置为 no
四、基本命令
1.返回redis的相关信息:info
2.清空所有数据库中的数据库:flushall
3.清空当前数据库: flushdb
4.切换数据库:select 0~15(默认配置16个数据库)
对String数据类型而言
1.添加String数据:set name xbq
2.取出String数据:get name
3.判断key为name的键 是否存在:exists name,返回0则没有
4.重命名key:rename name name1(将name重命名为name1)
5.查看key为name1的数据类型:type name1
6.在指定key的value后拼接指定数据:append name1 666(在name1对应的value后拼接666)
7.获取key对应的value的长度:strlen name1
8.删除指定的key:del name1
9.查看指定数据库的全部key:keys *
10.查看当前数据库的key的数量:dbsize
对list数据类型而言
1.添加数据(插入顺序是从尾部向头部):lpush mykey a b c d
2.查询全部数据:lrange mykey 0 -1
3.查询第一个到第三个数据:lrange mykey 0 2
4.查询索引为2(第三个)的数据:lindex mykey 2
5.查看链表mykey中的元素个数:llen mykey
6.取出链表的位于头部的数据:lpop mykey(取出之后链表中 就不存在此元素了)
7.删除两个等于a的元素:lrem mykey 2 a
8.将索引值为1的元素改为xbq:lset mykey 1 xbq
9.查询是否设置成功(在8的基础上):lindex mykey 1
10.删除指定链表:del mykey
11.添加数据:lpush mykey1 a b c d e f
12.获取索引值1到3之间的元素:ltrim mykey1 1 3
13.在元素d前面插入xbq:linsert mykey1 before d xbq
14.在元素c后面插入fy:linsert mykey1 after c fy
15.在链表mykey2中添加元素(插入顺序是从头部向尾部):rpush mykey2 a b c d e
16.取出链表mykey2中的尾部元素:rpop mykey2 ,即e
17.在链表mykey1中取出位于尾部的元素 放到链表mykey2的头部位置:rpoplpush mykey2 mykey3(重要)
对hash数据类型而言
1.添加数据:hset myhash name xbq
2.查询数据:hget myhash name
3.获取myhash键的字段数量:hlen myhash
4.判断myhash键中是否存在字段名为name的字段:hexists myhash name
5.删除该键:del myhash
6.添加数据,一次性添加多个字段:hmset myhash name xbq age 20 address shenzhen
7.查询数据,可以查询多个字段:hmget myhash name age
8.查询指定键中的所有字段和值,逐对出现:hgetall myhash
9.查询指定键中的所有的字段:hkeys myhash
10.查询指定键中的所有值:hvals myhash
对set数据类型而言
1.添加数据:sadd myset a b c d e
2.查询数据,结果是无序的,并不是插入的顺序:smembers myset
3.判断b是否在集合中存在:sismember myset b
4.查询集合中的数量:scard myset
5.随机查询集合中的元素:srandmember myset [count]
6.取出集合尾部的元素:spop myset
7.取出集合myset中的元素 放到集合myset1中:smove myset myset1 a
8.清空该数据库:flushdb
9.数据准备:
sadd myset a b c d
sadd myset2 c
sadd myset3 a c e
10.myset和myset2相比,a、b和d三个成员是两者之间的差异成员。再用这个结果继续和myset3进行差异比较,b和d是myset3不存在的成员: sdiff myset myset2 myset3
11.将3个集合的差异成员存在在diffkey关联的Set中,并返回插入的成员数量:sdiffstore mysetdiff myset myset2 myset3
12.取出3个集合中的交集部分:sinter myset myset2 myset3
13.将3个集合中的交集成员存储到与interkey关联的Set中: sinterstore interkey myset myset2 myset3
14.取出3个集合中的并集部分:sunion myset myset2 myset3
15.将3个集合中成员的并集存储到unionkey关联的set中:sunionstore unionkey myset myset2 myset3
对zset数据类型而言
1.添加数据:zadd myzset 1 a 格式:zadd 集合名 序号 集合元素
zadd myzset 1 a
zadd myzset 3 b 2 c
2.查询集合中的元素:zrange myzset 0 -1 (这里是有序的,按序号的大小 排序的),查询结果为 a c b
3.查询集合中的元素和序号:myzset 0 -1 withscores
4.查询集合中的个数:zcard myzset
5.查询元素对应的下标(下标是从0开始的):zrank myzset b
6.查询下标1~2之间的元素个数:zcount myzset 1 2
7.查询元素对应的序号:zscore myzset a
8.将c元素的序号增加4:zincrby myzset 4 c
9.查询序号满足表达式1 < score <= 2的成员:zrangebyscore myzset 1 2
10.删除指定的一个元素或多个元素:zrem myzset a b
五、五种数据类型的应用场景
1.String
字符串类型是Redis中最为基础的数据存储类型,它在Redis中是二进制安全的,这便意味着该类型可以接受任何格式的数据,如JPEG图像数据或Json对象描述信息等。在Redis中字符串类型的Value最多可以容纳的数据长度是512M。
2.list
在Redis中,List类型是按照插入顺序排序的字符串链表。和数据结构中的普通链表一样,我们可以在其头部(left)和尾部(right)添加新的元素。在插入时,如果该键并不存在,Redis将为该键创建一个新的链表。与此相反,如果链表中所有的元素均被移除,那么该键也将 会被从数据库中删除。List中可以包含的最大元素数量是4294967295。
从元素插入和删除的效率视角来看,如果我们是在链表的两头插入或删除元素,这将会是非常高效的操作,即使链表中已经存储了百万条记录,该操作也可以在常量时间内完成。然而需要说明的是,如果元素插入或删除操作是作用于链表中间,那将会是非常低效的。相信 对于有良好数据结构基础的开发者而言,这一点并不难理解。
Redis链表经常会被用于消息队列的服务,以完成多程序之间的消息交换。假设一个应用程序正在执行LPUSH操作向链表中添加新的元素,我们通常将这样的程序称之为"生产者(Producer)",而另外一个应用程序正在执行RPOP操作从链表中取出元素,我们称这样的程序为"消费者(Consumer)"。如果此时,消费者程序在取出消息元素后立刻崩溃,由于该消息已经被取出且没有被正常处理,那么我们就可以认为该消息已经丢失,由此可能会导致业务数据丢失,或业务状态的不一致等现象的发生。然而通过使用RPOPLPUSH命令,消费者程序在从主消息队列中取出消息之后再将其插入到备份队列中,直到消费者程序完成正常的处理逻辑后再将该消息从备份队列中删除。同时我们还可以提供一个守护进程,当发现备份队列中的消息过期时,可以重新将其再放回到主消息队列中,以便其它的消费者程序继续处理。
3.hash
将Redis中的Hashes类型看成具有String Key和String Value的map容器。所以该类型非常适合于存储值对象的信息。如Username、Password和Age等。如果Hash中包含很少的字段,那么该类型的数据也将仅占用很少的磁盘空间。每一个Hash可以存储4294967295个键值对。
4.set
在Redis中,我们可以将Set类型看作为没有排序的字符集合,和List类型一样,我们也可以在该类型的数据值上执行添加、删除或判断某一元素是否存在等操作。需要说明的是,这些操作的时间复杂度为O(1),即常量时间内完成次操作。Set可包含的最大元素数量是4294967295。
和List类型不同的是,Set集合中不允许出现重复的元素,这一点和C++标准库中的set容器是完全相同的。换句话说,如果多次添加相同元素,Set中将仅保留该元素的一份拷贝。和List类型相比,Set类型在功能上还存在着一个非常重要的特性,即在服务器端完成多个Sets之间的聚合计算操作,如unions、intersections和differences。由于这些操作均在服务端完成,因此效率极高,而且也节省了大量的网络IO开销。
可以使用Redis的Set数据类型跟踪一些唯一性数据,比如访问某一博客的唯一IP地址信息。对于此场景,我们仅需在每次访问该博客时将访问者的IP存入Redis中,Set数据类型会自动保证IP地址的唯一性。
充分利用Set类型的服务端聚合操作方便、高效的特性,可以用于维护数据对象之间的关联关系。比如所有购买某一电子设备的客户ID被存储在一个指定的Set中,而购买另外一种电子产品的客户ID被存储在另外一个Set中,如果此时我们想获取有哪些客户同时购买了这两种商品时,Set的intersections命令就可以充分发挥它的方便和效率的优势了。
5.zset
Sorted-Sets和Sets类型极为相似,它们都是字符串的集合,都不允许重复的成员出现在一个Set中。它们之间的主要差别是Sorted-Sets中的每一个成员都会有一个分数(score)与之关联,Redis正是通过分数来为集合中的成员进行从小到大的排序。然而需要额外指出的是,尽管Sorted-Sets中的成员必须是唯一的,但是分数(score)却是可以重复的。
在Sorted-Set中添加、删除或更新一个成员都是非常快速的操作,其时间复杂度为集合中成员数量的对数。由于Sorted-Sets中的成员在集合中的位置是有序的,因此,即便是访问位于集合中部的成员也仍然是非常高效的。事实上,Redis所具有的这一特征在很多其它类型的数据库中是很难实现的,换句话说,在该点上要想达到和Redis同样的高效,在其它数据库中进行建模是非常困难的。
可以用于一个大型在线游戏的积分排行榜。每当玩家的分数发生变化时,可以执行ZADD命令更新玩家的分数,此后再通过ZRANGE命令获取积分TOP TEN的用户信息。当然我们也可以利用ZRANK命令通过username来获取玩家的排行信息。最后我们将组合使用ZRANGE和ZRANK命令快速的获取和某个玩家积分相近的其他用户的信息。
Sorted-Sets类型还可用于构建索引数据。