redis应用

Redis简单概述:今天主要简单聊聊Redis在工作中的一些应用,有说的不对的地方勿拍砖啊。说到Redis,可能有不少朋友会说它就是一个缓存数据库,没错它确实主要是干缓存这件事,在我以前仅用过它的String或者再多一点Hash这两结构的时候,我也一度觉这么认为。后来因为工作需要,接触到了它其他的一些结构,List、Set等等以及底层一些实现,回过头来突然发现它完全就是迎合互联网市场的,这还只是应用层,在底层方面,比如IO模型、服务模型、数据结构,算法设计等等。保守点说,现在还有哪个互联网公司缓存这块没用Redis的?更甚至过分的说,有些业务模块直接用它来当数据库存储都有不少。这么牛逼的产品,到底是哪位大神写的?Redis之父(Salvatore Sanfilippo),就是这个意大利神人。
 
分布式锁:先简单讨论下为啥要有锁?服务端天生就是一个多线程环境(要不叫服务),这个特点跟CS客户端有本质区别,CS客户端如果你不主动开启work现场,它自始至终只有一个线程在跑,那就是UI线程(主线程)。说的有点跑题了啊,那么多线程环境有个特点,天生会导致资源不同步。在现实业务中,比如减库存操作,有3个客户下单同时读取了库存数据都是100,每人购买一件并且发生减库存操作,最终库存还是99,那么这就出现了BUG,可能这个例子有问题,因为有朋友要跟我抬杠了,redis本身命令操作就是单线程,6.0开始支持多线程,不要误解,它只是io多线程,命令执行还是单线程,而且默认是关闭的,我直接调用它的原子操作递减不就可以了吗?你就是一千的集群10万的并发,执行这个商品减一的命令它在redis这它还的串行,确实如此,不要杠,我只是想说分布式锁而已,如果要这样杠,数据库这样取数据它也是原子的操作,在默认级事务级别排他锁x锁本来就是独占锁确保了原子性。这还只是单机环境,如果是集群环境呢?肯定只会更复杂,我们这里不讨论单机环境,我相信现在没有人会做单机部署吧,即便就算是单机(最少要有高可用集群),我相信你也不用考虑并发问题,因为你压根就没有这样的需求。要解决这个问题并非只有分布式锁能处理,比如数据库层面也可以处理,乐观锁&悲观锁都是可以的,只是这样的话,我相信你业务系统的性能和存储系统抗不了几下。好了言归正传,多线程、多进程、多服务器,导致库存数据错误的根本问题在于并行,这是问题的本质,那么我们只要想办法把他们串行起来不就问题解决了么?如果串行,问题又来了,性能差,既然都上分布式了,肯定有高并发需求,那没办法,生产环境宁愿牺牲性能,也好过有致命BUG吧,性能问题可以再优化嘛。那么回到原来的问题,在分布式环境下,要想实现串行,只能借助三方共享服务实现了,在现阶段还是有不少产品服务供我们选择,比如Zookeeper、MQ、还有Redis等等。这里需要注意MQ是异步的方案,结合实际业务吧,可以做相应补偿机制,如京东下单,即便库存不足了,我还可以临近仓库调货。下面我们简单讨论下,用Redis来实现分布式锁,如果我们自己通过Setnx命令或者其他结构来实现一把生产环境能用的分布式锁,还是有点麻烦的,它的麻烦点主要有两个,Redis命令的原子性和锁赎命,主要是这个赎命的问题。有这么一个逻辑,客户端1设置的这把锁需要有超时时间,如果没有这个时间,客户端1挂了,这个KEY对应的锁也就一直挂在那,除非Redis内存不够用淘汰或者手动删除,如果设置时间,这个时间多长合适?10s、100s?这个固定不变的时间都不合适,比如客户端1因为网络资源处理了101s,这把锁被Redis服务端删除了,在并发情况下,其他线程或者进程获得了锁,数据也就可能会有问题了,所以我们看下Redisson开源框架是怎么处理的。看代码:
 
"if (redis.call('exists', KEYS[1]) == 0) then " +
"redis.call('hincrby', KEYS[1], ARGV[2], 1); " +
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return nil; " +
"end; " +
"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +
"redis.call('hincrby', KEYS[1], ARGV[2], 1); " +
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return nil; " +
"end; " +
"return redis.call('pttl', KEYS[1]);",
 
上面这段代码我是直接从Redisson源码里面copy出来的。Redisson框架是Java写的,目前好像只有JavaSDK,当然.NET客户端StackExchange.Redis LockTake好像也可以实现,具体没去看它的源码。这是一段加锁代码,这里大概解释一下,这是一段LUA脚本,Redis可以直接执行LUA脚本并且是原子操作,每个客户端都提供有这个API。以上代码的逻辑是,
1.先执行exists命令判断key是否存在(也就是是否存在锁资源),如果为true,则写入hash,key是之前传过来的资源标识符,field为线程id,这里设置了一个value为1,并且设置过期时间。
2.如果hash里面存在上面资源对应的这个数据(也就是自己的这把锁),则执行incrby操作+1,为啥+1?因为这是一把可重入锁,并且重新设置过期时间。
3.如果以上都不是,也就是这个资源有锁并且不是当前线程的资源(也就是有线程已经加锁,正在处理),则直接返回剩余过期时间。
4.以上都是原子操作。这么看来枷锁逻辑是没问题,下面我们看下正常情况下,解锁逻辑,也就是客户端处理完业务,自己解锁。看代码:
 
 1 f (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then " +
 2 "return nil;" +
 3 "end; " +
 4 "local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); " +
 5 "if (counter > 0) then " +
 6 "redis.call('pexpire', KEYS[1], ARGV[2]); " +
 7 "return 0; " +
 8 "else " +
 9 "redis.call('del', KEYS[1]); " +
10 "redis.call('publish', KEYS[2], ARGV[1]); " +
11 "return 1; " +
12 "end; " +
13 "return nil;",
 
同样是一段LUA脚本,看样子要实现Redis的高级功能,LUA脚本是必须的,下面简单说明下,这段正常释放锁的脚本逻辑。
1.这把锁不是当前线程的,无权删除,直接返回。
2.因为这是一把可重入锁,所以先做-1操作,再判断是否为0,如果不为0,重新设置过期时间,如果为0,删除这把锁,并且publish,因为在之前Trylock有订阅这个消息。到这里正常情况下,这个分布式锁逻辑是没有问题,如果非正常情况列?比如,线程业务操作时间超过了过期时间呢?我们继续看下代码:
 1 private void renewExpiration() {
 2 ExpirationEntry ee = EXPIRATION_RENEWAL_MAP.get(getEntryName());
 3 if (ee == null) {
 4 return;
 5 }
 6  
 7 Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() {
 8 @Override
 9 public void run(Timeout timeout) throws Exception {
10 ExpirationEntry ent = EXPIRATION_RENEWAL_MAP.get(getEntryName());
11 if (ent == null) {
12 return;
13 }
14  
15 Long threadId = ent.getFirstThreadId();
16 if (threadId == null) {
17 return;
18 }
19  
20 RFuture<Boolean> future = renewExpirationAsync(threadId);
21 future.onComplete((res, e) -> {
22 if (e != null) {
23 log.error("Can't update lock " + getRawName() + " expiration", e);
24 EXPIRATION_RENEWAL_MAP.remove(getEntryName());
25 return;
26 }
27  
28 if (res) {
29 // reschedule itself
30 renewExpiration();
31 }
32 });
33 }
34 }, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS);
35 ee.setTimeout(task);
36 }
37  
38 protected RFuture<Boolean> renewExpirationAsync(long threadId) {
39 return evalWriteAsync(getRawName(), LongCodec.INSTANCE, RedisCommands.EVAL_BOOLEAN,
40 "if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +
41 "redis.call('pexpire', KEYS[1], ARGV[1]); " +
42 "return 1; " +
43 "end; " +
44 "return 0;",
45 Collections.singletonList(getRawName()),
46 internalLockLeaseTime, getLockName(threadId));
47 }
 
上面是两个方法的代码,一个定时任务Java代码,一个就是锁赎命的脚本代码,定时任务隔多久执行一次呢?看这段代码/ 3, TimeUnit.MILLISECONDS,实际就是internalLockLeaseTime这个变量,该变量的值来自于private long lockWatchdogTimeout = 30 * 1000,也就是10s。最后还是简单说下,赎命的脚本逻辑,hexists命令判断锁资源是不是自己的,如果是重新设置过期时间30s。好了以上就是redis实现分布式锁的逻辑,是不是比较麻烦?以上方案是不是万无一失了?确实也差不多了,但是仔细考虑还是有点问题的,这就是高并发系统的复杂之处。生产环境Redis至少是高可用集群,由于Redis默认提供的是AP方案,如果需要开启CP方案需要修改配置文件,一般情况下用redis都是AP方案,这是分布式CAP理论,如果是AP,那么又有问题了,如果Master宕机了,Slave节点还没来得及同步数据,这时Slave节点做了Master,这时候锁资源丢失了,要解决这个问题还有种方案,Redis官方的红锁Redlock方案能解决这个问题,其实该方案的设计思路就CP原则,类似zookeeper的实现原理。
 
Redis和数据库双写一致性的问题:其实这也是一个比较麻烦的问题,以前浏览博客发现有朋友提出延迟双删的方案,并且还说是双保险的靠谱方案,这里我想说,老大一个BUG,逻辑都没通,还阻塞延迟500毫秒,居然还有很多人采纳,你知道500毫秒对于服务端而言能处理多少请求?说实话写了这么多年服务端代码,还从来没写过thread.sleep这样的代码,太吓人了。我们简单看下问题的本质,其实还是上面那个问题,高并发情况下,数据同步问题,又是锁?是的,分布式锁?差不多,只是这里叫读写锁,读写锁我相信大部分平台都有实现,.NET、Java等等,原理跟数据库Repeatable read或者Serializable级别的控制差不多,写锁是独占锁,读锁是共享锁。这里我们还是看下redisson框架的实现。看代码:
 
"local mode = redis.call('hget', KEYS[1], 'mode'); " +
"if (mode == false) then " +
"redis.call('hset', KEYS[1], 'mode', 'write'); " +
"redis.call('hset', KEYS[1], ARGV[2], 1); " +
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return nil; " +
"end; " +
"if (mode == 'write') then " +
"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +
"redis.call('hincrby', KEYS[1], ARGV[2], 1); " +
"local currentExpire = redis.call('pttl', KEYS[1]); " +
"redis.call('pexpire', KEYS[1], currentExpire + ARGV[1]); " +
"return nil; " +
"end; " +
"end;" +
"return redis.call('pttl', KEYS[1]);",
 
上面是获取写锁逻辑,代码就不详细解释了,还是基于Hash结构,只不过这里的读写锁是通过Mode字段实现,read表示读锁,write表示写锁,同样也是可重入锁。代码逻辑就到这吧。下面我们分析一下思路,如果现在有3个线程在操作key为a的值,1、3为读,2为写,123同样表示顺序,1在读取a时,获取了读锁,此时假如1号线程没有释放锁,2号写锁是加不了锁的,类似于数据库的s和ix、x锁不兼容,加入此时1号释放锁,2号拿到锁并且为写锁,3号是读取不了数据的,因为2号是独占锁,这也就就完美解决了一致性问题,但是性能确实不乐观,当然如果写少的情况下还是可以的。除了上面这种方案,还有一种同步的方案,通过三方服务,获取数据库操作日志,同步到Redis,比如阿里的开源框架canal,个人觉得一致性还是有蛮大问题,因为它们终究还是在网络环境里面,网络是个最不靠谱的东西。最后再说一种比较简单的方案,Cache Aside Pattern方案。当然这种方案也有个缺点,就是删除缓存失败,导致数据不同步,所以建议设置一个过期时间,时间多长?看业务吧,既然采用这种方案,肯定是在一定程度上能接受脏数据的。好了双写一致性就到这吧,最后简单聊下,redis的数据结构的应用。
 
List vs zset:
list:redis里面的list底层实现其实就是一个双向链表,当然它的实现还是很优雅的,如果列表里面的元素长度和数量较少的时候,它实际是采用ziplist,为啥作者要这么做呢?我们知道链表这个结构的存储在物理上是不一定连续的,而且很多时候指针数据空间比数据空间大,而ziplist可以解决这个问题。ziplist有个特点内存连续,说到内存连续1.查询性能肯定杠杠的,因为可以索引啊,2.一块连续的空间利用率更高了,但是它也有很大的缺点,跟我们数组一样,插入和删除的抖三抖,性能差。那如果碰到元素长度长和数据量大的时候,redis底层会直接转换双向链表,在3.2版本以后list底层又多了一种实现,quickList。quickList其实就是双向链表和ziplist的结合体,这个怎么理解?其实就是链表里面的每个节点用ziplist存储。下面说下应用,具体命令就不写了。
最新动态,比如某个业务,需要获取跟它相关的一些最新动态,我们就可以基于list实现,微信朋友圈,当我打开朋友圈它是不是给我推了朋友最新发的一些动态,当然我不知道微信是不是这个做的。再有栈、队列我们也可以轻松通过它来实现,可能list的应用场景有很多,我这里只是简单说几种。可能有朋友会说,那它为啥可以轻松应付这些场景,这主要还是得益于链表结构和作者的算法设计。redis里面的list可以左右push,可以区间取值,可以索引取值等等。下面说下zset。
zset有序集合:集合顾名思义就是无序,互异性就是不重复,那么它的底层实现是什么样的?ziplist和skiplist加字典,ziplist我们大概知道了,skiplist是啥?其实就是跳表,有点类似B+树,我们知道B+树是大部分关系数据库的索引结构,包括mysql、mssql等等。当然肯定是没有B+树复杂,B+树的节点分裂能让你怀疑人生。继续看下跳表,为啥redis的zset会有跳表实现,首先我们的看下跳表这个数据结构,索引+单链表。明白了吧,相对于增删改查比较平衡的一种数据结构,唯一的缺点空间稍大,因为需要构建索引层。索引层级的构建一般是通过随机数决定,跳表的简单介绍就到这吧。一个小问题,为啥不考虑平衡二叉树或者红黑树?查询性能几乎差不多吧,logn级别,增删改操作比起红黑树的rebalance操作要简单的多,红黑的左右护法左右旋尤其右旋,还是比较麻烦的,最后跳表还有链表结构的加持。下面简单说下应用场景吧,我们经常看到百度旁边的搜索排行榜,估计就是zset实现的,通过score分值,可以轻松实现。最后说下bitmap这个结构。
 
Bitmap:bitmap顾名思义就是位映射,不知道这么描述对不?那么它的底层原理是啥?其实就是通过bit结合offset来映射对应的真实数据,而且redis里面的bitmap还支持位运算,那么它的应用场景在哪?海量数据统计,布隆过滤器等等。有这么一个需求,假如我有一个大型系统,有上亿的用户,现在老板需要统计两个月的活跃用户数,怎么办?懵逼了吗?呵呵,假如引入reids的bitmap结构,我只需要bittop按位或这两个月的key,得到新的map,再用bitcount统计,就能帮我们完成这个统计,当然这个统计应该是比较消耗资源,所以生产环境个人建议,类似这种操作的db可以架设单独的实例。
 
 
 
 
 
 
 
 
posted @ 2021-05-04 02:59  小菜 。  阅读(318)  评论(0编辑  收藏  举报