Redis问题思考
1.redis快的原因
-
多线程技术能够帮助我们充分利用CPU的计算资源来并发的执行不同任务,从而提高效率。
-
多线程的本质是CPU模拟出来多个线程的情况,但模拟出来的情况有上下文切换的消耗,其中包括保存线程的执行上下文和加载线程的执行上下文, 但对于一个内存的系统来说,没有上下文切换的情况下就是效率最高的。
-
Redis 作为一个内存服务器,绝大数的操作都是纯内存的,而且处理速度非常快.单线程也可以并发的处理任务,比如redis的I/O多路复用机制并发处理来自客户端的多个连接。
IO多路复用:
IO多路复用是一种io模型,多路指多个TCP连接(即socket或者channel),复用指复用一个线程或进程处理上面所以的连接。IO多路复用可同时监听多个socket,当某个socket可操作的时候,它可以给你一个通知。这样当配合非阻塞的socket使用时,只有当系统通知我哪个描述符可操作了,才去执行操作,可以保证每次没次可以操作。实现io多路复用需要函数来支持,例如linux下的select/poll,这些函数都可以同时监视多个描述符的读写就绪状况,这样,多个描述符的I/O操作都能在一个线程内并发交替地顺序完成,这就叫I/O多路复用。
例子
模拟一个tcp服务器处理30个客户socket。
一个老师,让30个学生解答一道题目,然后检查学生做的是否正确,你有下面几个选择:
1.第一种选择:按顺序逐个检查,先检查A,然后是B,之后是C、D。。。这中间如果有一个学生卡主,全班都会被耽误。这种模式就好比,你用循环挨个处理socket,根本不具有并发能力。堵塞模型
2.第二种选择:你创建30个分身,每个分身检查一个学生的答案是否正确。这种类似于为每一个用户创建一个进程或者线程处理连接。
3.第三种选择,你站在讲台上等,谁解答完谁举手。这时C、D举手,表示他们解答问题完毕,你下去依次检查C、D的答案,然后继续回到讲台上等。此时E、A又举手,然后去处理E和A。。。这种就是IO复用模型,Linux下的select、poll和epoll的函数就是处理这些的。将用户socket对应的fd注册进epoll,然后epoll帮你监听哪些socket上有消息到达,这样就避免了大量的无用操作。此时的socket应该采用非阻塞模式。
这样,整个过程只在调用select、poll、epoll这些调用的时候才会阻塞,收发客户消息是不会阻塞的,整个进程或者线程就被充分利用起来,这就是事件驱动,所谓的reactor模式。
运用到多路复用的例子
netty
2.雪崩是如何产生的
雪崩的产生:redis发生错误,不能正常访问,所有的请求去访问数据库,导致数据库的访问量大增,造成数据库挂掉的场景。
雪崩的解决方案:
1.高可用
搭建集群,增加几台redis服务器,其中一台挂掉还有别的可以访问
2.限流降级
在缓存失效后,通过加锁或队列来控制度数据库写缓存的线程数量。某个key只允许一个线程查询数据和写缓存,其他队列等待
3.数据预热
在项目正式部署前,先把一些数据先预先访问缓存到redis。设置key的失效时间不要太集中,设置的均匀点,避免线程堵塞。
3.穿透的产生
穿透的产生:当用户查询数据发现redis中不存在 也就是缓存没有命中。然后去访问持久层数据库,发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中,于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透
穿透的解决方案:
1.缓存空对象
缓存中取不到且持久层也取不到的时候,可以将键值对的值设为null,失效时间设置短点(防止正常情况也无法使用)
4.redis的并发:
产生的场景:
正常redis不会存在并发问题,以为它是单线程的,在使用的时候,
多个连接操作同一个key的值时,执行结果和预期的可能会不一致,这就是并发影响的。
并发的解决方案
1使用redis自带的incr命令(不使用set)
2在代码中操作redis时,针对同一个key的资源,进行加锁 synchronized或lock