为什么 Redis 单线程还那么快
前提:
CPU 在切换线程的时候,有一个上下文切换时间,而这个上下文切换时间是非常耗时的,eg: 一个CPU主频是 2.6GHz ,这就以为着每秒可以执行2.6*109个指令,每个指令时间就大概是0.38ns,而一次上下文切换耗时2000ms,这个时间内,CPU 什么都干不了,只能保存上下文的动作。
大概就这么几点:
1、完全基于内存,绝大部分请求是纯粹的内存操作,非常快速。数据存在内存中,类似于HashMap,HashMap的优势就是查找和操作的时间复杂度都是O(1);
2、数据结构简单,对数据操作也简单,Redis中的数据结构是专门进行设计的;
3、采用单线程,避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切换而消耗 CPU,不用去考虑各种锁的问题,不存在加锁释放锁操作,没有因为可能出现死锁而导致的性能消耗;
4、使用多路I/O复用模型,非阻塞IO;
多路 I/O 复用模型理解:
多路I/O复用模型是利用 select、poll、epoll 可以同时监察多个流的 I/O 事件的能力,在空闲的时候,会把当前线程阻塞掉,当有一个或多个流有 I/O 事件时,就从阻塞态中唤醒,于是程序就会轮询一遍所有的流(epoll 是只轮询那些真正发出了事件的流),并且只依次顺序的处理就绪的流,这种做法就避免了大量的无用操作。
这里“多路”指的是多个网络连接,“复用”指的是复用同一个线程。采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络 IO 的时间消耗),且 Redis 在内存中操作数据的速度非常快,也就是说内存内的操作不会成为影响Redis性能的瓶颈,主要由以上几点造就了 Redis 具有很高的吞吐量。
注:这里我们一直在强调的单线程,只是在处理我们的网络请求的时候只有一个线程来处理,一个正式的Redis Server运行的时候肯定是不止一个线程的,这里需要大家明确的注意一下!例如Redis进行持久化的时候会以子进程或者子线程的方式执行
重点解释下多路复用:
多路-指的是多个socket连接,复用-指的是复用一个线程。
目前,多路复用主要有三种技术:select,poll,epoll。它们出现的顺序是按时间先后的,越排后的技术改正了之前技术的缺点。epoll是最新的也是目前最好的多路复用技术。
举个例子:一个酒吧服务员,前面有很多醉汉,epoll这种方式相当于一个醉汉吼了一声要酒,服务员听见之后就去给他倒酒,而在这些醉汉没有要求的时候服务员可以玩玩手机干点别的。但是select和poll技术是这样的场景:服务员轮流着问各个醉汉要不要倒酒,没有空闲的时间。io多路复用的意思就是多个醉汉共用一个服务员。
-
select:
1.会修改传入的参数,对于多个调用的函数来说非常不友好;
2.要是sock(io流出现了数据),select只能轮询这去找数据,对于大量的sock来说开销很大;
3.不是线程安全的,很恐怖;
4.只能监视1024个连接; -
poll:
1.还不是线程安全的...
2.去掉了1024个连接的限制;
3.不修改传入的参数了; -
epoll:
1.线程安全了;
2.epoll不仅能告诉你sock有数据,还能告诉你哪个sock有数据,不用轮询了;
3.however,只支持linux系统;