004-核心技术-netty概述、传统IO、Reactor线程模型
一、概述
1.1、原生NIO存在的问题
1)NIO的类库和API复杂,使用麻烦,需要熟练掌握Selector,ServerSocketChannel、SocketChannel、ByteBuffer等。
2)需要具备其他的额外技能,需要熟悉Java多线程编程,因为NIO涉及到Reactor模式,必须熟悉多线程和网络编程,才能写出高质量的NIO程序
3)开发工作量和难度比较大,如,客户端面临断连重连、网络闪断,半包读写、失败缓存、网络拥塞和异常流的处理等
4)JDK NIO的bug,如Epoll Bug,他会导致Selector空轮询,最终导致CPU100%,直到jdk1.7版本该问题仍存在,没有根本解决。
1.2、Netty介绍
1.2.1、官网介绍
官网地址:https://netty.io/
官网含义:Netty is an asynchronous event-driven network application framework for rapid development of maintainable high performance protocol servers & clients.
1)开源框架,异步的、基于事件驱动的网络应用程序框架,用以快速开发高性能、高可靠的网络IO程序。
2)简化现有NIO开发流程
3)使用广泛,如大数据、游戏、通信,如ElasticSearch、Dubbo等。
1.2.2、优点
1)对JDK自带的NIO进行了封装,解决上述bug
2)设计优雅:适用于各种传输类型统一API阻塞和非阻塞Socket;基于灵活且可扩展的事件模型,可以清晰地分离关注点;高度可定制的线程模型-单线程,一个或多个线程池。
3)适用方便,无其他依赖项,JDK5(3.x)或6(netty 4.x)
4)高性能、吞吐量更高;延迟更低、减少资源消耗;最小化不必要的内存复制
5)安全;完整的ssl\TLS和StartTLS支持
1.2.3、版本
netty3.X 比较旧;netty5.x废弃;netty4.x推荐适用,适用maven引入
<dependency> <groupId>io.netty</groupId> <artifactId>netty-all</artifactId> <version>4.1.65.Final</version> </dependency>
二、Netty线程模型
2.1、 线程模型介绍
不同线程模型,对程序的性能影响很大,目前从存在的线程模型有:传统阻塞IO模型和Reactor模式;
Reactor模式
根据Reactor的数量和处理资源池线程的数量不同,有3种典型的实现:单Reactor单线程、单Reactor多线程、主从Reactor多线程
Netty线程模式:主要基于主从Reactor多线程模型做了一定改进,其中主从Reactor多线程模型有多个Reactor。
参看书籍:Scalable IO in java
2.1.1、传统IO阻塞服务模型
1)工作原理图
2)模型特点
a、采用阻塞IO模式获取输入
b、每个连接都需要独立的线程完成数据的输入,业务处理、数据返回
3)问题分析
a、当并发数很大,就会创建大量的线程、占用很大系统资源
b、连接创建后,如果当前线程这哪是没有数据可读,该线程就会阻塞在read操作,造成线程资源浪费;
2.1.2、Reactor模式
Reactor常用叫法:反应器模式;2分发者模式(DIspatcher)3通知这模式(notifier)
a、针对传统IO服务模型的2个缺点,解决方案:
1)基于IO复用模型,多个连接共用一个阻塞对象,应用程序只需要在一个阻塞对象等待,无需阻塞等待所有连接。当某个连接有新的数据可以处理时,操作系统通知应用程序,线程从阻塞状态返回,开始进行业务处理
2)基于线程池服用线程资源,不必再为每个连接创建线程,将连接完成后的业务处理任务分配给线程进行处理,一个线程可以处理多个连接的业务。
b、设计思想:IO复用结合线程池
说明:Reactor模式,通过一个或多个输入同时传递给服务处理器的模式(基于事件驱动)
2)服务器端程序处理传入的多个请求,并将它们同步分派到相应的处理线程,因此Reactor模式也叫Dispatcher模式
3)Reactor模式号私用IO复用监听事件,收到事件后,分发给某个线程,这点就是网络服务器高并发处理关键。
c、核心组成
1)Reactor,在一个单独的线程中运行,负责监听和分发事件,分发给适当的处理程序来对IO事件作出反应。
2)Handlers,处理程序执行IO事件要完成的实际事件。Reactor通过调度适当的处理程序来相应IO事件,处理程序执行非阻塞操作。
d、Reactor优点
1)响应快,不必为单个同步时间所阻塞,虽然Reactor本身依然是同步的;2)可以最大程度的避免复杂的多线程及同步问题,并且避免了多线程/进程的切换开销
3)扩展性号,可以方便的通过增加Reactor实例个数来充分利用CPU资源;4)复用性好,Reactor模型本身与具体事件处理逻辑无关,具有很高的复用性
2.1.2.1、单Reactor单线程【不常用,原Redis使用】
上节的NIO原生API的群聊即是此种模式
方案说明:1)Select就是前面IO复用模型介绍的标准网络编程API,可以实现应用程序通过一个阻塞对象监听多路连接请求。
2)Reactor对象通过Select监控客户端请求事件,收到事件后通过DIspatch进行分发
3)如果是建立连接请求事件,则由Acceptor通过Accept处理连接请求,然后创建一个Handler对象处理连接完成后的后续业务处理
4)如果不是建立连接事件,则Reactor会分发调用连接对应的Handler来响应
5)Handler会完成Read→业务处理→Send的完整业务流程
优缺点:优点:1)模型简单,没有多线程,进程通信、竞争的问题,全部都在一个线程中完成
缺点1)性能问题,只有一个线程,无法完全发挥多核CPU的性能。Handler在处理某个连接上的业务时,整个进程无法处理其他连接事件,很容易导致性能瓶颈
缺点2)可靠性问题,线程意外终止,或者进入死循环,会导致整个系统通信模块不可用,不能接收和处理外部消息,造成节点故障。
使用场景:客户端的数量有限,业务处理非常快速,比如Redis在业务处理的时间复杂度O(1)的情况。
2.1.2.2、单Reactor多线程
工作原理图:
说明:1)Reactor对象通过Select监控客户端请求事件,收到事件后,通过dispatch进行分发
2)如果建立连接请求,则由Acceptor通过accept处理连接请求,然后创建一个Handler对象处理完连接后的各种事件
3)如果不是连接请求,则由reactor分发调用连接对应的handler来处理
4)handler只负责响应事件,不做具体的业务处理,通过read读取数据后,会分发给后面的worker线程池的某个线程处理业务
5)wocker线程池会分配独立线程完成真正的业务,并将结果返回给handler
6)handler收到相应后,通过send将结果返回给client
b、优缺点
优点:可以充分利用多核CPU的处理能力
缺点:多线程数据共享和访问比较复杂,reactor处理所有的事件的监听和响应,在单线程运行,在高并发场景容易出现性能瓶颈
2.1.2.3、主从Reactor多线程
针对单Reactor多线程模型中,在单线程运行,在高并发场景容易出现性能瓶颈,可以让Reactor在多线程中运行
工作原理图
优缺点:优点:父线程与子线程的数据交互简单职责明确,父线程只需要接收新链接,子线程完成后续的业务处理;
缺点:编程复杂度较高
应用:Nginx主从Reactor多进程模型,Memcached主从多线程模式,Netty主从多线程模式