随笔分类

随笔档案

1. Re:PKCS 15 个标准
mark
--虎豹骑
2. Re:Docker 启动镜像
我在： 2022年 1月 21日 21:43:59 看过本篇博客！
--努力变胖-HWP
3. Re:Socket通讯-Netty框架实现Java通讯
EchoServerHandler 的channelRead方法应该是读取客户端发过来的数据吧？
--果实1024
4. Re:spring boot 代理（not eligible for auto-proxying）
厉害了。
--xixilink
5. Re:SpringBoot整合Swagger2
大哥，访问地址出来的页面没有usercontroller下面的那一块
--好想大声说爱你
6. Re:Json Web Token JJWT
讲得真好!
--我是大炮
7. Re:SpringBoot 配置文件详解
大佬，多环境配置失效怎么解决，就是项目启动时，只会加载dev，设置为test，并没有生效
--燕子不会飞
8. Re:https 证书传递、验证和数据加密、解密过程解析
https用到的加密秘钥应该是三个随机数（1/2/3步都有随机数产生，客户端、服务端、客户端三个随机数）组合起来产生的秘钥吧，不是单独客户端产生的随机数
--凤雏小呆
9. Re:SpringBoot整合Swagger2
@ 沿鹏不用是自带的...
--Since-23
10. Re:OKHttp使用详解
同学，可以辅导我完成OKHTTP吗？我给你付报酬，遇到个问题无法解决！
--八大处
11. Re:SpringBoot整合Swagger2
大佬，swagger-ui.html文件还要放在springboot项目里面吗
--沿鹏
12. Re:SpringBoot整合Swagger2
我现在就在用丝袜哥.非常好用,值得推荐.不过2.8的版本反而不如1.X的好用
--可爱的小果果
13. Re:数字证书原理二
如果您把这节的内容看了几遍还没有搞懂证书的工作原理，您可以留言指出我没有说清楚的内容，我好方便进行修正。
真的越是大佬越谦虚
--20189312任方园
14. Re:SpringBoot 配置文件详解
@ 蓝_我的爱人模板配置中有...
--jtlgb
15. Re:SpringBoot 配置文件详解
大佬，能不能把你的博客园模板贡献出来嘛，我很喜欢你这个风格，是你自己改的吗
--蓝_我的爱人
16. Re:js读取解析JSON数据
谢谢博主，不过js怎么解析json字符串这么简单啊，java解析json就比较麻烦，得用类和泛型
--阿拉夏
17. Re:java 注解基本原理编程实现
代码里的new User对象是什么？
--AndrewYUE
18. Re:java 注解基本原理编程实现
代码跑过吗？好像不行也
--AndrewYUE
19. Re:spring @CrossOrigin解决跨域问题
--zhanqian
20. Re:spring @CrossOrigin解决跨域问题
沙发
--zhanqian

最近一直在解决线上一个问题，表现是：

Tomcat每到凌晨会有一个高峰，峰值的并发达到了3000以上，最后的结果是Tomcat线程池满了，日志看很多请求超过了1s。

服务器性能很好，Tomcat版本是7.0.54，配置如下：

 <Executor name="tomcatThreadPool" namePrefix="catalina-exec-"
        maxThreads="3000" minSpareThreads="800"/>

    <Connector executor="tomcatThreadPool" port="8084" protocol="org.apache.coyote.http11.Http11AprProtocol"
               connectionTimeout="60000"
               keepAliveTimeout="30000"
               maxKeepAliveRequests="8000"
               maxHttpHeaderSize="8192"
               URIEncoding="UTF-8"
               enableLookups="false"
               acceptCount="1000"
               disableUploadTimeout="true"
               redirectPort="8443" />

事后thread dump看其实真正处于RUNNABLE状态的线程很少，绝大部分线程都处于TIMED_WAITING状态：

于是大伙都开始纠结为什么线程会涨到3000，而且发现即使峰值过了线程数并不会降下来。

我们首先想到的是：

后端应用的处理瞬间比较慢，“堵住了”导致前端线程数涨了起来。

但是优化一个版本上线后发现虽然涨的情况有所好转，但是最终线程池还是会达到3000这个最大值。

==================================分割线=========================================

以上是大背景，中间的过程省略，直接跟各位说下目前我得到的结论：

1、首先是为什么线程不释放的问题？

简单说下我验证的Tomcat(7.0.54)线程池大概的工作机制

Tomcat启动时如果没有请求过来，那么线程数（都是指线程池的）为0；
一旦有请求，Tomcat会初始化minSapreThreads设置的线程数；
Tomcat不会主动对线程池进行收缩，除非确定没有任何请求的时候，Tomcat才会将线程池收缩到minSpareThreads设置的大小；
Tomcat6之前的版本有一个maxSpareThreads参数，但是在7中已经移除了，所以只要前面哪怕只有一个请求，Tomcat也不会释放多于空闲的线程。

至于Tomcat为什么移除maxSpareThreads这个参数，我想也是出于性能的考虑，不停的收缩线程池性能肯定不高，而多余的线程处于等待状态的好处是一有新请求过来立刻可以处理。

而且大量的Tomcat线程处于等待状态不会消耗CPU，但是会消耗一些JVM存储。

补充：上面标红的一句有点问题，进一步验证发现只有使用Keep-Alive（客户端和服务端都支持）时才是这种表现，如果客户端没有使用Keep-Alive那么线程会随着TCP连接的释放而回收。

Tomcat中Keep-Alive相关的参数：

maxKeepAliveRequests:

The maximum number of HTTP requests which can be pipelined until the connection is closed by the server. Setting this attribute to 1 will disable HTTP/1.0 keep-alive, as well as HTTP/1.1 keep-alive and pipelining. Setting this to -1 will allow an unlimited amount of pipelined or keep-alive HTTP requests. If not specified, this attribute is set to 100.

keepAliveTimeout:

The number of milliseconds this Connector will wait for another HTTP request before closing the connection. The default value is to use the value that has been set for the connectionTimeout attribute. Use a value of -1 to indicate no (i.e. infinite) timeout.

2、为什么线程池会满？

这是我现在纠结的核心。到底是不是应用的性能慢导致的，我现在的结论是有关系，但关键是并发。

Tomcat的线程池的线程数跟你的瞬间并发有关系，比如maxThreads设置为1000，当瞬间并发达到1000那么Tomcat就会起1000个线程来处理，这时候跟你应用的快慢关系不大。

那么是不是并发多少Tomcat就会起多少个线程呢？这里还跟Tomcat的这几个参数设置有关系，看官方的解释是最靠谱的：

maxThreads:

The maximum number of request processing threads to be created by this Connector, which therefore determines the maximum number of simultaneous requests that can be handled. If not specified, this attribute is set to 200. If an executor is associated with this connector, this attribute is ignored as the connector will execute tasks using the executor rather than an internal thread pool.

maxConnections:

The maximum number of connections that the server will accept and process at any given time. When this number has been reached, the server will accept, but not process, one further connection. This additional connection be blocked until the number of connections being processed falls below maxConnections at which point the server will start accepting and processing new connections again. Note that once the limit has been reached, the operating system may still accept connections based on the acceptCount setting. The default value varies by connector type. For BIO the default is the value of maxThreads unless an Executor is used in which case the default will be the value of maxThreads from the executor. For NIO the default is 10000. For APR/native, the default is 8192.

……

acceptCount:

The maximum queue length for incoming connection requests when all possible request processing threads are in use. Any requests received when the queue is full will be refused. The default value is 100.

minSpareThreads:

The minimum number of threads always kept running. If not specified, the default of 10 is used.

我简单理解就是：

maxThreads:Tomcat线程池最多能起的线程数；

maxConnections:Tomcat最多能并发处理的请求（连接）；

acceptCount:Tomcat维护最大的对列数；

minSpareThreads:Tomcat初始化的线程池大小或者说Tomcat线程池最少会有这么多线程。

比较容易弄混的是maxThreads和maxConnections这两个参数：

maxThreads是指Tomcat线程池做多能起的线程数，而maxConnections则是Tomcat一瞬间做多能够处理的并发连接数。比如maxThreads=1000，maxConnections=800，假设某一瞬间的并发时1000，那么最终Tomcat的线程数将会是800，即同时处理800个请求，剩余200进入队列“排队”，如果acceptCount=100，那么有100个请求会被拒掉。
注意：根据前面所说，只是并发那一瞬间Tomcat会起800个线程处理请求，但是稳定后，某一瞬间可能只有很少的线程处于RUNNABLE状态，大部分线程是TIMED_WAITING，如果你的应用处理时间够快的话。所以真正决定Tomcat最大可能达到的线程数是maxConnections这个参数和并发数，当并发数超过这个参数则请求会排队，这时响应的快慢就看你的程序性能了。

以上的结论都是我个人验证和总结，如有不对，跪求指正！！！

==========================更新（2015-1-20）===========================

以上的得出结论有严重的问题，特此更正下，如果误导了某些同学十分抱歉。

主要错误的结论是：

Tomcat不会主动对线程池进行收缩，除非确定没有任何请求的时候，Tomcat才会将线程池收缩到minSpareThreads设置的大小；
Tomcat6之前的版本有一个maxSpareThreads参数，但是在7中已经移除了，所以只要前面哪怕只有一个请求，Tomcat也不会释放多于空闲的线程。

Tomcat会停止长时间闲置的线程。Tomcat还有一个参数叫maxIdleTime：

(int) The number of milliseconds before an idle thread shutsdown, unless the number of active threads are less or equal to minSpareThreads. Default value is 60000(1 minute)

其实从这个参数解释也能看出来Tomcat会停止闲置了超过一定时间的线程的，这个时间就是maxIdleTime。但我之前的测试中确实没有发现线程释放的现象，这是为什么呢？我发现除了这个参数线程池线程是否释放？释放多少？还跟当前Tomcat每秒处理的请求数（从Jmeter或LoadRunner来看可以理解为TPS）有关系。通过下表可以清晰的看出来线程数，TPS和maxIdleTime之间的关系：

TPS	maxIdleTime（ms）	Thread Count
10	60,000	600
5	60,000	300
1	60,000	60

依次类推，当然Thread Count这一列是一个大约数，上下相差几个，但基本符合这样一个规则：

Thread Count = min(max((TPS * maxIdleTime)/1000,minSpareThreads),maxThreads)

当然这个Thread Count不会小于minSpareThreads，这个跟之前的结论还是一样的。我现在大胆猜测下（回头看源码验证下，或者哪位同学知道告诉我下，谢谢）：

Tomcat线程池每次从队列头部取线程去处理请求，请求完结束后再放到队列尾部，也就是说前后两次请求处理不会用同一个线程。某个线程闲置超过maxIdleTime就释放掉。

假设首先线程池在高峰时期暴涨到1000，高峰过后Tomcat处理一次请求需要1s（从Jmeter看TPS大约就为1），那么在maxIdleTime默认的60s内会用到线程池中60个线程，那么最后理论上线程池会收缩到60（假设minSpareThreads大于60）。另外：这个跟用不用Keep-Alive没关系（之前测试结论是因为用了Keep-Alive导致程序性能下降，TPS降低了很多导致的）

这就是为什么我之前的测试中、还有我们生产环境中线程数只增不减的原因，因为就算峰值过后我们的业务每秒请求次数仍然有100多，100*60=6000，也就是3000个线程每个线程在被回收之前肯定会被重用。

那么现在有另外一个问题，那么正常情况下为什么每秒100次的请求不会导致线程数暴增呢？也就是说线程暴增到3000的瓶颈到底在哪？这个我上面的结论其实也不是很准确。

真正决定Tomcat最大可能达到的线程数是maxConnections这个参数和并发数，当并发数超过这个参数则请求会排队，这时响应的快慢就看你的程序性能了。

这里没说清楚的是并发的概念，不管什么并发肯定是有一个时间单位的（一般是1s），准确的来讲应该是当时Tomcat处理一个请求的时间内并发数，比如当时Tomcat处理某一个请求花费了1s，那么如果这1s过来的请求数达到了3000，那么Tomcat的线程数就会为3000，maxConnections只是Tomcat做的一个限制。

欢迎斧正！

补充：

使用Jmeter可以很容易的控制请求的频率。