一、 线程切换
线程的切换受操作系统的调度控制
简单流程是这样的:
- 操作系统让cpu执行线程1
- 线程1执行到指令003的时候 操作系统让cpu执行线程2
- cpu会将线程1的执行半成品放到缓存中
- cpu接着执行线程2
- cpu执行线程2的004指令的时候 操作系统又让cpu执行线程1
- cpu从缓存拿出线程1的残次品接着执行
- cpu就是一个无脑的计算中心 它不管调度 只管计算(像极了我们程序员)
- 而操作系统 是负责调度的 (像极了我们的领导)
- 在这里应该能发现一个点那就是:线程的切换是需要耗费操作系统资源的 (领导使唤你干活儿 肯定要浪费领导时间和精力)
二、 单核cpu设置多线程 是否有意义
一个cpu在一个时间段只能跑一个线程,我单个cpu设置多个线程有意义吗 ?
当然有意义了,你只有一个脑子(CPU),你除了想你女朋友(假如你有),你还会想的姑娘吗~~(会的)
为什么呢,因为有时候你女朋友不一定在消耗你的脑子 线程也是如此,比如一个线程01需要进行数据库数据加载,这时候它是不消耗cpu的,他是在消耗网络IO,CPU多值钱呀,肯定不能空闲,所以在线程01加载数据库数据的时候,就可以让CPU进行线程02的计算操作
CPU密集型:
CPU密集型也叫计算密集型,简单说就是大部分时候CPU使用在100% ,而读写磁盘/内存时间很短
比如大量数据计算的,进行数据分析的 ,也可能是CPU性能极差的而磁盘/内存性能很好的情况
IO密集型:
IO密集型跟CPU密集型相反,大部分时间CPU使用率很小,而读写磁盘/内存占用很大时间
比如读数据库比较多的,网络请求比较多的,也可能是磁盘/内存质量差的的情况
三、 线程数越大越好吗
当然不是了,线程数太大了,CPU就不干活了,只用来切换线程了
就比如程序员,一天内负责两个项目的开发 ,上午在公司9楼项目组,下午在公司6楼项目组,
这个还可以接受,如果开发100个呢 ? 9点在1楼,刚坐下就要去2楼,2楼刚坐下又要去三楼,这一天时间都用在换楼层了
写个小例子感受一下:
public class NumTest {
// 一有1亿条数据的数组
public static double[] arr = new double[100000000];
public static void main(String[] args) throws InterruptedException {
// 初始化
Random r = new Random();
for (int i = 0; i < arr.length; i++) {
arr[i] =r.nextInt(10);
}
// 单线程计算
getSum01();
// 2线程计算
getSum02();
// 多个线程计算
getSum03();
}
// 单线程计算sum
private static void getSum01() {
long start = System.currentTimeMillis();
double sum = 0;
// 遍历求和
for (int i = 0; i <arr.length ; i++) {
sum = sum+arr[i];
}
long end = System.currentTimeMillis();
// 输出日志
System.out.println("一个线程计算 耗时:"+(end-start) + "毫秒," +" 计算结果:"+sum);
}
/**
* 2个线程计算sum
*/
static double sum01,sum02;
private static void getSum02() throws InterruptedException {
// 第一个线程 计算0到一半
Thread thread01 = new Thread(() -> {
for (int i = 0; i < arr.length / 2; i++) {
sum01 = sum01 + arr[i];
}
});
// 第二个线程 计算一半到length
Thread thread02 = new Thread(() -> {
for (int i = arr.length / 2; i < arr.length; i++) {
sum02 = sum02 + arr[i];
}
});
long start = System.currentTimeMillis();
thread01.start();
thread02.start();
// join 到主线程 阻塞
thread01.join();
thread02.join();
// 执行完之后 求一下两个线程分别求和的和
double sum =sum01+sum02;
long end = System.currentTimeMillis();
// 打印日志
System.out.println("2个线程计算 耗时:"+(end-start) + "毫秒," +" 计算结果:"+sum);
}
/**
* 多个线程计算
* @throws InterruptedException
*/
private static void getSum03() throws InterruptedException {
// 10个线程 可自行调节
int ThreadNum = 1000;
// 创建ThreadNum个长度的long数组 存储各个线程的求和结果
double[] sums = new double[ThreadNum];
// 存储多个线程
Thread[] threads = new Thread[ThreadNum];
// 每个线程计算的数字个数
final int segCount = arr.length/ThreadNum;
CountDownLatch cdl = new CountDownLatch(ThreadNum);
// 创建多个线程
for (int i = 0; i < ThreadNum; i++) {
int m = i;
Thread thread = new Thread(() -> {
// 每个线程执计算逻辑
for (int j = segCount*m; j <segCount*(m+1) && j < arr.length; j++) {
sums[m]+=arr[j];
}
cdl.countDown();
});
threads[i] = thread;
}
long start = System.currentTimeMillis();
// 全部启动
for (int i = 0; i < threads.length; i++) {
threads[i].start();
}
cdl.await();
// 最后求和
double sum = 0;
for (int i = 0; i < sums.length; i++) {
sum+=sums[i];
}
long end = System.currentTimeMillis();
// 打印日志
System.out.println("多个线程计算 耗时:"+(end-start) + "毫秒," +" 计算结果:"+sum);
}
}
输出结果:
一个线程计算 耗时:177毫秒, 计算结果:4.50063291E8
2个线程计算 耗时:99毫秒, 计算结果:4.50063291E8
多个线程计算 耗时:162毫秒, 计算结果:4.50063291E8
可以看出来 2个线程比一个执行快 但是1000个不一定比2个执行快 因为1000个线程上下文切换就要花费很多资源
四、 线程设置多少合适呢
- 实践中多少都是通过压测来确定的 但是压测初始值是可以自己推算一个的
- 怎么推算 比如我刚才那个例子: 我电脑4核 我想让每个核一个线程
这样切换就少了 我把ThreadNum设置为4
输出结果:
一个线程计算 耗时:177毫秒, 计算结果:4.49997398E8
2个线程计算 耗时:99毫秒, 计算结果:4.49997398E8
多个线程计算 耗时:79毫秒, 计算结果:4.49997398E8
-
那我们有多少核就设置多少个线程?
不是的!
首先,cpu不是只为你一个人服务的 除了你还有很多别的进程需要cpu
一般说的充分利用CPU 不是说都用到100% 我们还要留一部分cpu进行利用,跟你上班一样,地铁30分钟+走路10分钟到公司,你如果9点上班 你会8点20出门吗 肯定会早一点出门 留点儿余地 -
线程数量 设定公式
Nthread = Ncpu * Ucpu * (1+W/C )
Ncpu : 处理器的核数 java可以这样获取:System.out.println(Runtime.getRuntime().availableProcessors());
Ucpu: 期望CPU的利用率 在0 到 1 之间
W/C: 是等待时间与计算时间的比率 wait/compute
可以看出来:
cpu合数 和 cpu使用率确定的情况下 等待时间(W)越长可以设置的线程数就应该越多
如果c(计算时间)占比很大 也就是w/c ≈ 0 那合适的线程数就等于 NcpuxUcpux1
-
4中说的w和c 我怎么知道的 ?
这些值呢,一般来说 通过工具(profiler)进行测算java最常用的是JProfiler (收费的) 本地开发测试
如果已经部署到服务器上了 可以用阿里开源的 Arthas 做统计
后边会简单写一下:JProfiler Arthas的使用
有问题可以留言或关注公众号: