Java面试题(3)【线程】
一、线程的生命周期?线程有几种状态
二、Sleep()、wait()、join()、yield()的区别
三、说说你对线程安全的理解
四、Thread、Runnable的区别【此问题不应该问,问这个问题的面试官水平一般】
五、ThreadLocal的原理和使用场景
六、ThreadLocal内存泄漏的原因及如何避免
七、并发、并行、串行的区别
八、并发的三大特性
九、为什么要使用线程池?解释下线程池的参数?
十、简述线程池的处理流程
十一、线程池中阻塞队列的作用?为什么是先添加队列而不是先创建最大线程?
十二、线程池线程复用原理
一、线程的生命周期?线程有几种状态
1、线程通常有五种状态:创建、就绪、运行、阻塞和死亡状态。
2、阻塞的情况又分为三种:
(1)等待阻塞:运行的线程执行wait方法,该线程会释放占用的所有资源包括锁资源,JVM会把该线程放入”等待池中“。进入这个状态后,是不能自动唤醒的,必须依靠其他线程调用notify或notifyAll方法才能被唤醒,wait是object类的方法。
(2)同步阻塞:运行的线程在获取对象的同步锁时,若该同步锁被别的线程占用,则JVM会把该线程放入”锁池“中。
(3)其他阻塞:运行的线程执行sleep或join方法,或者发出了I/O请求时,JVM会把该线程设置为阻塞状态。当sleep状态超时,join等待线程终止或者超时,或者I/O处理完毕时,线程重新转入就绪状态。sleep是Thread类的方法。
1、新建状态(NEW):新创建了一个线程对象。
2、就绪状态(RUNNABLE):线程对象创建后,其他线程调用了该对象的start方法。该状态的线程位于可运行线程池中,变得可运行,等待获取CPU的使用权。
3、运行状态(RUNNING):就绪状态的线程获取了CPU,执行程序代码。
4、阻塞状态(BLOCKED):阻塞状态是线程因为某种原因放弃CPU使用权,暂时停止运行。直到线程进去就绪状态,才有机会转到运行状态。
5、死亡状态(Dead):线程执行完了或者因异常退出了run方法,该线程结束生命周期。
二、Sleep()、wait()、join()、yield()的区别
1、锁池
所有需要竞争同步锁的线程都会放在锁池中,比如当前对象的锁已经被其中一个线程得到,则其他线程需要在这个锁池进行等待,当前面的线程释放同步锁后锁池中的线程去竞争同步锁,当某个线程得到后会进入就绪队列进行等待CPU资源分配。
2、等待池
当我们调用wait()方法后,线程会放到等待池当中,等待池的线程是不会去竞争同步锁。只有调用了notify()或notifyAll()后等待池的线程才会开始去竞争锁,notify()是随机从等待池选出一个线程放到锁池,而notifyAll()是将等待池的所有线程放到锁池当中。
sleep与wait的区别
- Sleep是Thread类的静态本地方法,wait则是Object类的本地方法。
- Sleep方法不会释放Lock,但是wait会释放锁,而且会加入到等待队列中(等待池)。
sleep就是把CPU的执行资格和执行权释放出去,不再运行此线程,当定时时间结束再取回CPU资源,参与CPU的调度,获取到CPU资源后就可以继续运行了。
而如果sleep时该线程有锁,那么sleep不会释放这个锁,而是把锁带着进入了冻结状态,也就是说其他需要这个锁的线程根本不可能获取到这个锁。
也就是说无法执行程序。如果在睡眠期间其他线程调用了这个线程的interrupt方法,那么这个线程也会抛出interruptexception异常返回,这点和wait是一样的。
- sleep方法不依赖于同步器synchronized,但是wait需要依赖synxhronized关键字。
- sleep不需要被唤醒(休眠之后推出阻塞),但是wait需要(不指定时间需要被别人中断)。
- sleep一般用于当前线程休眠,或者轮询暂停操作,wait则多用于多线程之间的通信。
- sleep会让出CPU执行时间且强制上下文切换,而wait则不一定,wait后可能还是有机会重新竞争到锁继续执行的。
yield()执行后线程直接进入就绪状态,马上释放了CPU的执行权,但是依然保留了CPU的执行资格,所以有可能CPU下次进行线程调度还会让这个线程获取到执行权继续执行。
join()执行后线程进入阻塞状态,例如在线程B中调用线程A的join(),那线程B会进入到阻塞队列,直到线程A结束或终端线程。
public class Demo01 { public static void main(String[] args) throws InterruptedException { Thread t1 = new Thread(new Runnable() { @Override public void run() { try { Thread.sleep(3000); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println("22222"); } }); t1.start(); t1.join(); //这段代码必须等t1全部执行完毕(不管上面睡眠多长的时间),才会执行 System.out.println("111111"); } } //执行的结果 //22222 //111111
三、说说你对线程安全的理解
我们一般所将的线程安全不是指线程安全,应该是指内存的安全,堆是共享内容,可以被所有线程访问。
当多个线程访问一个对象时,如果不用进行额外的同步控制或其他的协调操作,调用这个对象的行为都可以获取正确的结果(预期得结果或单线程执行的结果),
我们就说这个对象时线程安全的
堆 是进程和线程共有的空间,分全局堆和局部堆。全局堆就是所有没有分配的空间,局部堆就是分配给用户的空间。堆在操作系统对进程初始化的时候分配,运行过程中也可以向系统要额外的堆,但是用完了要还给操作系统,要不然就是内存泄漏。
在Java中,堆是Java虚拟机所管理的内存中最大的一块,是所有线程共享的一块内存区域,在虚拟机启动时创建。
堆所存在的内存区域的唯一目的就是存放对象实例,几乎所有的对象实例以及数组都在这里分配内存。
栈 是每个线程独有的,保存其运行状态和局部自动变量的。栈在线程开始的时候初始化,每个线程的栈互相独立,因此,栈是线程安全的。操作系统在切换线程的时候会自动切换栈。栈空间不需要在高级语言里面显示的分配和释放。
目前主流操作系统都是多任务的,即多个线程同时运行。为了保证安全,每个进程只能访问分配给自己的内存空间,而不能访问别的进程的,这是由操作系统保障的。
在每个进行的内存空间中都会有一块特殊的公共区域,通常称为堆(内存)。进程内的所有线程都可以访问到该区域,这就是造成问题的潜在原因。
四、Thread、Runnable的区别【此问题不应该问,问这个问题的面试官水平一般】
Thread类(单继承)和Runnable接口(多实现)的实质是继承的关系,没有可比性。如果要做比较的话那么就是使用上的区别。
无论使用Runnable还是Thread,都会new Thread,然后执行run()方法。
用法上,如果有复杂的线程操作需求,那就选择继承Thread(里面提供的API更加丰富),如果只是简单的执行一个任务,那就实现Runnable
//会卖出多一倍的票,总共5张票,但是卖出了10张 public class Demo01 { public static void main(String[] args) { //多线程,这里new了两个实例这里就会有两个5,所以会卖出两倍 new MyThread().start(); new MyThread().start(); } static class MyThread extends Thread{
//成员变量 private int ticket = 5; @Override public void run(){ while (true){ System.out.println("Thread ticket="+ticket--); if(ticket < 0){ break; } } } } }
//结果:
Thread ticket=5
Thread ticket=4
Thread ticket=3
Thread ticket=2
Thread ticket=1
Thread ticket=0
Thread ticket=5
Thread ticket=4
Thread ticket=3
Thread ticket=2
Thread ticket=1
Thread ticket=0
//正常卖出5张票 public class Demo02 { public static void main(String[] args) { //new一个实例启动两个线程,这里只有1个5 MyThread2 mt = new MyThread2(); new Thread(mt).start(); new Thread(mt).start(); } static class MyThread2 implements Runnable{ private int ticket = 5; @Override public void run(){ while (true){ System.out.println("Thread ticket=" + ticket--); if(ticket < 0){ break; } } } } } //结果
Thread ticket=5
Thread ticket=4
Thread ticket=2
Thread ticket=1
Thread ticket=0
Thread ticket=3
五、ThreadLocal的原理和使用场景
每一个Thread对象均含有一个ThreadLocalMap类型的成员变量threadLocals,它存储本线程中所有ThreadLocal对象及其对应的值
ThreadLocalMap 由一个个Entry对象构成
Entry继承自weakReference<ThreadLocal<?>>,一个Entry由ThreadLocal对象和Object构成。由此可见,Entry的key是ThreadLocal对象,并且是一个弱引用。当没指向key的强引用后,该key就会被垃圾收集器回收。
当执行set方法时,ThreadLocal首先会获取当前线程对象,然后获取当前线程的ThreadLocalMap 对象。再以当前ThreadLocal对象为key,将值存储进ThreadLocalMap 对象中。
get方法执行过程类似。ThreadLocal首先会获取当前线程对象,然后获取当前线程的ThreadLocalMap 对象。再以当前ThreadLocal对象为key,获取对应的value。
由于每一条线程均含有各自私有的ThreadLocalMap 容器,这些容器相互独立互不影响,因此不会存在线程安全性问题,从而也无需使用同步机制来保证多条线程访问容器的互斥性。
使用场景:
1、在进行对象跨层传递的时候,使用ThreadLocal可以避免多次传递,打破层次间的约束。
2、线程间数据隔离
3、进行事务操作,用于存储线程事物信息(事务跟线程是绑在一起的)
4、数据库连接、Session会话管理。
spring框架事务开始时会给当前线程绑定一个Jdbc Connection,在整个事务过程都是使用线程绑定的,Connection 来执行数据库操作,
实现了事务的隔离性。Spring 框架里面就是用的ThreadLocal来实现这种隔离
以下图中实线为强引用,虚线为弱引用。
六、ThreadLocal内存泄漏的原因及如何避免
内存泄漏为程序在申请内存后,无法释放已申请的内存空间,一次内存泄漏危害可以忽略,但内存泄漏堆积后果很严重,无论多少内存,迟早会被占光。
OOM(内存不够)内存泄漏最终导致OOM。
不会被使用的对象或者变量占用的内存不能被回收,就是内存泄漏
强引用:使用最普遍的引用(new),一个对象具有强引用,不会被垃圾回收器回收。当内存空间不足,Java虚拟机宁愿抛出OutOfMemoryError错误,使程序异常终止,也不回收这种对象。
如果想取消强引用和某个对象之间的关联,可以显示地将引用赋值为null,这样可以使JVM在合适的时候就会回收该对象。
弱引用:JVM进行垃圾回收时,无论内存是否充足,都会回收被弱引用关联的对象。在Java中,用java.lang.ref.WeakRefrence类来表示。可以在缓存中使用弱引用。
ThreadLocal 的实现原理,每一个Thread维护一个ThreadLocalMap(存key,value), key 为使用弱引用的ThreadLocal实例,value为线程变量的副本。
ThreadLocalMap 使用ThreadLocal的弱引用作为key,如果一个ThreadLocal不存在外部强引用时,
key(ThreadLocal) 势必会被GC回收,这样就会导致ThreadLocalMap 中key为null, 而value还存在着强引用,只有thread线程退出以后,value 的强引用链条才会断掉,但如果当前线程再迟迟不结束的话,这些key为null的Entry的value就会一直存在一条强引用链(红色链条)
key 使用强引用
当ThreadLocalMap 的key为强引用回收ThreadLocal时,因为ThreadLocalMap 还持有ThreadLocal的强作用,如果没有收到删除,ThreadLocal不会被回收,导致Entry内存泄漏。
key 使用弱引用
当ThreadLocalMap 的key 为弱引用回收ThreadLocal时,由于ThreadLocalMap 持有ThreadLocal的弱引用,即使没有手动删除,ThreadLocal也会被回收。当key为Null,在下一次ThreadLocalMap 调用set(),get(),remove()方法的时候会被清除value值。
因此,ThreadLocal内存泄漏的根源是:由于ThreadLocalMap 的生命周期跟Thread一样长,如果没有手动删除对应key就会导致内存泄漏,而不是因为弱引用。
ThreadLocal正确的使用方法
- 每次使用完ThreadLocal都调用它的remove()方法清楚数据。(避免内存泄漏的问题)
- 将ThreadLocal变量定义成private static, 这样就一直存在ThreadLocal的强引用,也就能保证任何时候都能通过ThreadLocal的弱引用访问到Entry的value值,进而清除掉。
七、并发、并行、串行的区别
串行 在时间上不可能发生重叠,前一个任务没搞定,下一个任务就只能等着,前一个任务执行完了才能执行下一个任务。
并行 在时间上是重叠的,两个任务在同一时刻互不干扰执行。
并发 允许两个任务彼此干扰,统一时间点,只有一个任务运行,两个任务交替执行。
八、并发的三大特性
- 原子性
原子性是指在一个操作中CPU不可以在中途暂停然后再调度,即不被中断操作,要不全部执行完毕,要不都不执行。就好比转账,从账户A向账户B转1000元,那么必然包括两个操作,从A账户减去1000元,给B账户增加1000元。
private long count = 0; public void calc(){ count ++; }
i++既要保证原子性也要保证可见性,一般i++是线程不安全的,
- 1:将count从主存读到工作内存中的副本中
- 2:+1的运算
- 3:将结果写入工作内容
- 4:将工作内存的值刷回贮存(什么时候刷入由操作系统决定,不确定的)
那程序中原子性指的是最小的操作单元,比如自增操作,它本身其实并不是原子性操作,分了3步的,包括读取变量的原始值、进行加1操作、写入工作内存。所以在多线程中,有可能一个线程还没自增完,可能才执行到第二部,另一个线程就已经读取了值,导致结果错误。那如果我们能保证自增操作是一个原子性的操作,那么就能保证其他线程读取到的一定是自增后的数据。
关键字: synchronized
- 可见性
当多个线程访问同一个变量时,一个线程修改了这个变量的值,其他线程能够立即看得到修改的值。
若两个线程在不同的CPU,那么线程1改变了i的值还没有刷新到主存,线程2又使用了i,那么这个i值肯定还是之前的,线程1对变量的修改线程没看到这就是可见性问题。
//线程1 boolean stop = false; while(!stop){ for (int i = 0; i < 5; i++) { System.out.println(i); } } //线程2 stop = true;
如果线程2改变了stop的值,线程1一定会停止吗?不一定。当线程2更改了stop变量的值之后,但是还没来得及写入主存当中,线程2转去做其他事情了,那么线程1由于不知道线程2对stop变量的更改,因此还会一直循环下去。
关键字:volatile、synchronized、final
- 有序性
虚拟机在进行代码编译时,对于那些改变顺序之后不会对最终结果造成影响的代码,虚拟机不一定会按照我们写的代码的顺序来执行,有可能将他们重排序。实际上,对于有些代码进行重排序之后,虽然对变量的值没有造成影响,但有可能会出现线程安全问题。
int a = 0; boolean flag = false; public void write(){ a = 2; //1 flag = true; //2 } public void multiplay(){ if(flag){ //3 int ret = a * a; 4 } }
write方法里的1和2做了重排序,线程1先对flag赋值为true,随后执行到线程2,ret直接计算出结果,再到线程1,这时候a才赋值为2,很明显迟了一步。
关键字:volatile、synchronized
volatile 本身就包含了禁止指令重排序的语义,而 synchronized 关键字是由”一个变量在同一时刻只允许一条线程对其进行lock操作“这条规则明确的。
synchronized关键字同时满足以上三种特性,但是 volatile 关键字不满足原子性。
在某些情况下,volatile 的同步机制的性能确实要优于锁(使用 synchronized 关键字或java.util.concurrent包里面的锁)因为volatile 的总开销要比锁低。
九、为什么要使用线程池?解释下线程池的参数?
1、降低资源消耗;提高线程利用率,降低创建和销毁线程的消耗。
2、提高响应速度;任务来了,直接有线程可用可执行,而不是先创建线程,再执行。
3、提高线程的可管理性;线程是稀缺资源,使用线程池可以统一分配调优监控。
- corePoolSize 代表核心线程数,也就是正常情况下创建工作的线程数,这些线程创建后并不会消除,而是一种常驻线程,最终的回收是随时线程池的回收而回收。
- maxinumPoolSize 代表的是最大线程数,它与核心线程数相对应,表示最大允许被创建的线程数,比如当前任务较多,将核心线程数都用完了,还无法满足需求时,此时就会创建新的线程,但是线程池内线程总数不会超过最大线程数。
- keepAliveTime、unit 表示超出核心线程数之外的线程的空闲存活时间,也就是核心线程不会消失,但是超出核心线程数的部分线程如果空闲一定的时间则会被消除,我们可以通过setKeepAliveTime来设置空闲时间
- workQueue 用来存放待执行的任务,假设我们现在核心线程都已被使用,还有任务进来则全部放入队列,直到整个队列被放满但任务还再持续进入则会开始创建新的线程。
- ThreadFactory 实际上是一个线程工厂,用来生产线程执行任务。我们可以选择使用默认的创建工厂,产生的线程都在同一个组内,拥有相同的优先级,且都不是守护线程。当然我们也可以选择自定义线程工厂,一般我们会根据业务来制定不同的线程工厂。
- Handler 任务拒绝策略,有两种情况,第一种是当我们调用shutdown等方法关闭线程池后,这时候即使线程池内部还没有执行完的任务正在执行,但是由于线程池已经关闭,我们再继续想线程池提交任务就会遭到拒绝。另一种情况就是当达到最大的线程数,线程池已经没有能力继续处理新提交的任务时,这时也就拒绝。
十、简述线程池的处理流程
十一、线程池中阻塞队列的作用?为什么是先添加队列而不是先创建最大线程?
1. 一般的队列只能保证作为一个有限长度的缓冲区,如果超出了缓冲长度,就无法保留当前的任务了,阻塞队列通过阻塞可以保留住当前要继续入队的任务.
阻塞队列可以保证任务队列中没有任务时阻塞获取任务的线程,使得线程进去wait状态,释放cpu资源.
阻塞队列自带阻塞和唤醒的功能,不需要额外处理,无任务执行时,线程池利用阻塞队列的take方法挂起,从而维持核心线程的存活,不至于一直占用CPU资源。
2.创建线程的时候,是要获取全局锁的,这个时候其它的就得阻塞,影响了整体效果.
就好比一个企业里面有10个(core正式工的名额,最多招10个正式工,要是任务超过正式工人数(task>core)的情况下,工厂领导(线程池)不是首先扩招工人,还是这10人,但是任务可以稍微积压一下,即先放到队列去(代价低).10个正式工慢慢干,迟早会干完的,要是任务还在继续增加,超过正式工的加班忍耐极限了(队列满了),就得招外包帮忙了(注意是临时工)要是正式工加上外包还是不能完成任务,那新来的任务就会被领导拒绝了(线程池的拒绝策略)。
十二、线程池线程复用原理
线程池将线程和任务进行解耦,线程是线程,任务是任务,摆脱了之前通过Thread创建线程时的一个线程必须对应一个任务的限制。
在线程池中,同一个线程可以从阻塞队列中不断获取新任务来执行,其核心原理在于线程池对Thread进行了封装,并不是每次执行任务都会调用Thread.start()来创建新线程,而是让每个线程去执行一个“循环任务”,在这个“循环任务”中不停检查是否有任务需要被执行,如果有则直接执行,也就是调用任务中的run方法,将run方法当成一个普通的方法执行,通过这种方式只使用固定的线程就将所有任务的run方法串联起来。