Java面试题(持续更新中...)
一、JavaSE
线程有几个状态
6个状态分别是:新建,运行,阻塞,等待,超时等待,终止
wait和sleep的区别
- wait来自Object类,Sleep来自Thread类。
- wait会释放锁,sleep不会。
- wait必须在同步代码块中执行,sleep可以随便执行。
- wait可以捕获异常,sleep必须捕获异常。
synchronized和lock锁的区别
sync可重入锁,不可中断,非公平锁
lock可重入锁,可以判断锁,非公平锁(可设置)
什么是可重入锁
只要持有该锁,再次进入代码块就不需要争抢锁,如递归,可以一直进进出出,不会出现死锁
工作中遇到过的异常
运行时异常,IO异常,数据库连接异常,ClassNotfound异常,OutOfMemoryError异常,ConcurrentModification并发修改异常
信号量和互斥锁的区别
信号量:一次可以被多个线程持有,资源调度
互斥锁:一次只能被一个线程持有,资源互斥
什么是AQS
抽象对象同步器,基于CLH队列(双向链表),用volatile修饰共享状态(state),线程通过CAS去改变状态符,成功则获取锁成功,失败则进入等待队列,等待被唤醒。
Executors线程池工厂的三大方法
newSingleThreadExecutor()单个线程池,newFixedThreadPool(n)创建固定大小的线程池,newCachedThreadPool()可伸缩的线程池
单例模式
饿汉式:直接创建对象。
懒汉式:使用时创建对象,双重检测锁和volatile关键字解决并发问题。
CAS(比较并交换—乐观锁)机制
比较当前工作内存中的值和主内存中的值,如果这个值是期望的,则执行操作,否则不执行。
存在ABA狸猫换太子问题:
使用增加版本号可以解决,乐观锁机制
JUC提供了原子时间戳引用类AtomicStampedReference,可以解决ABA问题
怎么排查死锁问题
定位进程:jps -l
堆栈跟踪:jstack 进程号
JVM内存模型
- 堆:内存对象
- 栈:局部变量,方法出口,操作数,动态链接
- 方法区(元空间):常量,静态变量,类信息
- 本地方法栈:native方法
- 程序计数器:反编译代码的执行顺序号
JVM参数介绍
-Xmx最大堆内存
-Xms初始堆内存
JVM垃圾回收机制
JVM:年轻代内存满了之后会发生MINORGC,使用可达性分析算法,将引用的对象放入e0区,未引用的对象就进行minorgc垃圾回收,每发生一次minorgc,存活对象会在s0和s1区进行切换,当s区满了和分代年龄15,会进入老年代,老年代满了会发生fullgc,如果fullgc也释放不了对象,而新对象一直在产生并放入老年代就会内存溢出OOM。
JVM调优:判断该服务业务代码会执行多少秒*每秒产生多少M的对象,并设置年轻代Eden(8:1:1)的大小(业务代码刚好执行完成,发生minorgc进行回收),剩下的内存就分配给老年代。
G1收集器(C++语言实现),可以通过参数设置最大停顿时间,到达这个停顿时间就会发生gc,需要考虑业务场景,避免对象过大或者年龄太大,多数对象进入老年代。
JVM垃圾回收算法
- 引用计数法:程序计数器
- 年轻代-幸存者区:复制算法
- 老年代:
- 标记清除(标记存活的对象,没有标记的对象进行清除,会产生内存碎片)
- 标记整理(标记存活的对象,将存活的对象移动到一端,没有标记的对象进行清除,不会产生内存碎片)
为什么要设计STW(回收时停顿)
如果没有,fullgc和minorgc时会误删除程序中的非垃圾对象。
s区的大对象(大于50%)会直接放去老年代。
minorgc和fullgc会产生STW。
为什么堆里面要划分年轻代和老年代
答:如果不划分的话,垃圾对象一直堆积不回收,等真正发生gc的时候,时间会超级长。
年轻代为什么要有s0和s1区
- 如果没有的话会导致发生minorgc就把存活对象放入老年代了导致fullgc,停顿时间长
- 如果只有一个s区,复制算法会产生内存碎片,eden区和s0区会互相复制,比如说eden和s0区各有存活的对象,eden将存活对象放入s0区,会导致内存不连续
- 为什么要有两个区,经过权衡后的最优解
什么是可达性分析算法
GCRoot(虚拟机栈的引用)开始向下搜索,搜索走过的路径称为引用链,当一个对象的gc root没有任何引用链时,证明这个对象是不可用,不可达的。
JMM内存模型
主要分为主内存(堆)和工作内存(栈),工作内存是主内存和一份拷贝,主要操作有:锁定lock,解锁unlock,读取read,载入load,使用use,赋值assign,存储store,写入write
TCP三次握手
二次握手的问题:客户端的第一次请求时延误发送到了服务端,服务端成功接收到了请求(但在客户端认为这个请求已经失败了),第二次响应时服务端向客户端响应,客户端认为该请求已失败,并不会接收这次响应,服务端会一直死死的等待(死锁)客户端发送数据报文,造成资源消耗(如果客户端重新建立连接,会建立一个新的通道,上一个通道会一直存在)。如果是三次握手的情况下,第三次握手如果服务端在一段时间内没接收到客户端的响应,就会关闭这个连接通道。
第一次握手,客户端向服务端发送请求建立连接。
第二次握手,服务端向客户端响应是否确认建立连接。
第三次握手,客户端会向服务端发送一个确认建立连接。
三次握手的目的:防止已失效的连接请求报文突然传送到了服务端
TCP四次挥手
由于TCP双向通道互相独立所导致的,
- c向s发送"我要关闭连接"。
- s向c发送"我知道了",并且s进入半关闭状态(可以接收数据,不可以发送数据)。
- s向c发送"我要断开连接了,你确认下",进入最后确认状态。
- c向s发送"可以断开",s接收到后会进行关闭连接,c等待2msl(数据报文一来一回的最大时间),进入关闭状态。
ArraysList扩容机制
默认初始容量10,扩容原始容量的1.5倍取整,扩容因子1
Vector向量扩容机制
线程安全sync锁
默认初始容量10,扩容原始容量的2倍取整,扩容因子1
HashMap扩容机制
默认初始容量16,扩容倍数2,扩容因子0.75
数组长度大于64并且链表长度大于等于8(每产生哈希冲突,进行equal比较,hash码相同替换,不同插入链表)->链表转变为红黑树,链表长度小于等于6则从红黑数转为链表,jdk1.7采用头插,jdk1.8采用尾插。
时间和空间的权衡。
HashMap数据结构
HashMap的实现是基于数组和链表(或红黑树)的组合实现的。数组被初始化为一定数量的桶,每个桶可以包含一个链表或者红黑树。当使用put()方法向HashMap中添加一个键值对时,首先会对键进行哈希计算,然后找到对应的桶。如果桶为空,就将键值对插入到桶中。如果桶不为空,就遍历桶中的所有键值对,查找是否已经存在相同的键,如果存在则更新值,否则将新的键值对插入到桶中。
ConcurrentHashMap数据结构
1.7 采用ReentrantLock+Segment+HashEntry分段锁的思想,对每个Segment桶位加锁。
1.8 舍弃了分段锁的思想,更加接近hashmap,采用synchronized+CAS+HashEntry+红黑树,对每个数组元素加锁
HashMap寻址
put方法实际有4个参数,第一个参数hash值是32位,左移16位并"高16位和低16位进行异或得到的值"让本就随机的值更加随机,尽量避免hash碰撞,提高查询效率。
HashMap为什么线程不安全
因为put方法执行的时候,首先要获取插入的位置索引,如果此时有另一个线程进入获取了同样的索引并插入,当前线程如果再插入会覆盖插入的数据,导致数据不一致
并发的三大特性
原子性,可见性,有序性
双亲委派机制
类加载器:BootStrapClassLoader主加载器,ExtClassLoader扩展加载器,AppClassLoader系统类加载器以及线程上下文加载器,可以自定义加载器。
双亲委派:向上委派到顶层加载器,向下查找加载路径
守护线程
守护线程最后关闭,守护线程不可以用线程池创建,线程池创建的守护线程都会转换成用户线程,守护线程中创建线程,创建的还是守护线程
线程池执行流程
超过核心线程(甲方),就放入阻塞队列(排期),队列满了,开启最大线程执行(外包),最大线程满了,执行拒绝策略(驳回需求),最大线程空闲超过指定时间,回收线程(辞退)
线程池七大参数
- corePoolSize 线程池核心线程大小
- maximumPoolSize 线程池最大线程数量
- keepAliveTime 空闲线程存活时间
- unit 空闲线程存活时间单位
- workQueue 工作队列
- threadFactory 线程工厂
- handler 拒绝策略
- AbortPolicy:丢弃任务并抛出异常
- DiscardPolicy:静默丢弃任务,不抛异常
- DiscardOldestPolicy:丢弃最前面的任务,新任务加入队列
- CallerRunsPolicy:由调用线程执行该任务,不会丢弃
HTTP和TCP的区别
HTTP位于应用层,http是基于TCP的一个短连接。
TCP协议位于传输层,TCP协议支持长连接和短连接。
synchronized锁升级
Java虚拟机对synchronized的优化,大多数情况下锁不存在多线程竞争,所以向第一个现场偏护,一旦出现多线程竞争的情况下,就会从偏向锁升级为轻量级锁(自旋锁),如果自旋执行了一定次数的CAS(比较并交换)还没有获取到锁,就会从轻量级锁膨胀为重量级锁,只允许一个线程进入
进程和线程的区别
进程是系统分配资源的最小单位,线程是系统调度的最小单位。
一个程序至少有一个进程,一个进程至少有一个线程。
Java线程调度算法是时间片轮转方式。
threadlocal内存泄露
因为底层使用的threadlocalmap,key是软引用对象,可能gc的时候把key回收了,而value还在内存中,所以需要显式清除
二、JavaEE
spring如何解决的循环依赖问题
首先说下什么是循环依赖:A对象依赖于B对象,B对象依赖于A对象。
Spring解决循环依赖的核心思想在于提前曝光,首先创建实例化A,并在三级缓存中保存实例化A的lambda表达式以便获取A实例,然后去实例化B,在实例化B的时候就可以取到A了,后面再去实例化A。
当我没有循环依赖和AOP时,这个三级缓存是没有在后续用到的。
spring是什么
- 是一个轻量级的简化开发的框架,管理Bean的容器,各个框架的中间人(整合各种框架)
- ioc容器用于管理bean的生命周期,使用aop解决oop代码重复的问题
- springmvc是spring对web框架的一个解决方案,总前端控制器servlet视图解析器生成视图到页面。
- springboot是spring的快速开发包,相当于spring和springmvc的整合,约定大于配置。
AOP通知类型
前置通知,后置通知,环绕通知,异常通知,最终通知
spring对象的生命周期
- 解析类得到BeanDefinition定义对象。
- 推断构造方法。
- 进行实例化,得到对象。
- 给对象中的@Autowired注解属性赋值。
- 回调Aware方法(获取容器,用于访问容器中其他的Bean)。
- 调用初始化前的方法。
- 调用初始化。
- 调用初始化后的方法。
- 将单例Bean放入单例池。
- 使用Bean。
- 销毁Bean。
bean的作用域
singleton单例,prototype多例,request一个请求一个单例,session一个session一个单例,application一个上下文一个单例,webSocket一个连接一个单例
spring的单例Bean是线程安全的吗
不是,框架并没有对多线程进行处理,使用双重检测锁和可见性关键字,ThreadLocal或者加锁。
springboot的自动装配原理
@Import导入了扫描META-INFO/spring.factories文件,文件中配置了各个Starter中的配置类,配置类中使用@Bean注入,各个starter需要遵守springboot的约定
pageHelper分页原理
使用拦截器拦截并重写SQL
mybatis #和$的区别
(#)预编译,参数默认会加单引号,使用PreparedStatement的set方法赋值,用于取值场景,预防sql注入。
($)sql拼接,可用于动态表名/字段场景,会导致sql注入。
描述几个事务失效的场景
- 非public方法上加事务注解会失效,原因:AOP代理对象过滤了非public方法
- 同类中方法互调事务会失效,原因:绕过了AOP代理对象
- 数据库引擎不支持事务
- 异常被catch吃掉了
限流、熔断、降级
熔断-如果某个服务宕机,返回给前端友好信息,会定时检查服务是否恢复,慢慢恢复使用
限流-页面限制每秒的请求量QPS
降级-如果某个时间段,请求量太大,服务器压力太大,可以关闭一些不必要的功能,保留一些核心功能
springmvc执行流程
前端控制器DispatcherServlet -> 处理器映射器handlerMapping -> 处理器适配器handlerAdapter -> ModelAndView -> 视图解析器ViewReslove处理ModelAndView -> View视图渲染到页面
三、计算机基础
常见加密算法类型
AES: 对称加密-加解密用同一把钥匙(密钥)
RSA: 非对称加密-加密用公钥(密钥),解密用私钥(密钥)
linux常用指令
tail -f 实时监听日志
tail -n 100 查看末尾100行的日志
netstat -apn | grep 8080 查询指定端口的信息
ps -ef | grep pid 查询指定进程的信息
top 查看cpu使用情况
df -h 查看硬盘使用情况
free -h 查看内存使用情况
短url压缩算法
- 使用md5加密,分四段,随机取一段
- 使用放号器,初始0,新请求递增,转换成64进制(a-zA-Z0-9)
- 将短链接服务器和真实路径做个映射保存到redis
- 或者使用LUR本地缓存,存储最近访问的n个映射,更新最近映射的时间,淘汰最近未访问的映射
- 根据映射使用301或302重定向到真实地址
- 301永久重定向:无法记录点击率
- 302临时重定向:可以记录点击率
幂等是什么
接口只允许调用一次,对数据的影响只会触发一次
接口幂等性(多次点击导致数据问题),接口多次调用和一次调用结果相等
实现接口幂等性
使用乐观锁机制,增加唯一业务流水号
四、数据库
事务的四大特性
原子性,隔离性,持久性,一致性
事务的隔离级别和现象
- 读未提交:可能产生脏读,读取到未提交的数据
- 读已提交:可能产生不可重复读取问题,A事务中读取到B事务已提交的数据,导致两次读取数据不一致
- 可重复读:可能产生幻读问题,A事务中查询到B事务插入的数据,导致两次查询条数不一致
- 可序列化:最高级别,强制事务序列化执行,独占锁,并发效率慢
不可重复读和幻读的区别
不可重复读的重点在修改,两次查询数据不同
幻读的重点在新增和删除,两次查询行数不同
MySQL执行计划(explain)
主要优化看type字段,执行效率:避免(All和index) All全表<index遍历索引树<range检索范围数据<ref非唯一性索引扫描<eq_ref唯一性索引扫描<system表中只有一条数据<const通过索引一次命中,匹配一条数据
什么是MVCC机制
多版本并发控制的一种方法,通过版本链(readView维护活动的事务Id,排序成一个数组从小到大,数组外左边的是已提交的事务可以访问,数组外右边的是未提交的不可访问),实现多版本,可并发读写,通过readView,生成策略的不同,实现不同的隔离级别
MySQL慢查询日志分析
可以通过命令或者my.cnf配置开启慢查询日志记录,mysql提供了工具mysqldumpslow可以进行分析
什么是行锁,什么是表锁
行锁是排他锁,防止其它事务修改此行
表锁是共享读锁,独占写锁
Innodb和Myisam存储引擎的区别
Innodb支持事务、必须有主键、支持表/行锁、支持MVCC模式、支持外键
Myisam不支持事务、非必须有外键、只支持表锁、不支持MVCC模式、不支持外键
MySQL主从同步的基本原理
- 主库将修改语句保存到binlog日志中
- 主库创建一个线程将binlog日志发送到从库
- 从库创建一个IO线程读取binlog日志
- 从库解析binlog日志中的语句执行
MySQL调优
表结构建立的时候字段长度尽量不要浪费,因为mysql底层对内存页的数据存储是16kb,如果一行数据大小为16kb,那么只能存储一条数据,很恐怖。
MySQL内存页是什么
mysql的每次IO只能读取一个内存页的数据。
b+数的每个节点就是一个内存页的数据。
MySQL索引类型
聚簇索引(主键索引)
辅助索引(唯一索引、普通索引、组合索引)
倒排索引(全文索引)
覆盖索引--不需要回表查询
MySQL中的最左匹配原则
针对联合索引
- 联合索引(a,b,c)相当于建立了索引:(a),(a,b),(a,b,c)
- mysql内部优化器,会自动排序where条件,并匹配组合索引
MySQL中的b+树存储逻辑
b+树根节点不存储数据只存储键,叶子节点存放(聚集索引存放数据,非聚集索引存放主键和索引列),树的各个页之间(page16kb)是通过双向链表连接的,而叶子节点数据是通过单向链表连接的
五、缓存
RDB和AOP的区别
RDB:快照模式,通过配置文件save 600 3设置,600秒内至少有3个key发生修改,产生快照替换原有快照。
AOF:文件追加模式,记录修改动作到文件中,缺省一秒追加一次,appendfsync: 进行配置。
区别:AOF效率低于RDB,AOF采用追加RDB采用快照,RDB(如果死机后丢失未生成快照的数据)没有AOP(会丢失一秒内的数据,并不会影响之前存在的数据)数据安全
Redis为什么采用单线程
只在处理网络请求时采用单线程,完成基于内存操作,非阻塞多路IO复用(使用select,可以建立多个socket连接处理IO非多线程),避免了上下文和多线程切换避免加锁产生问题引起资源消耗
什么是缓存雪崩、缓存击穿、缓存穿透
缓存雪崩:缓存同一时间大面积失效,过期时间尽量间隔随机,缓存预热-启动时将数据同步到缓存。
缓存穿透:大量请求同时访问不存在的数据,都会到mysql查询,一般是受到了攻击,可通过缓存key-null➕过期时间,布隆过滤器,代码校验来解决。
缓存击穿:是指热点数据失效了,大量并发查同一条数据导致崩溃,可以通过热点数据永不过期-修改时同步缓存或者失效后数据库访问时加互斥锁
Redis基本数据类型
5种常见数据类型,string,hash,list,set,zset
Redis过期策略以及内存淘汰机制
过期策略
定期加惰性
定期删除-每过100毫秒检查key是否过期,过期就删除
惰性删除-获取key的时候检查是否过期,过期就删除
内存淘汰策略:
如果定期删除没删除key,也没请求key进行惰性删除,此时内存就会越来越大,可以在配置文件里配置内存淘汰策略,如:从已设置过期的key中取出最近没有使用过的key淘汰
Redis内存淘汰策略
- noenviction:不清除数据,只是返回错误,这样会导致浪费掉更多的内存,对大多数写命令(DEL 命令和其他的少数命令例外)
- allkeys-lru:从所有的数据集中挑选最近最少使用的数据淘汰,以供新数据使用
- volatile-lru:从已设置过期时间的数据集中挑选最近最少使用的数据淘汰,以供新数据使用
- allkeys-random:从所有数据集中任意选择数据淘汰,以供新数据使用
- volatile-random:从已设置过期时间的数据集中任意选择数据淘汰,以供新数据使用
- volatile-ttl:从已设置过期时间的数据集中挑选将要过期的数据淘汰,以供新数据使用
- volatile-lfu:从所有配置了过期时间的键中淘汰使用频率最少的键
- allkeys-lfu:从所有键中淘汰使用频率最少的键
Redis分布式锁的实现
setnx加过期时间expire,但不是同步执行的,可能导致死锁。
set中有很复杂的参数,可以把setnx和expire组成一条命令使用。
Redis延时队列的实现
使用zset,并设置个时间戳,然后查询出所有延时任务,找出需要进行处理的延时任务,通过时间戳判断是否大于当前系统的时间,大于就处理这个消息。
如何实现数据一致性
延时双删实现mysql和redis的数据一致性
- 删除redis缓存数据
- 更新数据库数据(这里可能有其他事务修改数据并成功放入缓存,导致redis数据不是最新的)
- 延时同步时间(等待其他更新缓存操作完成)
- 删除redis缓存数据
Redis持久化机制
aof:丢失数据少,恢复速度慢,写操作追加文件(日志记录),占用更多磁盘
rdb:丢失数据多,恢复速度快,间隔一段时间生成快照,文件较小
六、消息队列
如何避免消息重复发送和重复消费
重复发送:MQ内部针对每条生产者发送的消息生成一个inner-msg-id,作为去重和幂等的依据
重复消费:在消息消费时,要求消息体中必须要有一个bizId
RabbitMQ如何工作?
1. 生产者
- 创建交换机,指定交换机类型
- 创建队列
- 队列绑定交换机并可以指定routingKey路由键
- 发送消息到交换机并可以指定routingKey
1. 消费者
- 创建队列
- 监听队列
RabbitMQ交换机各个模式区别和作用?
2. fanout,广播模式,发送消息到所有绑定的队列
3. direct,路由模式,发送消息到指定routingKey的队列
4. topics,主题模式,发送消息到指定routingKey(绑定时可以使用通配符)的队列
5. headers和direct交换机完全一致,但性能差很多,几乎不用了
RabbitMQ工作流程
- ConnectionFactory --> Connection --> Channel --> 创建交换机 --> 创建队列 --> 队列绑定交换机 --> 发送消息/接收消息
- 直接发送到队列:底层使用了默认交换机
RabbitMQ常见故障的解决思路
RabbitMQ服务器宕机消息丢失
消息队列默认是持久化到硬盘上的,不惧怕重启