常见踩坑案例(一) subList引起FULLGC
计划真的赶不上变化,时间过得真快。废话不多说了,今天主要记录之前有同事遇到的一些坑分享出来。
一、封装类的应用会引起NPE异常
对于其他对象的应用,一般在使用之前会判断它是否为空,如果不为空才会使用它以及它里面的一些属性值。但是对于基本类型的封装类型,就有很多人漏掉对于它的判断。
就在前面几天有位同事问我说这段代码它怎么会报空指针呢? 先模拟下这个场景下的代码:
// 第三方的实体类对象 class Count{ Integer total; String name; String leavingNum; //... } public class DemoTest { public void fun() { Count count = new Count(); // 经过一系类对应值的获取之后 // 需要判断total是否为0,如果为0就进行其他的业务操作。 if (count.total == 0) { // 比方说打印日志。 } } @Test public void test() { fun(); } }
他给我看的代码就是类似fun()方法中的代码, 我一看这个代码就感觉不对劲,我说你这个Count类下的total属性是int吗?如果是int就可以这么用。他说为什么? “如果是Integer类型,那么它的初始值不是0而是null, 而你上面的这些逻辑又不能保证total 一定会获取到数值,那么它就还有可能是null,你这样使用的话就有可能包NPE的问题。所以针对对象的使用提前判空更有保障。” 我接着说。 在我说的过程中他反应还是很快的,立马查看了这个实体类中total字段的类型,于是就明白了。 如果没有养成提前使用判空的习惯(除非你能保证一定会有值),老手都容易会踩这样的坑。比方说针对Boolean类型的使用,有很多人会直接这样的哦(这样肯定会有问题的)。
Boolean flag = null; // 经过一系类操作处理 // 进行判断 if (flag) { //...... }
另外针对基本类型的封装类型使用还有些要注意的请看这篇文章:https://www.cnblogs.com/yuanfy008/p/8321217.html
二、subList带来的隐患
现在有很多都是基于分布式服务,那应该会存在这个域对应数据需要同步到其他域下,然后这种同步必然会产生差异,需要一种自检的job去检测差异。打个比方有些商家自己有官网售卖自己的产品,也还有可能会在天猫开旗舰店售卖。假如它分配在天猫的商品信息是通过它本地天猫数据库同步过去的,那么这种难免会产生差异,特别是库存,如果一边多一边少就可能会导致超卖的情况。 所以这种情况需要有个job对比两边的差异,下面先简单模拟下事发情况(注意下面的用法):
1 public class SubListTest { 2 3 @Test 4 public void test1() { 5 // 初始集合(有序) 6 List<Integer> list = new ArrayList<>(); 7 list.addAll(Arrays.asList(1, 2, 3, 4)); 8 9 // 业务场景:需要将list集合与很多场景下的数据进行对比,然后取出不同的。 10 // 对比的场景就不还原了,假设每次都是前面两个不同。 这里只列举四次对比,为了方便查看效果不使用for循环 11 12 // 第一次截取不同的数据 13 list = list.subList(0, 2); 14 // 查看list中有多少数据 15 System.out.println(list); 16 17 // 查询有新的数据,往list中添加 18 list.addAll(Arrays.asList(5, 6)); 19 //... 20 // 第二次截取 21 list = list.subList(0, 2); 22 System.out.println(list); 23 24 // 查询有新的数据,往list中添加 25 list.addAll(Arrays.asList(7, 8)); 26 //... 27 // 第三次截取 28 list = list.subList(0, 2); 29 System.out.println(list); 30 31 // 查询有新的数据,往list中添加 32 list.addAll(Arrays.asList(9, 10)); 33 //... 34 // 第四次截取 35 list = list.subList(0, 2); 36 System.out.println(list); 37 38 } 39 }
看到上面代码其实很简单,输出结果大家也都知道。下面先一步一步的分析,然后再介绍在大量数据的情况下这会产生结果。
第一步:查看下list的内存分配地址,后面会有需要。
第二步:跳到第一次截取之后,看list有什么变化?
它的内存地址变了,也就说每次subList都会产生一个新对象,那么得查看下这subList的源码,而源码中确实是会产生一个新对象。但是请仔细SubList的构造函数,其中会存放它的父级对象。那么这会产生什么影响呢?请接着往下看。
public List<E> subList(int fromIndex, int toIndex) { subListRangeCheck(fromIndex, toIndex, size); return new SubList(this, 0, fromIndex, toIndex); } private class SubList extends AbstractList<E> implements RandomAccess { private final AbstractList<E> parent; private final int parentOffset; private final int offset; int size; SubList(AbstractList<E> parent, int offset, int fromIndex, int toIndex) { this.parent = parent; this.parentOffset = fromIndex; this.offset = offset + fromIndex; this.size = toIndex - fromIndex; this.modCount = ArrayList.this.modCount; } // 后面方法省略 }
第三步:在第三次截取之前直接在源码中SubList构造函数中打断点,然后跳转进来,看看对应对象的属性值:
咋一看,这里面怎么param_1怎么来的?通过第二步查看SubList的源码再加上第一步的需要你留意list原生的的对象内存地址,你就知道param_1对应是这个list的根对象,它一直保留子对象新增的对象。那么大家想下,这种做法当遇到海量数据对比差异时会产生什么影响呢?
如果刚才看懂了上面所说的,那么肯定会明白这个list的根对象累积到后面肯定会变成大对象,这样会导致平凡的fullGc而且你还回收不掉。因为它一直在使用,直至这个程序运行结束。
那么像上面这种场景怎么优化解决呢? 可以这样考虑, 每次对比时候都弄一个新的list去获取差异,然后再把这个有差异的list添加至总的差异结果集中。(其实我们平时也不会用一个list去反反复复的subList)。如果大家有更好的优化,请留言探讨。