Java性能优化干货

在优化性能之前,首先要清楚木桶原理:

系统的最终性能取决于系统中性能表现最差的组件.

程序的性能一般为如下几个方面:

(1)执行速度: 程序的反映是否迅速,响应时间是否足够短.

(2)内存分配: 内存分配是否合理,是否过多地消耗内存或者存在泄漏

(3)启动时间: 程序从运行到可以正常处理业务需要花费多长时间

(4)负载承受能力: 当系统压力上升时,系统的执行速度,响应时间的上升曲线是否平缓

性能的参考指标:

执行时间: 一段代码从开始到结束所使用的时间

CPU时间: 函数或者线程占用CPU的时间

内存分配: 程序在运行时占用的内存时间

磁盘吞吐量: 描述I/O的使用情况

网络吞吐量: 描述网络的使用情况

响应时间 :系统对某用户行为或者事件做出响应的时间.

最有可能成为系统瓶颈的计算资源如下:

磁盘I/O: 磁盘读写的速度要比内存慢很多

网络操作: 网络操作的速度可能比本地IO更慢.

CPU: 科学计算,3D渲染等对CPU需求旺盛的应用.

异常: 对Java应用来说,异常的捕获和处理是非常消耗资源的.

数据库: 操作时等待数据库的响应速度.

锁竞争: 对高并发程序来说, 如果存在激烈的锁竞争,无疑是对性能极大的打击.

内存: 一般来说,内存在读写速度上不太可能成为性能瓶颈.

加速比 = 优化前系统耗时 / 优化后系统耗时

加速比越高, 表明优化效果越明显.

性能优化的层次:

代码优化

软件架构上

JVM虚拟机层

数据库

操作系统层面

数据库调优:

在应用层对SQL语句进行优化

对数据库进行优化

对数据库软件进行优化

这里举一个简单的优化方法 PreparedStatement来代替Statement 优点如下:

(1)代码的可读性和可维护性.

(2)PreparedStatement尽最大可能提高性能.

(3)最重要的一点是极大地提高了安全性.

善用设计模式:

首先了解一个概念: 延迟加载: 如果没有使用当前对象或是组件,则不需要真正的初始化它.

然后进入正题, 一般提到设计模式 ,大家首先想到的就是单例模式,它的好处如下:

(1)对于频繁使用的对象, 可以省略创建对象所花费的时间,尤其是对于重量级的对象来说,可以省掉非常可观的一笔系统开销.

(2)由于new操作的次数减少,因而对系统内存的使用频率也会降低,这将减轻GC压力,缩短GC缩短时间

但是要注意的地方就是: 序列化和反序列化可能会破坏单例.

代理模式, 使用代理对象完成用户请求, 屏蔽用户对真实对象的访问.

最常见的应用场景就是平时操作数据库的时候, jdbc等数据库连接对象都是已经创建好的, 调用时就省去了初始化这种连接数据库engine的时间

动态代理, 运行时动态生成代理类.

享元模式, 是设计模式中少数几个以提高系统性能为目的的模式之一, 如果系统中存在多个相同的对象,那么只需共享一份对象的拷贝, 而不必为每一次使用都创建新的对象.

它的核心是享元工厂, 需要确保系统可以共享相同的对象.

主要优点:

(1)可以节省重复创建对象的开销

(2)由于创建对象的数量减少, 所以对系统内存的需求也减少.

装饰者模式,可以动态添加功能. 代码重用使用的是委托机制而不是继承, 因为继承是一种紧密耦合,父类如果改动还要改动子类.

JDK中outputStream和InputStream类族的实现是装饰者模式的典型应用.

观察者模式, 当一个对象的行为依赖于另一个对象的状态时, 观察者模式就相当有用.

观察者模式可以用于事件监听, 通知发布等场合. 可以确保观察者在不使用监控的情况下, 及时收到相关消息和事件.

常用优化组件和方法:

(1)缓冲: 缓冲区是一块特定的内存区域,jdk中很多I/O组件都提供了缓冲功能,

(2)缓存: 缓存也是一块为提升系统性能而开辟的内存空间.

(3)并行替代串行,随着多核时代的到来,CPU的并行能力有了很大的提升,在这个背景下单纯的串行已经不能满足.java中提供了Thread对象和runnable接口用于创建进程内的线程.

(4)负载均衡: 并发数很多的情况下,单台计算机无法承受, 这时候一般都可以搭建服务器集群.

在使用tomcat集群时,有两种基本的session共享模式, 黏性session模式 (一台用户只能在一个机器上操作, 不能共享)和复制session模式(所有session在所有tomcat节点上,一般情况还是用这种合适).

字符串优化处理

string对象及其特点:

首先要了解string类型的3个基本特点:

(1)不变性.

(2)针对常量池的优化

(3)类的final定义 (不可能有任何子类, 这是对系统安全性的保护)

注意: 不变模式是一个可以提高多线程程序性能 , 降低多线程程序复杂度的设计模式.

StringBuffer 和 StringBuilder

(1)String常量的累加操作

String result = "aaa" + "bbb" + "ccc";

StringBuilder result = new StringBuilder();

result.append("aaa");

result.append("bbb");

result.append("ccc");

以上这两种方法我觉得大多数人都会以为是第二种效率更高,但实际上恰恰相反, 因为对于静态字符串的连接操作, Java在编译时会进行彻底的优化, 将多个连接操作的字符串在编译时合成一个单独的长字符串.

(2)String变量的累加操作

String str1= "aaa";

String str2 = "bbb";

String str3 = "ccc";

String result = str1 + str2 + str3;

这段代码其实是和 StringBuilder执行速度一样的, 因为对于变量字符串的累加,Java也做了相应的优化操作, 使用了StringBuilder对象来实现字符串的累加.

总结一下: 在无需考虑线程安全的情况下可以使用性能较好的StringBuiler, 但若系统有线程安全要求, 只能选择StringBuffer.

两者都可以设置一个容量参数, 在不指定容量参数时, 默认是16个字节.扩容策略是将原有的容量大小翻倍.

核心数据结构:

Set接口:

Set集合中的元素是不能重复的. 基于Set的重要实现有以下三种 : HashSet LinkedHashset TreeSet

这三种跟Map基本都是对应起来的 . HashSet的输出毫无规律可言 , LinkedHashMap的输出顺序跟输入顺序完全一致 ,TreeSet则将所有输出从小到大排序.

List接口:

这里我们只讨论3种最重要的List实现: ArrayList Vector 和 LinkedList .

这三种List均来自AbstratList的实现. 而AbstratList直接实现了List接口, 并扩展自AbstratCollection.

ArrayList Vector 均使用了数组实现, 使用了几乎相同的算法 ,唯一的区别可以认为是对多线程的支持. 没有实现线程同步的ArrayList要稍好于Vector ,但差别不是很明显.

LinkedList链表由一系列表项连接而成. 一个表项总是包含3个部分: 元素内容 , 前驱表项, 后驱表项.

ArrayList中的add() 性能取决于ensureCapacity()方法, 处理容量参数为10 如果容量不够的话自增到原来的1.5倍 . 如果能确定集合的大小可以直接指定容量参数的大小这样性能会提升很多.

LinkedList由于使用了链表的结构, 因此不需要维护容量的大小. 然而每次元素增加都需要新建一个Entry对象, 并进行更多的赋值操作, 在频繁的系统调用中, 对性能会产生一定的影响.

但是 , 如果是在任意位置新增或者删除元素 ,而不是在队尾新增 , 则比ArrayList 效率高非常多.ArrayList 在任意位置新增或删除时都要重新将元素复制一遍, 打破原有的数组排列顺序.

常用的集合遍历方法有3种:

Foreach , 迭代器和 for循环

总结: 对ArrayList这些底层用数组实现来说, 随机访问的速度是很快的. 可以优先考虑

Map接口:

围绕map接口, 最主要的实现类有HashTable (子类中还有properties类的实现) HashMap LinkedHashMap 和 TreeMap .

首先解决一下HashMap 和 HashTable的异同 (同步 / key,value的要求 / 算法):

HashTable大部分方法同步, 线程安全, key 和 value的值不允许使用null值, 而HashMap可以.

内部索引的映射算法不同.

尽管存在以上的诸多问题 , 但是两者实现的性能相差无几.

因为HashMap被广泛应用, 这里将一下HashMap的实现原理, 主要是将key作为hash算法, 然后将hash值映射到内存地址, 直接取得所对应的数据. 底层使用的数据结构是数组, 所谓的内存地址即数组的下标索引.

HashMap的高性能需要保证以下几点:

hash算法必须是高效的; hash值到内存地址(数组索引)的算法是快速的 ; 根据内存地址(数组索引) 可以直接取得对应的值.

HashMap初始大小为16, 最大长度是2的30次方，load factor默认是0.75，扩充的临界值是16*0.75=12 负载因子 = 元素个数 / 内部数组总大小

LinkedHashMap --> 有序的HashMap , HashMap最大功能缺点是他的无序性.

LinkedHashMap提供两种类型的排序: 一是元素插入时的顺序, 二是最近访问的顺序.

可以通过以下构造参数指定排序行为 :

public LinkedHashMap(int initialCapacity, float loadFactor ,boolean accessOrder) , 其中accessOrder为true时按照元素最后访问时间排序;

当assessOrder为false时 ,按照插入顺序排序默认为false.

TreeMap

从功能上讲 ,TreeMap有着比HashMap更为强大的功能, 它实现了SortedMap接口, 可以对元素进行排序

这两种可以排序的Map实现的区别: LinkedHashMap是基于元素进入集合的顺序排序, 而TreeMap则是基于元素的固有顺序(由Comparator或者 Comparable确定)

使用NIO (New I/O)提升性能:

由于I/O的速度要比内存慢 , 因此 ,在很多情况下 I/O 都会成为系统的瓶颈. 特性如下:

为所有的原始类型提供(Buffer)缓存支持;

增加通道(Channel)对象 , 作为新的原始I/O 抽象;

支持锁和内存映射文件的文件访问接口;

提供了基于Selector的异步网络 I/O

跟JDK1.4之前的区别是 : 之前的I/O是流式 ,NIO是基于块(Block)的, 它是块为基本单位处理数据.在NIO中, 最为重要的两个组件是缓冲Buffer 和通道 Channel.

缓冲是一块连续的内存块 , 是NIO读写数据的中转地通道表示缓冲数据的源头或者目的地. 它用于向缓冲读写或者写入数据. 是访问缓冲的接口.

Buffer的基本原理 :

Buffer中有3个重要的参数 : 位置 (position),容量(capactiy) 和上限(limit) .

强引用:

可以直接访问目标对象 ;

强引用所指向的对象在任何时候都不会被系统回收. JVM宁愿抛出OOM异常, 也不回收强引用所指向的对象;

强引用可能导致内存泄漏 .

有助于改善性能的技巧:

(1) 慎用异常: try-catch 对系统性能会造成影响

(2) 使用局部变量 : 局部变量的访问速度远远高于类的成员变量.

(3) 位运算代替乘除法: 在所有的运算中, 位运算是最为高效的, 最典型的就是对于整数的乘除运算优化.

a *=2 ; 优化为 : a <<=1;

a /=2 ; 优化为: a >>=1;

(4) 一维数组代替二维数组

(5)提取表达式 : 很多通用的代码只需要初始化一次就可以了.

(6)使用buffer代替 I/O操作

(7)使用clone() 代替new

(8)用静态方法代替实例方法 : 对于一些工具类, 应该使用static方法实现 ,这样不仅可以加快函数调用的速度, 同时, 调用static方法也不需要生成类的实例,

比调用实例方法更为方便, 易用.

JDK多任务执行框架

线程的数量必须得到控制, 盲目地大量创建线程对系统性能是有伤害的.

线程池: 基本功能就是进行线程的复用.

使用线程池后, 线程的创建和关闭通常由线程池维护, 线程通常不会因为执行完一次任务而关闭, 线程池中的线程会被多个任务重复使用.

线程池的大小对系统性能有一定的影响. 一般来说只要避免掉极大和极小的两种情况就可以了.<<java并发>>

Ncpu = CPU的数量

Ucpu = 目标CPU的使用率 , 0<=Ucpu<=1

W/C = 等待时间与计算时间的比率

最优线程池的大小等于 : Ncpu * Ucpu * (1 + W/C)

java中可以通过 Runtime.getRuntime().availableProcessors(); 获取cpu的个数.

JDK并发数据结构

着重介绍一些用于多线程环境的数据结构, 如并发list 并发set 并发map等.

并发list:

ArrayList不是线程安全的. 应该尽量避免在多线程环境中使用ArrayList ,如果因为某些原因必须使用的,则需要使用:

Collections.synchronizedList(List list) 进行包装.

同步关键字 synchronized 是 Java语言中最为常用的同步方法之一. 虽然 synchronized可以保证对象或者代码段的线程安全.

为了实现多线程间的交互 ,还需要使用Object对象的wait() 和 notify() 方法.

"锁"的性能和优化

在高并发的环境下, 激烈的锁竞争会导致程序的性能下降, 这边简单的介绍常见的锁:

线程的开销 , 避免死锁 , 减小锁持有时间 , 减小锁粒度 ,读写分离锁来替换独占锁, 锁分离 ,锁粗化, 自旋锁, 锁消除 , 锁偏向

JVM调优

由于java字节码是运行在JVM虚拟机上的, 同样的字节码使用不同的JVM虚拟机参数运行 ,其性能表现可能就不一样.

垃圾回收基础

Java语言的一大特点是可以进行自动垃圾回收处理. 但是当内存释放不够完全时, 即存在分配但永不释放的内存块 ,就会引起内存泄漏.严重时,导致程序瘫痪.

垃圾处理器的基本问题是:

哪些对象需要回收?

何时回收这些对象?

如何回收这些对象?

垃圾回收算法与思想:

1. 引用计数法

2. 标记-清除算法

3.复制算法

4.标记-压缩算法

posted @ 2017-12-04 15:19 哦克Oak 阅读(451) 评论(0) 收藏举报

刷新页面返回顶部

哦克Oak

Talk is cheap, show me the code! 微信号：Oak4911，欢迎交流。