2 深入分析 Java IO的工作机制(二)

2.5 I/O调优

  • 下面总结一些磁盘I/O和网络I/O的常用优化技巧。

2.5.1 磁盘I/O优化
1. 性能检测

  • 应用程序通常都需要访问磁盘来读取数据,而磁盘I/O通常都很耗时,要判断I/O是否是一个瓶颈,有一些参数指标可 以参考。
  • 我们可以压力测试应用程序,看系统的I/O wait指标是否正常,例如,测试机器有4个CPU,那么理想的I/O wait参数不应该超过25%,如果超过25%,I/O可能成为应 用程序的性能瓶颈。在Linux操作系统下可以通过iostat命令查看。
  • 通常我们在判断I/O性能时还会看到另外一个参数,就是IOPS,即要查看应用程序需要的最低的IOPS是多少,磁盘的 IOPS能不能达到要求。每个磁盘的IOPS通常在一个范围内,这和存储在磁盘上的数据块的大小和访问方式也有关,但主要是由磁盘的转速决定的,磁盘的转速越高,磁盘的IOPS也越高。
  • 现在为了提升磁盘I/O的性能,通常采用一种叫作RAID的技术,就是将不同的磁盘组合起来以提高I/O性能,目前有多种RAID技术,每种RAID技术对I/O性能的提升会有不同,可以用一个RAID因子来代表,磁盘的读写吞吐量可以通过iostat命令来获取,于是可以计算出一个理论的IOPS值,计 算公式如下:
  • (磁盘数 * 每块磁盘的IOPS)/(磁盘读的吞吐量 + RAID因子 * 磁盘写的吞吐量)= IOPS

2. 提升I/O性能

  • 通常提升磁盘I/O性能的方法有:
    • 增加缓存,减少磁盘访问次数。
    • 优化磁盘的管理系统,设计最优的磁盘方式策略,以及磁盘的寻址策略,这是在底层操作系统层面考虑的。
    • 设计合理的磁盘存储数据块,以及访问这些数据块的策略,这是在应用层面考虑的。例如,我们可以给存放的数据设计索引,通过寻址索引来加快和减少磁盘的访问量,还可以采用异步和非阻塞的方式加快磁盘的访问速度。
    • 应用合理的RAID策略提升磁盘I/O,RAID策略及说明如表2-3所示。

2.5.2 TCP网络参数调优

  • 要能够建立一个TCP连接,必须知道对方的IP和一个未被使用的端口号,由于32位操作系统的端口号通常由两个字节表示,也就是只有2^16=65535个,所以一台主机能够同时建立的连接数是有限的,当然操作系统还有一些端口0~1024是受保护的,如80端口、22端口,这些端口都不能被随意占用。

  • 在Linux中可以通过查看/proc/sys/net/ipv4/ip_local_port_range文件来知道当前这个主机可以使用的端口范围,如图2-22所示。

  • 图2-22表示可以使用的端口为61000-42768=18232。如果可以分配的端口号偏少,在遇到大量并发请求时就会成为瓶颈,由于端口有限导致大量请求等待建立连接,这样性能就会压不上去。另外如果发现有大量的TIME_WAIT的话,可以设置/proc/sys/net/ipv4/tcp_fin_timeout为更小的值来快速释放请求。我们通过另外一个主机ab -c 30 -n 1000000 10.232.101.208.8080/来压测这台机器,看看网络的连接情况,如图2-23所示。

  • 可以看出TIME_WAIT的连接有26364个,我们设置sudo sh -c "echo 3 > /proc/sys/net/ipv4/tcp_fin_timeout"后再进行测试,如图2-24所示。

  • 调整后TIME_WAIT的数量明显减少。除了增大端口范围之外,还可以让TCP连接复用等,这些调优参数如表2-4所示。

  • 注意,以上设置都是临时性的,系统重新启动后就会丢失。另外iain,Linux还提供了一些工具可用于查看当前的TCP统计信息,如下所示。

    • cat /proc/net/netstat: 查看TCP的统计信息
    • cat /proc/net/snmp:查看当前系统的连接情况
    • netstat -s:查看网络的统计信息

2.5.3 网络I/O优化

  • 网络I/O优化通常有如下一些基本处理原则。

    • 减少网络交互的次数。

    • 减少网络传输数据量的大小。

    • 尽量减少编码。

  • 根据应用场景设计合适的交互方式。所谓的交互场景主要包括同步与异步、阻塞与非阻塞方式,下面进行详细介绍。

  • 1. 同步与异步

  • 2. 阻塞与非阻塞

  • 3. 两种方式的组合

  • 组合的方式有4钟,分别是同步阻塞、同步非阻塞、异步阻塞、异步非阻塞,如表2-5所示。

  • 虽然异步和非阻塞能够提升I/O的性能,但是也会带来一些额外的性能成本,例如,会增加线程数量从而增加CPU的消耗,同时也会导致程序设计复杂度的上升。

  • 下面举一些异步和阻塞的操作实例。

  • 在Cassandra中要查询数据通常会向多个数据节点发送查询命令,但是要检查每个节点返回数据的完整性,就需要一个异步查询同步结果的应用场景,部分代码如下:

class AsyncResult implements IAsyncResult {
    private byte[] result_;
    private AtomicBoolean done = new AtomicBoolean(false);
    private Lock lock_ = new ReentrentLock();
    private Condition condition_;
    private long startTime_;
    public AsyncResult() {
        condition_ = lock_.newCondition();//创建一个锁
        startTime_ = System.currentTimeMillis();
    }
    //检查需要的数据是否已经返回,如果没有返回阻塞
    public byte[] get() {
        lock_.lock();
        try {
            if (!done_.get()) { condition_.await(); }
        } catch (InterruptedException ex) {
            throw new AssertionError(ex);
        } finally { lock_.unlock(); }
        return result_;
    }
    
    //检查需要的数据是否已经返回
    public boolean isDone() { return done_.get();}
    
    //检查在指定的时间内需要的数据是否已经返回,如果没有返回,抛出超时异常
    public byte[] get (long timeout, TimeUnit tu) throws TimeoutException {
        lock_.lock();
        try {
            boolean bVal = true;
            try {
                if ( !done_.get() ) {
                    long overall_timeout = timeout - (System.currentTimeMillis() - startTime_);
                    if (overall_timeout > 0) //设置等待超时的时间
                        bVal = condition_.await(overall_timeout, TimeUnit.MILLISECONDS);
                    else bVal = false;
                }
            } catch (InterruptedException ex) {
                throw new AssertionError(ex);
            }
            if (!bVal && !done_.get()) { //抛出超时异常
                throw new TimeoutException("Operation timed out.");
            }
        } finally { lock_.unlock(); }
        return result_;
    }
    
    //该函数供另外一个线程设置要返回的数据,并唤醒在阻塞的线程
    public void result(Message response) {
        try {
            lock_.lock();
            if (!done_.get()) {
                result_ = response.getMessageBody();//设置返回的数据
                done_.set(true);
                condition_.signal(); //唤醒阻塞的线程
            }
        } finally { lock_.unlock(); }
    }
}
posted @ 2018-01-17 18:24  _sanjun  阅读(167)  评论(0编辑  收藏  举报