NIO - Buffer
NIO —— Buffer源码分析
Buffer的类结构
底层的基础类是抽象类-Buffer,其中定义了四个变量:capacity(容量),limit(限制),position(位置),mark(标记)
在继承了Buffer后,分别对应Java的基本类型(除了Boolean)产生了7个抽象子类,并且在子类中定义了三个变量:hb(缓存数组),offset,isReadOnly
具体实现类有许多分为三大块:ByteBufferAsXXXX,DirectXXXX(缓冲区在普通内存上),HeapXXXX(缓冲区在JVM的堆上)
那么,要使用Buffer的时候如何进行实例化呢?
需要调用相应类型的Buffer中的静态方法wrap,得到一个实例对象(默认是HeapXXXX)。
在使用wrap进行构造缓冲区的时候,传入的数组在实际构造的时候只是引用了这个数组,因此在缓冲区之外对传入的数组进行操作时,均会影响到缓冲区。
Buffer中的变量描述
NIO的buffer和普通I/O的buffer中的缓存区别在于:NIO的Buffer给缓存数组定义了一系列的操作函数,方便快捷。
capacity(容量):缓存数组的大小,数组是一个final类型的变量,因此容量初始化后便不能更改,如果需要扩容,则需要新建一个buffer对象,将内容put到新对象里面。
limit(限制):第一个不能读取或者写入的索引位置。(可以使用limit()或limit(x)进行获取或修改);默认值为capacity。
position(位置):下一个要写入或者读取的索引位置。(可以使用position()或position(x)进行获取或修改);默认值为0。
mark(标记):在缓冲区中标记一个位置,在reset()时,将position的值改为mark。(可以使用mark()设置当前的position为mark值);默认值为-1;当position或者limit的值小于mark值时,此时mark作废变为-1。
几个变量直接的关系:
正常情况下,四个变量的值均不能为负数。
四个变量的大小顺序:0 <= mark <= position <= limit <= capacity
如果修改的limit值小于当前的position时,position也会相应的改变为limit值。
如果修改的position值大于当前的limit时,会直接抛出异常。
Buffer中提供的操作方法
普通方法:
remaining() —— 获取剩余空间大小(limit-position),可以作为读写时,循环的次数。
isReadOnly() —— 当前缓冲区是否是只读的
isDirect() —— 判断当前缓冲区是否是直接缓冲区;什么是直接缓冲区?正常情况下,buffer的缓冲数组是存放在JVM虚拟机中,这个数组再映射到硬盘中的地址,这会导致吞吐量低,运行效率低,因此,在初始化时可以使用静态方法allocateDirect直接分配直接地址。
put/get方法
get() —— 获取下一个值
get(int index) —— 获取第index位置的值(先判断变量是否合法,并且position值不变)
get(T[] dst, int offset, int length) —— 将length个值保存到从offset索引值开始的dst数组中(先判断变量是否合法)
在验证边界值时:如果是访问dst越界了,会抛出IndexOutOfBoundsException;如果是访问buffer越界了,会抛出BufferUnderflowException。
put(int x) —— 放入一个x值
put(int i, int x) —— 在第i位放入值x(先判断变量是否合法,并且position值不变)
put(T[] dst, int offset, int length) —— 将dst数组从offset开始的length个值存入到缓冲区中(先判断变量是否合法)
put(TBuffer src) —— 将src的缓冲区的remain内容放到当前缓冲区中(先判断变量是否合法)
***所有对数组进行的操作均是使用了System.arraycopy函数。
在验证边界值时:如果是访问src越界了,会抛出IndexOutOfBoundsException;如果是访问buffer越界了,会抛出BufferOverflowException。
因此,在get/put方法中有对数组操作时,一定要用remaining和hasRemaining函数判断剩余空间,在进行分批操作。
putType/getType
将传入的值,按照相应的type类型存储到缓冲区中。
静态方法:
allocate(int capacity) —— 生成一个固定大小的缓冲区(JVM的堆)
allocateDirect(int capacity) —— 生成一个固定大小的直接缓冲区(直接物理内存),虽然在操作的效率上高效,但是缓冲区的创建和销毁会增加消耗。创建是用Unsafe类进行创建,销毁时用虚引用引导GC对内存进行销毁。但不会立马释放
直接缓冲区和非直接缓冲区的比较:
直接缓冲区的put/get操作的效率要高于非直接缓冲区,因为在直接缓冲区中,put/get操作是直接本地系统的操作进行的,效率比通过jvm要高。
final方法:
clear() —— 将缓冲区的状态变为初始状态(limit = capacity;position = 0;mark = -1),并没有将原先的数据引用清除,准备好新一次的写入。
flip() —— 对缓存区进行反转,这个反转是将buffer从写的状态改变为读的状态(limit = position;position = 0;mark = -1)。
hasArray() —— 判断缓冲区底层是否有可用的数组。hb(数组)为null或者是isReadOnly的均返回false。
hasRemaining() —— 判断当前位置(position)和限制位置(limit)之间是否有元素。可以作为读写时,循环的次数。
rewind() —— 修改缓冲区的状态(position = 0;mark = -1),常用于重新读取缓冲区中的内容。
arrayOffset() —— 返回缓冲区中的offset变量,在写入时,起始值的偏移量
对缓冲区的操作
slice(截取) —— 按照缓冲区现在的状态,截取剩余的缓冲区,并创建一个buffer实例,但是底层的数组是共享的,也就是一边修改另一边也会有影响。
duplicate(复制) —— 复制一个状态与现在的一致的buffer实例,但是底层的数组还是共享的。
compact(压缩) —— 将剩余缓冲区压至缓冲区的最前面。
Byte缓冲区类型转换
利用asTypeBuffer可以将ByteBuffer缓冲区转换成相应类型的缓冲区,可视为一种视图(只允许读取,不允许修改)
缓冲区的比较
使用函数equal和compareTo,比较的先后顺序:
- 是否是自身
- 类型是否一致
- remaining是否一致
- position到limit之间的数据是否一致(之前不比较)
本人根据《NIO与Socket编程技术指南》和源码一起进行分析的,如有不正确的地方请进行指正,谢谢!