java io重点整理部分

java io流

1)java io流相关概念

输出流：

输入流：

因此输入和输出都是从程序的角度来说的。

字节流：一次读入或读出是8位二进制。

字符流：一次读入或读出是16位二进制。

字节流和字符流的原理是相同的，只不过处理的单位不同而已。后缀是Stream是字节流，而后缀是Reader，Writer是字符流。

节点流：直接与数据源相连，读入或读出。

直接使用节点流，读写不方便，为了更快的读写文件，才有了处理流。

处理流：与节点流一块使用，在节点流的基础上，再套接一层，套接在节点流上的就是处理流。

2)java io流的分类

按流向分:
输入流: 程序可以从中读取数据的流。
输出流: 程序能向其中写入数据的流。
按数据传输单位分:
字节流: 以字节为单位传输数据的流
字符流: 以字符为单位传输数据的流
按功能分:
节点流: 用于直接操作目标设备的流
过滤流: 是对一个已存在的流的链接和封装，通过对数据进行处理为程序提供功能强大、灵活的读写功能。

3)java io类结构图

流是一个很形象的概念，当程序需要读取数据的时候，就会开启一个通向数据源的流，这个数据源可以是文件，内存，或是网络连接。类似的，当程序需要写入数据的时候，就会开启一个通向目的地的流。这时候你就可以想象数据好像在这其中“流”动一样。Java把这些不同来源和目标的数据都统一抽象为数据流，在Java类库中，IO部分的内容是很庞大的，因为它涉及的领域很广泛:标准输入输出，文件的操作，网络上的数据流，字符串流，对象流，zip文件流，java io 类结构如下：

[1]输入字节流InputStream：InputStream 是所有的输入字节流的父类，它是一个抽象类；ByteArrayInputStream、StringBufferInputStream、 FileInputStream 是三种基本的介质流，它们分别从Byte 数组、StringBuffer、和本地文件中读取数据；PipedInputStream 是从与其它线程共用的管道中读取数据；ObjectInputStream 和所有FilterInputStream 的子类都是装饰流（装饰器模式的主角）。

[2]输出字节流OutputStream：OutputStream 是所有的输出字节流的父类，它是一个抽象类。
ByteArrayOutputStream、FileOutputStream 是两种基本的介质流，它们分别向Byte 数组、和本地文件中写入数据。PipedOutputStream 是向与其它线程共用的管道中写入数据，ObjectOutputStream 和所有FilterOutputStream 的子类都是装饰流。

[3]字节流的输入与输出的对应

图中蓝色的为主要的对应部分，红色的部分就是不对应部分。紫色的虚线部分代表这些流一般要搭配使用。从上面的图中可以看出Java IO 中的字节流是极其对称的。

不对称的类介绍如下：

1>LineNumberInputStream 主要完成从流中读取数据时，会得到相应的行号，至于什么时候分行、在哪里分行是由改类主动确定的，并不是在原始中有这样一个行号。在输出部分没有对应的部分，我们完全可以自己建立一个LineNumberOutputStream，在最初写入时会有一个基准的行号，以后每次遇到换行时会在下一行添加一个行号，看起来也是可以的。好像更不入流了。
2>PushbackInputStream 的功能是查看最后一个字节，不满意就放入缓冲区。主要用在编译器的语法、词法分析部分。输出部分的BufferedOutputStream 几乎实现相近的功能。
3>StringBufferInputStream 已经被Deprecated，本身就不应该出现在InputStream 部分，主要因为String 应该属于字符流的范围。已经被废弃了，当然输出部分也没有必要需要它了！还允许它存在只是为了保持版本的向下兼容而已。
4>SequenceInputStream 可以认为是一个工具类，将两个或者多个输入流当成一个输入流依次读取。完全可以从IO 包中去除，还完全不影响IO 包的结构，却让其更“纯洁”――纯洁的Decorator 模式。
5>PrintStream 也可以认为是一个辅助工具。主要可以向其他输出流，或者FileInputStream 写入数据，本身内部实现还是带缓冲的。本质上是对其它流的综合运用的一个工具而已。一样可以踢出IO 包！System.out 和System.out 就是PrintStream 的实例！

[4]字符输入流Reader：Reader 是所有的输入字符流的父类，它是一个抽象类;CharReader、StringReader 是两种基本的介质流，它们分别将Char 数组、String中读取数据;PipedReader 是从与其它线程共用的管道中读取数据;BufferedReader 很明显就是一个装饰器，它和其子类负责装饰其它Reader 对象;FilterReader 是所有自定义具体装饰流的父类，其子类PushbackReader 对Reader 对象进行装饰，会增加一个行号;InputStreamReader 是一个连接字节流和字符流的桥梁，它将字节流转变为字符流。FileReader 可以说是一个达到此功能、常用的工具类，在其源代码中明显使用了将FileInputStream 转变为Reader 的方法。我们可以从这个类中得到一定的技巧。Reader 中各个类的用途和使用方法基本和InputStream 中的类使用一致。

[5]字符输出流Writer：Writer 是所有的输出字符流的父类，它是一个抽象类；CharArrayWriter、StringWriter 是两种基本的介质流，它们分别向Char 数组、String 中写入数据。PipedWriter 是向与其它线程共用的管道中写入数据，BufferedWriter 是一个装饰器为Writer 提供缓冲功能；PrintWriter 和PrintStream 极其类似，功能和使用也非常相似；
OutputStreamWriter 是OutputStream 到Writer 转换的桥梁，它的子类FileWriter 其实就是一个实现此功能的具体类（具体可以研究一SourceCode）。

[6]字符流的输入与输出的对应

[8]字符流与字节流转换

转换流的特点：
其是字符流和字节流之间的桥梁
可对读取到的字节数据经过指定编码转换成字符
可对读取到的字符数据经过指定编码转换成字节
何时使用转换流？
当字节和字符之间有转换动作时；
流操作的数据需要编码或解码时。
具体的对象体现：
InputStreamReader:字节到字符的桥梁
OutputStreamWriter:字符到字节的桥梁
这两个流对象是字符体系中的成员，它们有转换作用，本身又是字符流，所以在构造的时候需要传入字节流对象进来。

4)java 管道通信

Java提供管道功能，实现管道通信的类有两组：PipedInputStream和PipedOutputStream或者是PipedReader和PipedWriter。管道通信主要用于不同线程间的通信。
一个PipedInputStream实例对象必须和一个 PipedOutputStream实例对象进行连接而产生一个通信管道。PipedOutputStream向管道中写入数据，PipedIntputStream读取PipedOutputStream向管道中写入的数据。一个线程的PipedInputStream对象能够从另外一个线程的PipedOutputStream对象中读取数据。

[java] view plain copy

//Sender类
package pipeCommu;
import java.io.PipedInputStream;
import java.io.PipedOutputStream;
public class Sender extendsThread{
private PipedOutputStream out=new PipedOutputStream();//发送者创建PipedOutputStream向外写数据;
public PipedOutputStream getOut(){
return out;
}
public void run(){
String strInfo="hello,receiver";
try{
out.write(strInfo.getBytes());//写入数据
out.close();
}catch(Exception e){
e.printStackTrace();
}
}
}
//Reader类，负责接收数据
package pipeCommu;
import java.io.PipedInputStream;
public class Reader extends Thread{
private PipedInputStream in=new PipedInputStream();//发送者创建PipedOutputStream向外写数据
public PipedInputStream getIn(){
returnin;
}
public void run(){
byte[] buf=new byte[1024];//声明字节数组
try{
int len=in.read(buf);//读取数据，并返回实际读到的字节数
System.out.println("receive from sender:"+newString(buf,0,len));
in.close();
}catch(Exception e){
e.printStackTrace();
}
}
}
package pipeCommu;
import java.io.*;
public class PipedStream {
public static void main(String[] args) throws Exception{
Sender send=new Sender();
Reader read=new Reader();
PipedOutputStream out=send.getOut();
PipedInputStream in=read.getIn();
out.connect(in);//或者也可以用in.connect(out);
send.start();
read.start();
}
}
package pipeCommu;
import java.io.*;
public class PipedCommu {
public static void main(String[] args) {
// TODOAuto-generatedmethodstub
try{
PipedReader reader=new PipedReader();
PipedWriter writer=new PipedWriter(reader);
Thread a=new Send(writer);
Thread b=new Read(reader);
a.start();
Thread.sleep(1000);
b.start();
}catch(IOException e){
e.printStackTrace();
}catch(InterruptedException e1){
e1.printStackTrace();
}
}
}
class Send extends Thread{
PipedWriter writer;
public Send(PipedWriter writer){
this.writer=writer;
}
public void run(){
try{
writer.write("this is a.hello world".toCharArray());
writer.close();
}catch(IOException e){
e.printStackTrace();
}
}
}
class Read extends Thread{
PipedReader reader;
public Read(PipedReader reader){
this.reader=reader;
}
public void run(){
System.out.println("this is B");
try{
char[] buf=new char[1000];
reader.read(buf,0,100);
System.out.println(new String(buf));
}catch(Exception e){
e.printStackTrace();
}
}
}

5)java 对象序列化

对于一个存在Java虚拟机中的对象来说，其内部的状态只是保存在内存中。JVM退出之后，内存资源也就被释放，Java对象的内部状态也就丢失了。而在很多情况下，对象内部状态是需要被持久化的，将运行中的对象状态保存下来(最直接的方式就是保存到文件系统中)，在需要的时候可以还原，即使是在 Java虚拟机退出的情况下。
对象序列化机制是Java内建的一种对象持久化方式，可以很容易实现在JVM中的活动对象与字节数组(流)之间进行转换，使用得Java对象可以被存储，可以被网络传输，在网络的一端将对象序列化成字节流，经过网络传输到网络的另一端，可以从字节流重新还原为Java虚拟机中的运行状态中的对象。

对于任何需要被序列化的对象，都必须要实现接口Serializable，它只是一个标识接口，本身没有任何成员，只是用来标识说明当前的实现类的对象可以被序列化。

如果在类中的一些属性，希望在对象序列化过程中不被序列化，使用关键字transient标注修饰就可以。当对象被序列化时，标注为transient的成员属性将会自动跳过。

注：

[1].当一个对象被序列化时，只保存对象的非静态成员变量，不能保存任何的成员方法,静态的成员变量和transient标注的成员变量。
　 [2].如果一个对象的成员变量是一个对象，那么这个对象的数据成员也会被保存还原，而且会是递归的方式。
　 [3].如果一个可序列化的对象包含对某个不可序列化的对象的引用，那么整个序列化操作将会失败，并且会抛出一个NotSerializableException。可以将这个引用标记transient,那么对象仍然可以序列化。

java对象序列化示例代码：

实体类：

[java] view plain copy

class Student implements Serializable{
private String name;
private transient int age;
private Course course;
public void setCourse(Course course){
this.course = course;
}
public Course getCourse(){
return course;
}
public Student(String name, int age){
this.name = name;
this.age = age;
}
public String toString(){
return "Student Object name:"+this.name+" age:"+this.age;
}
}
class Course implements Serializable{
private static String courseName;
private int credit;
public Course(String courseName, int credit){
this.courseName = courseName;
this.credit = credit;
}
public String toString(){
return "Course Object courseName:"+courseName
+" credit:"+credit;
}
}

将对象写入文件序列化

[java] view plain copy

public class TestWriteObject{
public static void main(String[] args) {
String filePath = "C://obj.txt";
ObjectOutputStream objOutput = null;
Course c1 = new Course("C language", 3);
Course c2 = new Course("OS", 4);
Student s1 = new Student("king", 25);
s1.setCourse(c1);
Student s2 = new Student("jason", 23);
s2.setCourse(c2);
try {
objOutput = new ObjectOutputStream(new FileOutputStream(filePath));
objOutput.writeObject(s1);
objOutput.writeObject(s2);
objOutput.writeInt(123);
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}finally{
try {
objOutput.close();
} catch (IOException e) {
e.printStackTrace();
}
}
System.out.println("Info:对象被写入"+filePath);
}

从文件中读取对象，反序列化

[java] view plain copy

public class TestReadObject {
public static void main(String[] args) {
String filePath = "C://obj.txt";
ObjectInputStream objInput = null;
Student s1 = null,s2 = null;
int intVal = 0;
try {
objInput = new ObjectInputStream(new FileInputStream(filePath));
s1 = (Student)objInput.readObject();
s2 = (Student)objInput.readObject();
intVal = objInput.readInt();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}catch(ClassNotFoundException cnfe){
cnfe.printStackTrace();
}finally{
try {
objInput.close();
} catch (IOException e) {
e.printStackTrace();
}
}
System.out.println("Info:文件"+filePath+"中读取对象");
System.out.println(s1);
System.out.println(s1.getCourse());
System.out.println(s2);
System.out.println(s2.getCourse());
System.out.println(intVal);
}
}

7、java nio

1)java nio简介

nio 是 java New IO 的简称，在 jdk1.4 里提供的新 api 。 Sun 官方标榜的特性如有：为所有的原始类型提供 (Buffer) 缓存支持；字符集编码解码解决方案；Channel ：一个新的原始 I/O 抽象；支持锁和内存映射文件的文件访问接口；提供多路 (non-bloking) 非阻塞式的高伸缩性网络 I/O 。

2)java nio非阻塞原理

一个常见的网络 IO 通讯流程如下 :

从该网络通讯过程来理解一下何为阻塞 :在以上过程中若连接还没到来，那么 accept 会阻塞 , 程序运行到这里不得不挂起， CPU 转而执行其他线程。在以上过程中若数据还没准备好， read 会一样也会阻塞。阻塞式网络 IO 的特点：多线程处理多个连接。每个线程拥有自己的栈空间并且占用一些 CPU 时间。每个线程遇到外部未准备好的时候，都会阻塞掉。阻塞的结果就是会带来大量的进程上下文切换。且大部分进程上下文切换可能是无意义的。比如假设一个线程监听一个端口，一天只会有几次请求进来，但是该 cpu 不得不为该线程不断做上下文切换尝试，大部分的切换以阻塞告终。

何为非阻塞？
下面有个隐喻：
一辆从 A 开往 B 的公共汽车上，路上有很多点可能会有人下车。司机不知道哪些点会有哪些人会下车，对于需要下车的人，如何处理更好？
1. 司机过程中定时询问每个乘客是否到达目的地，若有人说到了，那么司机停车，乘客下车。 ( 类似阻塞式 )
2. 每个人告诉售票员自己的目的地，然后睡觉，司机只和售票员交互，到了某个点由售票员通知乘客下车。 ( 类似非阻塞 )
很显然，每个人要到达某个目的地可以认为是一个线程，司机可以认为是 CPU 。在阻塞式里面，每个线程需要不断的轮询，上下文切换，以达到找到目的地的结果。而在非阻塞方式里，每个乘客 ( 线程 ) 都在睡觉 ( 休眠 ) ，只在真正外部环境准备好了才唤醒，这样的唤醒肯定不会阻塞。
非阻塞的原理
把整个过程切换成小的任务，通过任务间协作完成。由一个专门的线程来处理所有的 IO 事件，并负责分发。事件驱动机制：事件到的时候触发，而不是同步的去监视事件。线程通讯：线程之间通过 wait,notify 等方式通讯。保证每次上下文切换都是有意义的。减少无谓的进程切换。

以下是异步 IO 的结构：

Reactor 就是上面隐喻的售票员角色。每个线程的处理流程大概都是读取数据、解码、计算处理、编码、发送响应。
异步 IO 核心 API：

Selector：异步 IO 的核心类，它能检测一个或多个通道 (channel) 上的事件，并将事件分发出去。使用一个 select 线程就能监听多个通道上的事件，并基于事件驱动触发相应的响应。而不需要为每个 channel 去分配一个线程。
SelectionKey：包含了事件的状态信息和时间对应的通道的绑定。

3)Buffer结构、主要方法

Buffer内部结构如图：

一个 buffer 主要由 position,limit,capacity 三个变量来控制读写的过程。此三个变量的含义见如下表格：

参数	写模式	读模式
position	当前写入的单位数据数量。	当前读取的单位数据位置。
limit	代表最多能写多少单位数据和容量是一样的。	代表最多能读多少单位数据，和之前写入的单位数据量一致。
capacity	buffer 容量	buffer 容量

Buffer 常见方法：
flip(): 写模式转换成读模式
rewind() ：将 position 重置为 0 ，一般用于重复读。
clear() ：清空 buffer ，准备再次被写入 (position 变成 0 ， limit 变成 capacity) 。
compact(): 将未读取的数据拷贝到 buffer 的头部位。
mark() 、 reset():mark 可以标记一个位置， reset 可以重置到该位置。
Buffer 常见类型： ByteBuffer 、 MappedByteBuffer 、 CharBuffer 、 DoubleBuffer 、 FloatBuffer 、 IntBuffer 、 LongBuffer 、ShortBuffer 。
channel 常见类型 :FileChannel 、 DatagramChannel(UDP) 、 SocketChannel(TCP) 、 ServerSocketChannel(TCP)

4)Buffer、Chanel

Channel 和 buffer 是 NIO 是两个最基本的数据类型抽象。Buffer:是一块连续的内存块，是 NIO 数据读或写的中转地；Channel:数据的源头或者数据的目的地，用于向 buffer 提供数据或者读取 buffer 数据，buffer 对象的唯一接口，支持异步 I/O 。chanel与Buffer关系如下：

Buffer、Chanel使用例子：

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.nio.ByteBuffer;
import java.nio.channels.FileChannel;
public class CopyFile {
public static void main(String[] args) throws Exception {
String infile = "C:\\copy.sql";
String outfile = "C:\\copy.txt";
// 获取源文件和目标文件的输入输出流
FileInputStream fin = new FileInputStream(infile);
FileOutputStream fout = new FileOutputStream(outfile);
// 获取输入输出通道
FileChannel fcin = fin.getChannel();
FileChannel fcout = fout.getChannel();
// 创建缓冲区
ByteBuffer buffer = ByteBuffer.allocate(1024);
while (true) {
// clear方法重设缓冲区，使它可以接受读入的数据
buffer.clear();
// 从输入通道中将数据读到缓冲区
int r = fcin.read(buffer);
// read方法返回读取的字节数，可能为零，如果该通道已到达流的末尾，则返回-1
if (r == -1) {
break;
}
// flip方法让缓冲区可以将新读入的数据写入另一个通道
buffer.flip();
// 从输出通道中将数据写入缓冲区
fcout.write(buffer);
}
}
}

5)nio.charset

字符编码解码 : 字节码本身只是一些数字，放到正确的上下文中被正确被解析。向 ByteBuffer 中存放数据时需要考虑字符集的编码方式，读取展示 ByteBuffer 数据时涉及对字符集解码。Java.nio.charset 提供了编码解码一套解决方案。
以我们最常见的 http 请求为例，在请求的时候必须对请求进行正确的编码。在得到响应时必须对响应进行正确的解码。
以下代码向 baidu 发一次请求，并获取结果进行显示。例子演示到了 charset 的使用。

[java] view plain copy

package nio.readpage;
import java.nio.ByteBuffer;
import java.nio.channels.SocketChannel;
import java.nio.charset.Charset;
import java.net.InetSocketAddress;
import java.io.IOException;
public class BaiduReader {
private Charset charset = Charset.forName("GBK");// 创建GBK字符集
private SocketChannel channel;
public void readHTMLContent() {
try {
InetSocketAddress socketAddress = new InetSocketAddress(
"www.baidu.com", 80);
//step1:打开连接
channel = SocketChannel.open(socketAddress);
//step2:发送请求，使用GBK编码
channel.write(charset.encode("GET " + "/ HTTP/1.1" + "\r\n\r\n"));
//step3:读取数据
ByteBuffer buffer = ByteBuffer.allocate(1024);// 创建1024字节的缓冲
while (channel.read(buffer) != -1) {
buffer.flip();// flip方法在读缓冲区字节操作之前调用。
System.out.println(charset.decode(buffer));
// 使用Charset.decode方法将字节转换为字符串
buffer.clear();// 清空缓冲
}
} catch (IOException e) {
System.err.println(e.toString());
} finally {
if (channel != null) {
try {
channel.close();
} catch (IOException e) {
}
}
}
}
public static void main(String[] args) {
new BaiduReader().readHTMLContent();
}
}

注：本文java io流部分内容参考博客：《java io流分析整理》http://blog.csdn.net/llhhyy1989/article/details/7388059、《java Io流学习总结》http://blog.csdn.net/heliteng/article/details/12812715、《java 对象序列化》http://yuyiming.iteye.com/blog/1277089

posted @ 2015-10-26 20:00 涂文鼎阅读(225) 评论(0) 收藏举报

刷新页面返回顶部

涂文鼎

java io重点整理部分

公告