练习_文件复制与使用字节流读取中文的问题与字符输入流_Reader类&FileReader类介绍
练习_文件复制
图片复制复制原理图解
原理:从已有文件中读取字节,将该字节写出到另一个文件中
明确:
数据源:c:\a.jpg
数据目的地:d:\a.jpg
文件复制的步骤:
1.创建一个字节输入流对象,构造方法中绑定要读取的数据源
2.创建一个字节输出流对象,构造方法中绑定要写入的目的地
3.使用字节输入流对象中的方法read读取文件
4.使用字节输出流中的方法write,把读取到的字节写入到目的地的文件中
5.释放资源
package DemoOutputStream; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; /* 文件复制练习:一都一写 明确: 数据源:c.txt 数据目的地:a.txt 文件复制的步骤: 1.创建一个字节输入流对象,构造方法中绑定要读取的数据源 2.创建一个字节输出流对象,构造方法中绑定要写入的目的地 3.使用字节输入流对象中的方法read读取文件 4.使用字节输出流中的方法write,把读取到的字节写入到目的地的文件中 5.释放资源 */ public class Demo01File { public static void main(String[] args) throws IOException { long s = System.currentTimeMillis(); // 1.创建一个字节输入流对象,构造方法中绑定要读取的数据源 FileInputStream fis = new FileInputStream("c.txt"); // 2.创建一个字节输出流对象,构造方法中绑定要写入的目的地 FileOutputStream fos = new FileOutputStream("a.txt"); //一次读取一个字节写入一个字节的方式 // 3.使用字节输入流对象中的方法read读取文件 /* int len = 0; while ((len=fis.read())!=-1 ){ // 4.使用字节输出流中的方法write,把读取到的字节写入到目的地的文件中 fos.write(len); }*/ //使用数组缓冲读取多个字节,写入多个字节 byte[] bytes = new byte[1024]; //3.使用字节输入流对象中的方法read读取文件 int len = 0;//每次读取的有效字节个数 while ((len=fis.read(bytes))!=-1){ // 4.使用字节输出流中的方法write,把读取到的字节写入到目的地的文件中 fos.write(bytes,0,len); } // 5.释放资源(先关闭写的,后关闭读的;如果写完了,肯定读取完毕了) fos.close(); fis.close(); long e = System.currentTimeMillis(); System.out.println("复制文件共耗时:"+(e-s)+"毫秒"); } }
使用字节流读取中文的问题
package DemoOutputStream; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; /* 使用字节流读取中文文件 1个中文 GBK:占用两个字节 UTF-8:占用3个字节 */ public class Demo04InputStream { public static void main(String[] args) throws IOException { FileInputStream fis = new FileInputStream("j.txt"); int len = 0; while ((len = fis.read())!=-1){ System.out.println((char) len); } fis.close(); } }
多初学者在学到字节输入流时都有一个疑惑,当使用字节输入流(FileInputStream)读取数字字母时会正常读取,而读取中文数据时会出现中文乱码的情况,是不是读取中文数据非得使用字符输入流来读取呢?其实字节输入流一样是可以读取中文数据的。
看你使用的是什么开发工具,idea的话是默认使用utf-8编码的,使用eclipse的小伙伴需要手动改成utf-8,具体怎么改这里不介绍了。
首先应该明确两点:utf-8编码1个中文占3个字节,gbk编码1个中文占2个字节
所以当我们读取中文数据采用的是一次读取一个字节的方式,始终会报错,假如你的开发工具改的是gbk编码,那么每次读取到该中文字符的1/2个字节,utf-8的话每次读取到的是1/3个字节,所以读取中文数据不能采用该方式读取。只能使用每次读取一个字节数组的方式来读取
当我们使用记事本中存储汉字时默认是ANSI编码,其实就是GBK编码。如果开发工具已经改为了utf-8,读取中文数据要想不乱码,可以使用String类的一个构造方法
String(byte[] bytes, int offset, int length, Charset charset)
将charset改为gbk即可,下面看具体代码
package DemoOutputStream; import java.io.FileInputStream; import java.io.IOException; public class FileInputStreamDemo06 { public static void main(String[] args) throws IOException { FileInputStream fis = new FileInputStream("G:\\XQ1.01\\网站原型\\WPS Office\\11.1.0.11365\\office6\\addons\\cef\\locales\\c.txt"); int len; byte[] bytes = new byte[1024]; while ((len = fis.read(bytes)) != -1) { System.out.print(new String(bytes, 0, len, "GBK")); } fis.close(); } }
因为gbk编码一个中文字符占用两个字节,所以这里定义一个长度为2的字节数组,当然也可以是2的整数倍
运行结果
要想不出现乱码还可以将记事本的编码改为utf-8,改编码的方式可以将刚才的文件另存,具体步骤如下
这里就可以使用String类的另外一个构造方法
String(byte[] bytes, int offset, int length)
因为记事本改为了utf-8就和开发工具的编码想同了,但是这里定义数组的时候需要定义为长度为3。
总结:以上的做法其实意义不大,读取中文数据的时候我们最好还是使用字符输入流进行读取
package DemoOutputStream; /* java.io.Reader:字符输入流,是字符输入流的最顶层的父类,定义了一些共性的成员方法,是一个抽象类共性的成员方法:一 int read()读取单个字符并返回。 int read (char[ ] cbuf)一次读取多个字符,将字符读入数组。 void close()关闭该流并释放与之关联的所有资源。 java.io.FiLeReader extends InputStreamReader extends ReaderFiLeReader:文件字符输入流 作用:把硬盘文件中的数据以字符的方式读取到内存中 构造方法: FiLeReader(string fiLeName) FiLeReader(File file) 参数:读取文件的数据源 String fiLeName :文件的路径File file:一个文件 FiLeReader构造方法的作用: 1.创建一个FiLeReader对象 2.会把FiLeReader对象指向要读取的文件 */ public class Demo02Reader { }