InputStreamReader解决读取文本中文乱码
创建一个txt文本,文本采用的编码格式是ANSI,首先FileInputStream从a.txt文件读取,并且一个字节一个字节传给InputStreamReader,当返回三个字节时(UTF-8是三个字节为1个汉字),FileInputStream就去UTF-8表中找所对应的中文汉字。结果显而易见,所以出现乱码.所以要将“UTF-8"设置为"GBK”,或者将txt文本的编码格式改为UTF-8
1 /** 2 * http://127.0.0.1:8080/zifuliu/du 3 * 字符流,输入流,读 4 * 高效流 5 * @return 6 * @throws IOException 7 */ 8 @RequestMapping("/du") 9 public String du()throws IOException { 10 //使用默认编码 11 InputStreamReader inputStreamReader = new InputStreamReader(new FileInputStream("D:/aaa.txt"),"utf-8"); 12 BufferedReader bufferedReader = new BufferedReader(inputStreamReader); 13 String str; 14 StringBuilder stringBuilder = new StringBuilder(); 15 while ((str=bufferedReader.readLine())!=null){ 16 System.out.println("====>字符流:"+str); 17 stringBuilder.append(str); 18 } 19 bufferedReader.close(); 20 return stringBuilder.toString(); 21 }
gbk和utf-8区别?
区别:GBK主要用于中文编码,包含全部中文字符,utf8包含全世界所有国家需要用到的字符;utf8比较灵活,长度在1-6个字节,GBK的长度为2个字节,和GBK相比,utf8会占用更多的数据库存储空间。