InputStreamReader解决读取文本中文乱码

创建一个txt文本,文本采用的编码格式是ANSI,首先FileInputStream从a.txt文件读取,并且一个字节一个字节传给InputStreamReader,当返回三个字节时(UTF-8是三个字节为1个汉字),FileInputStream就去UTF-8表中找所对应的中文汉字。结果显而易见,所以出现乱码.所以要将“UTF-8"设置为"GBK”,或者将txt文本的编码格式改为UTF-8

复制代码
 1  /**
 2      * http://127.0.0.1:8080/zifuliu/du
 3      * 字符流,输入流,读
 4      * 高效流
 5      * @return
 6      * @throws IOException
 7      */
 8     @RequestMapping("/du")
 9     public String du()throws IOException {
10         //使用默认编码
11         InputStreamReader inputStreamReader = new InputStreamReader(new FileInputStream("D:/aaa.txt"),"utf-8");
12         BufferedReader bufferedReader = new BufferedReader(inputStreamReader);
13         String str;
14         StringBuilder stringBuilder = new StringBuilder();
15         while ((str=bufferedReader.readLine())!=null){
16             System.out.println("====>字符流:"+str);
17             stringBuilder.append(str);
18         }
19         bufferedReader.close();
20         return stringBuilder.toString();
21     }
复制代码

 

 

gbk和utf-8区别?

区别:GBK主要用于中文编码,包含全部中文字符,utf8包含全世界所有国家需要用到的字符;utf8比较灵活,长度在1-6个字节,GBK的长度为2个字节,和GBK相比,utf8会占用更多的数据库存储空间。

 

posted @   LY-留言  阅读(2922)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 通过 API 将Deepseek响应流式内容输出到前端
点击右上角即可分享
微信分享提示