C#中StreamReader读取中文文本出现乱码的解决方法
在编写文本文件读写程序的过程中,有如下代码
StreamReader sr = new StreamReader(FileName);
结果发现打开中文文本文件出现乱码。
究其原因,原来自从Windows 2000之后的操作系统在文件处理时默认编码采用Unicode,所以.Net 的文件默认编码也是Unicode。除非另外指定,StreamReader 的默认编码为 Unicode,而不是当前系统的 ANSI 代码页。但是文档大部分还是以ANSI编码储存,中文文本使用的是gb2312,所以才造成中文乱码的状况,也就是说在读取文本的时候要指定编码格式。
但是问题来了,System.Text.Encoding 里面一堆编码格式ASCII、UTF-8等等,要选哪一个好?
其实很简单,用
System.Text.Encoding.Default 告诉
StreamReader 目前操作系统的编码即可。
StreamReader reader = new StreamReader(FileName, System.Text.Encoding.Default)
StreamReader sr = new StreamReader(FileName);
结果发现打开中文文本文件出现乱码。
究其原因,原来自从Windows 2000之后的操作系统在文件处理时默认编码采用Unicode,所以.Net 的文件默认编码也是Unicode。除非另外指定,StreamReader 的默认编码为 Unicode,而不是当前系统的 ANSI 代码页。但是文档大部分还是以ANSI编码储存,中文文本使用的是gb2312,所以才造成中文乱码的状况,也就是说在读取文本的时候要指定编码格式。
但是问题来了,System.Text.Encoding 里面一堆编码格式ASCII、UTF-8等等,要选哪一个好?
其实很简单,用
System.Text.Encoding.Default 告诉
StreamReader 目前操作系统的编码即可。
StreamReader reader = new StreamReader(FileName, System.Text.Encoding.Default)