C# 字符编码简介
第一个字符编码是英文编码ASCII,后来每个国家都有了自己的字符编码,都是从ASCII扩展而来的,都兼容ASCII编码。
GB2312:简体中文,英文占一个字节,中文占两个字节
GBK:兼容GB2312,英文占一个字节,中文占两个字节
Big5:繁体中文;
Unicode:国际编码,中英文都是连个字节;
UTF-8:国际编码,英文占一个字节,中文占三个字节
计算机再解释各种编码时都是先找到存储文本编码对应的16进制值,再将其转换成10进制,再转换成2进制,计算机就知道是什么文本了
输出Encoding.GetEncodings();得到支持所有的编码;
System.Text.Encoding.GetEncoding("UTF-8"); 指定默认编码;
String str=File.ReadAllText("11.txt",Encoding.GetEncoding("utf-8")); //以utf-8格式得到文本
//Encoding.Default表示参与的是计算机默认的“区域和语言“中的编码格式,由于我们计算机默认的都是简体中文,所以再建立文本文件时
//计算机默认的是ANSI,则表示简体中文。
Sting str=File.ReadAllText("11.txt",Encoding.Default); //表示可以