C# 字符编码简介

 第一个字符编码是英文编码ASCII,后来每个国家都有了自己的字符编码,都是从ASCII扩展而来的,都兼容ASCII编码。
 GB2312:简体中文,英文占一个字节,中文占两个字节
 GBK:兼容GB2312,英文占一个字节,中文占两个字节
 Big5:繁体中文;
 Unicode:国际编码,中英文都是连个字节;
 UTF-8:国际编码,英文占一个字节,中文占三个字节

计算机再解释各种编码时都是先找到存储文本编码对应的16进制值,再将其转换成10进制,再转换成2进制,计算机就知道是什么文本了 
 
 输出Encoding.GetEncodings();得到支持所有的编码;
 System.Text.Encoding.GetEncoding("UTF-8"); 指定默认编码;
 String str=File.ReadAllText("11.txt",Encoding.GetEncoding("utf-8"));  //以utf-8格式得到文本
 //Encoding.Default表示参与的是计算机默认的“区域和语言“中的编码格式,由于我们计算机默认的都是简体中文,所以再建立文本文件时
 //计算机默认的是ANSI,则表示简体中文。
 Sting str=File.ReadAllText("11.txt",Encoding.Default);    //表示可以
 

posted @ 2012-10-06 12:25  勤奋的小码  阅读(644)  评论(0编辑  收藏  举报