字符集
字符(Character)是各种文字和符号的总称
符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。
对中文字符进行编码,是中文信息交流的技术基础。
ASCII
BIG5
GB18030
新增用途:满足中国大陆、香港、台湾、日本和韩国等东亚地区信息交换多文种、大字量、多用途、统一编码格式的要求。并且与Unicode 3.0版本兼容,填补Unicode扩展字符字汇“统一汉字扩展A”的内容。并且与以前的国家字符编码标准(GB2312,GB13000.1)兼容。
Unicode
定义:由一个名为 Unicode 学术学会(Unicode Consortium)的机构制订的字符编码系统,支持现今世界各种不同语言的书面文本的交换、处理及显示
编码方法:在书写时在前面加上前缀“U+”,例如字母“A”的编码为 004116,所以“A”的编码书写为“U+0041”。
utf是把Unicode转做某种格式的意思。
![](https://images2015.cnblogs.com/blog/1009598/201609/1009598-20160922181802152-1789811712.jpg)