decoder:解码--> 将文件内容转换为字符对象;

encoder:编码-->将字符对象转换为字节或者字节数组;

 

ASCII  (American Standard for Information Tnterchange )  使用7 bit 表示一个字符,共计表示128字符

ISO-8859-1 :八bit 表示一个字符 ,即用一个字节表示一个字符 ,表示256个字符

gb2312:  中华人民共和国制定, 两个字节表示一个汉字,没有考虑生僻字,表示汉字不全(中国制定)

gbk :  gb2312 扩展,表示汉字数量超过gb2312(中国制定)

gb18030  :对gbk 扩展;(中国制定)

big5 :繁体中文

unicode :表示全世界的所有字符,统一的采用两个字节表示一个字符; 问题出现:存储容量问题出现,原来一个字节表示的字符,现在用两个,容量堪忧

      UTF(unicode Transiation Format 即unicode 转换格式),是一种存储格式

 

    unicode 是一个编码方式,而UTF 是存储方式,UTF-8 是unicode的实现方式之一

UTF-8 :变长的字节表示形式,意思就是,一个英文我就占用1个字节,汉字就三个字节方式存储

    

posted on 2018-09-22 11:05  iscys  阅读(153)  评论(0编辑  收藏  举报