【Python 学习_第3周_字符编码】金角大王培训_第三周_字符编解码_心得及网上资料连接

一、计算机编码简介

编码是指示将信息从表示方法A转变为表示方法B,解码是编码的逆过程,信息通过编解码后,信息内容不变。

针对计算机而言,编码就是将信息转为计算机可以识别的二进制0、1数字,而由于各国表示信息的方式不一致(如中文:汽车;美国: bus),因此各国产生了自己的编码规则,比较常用的是

ASCII码:早期计算机编码,在内存占用1个字节(8bit),因此最多能表示256个符号,表示为英文字母和特殊符号。

GBK编码:随着计算机在中国应用,国内编码经历gb2312 – gbk的演变,现应用较多的是GBK编码。GBK占2个字节。

Unicode编码:由于各国采用自己的编码格式,标准组织制定了Unicode编码,兼容各种编码方式,因此又称万国码,占有2个字节。

UTF-8编码:ASCII仅仅占用一个字节,而unicode编码同一为2个字节,为了节省存储空间,提高信息传输速度,产生utf-8编码,又称变字长编码,其中ASCII占1个字节,汉字占3个字节。

注意:文件在硬盘存储的数据是通过某种编码方式编码的bytes字节串,在内存中的数据都是unicode。

二、Python编码转换语句

编解码间转换图

 

 

从utf-8 转成 GBK Python3.x实现代码

Utf8_to_gbk = 变量名.decode(‘utf-8’).encode(‘gbk’)

gbk_to_utf8= 变量名.decode(‘gbk’).encode(‘utf-8’)

三、网上资料

 博客园中发现将的比较好的链接 https://www.cnblogs.com/yuanchenqi/articles/5956943.html

posted @ 2018-06-30 11:30  徐徐前行  阅读(177)  评论(0编辑  收藏  举报