重点是一个编码与解码:

字符编码:
二进制
--->ASCII码 : 只能存英文,数字和拉丁字符。一个字符占一个字节,8位
--->gb2312: 只有6700多个中文,1980
--->gbk1.0: 存了2万多个字符,1995
--->gb18030: 2000,27000中文


---->unicode: utf-32 : 一个字符占4个字节
---->unicode: utf-16 : 一个字符占2个字节或者2个以上,65535.
---->unicode: utf-8 : 一个英文用ASCII来存,一个中文占3个字节。


编码 encode 解码decode

In python2
默认编码是ASCII
in python3
默认unicode
encode除了编码的同时,还会将处ASCII中的其他转为byte类型
decode除了解码的同时,还会将处ASCII中的byte类型转为字符类型

这个的了解不是很好,但是重点是要求懂得转换不同的编码格式。这个多用于不同语言的转换中的,这里将不同语言先转换成unicode的格式,然后在解码它。这样就能够保证语言的转换了。但是有的时候
还需要保证环境的编码格式正确,这样才能使得字符串正常的输出。