python心得二(编码问题)

内容编码

字码发展
1.ascii(只识别英文)
8位就可以表示所有英文,字符数字,1个字节就可以

2.unicode(万国码)
最少两个字节
中文三个字节

3.utf-8
万国码存在空间浪费
英文8位
中文24位

PYTHON 3默认就是UTF-8编码 不需加#coding:utf-8

编程和解码

utf-8或者gbk等编码都是,由万国码编码而来的这个过程叫做(编码),将utf-8在还原成万国码这个过程叫做(解码)

decode()   函数 为解码  函数值:为要解码的编码(原本编码)

    使用方法:要解码的字符串变量.decode(要解码的编码)

     如:jiem = zifu.decode("utf-8")

encode() 函数 为编码  函数值:为要编的码(编码)

    使用方法:要编码的解码变量.decode(要编的码)

注意:如果是python3.5或者以上版本,可以省略解码的环境,直接第二步重新编码就可以,也就是可以直接将utf-8直接编码成gbk,(解码的过程解释器会自动完成)

 

posted @ 2018-01-05 10:35  我爱在伊甸园吃苹果  阅读(162)  评论(0编辑  收藏  举报