Python编码相关
-
编码
- ascii,只支持英文,8位表示一个字符,2**8
- unicode,万国码,32位表示一个字符,2**32
- utf-8,压缩unicode,用尽量少的位数表示一个字符,以8位为单位
-
python解释器编码
-
py2: ascii,指定编码,文件头部加:
# -*- coding:utf-8 -*-
-
py3: 默认为utf-8
-
-
文件编码
- 建议:编写文件时,保存文件用utf-8格式。
- 以书面编码保存,用什么编码方式打开,否则会乱码。
-
unicode & utf-8
unicode在内存中数据计算时使用。utf-8在存储硬盘,或者网络io时使用,达到节省空间的效果。
由于utf-8是压缩的unicode,两者在数据从硬盘到内存之间可转换使用。