python:汉字编码

汉字编码

国标系列:

    GB18030 (二字节或四字节编码, 共27533个字)

    GBK (二字节编码, 共21003个字)

    GB2312 (二字节编码,共6763个汉字) (Windows常用)

国际标准:

     UNICODE <---> UTF-8 (Linux / Mac OS X / IOS / Android 等常用)

python编码字符串:

       'gb2312'   

       'gbk'       

      'gb18030'         

      'utf-8'         

      'ascii' ...

      以上字符串用于encode和 decode中

编码注释:

    在python源文件的第一行或第二行写入如下内容:

      # -*- coding:gbk -*-                  # 设置源文件编码格式为gbk

      或 # -*- coding:utf-8 -*-         # 设置源文件编码格式为utf-8

       作用: 告诉解释执行器,此前文件的编码是什么

posted @ 2020-05-25 22:01  昱成  阅读(1323)  评论(0编辑  收藏  举报