Python3 字符编码到底是个什么鬼
首先ASCII码是美国人自己给自己用的,只针对英文及一系列符号,凭想象预留了编码位置,不料有个东方大国文字过于复杂,预留根本不够,所以这个大国重新搞了个编码gb2312、gbk等,结果就是全世界各国都搞自己的,一旦跨国就乱套了,所以有个国际组织搞了个Unicode ,就是搞了个编码转换平台,各国交流使用时都到我这平台上来转成相应的编码,我给大家提供转码服务,但是但是,这东西对于西方国家来说,这东西太占空间啦,因为ASCII码太简单了用不了我大国这多空间来存字符,所以又搞了个UTF-8实现想长就长,想短就短都能适应,按需占空间,替代Unicode。
Python3目前默认编码为UTF-8,Python2中,这个UTF-8的高度还没被提高到平台级别,也是子集,也许先解码成unicode,但在Python3中,级别提高直接取代Unicode成为了皇上,Unicode退居二线。
实现字符转码使用的就是encode()和decode(),前者括号里写你想转成啥码,后者是转成utf-8,你要在括号里写你现在是啥码,就这点事!!