Python的小数据池和编码解码

1、小数据池

  代码块:  一个模块, 一个函数, 一个类, 甚至每一个command命令都是一个代码块. 一个文件也是一个代码块.而不需要创建一个新的数据. 这样会节省更多的内存区域.

      在cmd命令行执行python时,每一条代码就是一个代码块; 

         在pycharm中执行文件时,每一个.py文件就是一个代码块.

  is:  判断的是两者的内存地址是否一致.   print(id(变量))  ----> 查内存地址

  ==:  判断两者值是否一致.

  小数据池:  一种缓存机制, 可以快速地创建字符串对象, 以减少内存的浪费 (只针对整数, 字符串, bool). 

      在python中对-5到256之间的整数会被驻留在内存中, 并将一定规则的字符串缓存. 在使用时, 内存中只会创建一个给数据的对象, 保存在小数据池中. 当使用的时候直接从小数据池中获取对象的内存引用, 而不需要创建一个新的数据, 这样就会节省更多的内存区域.

      对于整数:  -5 到 256

      对于字符串: 只针对含有字母,数字,下划线式并且字符长度不大于20的字符串会缓存(汉字不会缓存).

2、编码解码

  ASCII(含数字,字母和特殊字符) :  8位  1字节  

  gbk(国标码,含有6w多个汉字):    16位  2字节

  Unicode(万国码):         32位  4字节  (太长不适合传输和保存)

  utf-8(可变长度的unicode):       24位  英文1字节, 欧洲文字2字节, 中文3字节  (适合传输和保存)

  在python 3的内存中,用的是unicode, 在python 2中用的是ASCII.

  程序在运行的时候, 使用的是unicode编码方式, 因为unicode是万国码, 什么内容都可以进行显示, 在数据传输和存储时候, 则以 utf-8 的形式进行存储, 省内存.

  encode()和decode()

1 bs = b'\xc2\xed\xbb\xaf\xcc\xda'    # GBK编码
2 b = bs.decode("GBK")
3 bss = b.encode("utf-8")
4 print(bss)
编码解码

 

posted @ 2018-10-24 15:09  恐水的鱼  Views(221)  Comments(0Edit  收藏  举报