python编码与存储读取数据(数组字典)
Camp时在python2的编码上坑了不少。
python2字符串类型只有两种: str类型:b'xxx'即是str类型, 是编码后的类型,len()按字节计算 unicode类型:len()按unicode字符计算
python2打开文件读取的字符串是str类型,无encoding参数 python2下读写文件建议使用 codecs 包 codecs.open, codecs.write可以指定编码
python3的编码
python3字符串类型分两种: str类型:u'xxx'即是str类型,是未编码的unicode。注意与python2的区分 bytes类型:编码后的类型
python3打开文件有encoding参数, 可以按指定编码方式读入,读取为str类型(即未编码的unicode)字符串
Python 2 将 strings 处理为原生的 bytes 类型,而不是 unicode,
Python 3 所有的 strings 均是 unicode 类型。
utf-8编码兼容ascii编码,asscii编码后的字符与utf-8编码后的字符结果相同
========================================================================================
python存储读取数据
数组
import numpy a = [1, 2, 3, 4, 5] numpy.save('arr1.npy', a) b = numpy.load('arr1.npy') ################# import numpy a = [1, 2, 3, 4, 5] numpy.savetxt('arr.txt',a) b = numpy.loadtxt('arr.txt') ################# import numpy a = [1,2,3,4,5] a.tofile('arr1.bin',) b = numpy.fromfile("arr1.bin",dtype=**)
字典
#使用pickle模块将数据对象保存到文件 import pickle data1 = {'a': [1, 2.0, 3, 4+6j], 'b': ('string', u'Unicode string'), 'c': None} selfref_list = [1, 2, 3] selfref_list.append(selfref_list) output = open('data.pkl', 'wb') # Pickle dictionary using protocol 0. pickle.dump(data1, output) # Pickle the list using the highest protocol available. pickle.dump(selfref_list, output, -1) output.close()
#使用pickle模块从文件中重构python对象 import pprint, pickle pkl_file = open('data.pkl', 'rb') data1 = pickle.load(pkl_file) pprint.pprint(data1) data2 = pickle.load(pkl_file) pprint.pprint(data2) pkl_file.close()
诸神对凡人心生艳羡,厌倦天堂。