python编码解码
编码解码
Unicode支持多种编码格式,给程序猿带来了负担。每当向文件写入字符串时,必须定义一个编码(encoding参数)用于把对应的Unicode内容转换成定义的格式。python通过Unicode字符串的encode()函数解决了这个问题,该函数接受字符串中的字符为参数,输出指定格式的内容。
1.一个简单的例子
创建一个Unicode字符串,用UTF-8编码将它编码,然后写到一个文件夹中。接着把数据从文件中读回来,解码成Unicode字符串对象。最后打印出Unicode字符串
__author__ = 'Administrator'
'''
一个例子有关编码转换
'''
CODEC='utf-8'
File='unicode.txt'
hello_out=u"test"
bytes_out=hello_out.encode(CODEC)
f=open(File,"w")
f.write(bytes_out)
f.close()
f=open(File,"r")
bytes_in=f.read()
f.close()
hello_in=bytes_in.decode(CODEC)
print hello_in
2.把Unicode应用到实际应用中 注意点:1.程序中出现字符串一定要加个u
2.不要用str()函数,用unicode()代替
3.不到必须时不要在程序里解码Unicode字符。
写入文件或数据库,网络时候,才调用encode()函数;相应时,只在你需要把数据读回来的时候才调用decode()函数