Python 2.6 字符编码转换

在Python中有两个和字符很相关的类型,一个是str类型,一个是unicode类型。

这两种类型的对象都是sequece序列,其中str是字节序列,而unicode是字符序列        

 

decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码。

encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串str2转换成gb2312编码。

 

# -*- coding:utf-8 -*- 
site="博客园"
usite=unicode(site,"utf8")

 

因为这里源码的编码方式是utf8,且site的类型是str类型,即字节序列,所以我们将”博客园”从源码文件中按照utf-8读取成字节序列

然后使用unicode函数 将utf8编码的字符串site转化成unicode类型,从字节序列转化成字符序列

 

unicode(site,"utf8") 等同于 site.decode("utf8")

 

参考文章

http://lukejin.javaeye.com/blog/598303

http://wolfmaster.javaeye.com/blog/638029

 

 

 

posted on 2010-10-17 17:52  frouds  阅读(3984)  评论(0编辑  收藏  举报