2011 年 3月 2 日随笔档案 - dkcndk

2011年3月2日

摘要： from:http://www.unixresources.net/linux/clf/python/archive/00/00/42/73/427317.html结合二位的答复，运行结果如下： >>> a='中国' >>> b=unicode(a, 'cp936') >>> b u'u4e2du56fd' >>> c = b.encode('utf-8') >>> c 'xe4xb8xadxe5x9bxbd' >> 阅读全文

posted @ 2011-03-02 17:17 dkcndk 阅读(996) 评论(0) 推荐(0) 编辑

Python 字符编码判断

摘要：法一：isinstance(s, str) 用来判断是否为一般字符串isinstance(s, unicode) 用来判断是否为unicode或if type(str).__name__!="unicode":str=unicode(str,"utf-8")else:pass法二：Python chardet 字符编码判断使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页，有的页面使用GBK/GB2312，有的使用UTF8，如果你需要去爬一些页面，知道网页编码很重要的，虽然HTML页面有charset标签，但是有些时候是不对的。阅读全文

posted @ 2011-03-02 02:36 dkcndk 阅读(80724) 评论(1) 推荐(2) 编辑

公告

昵称： dkcndk
园龄： 14年
粉丝： 353
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类 (231)

随笔档案 (537)

博友

数据通信与网络
Linux内核 Linux网络编程必看书籍推荐http://blog.csdn.net/21aspnet/article/details/6694485

公告

搜索

常用链接

我的标签

随笔分类 (231)

随笔档案 (537)

博友

阅读排行榜

评论排行榜

推荐排行榜

最新评论