2014年3月30日

摘要: python的中文处理还是比较麻烦的,utf-8的字符串的长度是1-6个字符,一不小心就会从中截断,出现所谓的乱码。下面这个函数提供了,从一段utf-8编码的字符串中,截取固定长度的字串。ord(char)将字符转换称整数,根据utf-8的编码规则,确定每个utf-8的字占用几个字符,从而避免截断的情况。参数: string :utf-8字符串,如果是别的字符编码,请先转换成utf-8(推荐所有字符串和文件都用utf-8格式的) length :字符数(注意不是中文字的个数)题外话:python的字符编码,有几个函数unicode(str,'charset'),str.deco 阅读全文
posted @ 2014-03-30 00:44 jounyl 阅读(11936) 评论(0) 推荐(0) 编辑

导航