代码改变世界

初探python编码

2013-07-26 03:50 by 江湖么名, 793 阅读, 0 推荐, 收藏, 编辑
摘要:背景:在实际数据处理中,我们或多或少会接触到中文,如两个dc pack包的diff。使用python对中文数据 处理难免会遇到编码问题。python里面主要考虑三种编码:1、源文件编码:如果我们在源文件中使用中文注释或中文docstring或中文字符串,如不明确指定应使用哪个中文字符集,解 释器将无法处理我们的程序。这是因为解释器默认程序使用的是ASCII或ISO-8859-1(即LATIN-1)编码。解决方法是在文件头部使用coding声明(往往紧跟在#!注释行后面):#coding: gbk或# coding=gbk或# -*- coding: gbk -*-2、内部编码: python内 阅读全文

python中,将字符串由utf8转gbk

2013-07-26 01:46 by 江湖么名, 966 阅读, 0 推荐, 收藏, 编辑
摘要:uni_str = utf8_str.decode('utf-8');gbk_str = uni_str.encode('gbk'); 阅读全文

str 编码

2013-07-26 00:00 by 江湖么名, 288 阅读, 0 推荐, 收藏, 编辑
摘要:你需要的是让编码用实际编码而不是 ascii1对需要 str->unicode 的代码,可以在前边写上import sysreload(sys)sys.setdefaultencoding('utf8')把 str 编码由 ascii 改为 utf8 (或 gb18030)2.python3 区分了 unicode str 和 byte arrary,并且默认编码不再是 ascii3. 字符串转为unicode判断是不是unicode : isinstance (in_str, unicode) 是返回Trueuni_str = unicode(in_str," 阅读全文

python中unicode、utf8、gbk等编码问题

2013-07-25 23:43 by 江湖么名, 6846 阅读, 0 推荐, 收藏, 编辑
摘要:概要:编码转换无疑是程序开发过程中常遇到而且很让人头疼的问题,一旦和数据库交互那就更麻烦了,今天来总结一下 python 中编码转换的方法。前一段时间就想写一篇总结Python字符串的文章,但是时间较紧,而且我当时遇到的问题也不是很难,就暂搁下了,今天又被这编码折磨一番,泪奔啊……至于unicode、utf8等编码原理以及区别等问题可以去百度百科查看,网上也有介绍,我想说的是直接的转换方法——先知其然,然后再知其所以然吧。1.普通字符串与unicode转换无论是什么平台什么编码格式都能转换为unicode格式。以utf8编码方式把字符串转换为unicode:'aaa'.deco 阅读全文

Python字符编码详解

2013-07-25 23:38 by 江湖么名, 298 阅读, 0 推荐, 收藏, 编辑
摘要:本文简单介绍了各种常用的字符编码的特点,并介绍了在python2.x中如何与编码问题作战 :) 请注意本文关于Python的内容仅适用于2.x,3.x中str和unicode有翻天覆地的变化,请查阅其他相关文档。 尊重作者的劳动,转载请注明作者及原文地址 >. 打开看看)而UTF则引入了BOM来表示自身编码,如果一开始读入的几个字节是其中之一,则代表接下来要读取的文字使用的编码是相应的编码:BOM_UTF8 '\xef\xbb\xbf' BOM_UTF16_LE '\xff\xfe' BOM_UTF16_BE '\xfe\xff'并不是所有 阅读全文

python的str,unicode对象的encode和decode方法(转)

2013-07-25 23:24 by 江湖么名, 687 阅读, 0 推荐, 收藏, 编辑
摘要:python的str,unicode对象的encode和decode方法(转)python的str,unicode对象的encode和decode方法 python中的str对象其实就是"8-bit string" ,字节字符串,本质上类似java中的byte[]。 而python中的unicode对象应该才是等同于java中的String对象,或本质上是java的char[]。 对于 Python代码 s="你好" u=u"你好"s="你好" u=u"你好" 1. s.decode方法和u.e 阅读全文

Python字符串的encode与decode研究心得乱码问题解决方法

2013-07-25 23:22 by 江湖么名, 290 阅读, 0 推荐, 收藏, 编辑
摘要:为什么会报错“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)”?本文就来研究一下这个问题。字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb23 阅读全文

UnicodeEncodeError: 'gbk' codec can't encode character ...

2013-07-25 15:11 by 江湖么名, 951 阅读, 0 推荐, 收藏, 编辑
摘要:使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题。 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗?不是的。 很多时候,我们使用了decode和encode,试遍了各种编码,utf8,utf-8,gbk,gb2312等等,该有的编码都试遍了,可是编译的时 候仍然出现:Unicode 阅读全文

Project interpreter not specified(eclipse+pydev) (转)

2013-07-25 10:25 by 江湖么名, 415 阅读, 0 推荐, 收藏, 编辑
摘要:【小记】 最近因为想配置Android的开发环境,把原来的MyEclipse5.5删了,下载了最新的Eclipse3.7版本,因为之前在进行Python开发,就下载了最新的Pydev2.4版本,安装插件之后,新建Python工程时,提示如下错误:Project interpreter not specified,(见图一)。 开始我以为是插件安装有问题,后来查了蛮久才发现是没有导入Python的开发环境导致的。 知道原因了解决就很简单了: 0、当然你的系统必须已经安装了Python的安装环境,这是必须的哦,因为Eclipse仅仅是提供一个IDE而已,并不提供各种语言的解释器、编译器... 阅读全文

Eclipse+PyDev

2013-07-25 10:12 by 江湖么名, 194 阅读, 0 推荐, 收藏, 编辑
摘要:Eclipse+PyDevsudo apt-get install openjdk-6-jdksudo apt-get install eclipseHelp-->Install New Software-->Add-->Name:PyDev-->Location:http://pydev.org/updatesPyDev-->PyDev for EclipsePreference-->PyDev-->Interpreter-->Interpreter Name:Python-->Interpreter Executable:/usr/bi 阅读全文
上一页 1 ··· 7 8 9 10 11 12 13 14 下一页