每日学习笔记(5)
#coding=utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
myDict = {}
myList = []
global_var = 0
def changeVar():
global global_var
myDict['1001'] = 'hello'
myDict['1002'] = 'world'
myList.append(1)
myList.append(2)
global_var += 1
def printVar():
for key in myDict.keys():
print "key is %s" % key
print myDict[key]
print global_var
for item in myList:
print "item is %s" % item
if __name__ == '__main__':
for i in range(1,4):
myDict = {}
changeVar()
printVar()
2,我个人处理python中文编码的一个基本流程是:
1)首先声明:
#coding=utf-8
这样确保中文字符可以在代码文件中显示,然后代码文件也保存为utf8(无BOM头结构)
2)为处理方便,将系统的默认编码处理方式也改成utf8
reload(sys)
sys.setdefaultencoding('utf8')
3)然后对代码中处理的变量var,一个基本原则就是:如果你明确知道变量的自身编码,那么就根据其编码decode为unicode,此时可以通过type(var) is unicode是否为true来确定是否已经转成unicode了,然后你可以再将其encode为utf8格式,当然,如果你一开始就不知道变量var是什么编码,那么建议采用chardet库来进行检测,这个库Mozilla也在用的,准确度还是不错的。
4)如果你不担心存储的性能问题,强烈建议全部存储为utf8吧,别再啥gb2312,gbk之类,烦死了
3,python的日志模块非常简练,方便,实例如下:
Logger = None
LogFile = "c://test.log"
def initLogger():
global Logger
Logger = logging.getLogger()
handler = logging.FileHandler(LogFile)
formatter = logging.Formatter('%(asctime)s ********* %(message)s')
handler.setFormatter(formatter)
Logger.addHandler(handler)
Logger.setLevel(logging.INFO)
if __name__ == '__main__':
initLogger()
Logger.info("hello,world")
4,在判断一个变量是否在一个List或Dictionary中存在时,一定要小心变量的类型是否和List或Dictionary中存储的变量类型是否一致,否则就悲剧了,我最近就碰到这样一个bug,
如果类型不一致,那么这个判断会始终都是false的
5,脚本进入生产环境后,一定记得把debug置为false,从而将debugs时使用的print信息都屏蔽掉,最好还是结合Logger来进行调试吧
6,Python脚本开头都加入下面这两句
#coding=utf-8
如果为了可移植性考虑,你也可以将第一句写成
不过我还是建议你用第一种,毕竟自己指定python的版本才放心,要是依靠系统来查找,若存在多个python版本,那就悲剧了
作者:洞庭散人
出处:http://phinecos.cnblogs.com/
posted on 2010-06-08 11:50 Phinecos(洞庭散人) 阅读(1001) 评论(0) 编辑 收藏 举报