2013 年 3月 6 日随笔档案 - youngkang

2013年3月6日

摘要：背景：在跑hadoop是python脚本经常要处理不同的格式的编码数据，主要字符编码：ascii,gb18030,unicode,utf-8等python有两种字符串byteString = "hello world! (in my default locale)"unicodeString = u"hello Unicode world!"相互转换1 s = "hello normal string"2 u = unicode( s, "utf-8" )3 backToBytes = u.encode( &quo 阅读全文

posted @ 2013-03-06 18:11 youngkang 阅读(363) 评论(0) 推荐(0) 编辑