2013年3月6日
摘要: 背景:在跑hadoop是python脚本经常要处理不同的格式的编码数据,主要字符编码:ascii,gb18030,unicode,utf-8等python有两种字符串byteString = "hello world! (in my default locale)"unicodeString = u"hello Unicode world!"相互转换1 s = "hello normal string"2 u = unicode( s, "utf-8" )3 backToBytes = u.encode( &quo 阅读全文
posted @ 2013-03-06 18:11 youngkang 阅读(363) 评论(0) 推荐(0) 编辑