摘要: Excel在读取csv的时候是通过读取文件头上的bom来识别编码的,如果文件头无bom信息,则默认按照unicode编码读取。(这个bom是微软自己定义的一种文件头部协定,顾名思义存储在文件头部,存储内容就是标识文件编码的信息。) 而我们生成csv的平台不一定遵循微软的bom协议,导致如果输出非un 阅读全文
posted @ 2018-05-21 16:13 行知散人 阅读(1107) 评论(0) 推荐(0) 编辑
摘要: 其实,这里要讨论的内容是针对 Python2 的,实际上也是 Python2 中让人头疼的编码问题,而 Python3 则好处理得多。 先来看看例子: >>> s = "我正在学Python" >>> s '\xe6\x88\x91\xe6\xad\xa3\xe5\x9c\xa8\xe5\xad\x 阅读全文
posted @ 2018-05-21 15:27 行知散人 阅读(669) 评论(0) 推荐(0) 编辑