字符编码笔记

字符编码笔记

引入

在用python处理多个文件的时候,里面存有不同编码,使用晚上copy的编码判断也不好使,而我的目的也很简单,就是在第二行加入一串文字,比如123456.那么,在不同编码下是否能通过读取二进制字节的方式判断到\n呢?

结论 在我们中文编码和utf8中,是可以的,实际上所有的非可见字符都是可以的编码都跳过了这些非可见字符

编码一览表

字符编码其实从历史发展的角度来看更好理解,我们这里值讨论简体中文和英文,也就是如下的发展顺序

mark

知识点速记

参考文献

字符编码笔记:ASCII,Unicode 和 UTF-8 阮一峰

汉字unicode编码表

UTF-8 遍地开花

详细的中文字符编码

posted @ 2019-01-30 16:54  zongzi10010  阅读(172)  评论(0编辑  收藏  举报