摘要:
编码简介最近被字符集搞得头大,基于为自己扫盲的目的,索性收集资料研究一下,现将各方资料归纳成本文。这里并不想把复杂的规则说明一大通。如有需要,请参照其他资料或本文给出的参考资料。 如有错误,欢迎指正。 [顺便发下牢骚,je的编辑器真TMD难用,排版排得我半死]基础知识字节和字符 字节(octet):顾其英文名而思义,就是一个八位的存储单元,取值范围一定是0~255; 字符(character):就是一个语言上的符号,"中"字就是一个字符。字符所占的大小由其编码方式解决,比如"中"在UTF-8中占3个字节(0xE4A8AD),而在GBK中,则占两个字节(0 阅读全文