摘要: 计算中文字符长度,通常会想到1个中文字符占两个字节。我本来一直也这么认为,可是一次计算utf-8中文字符的时候,似乎又并没这样计算,这就要看中文到底是以什么机器可识别字符存储的。 我首先在PHP中做了实验,用strlen()函数取中文字符串“我是”的长度,在UTF-8下是6,在GBK下是4,说明UTF-8每个中文字符占用了3字节,GBK每个中文字符占用2字节。 然后我又在WINDOWS 7下用EditPlus做了实验,分别保存纯文本(不含任何空格,只有末尾空字符,不算入长度)“我是”,然后用十六进制的方法查看,UTF-8下是"E6 88 91 E6 98 AF" 和 GBK 阅读全文