摘要:
UTF8并不算是一种电脑编码,而是一种储存和传送的格式,如前所述,每个Unicode/UCS字符都以 2或4个bytes来储存,看看以下的比较:以"I am Chinese"为例用ANSI储存: 12 Bytes用Unicode/UCS2储存: 24 Bytes + 2 Bytes(header)用UCS4储存: 48 Bytes + 4 Bytes(header)以"我是中国人"为例用ANSI储存: 10 Bytes(GB2312)用Unicode/UCS2储存: 10 Bytes + 2 Bytes(header)用UCS4储存: 20 Bytes 阅读全文