unicode17个平面,每个平面16位, 17需要5位,共21位。

utf8 4个byte可以表示21位,所以目前4byte够了。

 

unicode17个平面,大约可以表示110万个字符,已经用了10万左右

 

常用汉字,如:一汉龥 占用3字节

非常用汉字,如: 占用4个字节

utf16 前者两个字节,后者4个字节。

utf表示ascll码时,只要1个字节,utf16要两个字节

posted on 2022-09-26 22:45  闻缺陷则喜何志丹  阅读(16)  评论(0编辑  收藏  举报  来源