unicode17个平面,每个平面16位, 17需要5位,共21位。

utf8 4个byte可以表示21位,所以目前4byte够了。

 

unicode17个平面,大约可以表示110万个字符,已经用了10万左右

 

常用汉字,如:一汉龥 占用3字节

非常用汉字,如: 占用4个字节

utf16 前者两个字节,后者4个字节。

utf表示ascll码时,只要1个字节,utf16要两个字节

posted on   闻缺陷则喜何志丹  阅读(31)  评论(0编辑  收藏  举报  
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~
历史上的今天:
2020-09-26 PCLint9可以发现 VS2005不能发现的错误



点击右上角即可分享
微信分享提示