Java基础 Unicode、UTF-8

UTF-8 不是字符集,而是 Unicode 字符集的一种编码方式

UTF-8 编码规则:用 1~4 个字节保存

 

UTF-8 规定,如果是 ASCII 里面的英文字母,统一用一个字节表示,二进制的第一位是 0,转成十进制是正数

UTF-8 规定 一个中文用三个字节表示,二进制的第一位是 1,第一个字节转成十进制是负数

 

如果是一个字节,前面直接补 0 就可以了;

如果是三个字节,左边的第一个字节前面要加 1110,中间的第二个字节前面要加 10,右边的第三个字节前面也要加 10

 

posted @   1stzz1  阅读(77)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
点击右上角即可分享
微信分享提示