一个字符占几个字节
1个汉字字符存储需要2个字节,1个英文字符存储需要1个字节。ASCII是一个字节,Unicode是两个字节。Java的字符是Unicode的,所以是两个字节。字符是指计算机中使用的字母、数字、字和符号。
不同的编码里,字符和字节的对应关系也不同,与编码方式有关,常见的编码字符与字节的对应关系如下:
1、ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制,最小值0,最大值255。
2、UTF-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
3、Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。
符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“”占2个字节的大小。
4、GBK编码方式是中文占两个字节,英文占1个字节。
确定要研究的编码,比如UTF-8或者UTF-16 LE。要得到某个字符几个字节,两种办法:1. 根据编码的定义得出。(每种长度可扩展的编码都会规定在什么情况下这个字符是几个字节,比如上面那两种,都存在2字节和4字节的字符。)2. 动手实验判断。(保存为文本文件,用十六进制编辑器打开查看。)。
一个字等于多少个字节,与系统硬件(总线、cpu命令字位数等)有关,不应该毫无前提地说一个字等于多少位。正确的说法:①:1字节(byte) = 8位(bit)②:在16位的系统中(比如8086微机) 1字 (word)= 2字节(byte)= 16(bit) 在32位的系统中(比如win32) 1字(word)= 4字节(byte)=32(bit) 在64位的系统中(比如win64)1字(word)= 8字节(byte)=64(bit)