位与字节、asscii、unicode、utf-8、gbk 等之间的关系与区别
阅读目录:
位与字节的关系
位:简单来说一位就是一个二进制数。
官方一点:数据存储的最小单位。在计算机中的二进制数系统中,位,简称为b,也称为比特,每个0或者1就是一个位(bit)。
计算机中的CPU位数指的是CPU一次能处理的最大位数。例如32位计算机的CPU一个机器周期内可以处理32位二进制数据的计算机。
字节:简单来说就是8个二进制数,即8 bit 就称为一个字节(Byte)。
字节这个词最早起源于1956年前后,由IBM公司提出。最早的拼写方式是bite,但是为了避免与bit混淆用y代替了i,到20世纪60年代中叶,在IBM的360系统的方展下(一种大规模复杂的商用计算机)字节这个词逐渐开始用来表示一组8比特数据。
b、B、KB、MB、GB的关系
b 比特bit / 位
B——字节
KB——千比特
MB——兆比特
GB——吉比特
1 B = 8b (8个bit/ 位) 一个字节(byte)等于8位(bit)
1 kB = 1024 B (kB - kilobajt)
1 MB = 1024 kB (MB - megabajt)
1 GB = 1024 MB (GB - gigabajt)
asscii、unicode、utf-8、gbk的区别
ascii 不支持中文
Unicode 中文4个字节,英文2个字节
utf-8 中文3个字节,英文占1个字节,欧洲2个字节
GBK 中文2个字节,英文1个字节
Windows默认是GBK
字节码和机器码的区别
什么是机器码?
机器码(machine code),学名机器语言指令,有时也被称为原生码(Native Code),是电脑的CPU可直接解读的数据。
通常意义上来理解的话,机器码就是计算机可以直接执行,并且执行速度最快的代码。
用机器语言编写程序,编程人员要首先熟记所用计算机的全部指令代码和代码的涵义。手编程序时,程序员得自己处理每条指令和每一数据的存储分配和输入输出,还得记住编程过程中每步所使用的工作单元处在何种状态。这是一件十分繁琐的工作,编写程序花费的时间往往是实际运行时间的几十倍或几百倍。而且,编出的程序全是些0和1的指令代码,直观性差,还容易出错。现在,除了计算机生产厂家的专业人员外,绝大多数的程序员已经不再去学习机器语言了。
- 机器语言是微处理器理解和使用的,用于控制它的操作二进制代码。
- 8086到Pentium的机器语言指令长度可以从1字节到13字节。
- 尽管机器语言好像是很复杂的,然而它是有规律的。
- 存在着多至100000种机器语言的指令。这意味着不能把这些种类全部列出来。
总结:机器码是电脑CPU直接读取运行的机器指令,运行速度最快,但是非常晦涩难懂,也比较难编写,一般从业人员接触不到。
什么是字节码?
字节码(Bytecode)是一种包含执行程序、由一序列 op 代码/数据对 组成的二进制文件。字节码是一种中间码,它比机器码更抽象,需要直译器转译后才能成为机器码的中间代码。
通常情况下它是已经经过编译,但与特定机器码无关。字节码通常不像源码一样可以让人阅读,而是编码后的数值常量、引用、指令等构成的序列。
字节码主要为了实现特定软件运行和软件环境、与硬件环境无关。字节码的实现方式是通过编译器和虚拟机器。编译器将源码编译成字节码,特定平台上的虚拟机器将字节码转译为可以直接执行的指令。字节码的典型应用为Java bytecode。
字节码在运行时通过JVM(JAVA虚拟机)做一次转换生成机器指令,因此能够更好的跨平台运行。
总结:字节码是一种中间状态(中间码)的二进制代码(文件)。需要直译器转译后才能成为机器码。