1、定义
1) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
2) Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
例如:
(1)16bit宽的数0x1234在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)为:
内存地址 |
0x4000 |
0x4001 |
存放内容 |
0x34 |
0x12 |
而在Big-endian模式CPU内存中的存放方式则为:
内存地址 |
0x4000 |
0x4001 |
存放内容 |
0x12 |
0x34 |
(2)32bit宽的数0x12345678在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)为:
内存地址 |
0x4000 |
0x4001 |
0x4002 |
0x4003 |
存放内容 |
0x78 |
0x56 |
0x34 |
0x12 |
而在Big-endian模式CPU内存中的存放方式则为:
内存地址 |
0x4000 |
0x4001 |
0x4002 |
0x4003 |
存放内容 |
0x12 |
0x34 |
0x56 |
0x78 |
在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。例如一个16bit的short型x,在内存中的地址为0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,刚好相反。我们常用的X86结构是小端模式,而KEIL C51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
判断大端模式还是小端模式
union _node { int data; char key; }node; node.data = 0x1234; if(node.key == 0x34) { printf("little endian\n"); } else { printf("big endian\n"); }
小端模式下的程序
short int x; char x0,x1,x2,x3; x=0x1122; x0=((char*)&x)[0]; //低地址单元,与下面的x2=*((char*)&x+0); 作用相同 x1=((char*)&x)[1]; //高地址单元,与下面的x3=*((char*)&x+1); 作用相同 x2=*((char*)&x+0); //低地址单元 x3=*((char*)&x+1); //高地址单元 printf("%x\n", x0); //22 printf("%x\n", x1); //11 printf("%x\n", x2); //22 printf("%x\n", x3); //11
如何进行转换
//16位 #define BigtoLittle16(A) (( ((uint16)(A) & 0xff00) >> 8) | \ (( (uint16)(A) & 0x00ff) << 8)) //32位 #define BigtoLittle32(A) ((( (uint32)(A) & 0xff000000) >> 24) | \ (( (uint32)(A) & 0x00ff0000) >> 8) | \ (( (uint32)(A) & 0x0000ff00) << 8) | \ (( (uint32)(A) & 0x000000ff) << 24))
linux下网络编程经常用到的函数htonl
#include <stdio.h> #include <arpa/inet.h> void endian() { uint32_t a = 0x1234; uint32_t b = htonl(a); char c = *((char *)&a); char d = *((char *)&b); printf("%x\n", a); printf("%x\n", b); printf("%x\n", c); printf("%x\n", d); } int main(void) { endian(); return 0; }
一般操作系统都是小端,而通讯协议是大端的。htonl将主机的无符号长整形数转换成网络字节顺序。htonl,其实是host to network, l 的意思是返回类型是long