大端、小端与网络字节序
大端(Big-Endian),小端(Little-Endian)以及网络字节序的概念在编程中经常会遇到,网络字节序(Network Byte Order)一般是指大端(Big-Endian,对大部分网络传输协议而言)传输,大端小端的概念是面向多字节数据类型的存储方式定义的,小端就是低位在前(低位字节存在内存低地址,字节高低顺序和内存高低地址顺序相同),大端就是高位在前,(其中“前”是指靠近内存低地址,存储在硬盘上就是先写那个字节)。概念上字节序也叫主机序。
一、大小端概念
1、首先大小端是面向多字节类型定义的,比如2字节、4字节、8字节整型、长整型、浮点型等,单字节的字符串一般不用考虑。
2、大端小端存储、传输、以及接收处理需要对应。
3、大端(Big-Endian)就是高字节(MSB)在前,内存存储体现上,数据的高位更加靠近低地址。(低地址存高字节)
4、小端(Little-Endian)就是低字节(LSB)在前,内存存储体现上,数据的低位更加靠近低地址。(低地址存低字节)
5、网络字节序一般是指大端传输。
二、大小端存储示例
假设一个32位 unsigned int型数据0x12 34 56 78,大小端8位存储方式如下:
- 大端存储方式为0x12 34 56 78
- 小端存储方式为0x78 56 34 12,如下图。
三、常见CPU的大小端存储方式
不同CPU有不同的字节序类型,典型的使用小端存储的CPU有:Intel x86和ARM
典型的使用大端存储CPU有:Power PC、MIPS UNIX和HP-PA UNIX
注:
以上CPU需根据具体型号查询手册,有的CPU甚至可能同时能支持两种存储方式。
上文说的网络字节顺序则是表示网络传输时的字节序,按照TCP/IP协议是按照大端传输方式,也就是高字节先走(先传12,接着34,56,78),这跟本机存储和服务器存储没有关系,只要确保双方解析对应即可。
四、四个转换函数
C/C++中有如下四个常用的转换函数,这四个函数在小端系统中生效,大端系统由于和网络字节序相同,所以无需转换。
- htons —— 把unsigned short类型从主机序转成网络字节序
- ntohs —— 把unsigned short类型从网络字节序转成主机序
- htonl —— 把unsigned long类型从主机序转成网络字节序
- ntohl —— 把unsigned long类型从网络字节序转成主机序
以上函数包含头文件:
#if defined(_LINUX) || defined(_DARWIN) #include <netinet/in.h> #endif #ifdef WIN32 #include <WINSOCK2.H> #endif