字符编码与大小端

1. UNICODE个人感觉分广义和狭义, 广义的UNICODE包括UTF8, UCS2, UCS4, 而狭义的UNICODE(主要是Windows平台)就是指UCS2。

2. UNICODE统一为两个字节,增加了网络传输及存储的开销。

3. UTF8对英文字符还是1个字节存储,只对其他语言字符用多个字节存储(2-6个字节)。

4. UNCIODE与UTF8之间可相互转换,C++11中的操作如下:

 

std::codecvt_utf8 封装了UTF8相关的编码转换
std::codecvt_utf16 封装了UCS2相关的编码转换
std::codecvt_utf8_utf16 封装了UTF8与UCS2的编码转换

 

5. 低字节在低地址的为小端;高字节在低地址的为大端。

6. 系统的大小端和CPU架构体系相关联, 比如说X86是小端, PowPC是大端,ARM则是可控制(默认也是小端)。

7. 程序判断大小端:

  bool IsLittleEndian()  {  int i=1;  return (*(char *)&i == 1); }

8. 栈存储数据int类型整数1的结构如下:

                       

 

posted on 2015-11-24 16:19  霏霏暮雨  阅读(789)  评论(0编辑  收藏  举报

导航