代码改变世界

随笔分类 -  文字编码

细说:Unicode, UTF-8, UTF-16, UTF-32, UCS-2, UCS-4

2021-09-08 11:59 by dreamboy2000, 243 阅读, 收藏, 编辑
摘要: 1. Unicode与ISO 10646 全世界很多个国家都在为自己的文字编码,并且互不想通,不同的语言字符编码值相同却代表不同的符号(例如:韩文编码EUC-KR中“한국어”的编码值正好是汉字编码GBK中的“茄惫绢”)。因此,同一份文档,拷贝至不同语言的机器,就可能成了乱码,于是人们就想:我们能不能 阅读全文

ucs2-utf8 (Convert characters set beetween utf-8 and ucs2 ONLY for simply chinese, ascii ,littlen-endian Computer.)

2021-09-07 19:11 by dreamboy2000, 191 阅读, 收藏, 编辑
摘要: #include <stdio.h> typedef unsigned short ucs2; //Unicode2 16bits. typedef unsigned char utf8; // utf-8 8bits. /* * * 一:e4 b8 80 (utf-8) * 1110 0000 1 阅读全文
点击右上角即可分享
微信分享提示