2011年9月17日

GB编码(转)

摘要: GB中文编码发展过程:GB2312-->GBK-->GB18030GB2312字符集作用:国家简体中文字符集,兼容ASCII。位数:使用2个字节表示,能表示7445个符号,包括6763个汉字,几乎覆盖所有高频率汉字。范围:高字节从A1到F7,低字节从A1到FE。将高字节和低字节分别加上0XA0即可得到编码。GBK字符集作用:它是GB2312的扩展,加入对繁体字的支持,兼容GB2312。位数:使用2个字节表示,可表示21886个字符。范围:高字节从81到FE,低字节从40到FE。GB18030字符集作用:它解决了中文、日文、朝鲜语等的编码,兼容GBK。位数:它采用变字节表示(1ASC 阅读全文

posted @ 2011-09-17 18:18 奋斗者 阅读(2354) 评论(0) 推荐(0) 编辑

一个GBK编码导致的问题(转)

摘要: 昨天听镇方分享店铺内的架构,提到一个有趣的问题, 由于中文都采用GBK编码,所以在搜索(使用strstr搜索子串)时会出现一些错误的匹配,高亮要在字符串中插入一些标记,这个时候会导致前端显示乱码。“夏新”的GBk编码是”0xcf 0xc4 0xd0 0xc2″,”男”的GBK编码是”0xc4 0xd0″,刚好匹配上了中间两个字节,如果”夏新”后面还有汉字的话,这些字就要悲剧了。如果使用UTF-8编码就不会有问题了,因为中文使用UTF-8编码需要三个字节(1110xxxx 10xxxxxx 10xxxxxx),而第一个字节会是’E',后续两个字节都是10开始的,最大也就是’B', 阅读全文

posted @ 2011-09-17 16:42 奋斗者 阅读(713) 评论(0) 推荐(0) 编辑

导航