会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
IR&ML&NLP
自然语言领域的菜鸟的胡言乱语
博客园
首页
新随笔
联系
管理
订阅
2010年11月30日
字符串编码问题
摘要: 对自己在程序中所遇到的字符串编码问题的一个总结,首先,我们先看看我们经常听说的几种编码格式:ASCII,Unicode,UTF-8 当然还有我想拿出来单独来说的GB2312,GBK等等。首先说,这种字符编码是美国制定的,所以它只对英文字符与二进制位之间做了一个对应,区分大小写的英文字符共52个,再加上例如空格之类的控制字符,ASCII共规定了128个字符编码。此时,一个字节的最高位(置为0)是没有...
阅读全文
posted @ 2010-11-30 05:41 可乐LL
阅读(912)
评论(0)
推荐(0)
编辑
公告