摘要: 最近得到一份Unicode编码的文件,想转换成utf-8(其实就是想转成非Unicode)。在网上找了很多文章,有很多人把utf-8理解为unicode,搞得乱哄哄的。请记住,下面的段落是讲如何把 Unicode 编码的文件 转化为 非Unicode的方式。在linux下用iconv命令,iconv -f ucs-2 -t utf-8 myfile > destfile搞了半天,发现,Unicode编码(简称为ucs)其实分为ucs-2be 和ucs-2se 一个是大端法(big-endian),一个是小端法(little-endian),也就是一个码子(2byte)的字节序列不同。wi 阅读全文
posted @ 2012-10-11 16:24 CodeJumper 阅读(10018) 评论(0) 推荐(0) 编辑