关于N900的TXT文本的编码注意事项
2011-08-28 23:34 狼人:-) 阅读(208) 评论(0) 编辑 收藏 举报N900上TXT文本的编码格式为UTF-8。此格式不用说,是目前兼容性相当好的一种编码。但是比如PC上(特指中文系统的XP、win7等)建立的TXT文本默认是ANSI
所以当存储有中文的ANSI编码的TXT文本在N900上中文显示成乱码,更有可能无法打开(大量特殊符号)。提示系统内部错误,这是因为编码不兼容所致。
当然如果是全E文就不会发上以上问题。
结论是,PC端生成的TXT文本最好另存为UTF-8编码。然后在N900上使用。(N900生成的TXT文本直接是UTF-8编码)
大量特殊符号:ANSI所包含的符号远比UTF-8少,例如全角的·在ANSI编码文本里会无法显示,成为?号.
知识角
unicode和ansi都是字符代码的一种表示形式。
为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如:汉字'中'在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。
不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下,ANSI 编码代表 GB2312 编码,在日文操作系统下,ANSI 编码代表 JIS 编码。
不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。
声明:此博有部分内容为转载,版权归原作者所有~