Linux内核分析——字符集总结与分析
一、 设置修改系统、应用默认字符集
1. 查看虚拟机的字符集:
由此可见,该虚拟机的字符集为zh_CN.UTF-8。
2. 查看服务器支持的编码方式
3. 修改字符集类型
上图可见,LANG字符集类型修改为en_US.utf-8。
4. 查看某个文件的字符类型
二、 同一文件存储为不同字符集,并分析原始数据
三、总结:
分析完这4个文件,我们发现这4种编码方式只是汉字不同格式运用不同编码,而阿拉伯数字和英文字母都是用ascii编码表示,也就是为什么我们有时候打开一个文件会出现乱码,而阿拉伯数字和英文字母都是正常的原因,汉字在不同的编码格式中都是有不同的汉字编码,而阿拉伯数字和英文字母通用ascii编码表示。