Linux 使用unzip解压乱码

unzip 解压乱码问题

 

unzip软件包的unzip命令提供了-O参数(以及-I参数),可以指定编码。

 

-O CHARSET 为DOS,Windows和OS / 2归档文件指定字符编码
-I CHARSET 为UNIX和其他归档文件指定字符编码

 

可以使用下面的命令进行解压,即制定字符编码集

unzip -O gb18030  ***.zip

 

关于中文字符集:
中文字符集有gb2312、gbk与gb18030三种,其中:

gb2312发布于1980年,收录汉字6763个(不包含一些古文生僻字);
gbk发布于1995年,收录汉字21003个;
gb18030现行版本发布于2005年,收录汉字70244个。

 

使用gb18030是最全的

posted @ 2024-07-31 10:37  TW-NLP  阅读(2)  评论(0编辑  收藏  举报