linux shell 中文件编码查看及转换方法

参考:

http://edyfox.codecarver.org/html/vim_fileencodings_detection.html

 

一、查看文件编码。 
    在打开文件的时候输入:set fileencoding 
    即可显示文件编码格式。 



二、文件编码转换 
    1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 
        在打开的文件中输入:set fileencoding=utf-8 

    2、使用iconv转换,iconv的命令格式如下: 

        iconv -f encoding -t encoding inputfile 
        比如将一个 编码的文件转换成GBK编码 
        iconv -f UTF-8 -t GBK file1 -o file2 

iconv的用法: 

用法: iconv [选项...] [文件...] 
Convert encoding of given files from one encoding to another. 
输入/输出格式规范: 
  -f, --from-code=NAME       原始文本编码 
  -t, --to-code=NAME         输出编码 
信息: 
  -l, --list                 列举所有已知的字符集 
输出控制: 
  -c                         从输出中忽略无效的字符 
  -o, --output=FILE          输出文件 
  -s, --silent               suppress warnings 
      --verbose              打印进度信息 
  -?, --help                 给出该系统求助列表 
      --usage                给出简要的用法信息 
  -V, --version              打印程序版本号 

将GB2312编码的文件内容转换为UTF-8 
iconv -f GB2312 -t UTF-8 file-name > new-file-name 

将UTF-8编码的文件内容转换为GB2312 
iconv -f UTF-8 -t GB2312 file-name > new-file-name 
注意:转换前一定要将重要的文件备份,特别是转换文件内容的时候 

三、文件名编码转换: 

    从linux往windows拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名 中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。 
    在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。 

    1、先看一下你的系统上是否安装了convmv,如果没安装的话在终端输入下面的命令安装: 
       sudo yum -y install convmv 

    2、下面看一下convmv的具体用法: 
       convmv -f 源编码 -t 新编码 [选项] 文件名 
       常用参数: 
          -r 递归处理子文件夹 
          --notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。 
          --list 显示所有支持的编码 
          --unescap 可以做一下转义,比如把%20变成空格 
    比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下: 
    convmv -f UTF-8 -t GBK --notest utf8编码的文件名 

    这样转换以后"utf8编码的文件名"会被转换成GBK编码(只是文件名编码的转换,文件内容不会改变)

posted on   TMatrix52  阅读(565)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET10 - 预览版1新功能体验(一)

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示