DOS/Windows和Linux/Unix的文件格式转换(转载)

    转自: http://zhaizhenxing.blog.51cto.com/643480/134756,谢谢作者。

 

    DOS/Windows和Linux/Unix的文件换行回车格式不同,基于 DOS/Windows 的文本文件在每一行末尾有一个 CR(回车)和 LF(换行),而 UNIX 文本只有一个换行。

    1)、把Dos/Windows下的文件移至Linux/Unix系统

    虽然很多程序不在乎 DOS/Windows 格式的 CR/LF 文本文件,但是有几个程序却在乎 -- 最著名的是 bash,只要一遇到回车,它就会出问题。以下 sed 调用将把 DOS/Windows 格式的文本转换成可信赖的 UNIX 格式:

    $ sed -e 's/.$//' mydos.txt > myunix.txt

    该脚本的工作原理很简单:替代规则表达式与一行的最末字符匹配,而该字符恰好就是回车。我们用空字符替换它,从而将其从输出中彻底删除。如果使用该脚本并注意到已经删除了输出中每行的最末字符,那么,您就指定了已经是 UNIX 格式的文本文件。也就没必要那样做了!

    2)、把Linux/UNIX 文本移至 Windows 系统,使用以下脚本执行必需的格式转换:

    $ sed -e 's/$/\r/' myunix.txt > mydos.txt

    在该脚本中,'$' 规则表达式将与行的末尾匹配,而 '\r' 告诉 sed 在其之前插入一个回车。在换行之前插入回车,立即,每一行就以 CR/LF 结束。请注意,仅当使用 GNU sed 3.02.80 或以后的版本时,才会用 CR 替换 '\r'。

    3)使用dos2unix和unix2dos命令,这种方法最简单。

    在window上随便创建一个文件Noname2.txt,内容如下:
    sfadadfad
    sfasd
    fads
    fasdfads

    在Linux上用hexdump工具进行查看:

    A52>hexdump Noname2.txt
    0000000 6673 6461 6461 6166 0d64 730a 6166 6473
    0000010 0a0d 6166 7364 0a0d 6166 6473 6166 7364
    0000020 0a0d  
    0000022

    用dos2unix工具转换后:

    A52>dos2unix Noname2.txt
    dos2unix: converting file Noname2.txt to UNIX format ...

    A52>hexdump Noname2.txt
    0000000 6673 6461 6461 6166 0a64 6673 7361 0a64
    0000010 6166 7364 660a 7361 6664 6461 0a73  
    000001e

    再使用unix2dos转换回去:

    A52>unix2dos Noname2.txt
    unix2dos: converting file Noname2.txt to DOS format ...

    A52>hexdump Noname2.txt
    0000000 6673 6461 6461 6166 0d64 730a 6166 6473
    0000010 0a0d 6166 7364 0a0d 6166 6473 6166 7364
    0000020 0a0d  
    0000022

    本文出自 “帅小伙的博客” 博客,请务必保留此出处http://zhaizhenxing.blog.51cto.com/643480/134756

posted on 2013-05-23 20:59  次奥砖家  阅读(387)  评论(0编辑  收藏  举报

导航