windows下默认的 文本编码 是GBK(gb2313),而linux的是UTF-8,因此在windows下的文本文档直接在linux下打开会是

乱码,

基本上 ,用几个工具就能解决了

enca (默认安装过的) ,encov  ,iconv,dos2unix

先安装相应的软件包,我用的linuxmint,这几个软件在ubuntu的源里面都有的

直接安装:  apt-get install  enca   dos2unix 

首先先查看文本的编码

enca    file

iconv  -f  GBK  -t  UTF-8  file  详细命令man一下

或者  enconv     -f  GBK   -t UTF-8  file  file.new 

如果不是在windows下写的脚本 的话,一般文本的查看就这些了

不过如果是可执行的命令的话,

需要转换每行结尾的换行符

windows默认的 是  CRLF   CRLF -- Carriage-Return Line-Feed 回车换行

就是回车(CR, ASCII 13, \r) 换行(LF, ASCII 10, \n

  换行在有的ASCII码表也用newline(简nl)来进行表示,这里的lf是line feed的概念,意思是一样的。   这两个ACSII字符不会在屏幕有任何输出,但在Windows中广泛使用来标识一行的结束。而在Linux/UNIX系统中只有换行符。   CR和LF组合在一起即CRLF命令

  它表示键盘上的"Enter"键(可以用来模拟回车键)

而linux中只有LF

Dos和windows采用回车+换行CR/LF表示下一行,
而UNIX/Linux采用换行符LF表示下一行,
苹果机(MAC OS系统)则采用回车符CR表示下一行.
CR用符号’r’表示, 十进制ASCII代码是13, 十六进制代码为0x0D;
LF使用’n’符号表示, ASCII代码是10, 十六制为0x0A.

(以上两段摘自别处)

而windows的CR/LF则在linux识别为^M

所有要使命令 能正确执行

dos2unix   file

即可。

 

 posted on 2012-04-20 18:46  huaixiaoz  阅读(1197)  评论(0编辑  收藏  举报