windows下默认的 文本编码 是GBK(gb2313),而linux的是UTF-8,因此在windows下的文本文档直接在linux下打开会是
乱码,
基本上 ,用几个工具就能解决了
enca (默认安装过的) ,encov ,iconv,dos2unix
先安装相应的软件包,我用的linuxmint,这几个软件在ubuntu的源里面都有的
直接安装: apt-get install enca dos2unix
首先先查看文本的编码
enca file
iconv -f GBK -t UTF-8 file 详细命令man一下
或者 enconv -f GBK -t UTF-8 file file.new
如果不是在windows下写的脚本 的话,一般文本的查看就这些了
不过如果是可执行的命令的话,
需要转换每行结尾的换行符
windows默认的 是 CRLF CRLF -- Carriage-Return Line-Feed 回车换行
就是回车(CR, ASCII 13, \r) 换行(LF, ASCII 10, \n
换行在有的ASCII码表也用newline(简nl)来进行表示,这里的lf是line feed的概念,意思是一样的。 这两个ACSII字符不会在屏幕有任何输出,但在Windows中广泛使用来标识一行的结束。而在Linux/UNIX系统中只有换行符。 CR和LF组合在一起即CRLF命令
它表示键盘上的"Enter"键(可以用来模拟回车键)
而linux中只有LF
Dos和windows采用回车+换行CR/LF表示下一行,
而UNIX/Linux采用换行符LF表示下一行,
苹果机(MAC OS系统)则采用回车符CR表示下一行.
CR用符号’r’表示, 十进制ASCII代码是13, 十六进制代码为0x0D;
LF使用’n’符号表示, ASCII代码是10, 十六制为0x0A.
(以上两段摘自别处)
而windows的CR/LF则在linux识别为^M
所有要使命令 能正确执行
dos2unix file
即可。