cheng_you_know

学而时习之!

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

转:http://www.cnblogs.com/dartagnan/archive/2010/12/14/2003499.html

问题来源:

“回车”(carriage return)VS  “换行”(line feed)
在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。
于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。
这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。
后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。
Unix系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<换行><回车>”,即“\n\r”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。
c语言编程时(windows系统)
\r 就是return 回到 本行 行首 这就会把这一行以前的输出 覆盖掉
如:
int main() {
cout << "hahaha" << "\r" << "xixi" ;
}
最后只显示 xixi 而 hahaha 背覆盖了
\n 是回车+换行 把光标 先移到 行首 然后换到下一行 也就是 下一行的行首拉
int main() {
cout << "hahaha" << "\n" << "xixi" ;
}




所谓回车、换行这些控制符,都是从以前的电传打字机的控制命令继承下来的。回车就是打印头复位,换行就是走纸。Dos/Windows和Unix/Linux对回车、换行的理解差别就在于Dos/Windows认为0d=0d0a=0a,而Unix/Linux坚持沿用电传打字机的工作方式(这个其实是比较正确的)。

所以在回车换行在Linux中是"0d",在Windows中是"0d0a".我们可以通过下面的程序测试一下:

上面的红色字体估计是原作者笔误,linux的换行符是\n,Ascii码是0a,而不是0d。至于要测试的话,可以使用od -t x1 文件名去查看。

而\r在linux下的vi看到的是蓝色的^M,是使用ctrl+m+v输出的,可以在命令模式中使用

:%s/^M//g删除,或者使用dos2unix去掉。

#define MAX_LENGTH 15536
#include
#include
using namespace std;
string delEnter(const string src) // 过滤掉串中的回车换行符
{
    string des;
    for(int i = 0; i < src.length(); i++)
    {
char tempChar = src[i];
        if( tempChar!=10 && tempChar!=13)
    des.append(1,tempChar);
    }
   return des;
}

int main()
{
        char html[MAX_LENGTH] = "";
        FILE *fp = fopen("Linux.txt", "rb"); //FILE *fp = fopen("Windows.txt", "rb");
        char buf[16384];
        while (fgets(buf, 16384, fp))
            strcat(html, buf);
        strcat(html,"\0");
        string s(html);
        cout << "string is: " << s << endl;;
        cout << "The size of string is: " << s.length() << endl;
        cout << "after del string is: " << delEnter(s) << endl;
        cout << "The size of string is: " << delEnter(s).length() << endl;

        fclose(fp);
        return 0;
}

程序中文件Linux.txt是从Linux系统中copy过来的。
我们可以通过这个程序观察到,通过过滤掉回车换行符,Linux文件中的字符数的减少等于其行数,而

Windows中等于其行数的两倍。但有一个问题要注意,程序中行:
FILE *fp = fopen("Linux.txt", "rb");
不能写成:
FILE *fp = fopen("Linux.txt", "r");
后者默认的文件打开方式是文本方式,这时系统自动对文本进行了转换,就不能得到上述的结论。

不过大家可以在Windows下用工具HexWorkShop,在Linux下用命令hexdump直接观察具体的二进制代码,更为直接。

原文地址:http://noding.bokee.com/3867119.html

关于回车和换行的历史。

回车和换行关于“回车”(carriage return)和“换行”(line feed)这两个概念的来历和区别。
在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。
于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。
这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。
后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。
Unix系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<换行><回 车>”,即“\n\r”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打 开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。

Dos和windows采用回车+换行CR/LF表示下一行,

    而UNIX/Linux采用换行符LF表示下一行,

     苹果机(MAC OS系统)则采用回车符CR表示下一行.


    CR用符号'\r'表示, 十进制ASCII代码是13, 十六进制代码为0x0D;

    LF使用'\n'符号表示, ASCII代码是10, 十六制为0x0A. 所以Windows平台上换行在文本文件中是使用 0d 0a 两个字节表示, 而UNIX和苹果平台上换行则是使用0a或0d一个字节表示.


    一般操作系统上的运行库会自动决定文本文件的换行格式. 如一个程序在windows上运行就生成CR/LF换行格式的文本文件,而在Linux上运行就生成LF格式换行的文本文件. 在一个平台上使用另一种换行符的文件文件可能会带来意想不到的问题, 特别是在编辑程序代码时. 有时候代码在编辑器中显示正常, 但在编辑时却会因为换行符问题而出错. 很多文本/代码编辑器带有换行符转换功能, 使用这个功能可以将文本文件中的换行符在不同格式单互换.

    在不同平台间使用FTP软件传送文件时, 在ascii文本模式传输模式下, 一些FTP客户端程序会自动对换行格式进行转换. 经过这种传输的文件字节数可能会发生变化. 如果你不想ftp修改原文件, 可以使用bin模式(二进制模式)传输文本.

posted on 2013-09-17 10:13  cheng_you_know  阅读(427)  评论(0编辑  收藏  举报