cin<<, cin.get,cin.getline等函数深入分析

很多初学者都认为cin函数是一个很简单的函数，其实不然！cin函数有很多需要了解的知识（比如：cin的返回值是什么，cin提供了哪些成员函数且分别是什么作用，如cin.clear(), cin.ignore(), cin.fail(), cin.good()等等），如果没有很好的掌握，在使用的时候很可能会出问题却不知其原因！而且很多人也确确实实遇到过不少问题，以下是几个简单的例子：

程序1：

#include <iostream>

using namespace std;

int main()

{

int m, n;

cin>>m;

cin>>n;

return 0;

}

测试情况：

如果用户每次都输入两个合法的数，程序不会出问题！

但是如果用户第一次输入时给一个非法的输入，比如说输入一个字符'a'，你会发现程序不

会再执行第二条输入语句。似乎有点奇怪！！

程序2：

#include <iostream>

using namespace std;

int main()

{

char str[8];

cin.getline(str, 5);

cout<<str<<endl;

cin.getline(str, 5);

cout<<str<<endl;

return 0;

}

程序的功能很简单，就是输入一个字符串再输出，再次输入一个字符串输出。程序执行情况：

测试一：

abcd (回车)

abcd (输出)

efgh (回车)

efgh (输出)

当用户第一次输入的字符串字符数小于4时，程序执行正常！

测试二：

abcdefgh (回车)

abcd (输出)

(输出-换行)

当用户第一次输入的字符数字符数大于4时，第一个字符串接受输入的前四个字符，而第二次的输入操作没有执行，第二个字符串输出为空。似乎也很奇怪！！！

其实在很多时候都会遇到诸如此类的问题，如果不熟悉程序输入的原理和cin等一些函数的原理就不知道怎么解决！我在这里做一个简单的介绍，也许介绍得不是很准确和全面，或者存在一些误解，请大家包涵！

输入操作的原理

与前一节中提到的scanf函数一样，程序的输入都建有一个缓冲区，即输入缓冲区。一次输入过程是这样的，当一次键盘输入结束时会将输入的数据存入输入缓冲区，而cin函数直接从输入缓冲区中取数据。正因为cin函数是直接从缓冲区取数据的，所以有时候当缓冲区中有残留数据时，cin函数会直接取得这些残留数据而不会请求键盘输入，这就是例子中为什么会出现输入语句失效的原因！

cin的一些输入函数和操作符

cin is a extern istream object。提供了很多可用的成员函数和重载的操作符，如：cin<<, cin.get(), cin.getline()等。下面我们来了解一下这几个函数：

一. cin<<

该操作符是根据后面变量的类型读取数据。

输入结束条件：遇到Enter、Space、Tab键。(这个很重要！)

对结束符的处理：丢弃缓冲区中使得输入结束的结束符(Enter、Space、Tab)

读字符的情况：

程序3：

#include <iostream>

using namespace std;

int main()

{

char c1, c2;

cin>>c1;

cin>>c2;

cout<<c1<<" "<<c2<<endl;

return 0;

}

测试一输入：

a[Enter]

b[Enter]

输出:

a b

测试二输入：

a b[Enter]

输出：

a b

读字符串的情况：

程序4：

#include <iostream>

using namespace std;

int main()

{

char str1[10], str2[10];

cin>>str1;

cin>>str2;

cout<<str1<<endl;

cout<<str2<<endl;

return 0;

}

测试一输入：

abcd[Enter]

efgh[Enter]

输出：

abcd

efgh

【分析】输入遇到回车符结束，很正常。

测试二输入：

abcd efgh

输出：

abcd

efgh

【分析】第一次读取字符串时遇到空格则停止了，将abcd读入str1，并舍弃了空格，将后面的字符串给了第二个字符串。这证明了cin读入数据遇到空格结束；并且丢弃空格符；缓冲区有残留数据室，读入操作直接从缓冲区中取数据。

二．cin.get()

该函数有三种格式：无参，一参数，二参数

即cin.get(), cin.get(char ch), cin.get(array_name, Arsize)

读取字符的情况：

输入结束条件：Enter键

对结束符处理：不丢弃缓冲区中的Enter

cin.get() 与 cin.get(char ch)用于读取字符，他们的使用是相似的，

即：ch=cin.get() 与 cin.get(ch)是等价的。

程序5：

#include <iostream>

using namespace std;

int main()

{

char c1, c2;

cin.get(c1);

cin.get(c2);

cout<<c1<<" "<<c2<<endl; // 打印两个字符

cout<<(int)c1<<" "<<(int)c2<<endl; // 打印这两个字符的ASCII值

return 0;

}

测试一输入：

a[Enter]

输出:

97 10

【分析】会发现只执行了一次从键盘输入，显然第一个字符变量取的'a', 第二个变量取的是Enter(ASCII值为10)，这是因为该函数不丢弃上次输入结束时的Enter字符，所以第一次输入结束时缓冲区中残留的是上次输入结束时的Enter字符！

测试二输入：

a b[Enter]

输出：

97 32

【分析】显然第一个字符变量取的'a', 第二个变量取的是Space(ASCII值为32)。原因同上，没有丢弃Space字符。

读取字符串的情况：

cin.get(array_name, Arsize)是用来读取字符串的，可以接受空格字符，遇到Enter结束输入，按照长度(Arsize)读取字符, 会丢弃最后的Enter字符。

程序6：

#include <iostream>

using namespace std;

int main ()

{

char a[20];

cin.get(a, 10);

cout<<a<<endl;

return 0;

}

测试一输入：

abc def[Enter]

输出：

abc def

【分析】说明该函数输入字符串时可以接受空格。

测试二输入：

1234567890[Enter]

输出：

123456789

【分析】输入超长，则按需要的长度取数据。

程序7：

#include <iostream>

using namespace std;

int main ()

{

char ch, a[20];

cin.get(a, 5);

cin>>ch;

cout<<a<<endl;

cout<<(int)ch<<endl;

return 0;

}

测试一输入：

12345[Enter]

输出：

1234

【分析】第一次输入超长，字符串按长度取了"1234"，而'5'仍残留在缓冲区中，所以第二次输入字符没有从键盘读入，而是直接取了'5'，所以打印的ASCII值是53('5'的ASCII值)。

测试二输入：

1234[Enter]

a[Enter]

输出：

1234

【分析】第二次输入有效，说明该函数把第一次输入后的Enter丢弃了！

三．cin.getline()

cin.getline() 与 cin.get(array_name, Arsize)的读取方式差不多，以Enter结束，可以接受空格字符。按照长度(Arsize)读取字符, 会丢弃最后的Enter字符。

但是这两个函数是有区别的：

cin.get(array_name, Arsize)当输入的字符串超长时，不会引起cin函数的错误，后面的cin操作会继续执行，只是直接从缓冲区中取数据。但是cin.getline()当输入超长时，会引起cin函数的错误，后面的cin操作将不再执行。（具体原因将在下一部分"cin的错误处理"中详细介绍）

程序8：

#include <iostream>

using namespace std;

int main ()

{

char ch, a[20];

cin.getline(a, 5);

cin>>ch;

cout<<a<<endl;

cout<<(int)ch<<endl;

return 0;

}

测试输入：

12345[Enter]

输出：

1234

-52

【分析】与cin.get(array_name, Arsize)的例程比较会发现，这里的ch并没有读取缓冲区中的5，而是返回了-52，这里其实cin>>ch语句没有执行，是因为cin出错了！下一部分将详细介绍。

在前一节中我们有几个例子中提到了cin函数出错，以致不再执行读操作(程序8)。而且我们经常会看到程序中会出现cin.clear(),cin.ignore(), cin.fail()等函数。这些函数都是与cin的错误处理有关的。这一节我们来分析一下cin的错误处理机制，并且学习几个重要的函数：cin.fail(), cin.bad(), cin.good(), cin.clear(), cin.ignore()等。

程序执行时有一个标志变量来标志输入的异常状态，其中有三位标志位分别用来标志三种异常信息，他们分别是：failbit，eofbit，badbit。这三个标志位在标志变量中是这样分配的：
____________________________________
| 2 | 1 | 0 |
| failbit | eofbit | badbit |
|___________|__________|___________|
看一下这几个标志位的作用(引用msdn)：
badbit, to record a loss of integrity of the stream buffer.
eofbit, to record end-of-file while extracting from a stream.
failbit, to record a failure to extract a valid field from a stream.
In addition, a useful value is goodbit, where no bits are set.

接下来我么看几个ios类的数据定义(引用msdn)：
typedef T2 iostate;
static const iostate badbit, eofbit, failbit, goodbit;

这里ios类定义了这四个常量badbit, eofbit, failbit, goodbit，其实这四个标志常量就是取对应标志位的掩码，也即输入的四种异常情况！
以上四个常量对应的取值为：
ios::badbit    001   输入（输出）流出现致命错误，不可挽回
ios::eofbit    010   已经到达文件尾
ios::failbit   100   输入（输出）流出现非致命错误，可挽回
ios::goodbit   000   流状态完全正常, 各异常标志位都为0

我们可以用输出语句来验证这几个常量的值：
cout << ios:: failbit << endl;
cout << ios:: eofbit << endl;
cout << ios:: badbit << endl;
cout << ios:: goodbit << endl;
输出的结果为：
4
2
1
0
【注意】它们不是failbit、badbit、eofbit、goodbit这四个标记位的存贮变量，而是四个标志四种异常状态的常量，其实他们就相当于取对应状态标志位的掩码。如果标志变量为flag，则flag & failbit 就取得fail标志位。

搞清楚了标志位的原理后，我们来看几个关于异常标志的函数：

1、iostate ios::rdstate()
取标志变量的值，我们可以用该函数取得整个标志变量的值，再与前面定义的标志位常量相与就可以获得对应标志位的状态。如：
void TestFlags( ios& x ) // 获得x流的三个标志位状态
{
cout << ( x.rdstate( ) & ios::badbit ) << endl;
cout << ( x.rdstate( ) & ios::failbit ) << endl;
cout << ( x.rdstate( ) & ios::eofbit ) << endl;
cout << endl;
}

2、bool ios::fail() const;
1 or true if rdstate & failbit is nonzero, otherwise 0 or false. (引用msdn)
其中rdstate即通过rdstate()取得的标识变量的值，与failbit相与，即取得failbit标志位的值，如果结果非零则放回true，否则返回false。即该函数返回failbit的状态，将标志位状态通过bool值返回。

3、bool ios::bad() const;
1 or true if rdstate & badbit is nonzero; otherwise 0. (引用msdn)
与fail()相似。

4、bool ios::good() const;
1 or true if rdstate == goodbit (no state flags are set), otherwise, 0 or false. (引用msdn)
改函数取goodbit的情况，即三个标志位都0(即没有任何异常情况)时返回true，否则返回false。

5、void ios::clear(iostate _State=goodbit);
该函数用来重置标识变量，_State是用来重置的值，默认为goodbit，即默认时将所有标志位清零。用户也可以传进参数，如：clear(failbit)，这样就将标识变量置为failbit(即：001)。
我们一般是用它的默认值，当cin出现异常，我们用该函数将所有标志位重置。如果cin出现异常，没有重置标志的话没法执行下一次的cin操作。如上一节的程序2的测试二为什么第二次输入操作没有执行？程序8中 cin>>ch 为什么没有执行？都是这个原因！！！
所以经常在程序中使用 cin.clear(), 为了重置错误标志！

6、另外还有一个函数 void ios::setstate(iostate _State);
这个函数也是用来设置标识变量的，但与clear()不同。clear()是将所有标志清零，在置以参数新的标志。而该函数不清零其他的标志，而只是将参数对应的标志位置位。这个函数不是经常使用，这里不再赘述。

在搞清楚了这几个函数后，对cin输入操作的错误处理就有了比较深的了解了。下面我们回过头来看看上一节程序8的测试，因为第一次用getline()读取字符串超长，所以导致出现异常，大家可以查看一下标志位来验证一下！所以会导致后面的 cin>>ch 语句没有执行。那我们利用前面学习的clear()函数来强制重置错误标志，看看会出现什么情况呢？
程序9：
#include <iostream>
using namespace std;
int main ()
{
char ch, str[20];
cin.getline(str, 5);
cout<<"flag1:"<<cin.good()<<endl;    // 查看goodbit状态，即是否有异常
cin.clear();                         // 清除错误标志
cout<<"flag1:"<<cin.good()<<endl;    // 清除标志后再查看异常状态
cin>>ch;
cout<<"str:"<<str<<endl;
cout<<"ch :"<<ch<<endl;
return 0;
}
测试输入：
12345[Enter]
输出：
flag1:0 // good()返回false说明有异常
flag2:1 // good()返回true说明，clear()已经清除了错误标志
str:1234
ch :5
【分析】程序执行结束还是只执行了一次读操作，cin>>ch还是没有从键盘读取数据，但是与程序8中不同，这里打印了ch的值为'5'，而且在cin>>ch之前已经清楚了错误标志，也就是cin>>ch的读操作实际上执行了。这就是前面讲的cin读取数据的原理：它是直接从输入缓冲区中取数据的。此例中，第一次输入"12345", 而getline(str, 5)根据参数'5'只取缓冲区中的前4个字符，所以str取的是"1234"，而字符'5'仍在缓冲区中，所以cin>>ch直接从缓冲区中取得数据，没有从键盘读取数据！
也就是当前一次读取数据出错后，如果缓冲区没有清空的话，重置错误标志还不够！要是能将缓冲区的残留数据清空了就好了哦！下面我们再来看一个很重要的函数！

7、basic_istream& ignore(streamsize _Count = 1, int_type _Delim = traits_type::eof());
function: Causes a number of elements to be skipped from the current read position.
Parameters:
_Count, The number of elements to skip from the current read position.
_Delim, The element that, if encountered before count, causes ignore to return and allowing all elements after _Delim to be read. (引用msdn)
这个函数用来丢弃输入缓冲区中的字符，第一参数定义一个数，第二个参数定义一个字符变量。下面解释一下函数是怎样执行的：函数不停的从缓冲区中取一个字符，并判断是不是_Delim，如果不是则丢弃并进行计数，当计数达到_Count退出，如果是则丢弃字符退出。例：cin.ignore(5, 'a'); 函数将不断从缓冲区中取一个字符丢弃，直到丢弃的字符数达到5或者读取的字符为'a'。下面我们看个程序例子：
程序10：
#include <iostream>
using namespace std;
int main ()
{
cin.ignore(5, 'a');
return 0;
}
测试一输入：
c[enter]
c[enter]
c[enter]
c[enter]
c[enter]
程序结束。
【分析】程序开始时缓冲区是空的，cin.ignore()到缓冲区中取数据，没有则请求从键盘输入，每次从键盘输入一个字符，如果不是'a'则丢弃，所以该测试中共输入了5次，直到计数达到5。

测试二输入：
c[enter]
c[enter]
a[enter]
程序结束。
【分析】前面两个字符不是'a'丢弃且计数没达到5，第三次输入为'a', 丢弃该字符程序结束！

丢弃一个字符：
我们看看这个函数的默认值，第一个参数默认为1，第二个参数默认为EOF。所以cin.ignore()就是丢弃缓冲区中的第一个字符，这在程序中也是比较常用的！我们回过头看看程序5，程序5中用cin.get()读取字符，第一次读取时用回车符结束，而get函数不丢弃回车符，所以回车符仍残留在缓冲区中，导致第二次读取数据直接从缓冲区中取得回车符！这与我们最初的用以是不相符的，既然cin.get()不会自动丢弃输入结束时的回车符，这里我们学会了ignore()函数，我们就可以自己手动求其回车符啊！所以程序5可以这样改动：
程序11：
#include <iostream>
using namespace std;
int main()
{
char c1, c2;
cin.get(c1);
cin.ignore(); // 用该函数的默认情况，丢弃一个字符，即上次输入结束的回车符
cin.get(c2);
cout<<c1<<" "<<c2<<endl; // 打印两个字符
cout<<(int)c1<<" "<<(int)c2<<endl; // 打印这两个字符的ASCII值
return 0;
}
测试一输入：
a[Enter]
b[Enter]
输出:
a
b
97 98
【分析】这样程序就正常了！

清空整个缓冲区：
其实该函数最常用的方式是这样的，将第一个参数设的非常大，将第二个参数设为'\n'，这样就可以缓冲区中回车符中的所有残留数据，因为一般情况下前面输入残留的数据是没有用的，所以在进行新一次输入操作前将缓冲区中所有数据清空是比较合理。
如：cin.ignore(1024, '\n');
或者：cin.ignore(std::numeric_limits<std::streamsize>::max(), '\n');
（std::numeric_limits<std::streamsize>::max()应该是定义的一个最大值，具体的我也不大明白，不再误导，敬请高手指点！）

posted @ 2012-01-18 23:12 江海不系舟阅读(286) 评论(0) 收藏举报

刷新页面返回顶部

这个世界自始至终只有两种人：一种是像我这样的人，一种是不像我这样的人。

cin<<, cin.get,cin.getline等函数深入分析

公告