cin<<, cin.get,cin.getline等函数深入分析

 

 

很多初学者都认为cin函数是一个很简单的函数,其实不然!cin函数有很多需要了解的知识(比如:cin的返回值是什么,cin提供了哪些成员函数且分别是什么作用,如cin.clear(), cin.ignore(), cin.fail(), cin.good()等等),如果没有很好的掌握,在使用的时候很可能会出问题却不知其原因!而且很多人也确确实实遇到过不少问题,以下是几个简单的例子:

程序1

#include <iostream>

using namespace std;

int main()

{

       int m, n; 

       cin>>m;

    cin>>n;

       return 0;

}

测试情况:

如果用户每次都输入两个合法的数,程序不会出问题!

但是如果用户第一次输入时给一个非法的输入,比如说输入一个字符'a',你会发现程序不

会再执行第二条输入语句。似乎有点奇怪!!

程序2

#include <iostream>

using namespace std;

int main()

{

       char str[8]; 

       cin.getline(str, 5); 

       cout<<str<<endl; 

       cin.getline(str, 5); 

       cout<<str<<endl; 

       return 0;

}

程序的功能很简单,就是输入一个字符串再输出,再次输入一个字符串输出。程序执行情况:

测试一:

abcd (回车)

abcd (输出)

efgh (回车)

efgh (输出)

当用户第一次输入的字符串字符数小于4时,程序执行正常!

测试二:

abcdefgh (回车)

abcd (输出)

     (输出-换行)

当用户第一次输入的字符数字符数大于4时,第一个字符串接受输入的前四个字符,而第二次的输入操作没有执行,第二个字符串输出为空。似乎也很奇怪!!!

其实在很多时候都会遇到诸如此类的问题,如果不熟悉程序输入的原理和cin等一些函数的原理就不知道怎么解决!我在这里做一个简单的介绍,也许介绍得不是很准确和全面,或者存在一些误解,请大家包涵!

输入操作的原理

与前一节中提到的scanf函数一样,程序的输入都建有一个缓冲区,即输入缓冲区。一次输入过程是这样的,当一次键盘输入结束时会将输入的数据存入输入缓冲区,而cin函数直接从输入缓冲区中取数据。正因为cin函数是直接从缓冲区取数据的,所以有时候当缓冲区中有残留数据时,cin函数会直接取得这些残留数据而不会请求键盘输入,这就是例子中为什么会出现输入语句失效的原因!

cin的一些输入函数和操作符

cin is a extern istream object。提供了很多可用的成员函数和重载的操作符,如:cin<<, cin.get(), cin.getline()等。下面我们来了解一下这几个函数:

. cin<<

该操作符是根据后面变量的类型读取数据。

输入结束条件   :遇到EnterSpaceTab键。(这个很重要!)

对结束符的处理 :丢弃缓冲区中使得输入结束的结束符(EnterSpaceTab)

读字符的情况:

程序3

#include <iostream>

using namespace std;

int main()

{

       char c1, c2;

       cin>>c1;

       cin>>c2;

       cout<<c1<<" "<<c2<<endl;

       return 0; 

}

测试一输入:

a[Enter]

b[Enter]

输出:

a b

测试二输入:

a b[Enter]

输出:

a b

  

读字符串的情况:

程序4

#include <iostream>

using namespace std;

int main()

{

       char str1[10], str2[10];

       cin>>str1;

       cin>>str2;

       cout<<str1<<endl;

       cout<<str2<<endl;

       return 0; 

}

测试一输入:

abcd[Enter]

efgh[Enter]

输出:

abcd

efgh

【分析】输入遇到回车符结束,很正常。

测试二输入:

abcd efgh

输出:

abcd

efgh

【分析】第一次读取字符串时遇到空格则停止了,将abcd读入str1,并舍弃了空格,将后面的字符串给了第二个字符串。这证明了cin读入数据遇到空格结束;并且丢弃空格符;缓冲区有残留数据室,读入操作直接从缓冲区中取数据。

  

二.cin.get()

该函数有三种格式:无参,一参数,二参数

cin.get(), cin.get(char ch), cin.get(array_name, Arsize)

读取字符的情况:

输入结束条件:Enter

对结束符处理:不丢弃缓冲区中的Enter

cin.get() 与 cin.get(char ch)用于读取字符,他们的使用是相似的,

即:ch=cin.get() 与 cin.get(ch)是等价的。

程序5

#include <iostream>

using namespace std;

int main()

{

       char c1, c2;

       cin.get(c1);

       cin.get(c2);

       cout<<c1<<" "<<c2<<endl;   // 打印两个字符

       cout<<(int)c1<<" "<<(int)c2<<endl; // 打印这两个字符的ASCII

       return 0; 

}

测试一输入:

a[Enter]

输出:

a

97 10

【分析】会发现只执行了一次从键盘输入,显然第一个字符变量取的'a', 第二个变量取的是Enter(ASCII值为10),这是因为该函数不丢弃上次输入结束时的Enter字符,所以第一次输入结束时缓冲区中残留的是上次输入结束时的Enter字符!

测试二输入:

a b[Enter]

输出:

97 32

【分析】显然第一个字符变量取的'a', 第二个变量取的是Space(ASCII值为32)。原因同上,没有丢弃Space字符。

读取字符串的情况:

cin.get(array_name, Arsize)是用来读取字符串的,可以接受空格字符,遇到Enter结束输入,按照长度(Arsize)读取字符会丢弃最后的Enter字符。

程序6

#include <iostream>

using namespace std;

int main ()

{

char a[20];

cin.get(a, 10);

cout<<a<<endl;

return 0;

}

测试一输入:

abc def[Enter]

输出:

abc def

【分析】说明该函数输入字符串时可以接受空格。

测试二输入:

1234567890[Enter]

输出:

123456789

【分析】输入超长,则按需要的长度取数据。

程序7

#include <iostream>

using namespace std;

int main ()

{

char ch, a[20];

cin.get(a, 5);

cin>>ch;

cout<<a<<endl;

cout<<(int)ch<<endl;

return 0;

}

测试一输入:

12345[Enter]

输出:

1234

53

【分析】第一次输入超长,字符串按长度取了"1234",而'5'仍残留在缓冲区中,所以第二次输入字符没有从键盘读入,而是直接取了'5',所以打印的ASCII值是53('5'ASCII)

测试二输入:

1234[Enter]

a[Enter]

输出:

1234

97

【分析】第二次输入有效,说明该函数把第一次输入后的Enter丢弃了!

  

三.cin.getline()

cin.getline() 与 cin.get(array_name, Arsize)的读取方式差不多,以Enter结束,可以接受空格字符。按照长度(Arsize)读取字符会丢弃最后的Enter字符。

但是这两个函数是有区别的:

cin.get(array_name, Arsize)当输入的字符串超长时,不会引起cin函数的错误,后面的cin操作会继续执行,只是直接从缓冲区中取数据。但是cin.getline()当输入超长时,会引起cin函数的错误,后面的cin操作将不再执行。(具体原因将在下一部分"cin的错误处理"中详细介绍)

程序8

#include <iostream>

using namespace std;

int main ()

{

char ch, a[20];

cin.getline(a, 5);

cin>>ch;

cout<<a<<endl;

cout<<(int)ch<<endl;

return 0;

}

测试输入:

12345[Enter]

输出:

1234

-52

【分析】与cin.get(array_name, Arsize)的例程比较会发现,这里的ch并没有读取缓冲区中的5,而是返回了-52,这里其实cin>>ch语句没有执行,是因为cin出错了!下一部分将详细介绍。

在前一节中我们有几个例子中提到了cin函数出错,以致不再执行读操作(程序8)。而且我们经常会看到程序中会出现cin.clear(),cin.ignore(), cin.fail()等函数。这些函数都是与cin的错误处理有关的。这一节我们来分析一下cin的错误处理机制,并且学习几个重要的函数:cin.fail(), cin.bad(), cin.good(), cin.clear(), cin.ignore()等。

程序执行时有一个标志变量来标志输入的异常状态,其中有三位标志位分别用来标志三种异常信息,他们分别是:failbiteofbitbadbit。这三个标志位在标志变量中是这样分配的:
____________________________________
|     2     |     1    |     0     |
| failbit | eofbit |   badbit |
|___________|__________|___________|
看一下这几个标志位的作用(引用msdn)
badbit, to record a loss of integrity of the stream buffer.
eofbit, to record end-of-file while extracting from a stream.
failbit, to record a failure to extract a valid field from a stream.
In addition, a useful value is goodbit, where no bits are set.

接下来我么看几个ios类的数据定义(引用msdn)
typedef T2 iostate; 
static const iostate badbit, eofbit, failbit, goodbit;

这里ios类定义了这四个常量badbit, eofbit, failbit, goodbit,其实这四个标志常量就是取对应标志位的掩码,也即输入的四种异常情况!
以上四个常量对应的取值为:
ios::badbit    001   输入(输出)流出现致命错误,不可挽回 
ios::eofbit    010   已经到达文件尾
ios::failbit   100   输入(输出)流出现非致命错误,可挽回 
ios::goodbit   000   流状态完全正常各异常标志位都为0

我们可以用输出语句来验证这几个常量的值:
cout << ios:: failbit << endl;
cout << ios:: eofbit << endl;
cout << ios:: badbit << endl; 
cout << ios:: goodbit << endl;
输出的结果为:
4
2
1
0
【注意】它们不是failbitbadbiteofbitgoodbit这四个标记位的存贮变量,而是四个标志四种异常状态的常量,其实他们就相当于取对应状态标志位的掩码。如果标志变量为flag,则flag & failbit 就取得fail标志位。


搞清楚了标志位的原理后,我们来看几个关于异常标志的函数:

1iostate ios::rdstate()
取标志变量的值,我们可以用该函数取得整个标志变量的值,再与前面定义的标志位常量相与就可以获得对应标志位的状态。如:
void TestFlags( ios& x ) // 获得x流的三个标志位状态
{
cout << ( x.rdstate( ) & ios::badbit ) << endl;
cout << ( x.rdstate( ) & ios::failbit ) << endl;
cout << ( x.rdstate( ) & ios::eofbit ) << endl;
cout << endl;
}

2bool ios::fail() const;
1 or true if rdstate & failbit is nonzero, otherwise 0 or false. (引用msdn)
其中rdstate即通过rdstate()取得的标识变量的值,与failbit相与,即取得failbit标志位的值,如果结果非零则放回true,否则返回false。即该函数返回failbit的状态,将标志位状态通过bool值返回。

3bool ios::bad() const;
1 or true if rdstate & badbit is nonzero; otherwise 0. (引用msdn)
fail()相似。

4bool ios::good() const;
1 or true if rdstate == goodbit (no state flags are set), otherwise, 0 or false. (引用msdn)
改函数取goodbit的情况,即三个标志位都0(即没有任何异常情况)时返回true,否则返回false

5void ios::clear(iostate _State=goodbit);
该函数用来重置标识变量,_State是用来重置的值,默认为goodbit,即默认时将所有标志位清零。用户也可以传进参数,如:clear(failbit),这样就将标识变量置为failbit(即:001)
我们一般是用它的默认值,当cin出现异常,我们用该函数将所有标志位重置。如果cin出现异常,没有重置标志的话没法执行下一次的cin操作。如上一节的程序2的测试二为什么第二次输入操作没有执行?程序8中 cin>>ch 为什么没有执行?都是这个原因!!!
所以经常在程序中使用 cin.clear(), 为了重置错误标志!

6、另外还有一个函数 void ios::setstate(iostate _State);
这个函数也是用来设置标识变量的,但与clear()不同。clear()是将所有标志清零,在置以参数新的标志。而该函数不清零其他的标志,而只是将参数对应的标志位置位。这个函数不是经常使用,这里不再赘述。

在搞清楚了这几个函数后,对cin输入操作的错误处理就有了比较深的了解了。下面我们回过头来看看上一节程序8的测试,因为第一次用getline()读取字符串超长,所以导致出现异常,大家可以查看一下标志位来验证一下!所以会导致后面的 cin>>ch 语句没有执行。那我们利用前面学习的clear()函数来强制重置错误标志,看看会出现什么情况呢?
程序9
#include <iostream>
using namespace std;
int main ()
{
char ch, str[20];
cin.getline(str, 5);
cout<<"flag1:"<<cin.good()<<endl;    // 查看goodbit状态,即是否有异常
cin.clear();                         // 清除错误标志
cout<<"flag1:"<<cin.good()<<endl;    // 清除标志后再查看异常状态
cin>>ch; 
cout<<"str:"<<str<<endl;
cout<<"ch :"<<ch<<endl;
return 0;
}
测试输入:
12345[Enter]
输出:
flag1:0 // good()返回false说明有异常
flag2:1 // good()返回true说明,clear()已经清除了错误标志
str:1234
ch :5
【分析】程序执行结束还是只执行了一次读操作,cin>>ch还是没有从键盘读取数据,但是与程序8中不同,这里打印了ch的值为'5',而且在cin>>ch之前已经清楚了错误标志,也就是cin>>ch的读操作实际上执行了。这就是前面讲的cin读取数据的原理:它是直接从输入缓冲区中取数据的。此例中,第一次输入"12345", getline(str, 5)根据参数'5'只取缓冲区中的前4个字符,所以str取的是"1234",而字符'5'仍在缓冲区中,所以cin>>ch直接从缓冲区中取得数据,没有从键盘读取数据!
也就是当前一次读取数据出错后,如果缓冲区没有清空的话,重置错误标志还不够!要是能将缓冲区的残留数据清空了就好了哦!下面我们再来看一个很重要的函数!

7basic_istream& ignore(streamsize _Count = 1, int_type _Delim = traits_type::eof());
function: Causes a number of elements to be skipped from the current read position.
Parameters:
_Count, The number of elements to skip from the current read position.
_Delim, The element that, if encountered before count, causes ignore to return and allowing all elements after _Delim to be read. (引用msdn)
这个函数用来丢弃输入缓冲区中的字符,第一参数定义一个数,第二个参数定义一个字符变量。下面解释一下函数是怎样执行的:函数不停的从缓冲区中取一个字符,并判断是不是_Delim,如果不是则丢弃并进行计数,当计数达到_Count退出,如果是则丢弃字符退出。例:cin.ignore(5, 'a'); 函数将不断从缓冲区中取一个字符丢弃,直到丢弃的字符数达到5或者读取的字符为'a'。下面我们看个程序例子:
程序10
#include <iostream>
using namespace std;
int main ()
{
cin.ignore(5, 'a');
return 0;
}
测试一输入:
c[enter]
c[enter]
c[enter]
c[enter]
c[enter]
程序结束。
【分析】程序开始时缓冲区是空的,cin.ignore()到缓冲区中取数据,没有则请求从键盘输入,每次从键盘输入一个字符,如果不是'a'则丢弃,所以该测试中共输入了5次,直到计数达到5

测试二输入:
c[enter]
c[enter]
a[enter]
程序结束。
【分析】前面两个字符不是'a'丢弃且计数没达到5,第三次输入为'a', 丢弃该字符程序结束!


丢弃一个字符:
我们看看这个函数的默认值,第一个参数默认为1,第二个参数默认为EOF。所以cin.ignore()就是丢弃缓冲区中的第一个字符,这在程序中也是比较常用的!我们回过头看看程序5,程序5中用cin.get()读取字符,第一次读取时用回车符结束,而get函数不丢弃回车符,所以回车符仍残留在缓冲区中,导致第二次读取数据直接从缓冲区中取得回车符!这与我们最初的用以是不相符的,既然cin.get()不会自动丢弃输入结束时的回车符,这里我们学会了ignore()函数,我们就可以自己手动求其回车符啊!所以程序5可以这样改动:
程序11
#include <iostream>
using namespace std;
int main()
{
char c1, c2;
cin.get(c1);
        cin.ignore(); // 用该函数的默认情况,丢弃一个字符,即上次输入结束的回车符
cin.get(c2);
cout<<c1<<" "<<c2<<endl;   // 打印两个字符
cout<<(int)c1<<" "<<(int)c2<<endl; // 打印这两个字符的ASCII
return 0; 
}
测试一输入:
a[Enter]
b[Enter]
输出:
a
b
97 98
【分析】这样程序就正常了!


清空整个缓冲区:
其实该函数最常用的方式是这样的,将第一个参数设的非常大,将第二个参数设为'\n',这样就可以缓冲区中回车符中的所有残留数据,因为一般情况下前面输入残留的数据是没有用的,所以在进行新一次输入操作前将缓冲区中所有数据清空是比较合理。
如:cin.ignore(1024, '\n'); 
或者:cin.ignore(std::numeric_limits<std::streamsize>::max(), '\n'); 
std::numeric_limits<std::streamsize>::max()应该是定义的一个最大值,具体的我也不大明白,不再误导,敬请高手指点!)

posted @ 2012-01-18 23:12  江海不系舟  阅读(254)  评论(0编辑  收藏  举报