set和muliset

set就是数学上的集合——每个元素最多只能出现一次。

【关于set】
set是关联式容器。set作为一个容器也是用来存储同一数据类型的数据类型,并且能从一个数据集合中取出数据,在set中每个元素的值都唯一,而且系统能根据元素的值自动进行排序。应该注意的是set中数元素的值不能直接被改变。C++ STL中标准关联容器set, multiset, map, multimap内部采用的就是一种非常高效的平衡检索二叉树:红黑树,也称为RB树(Red-Black Tree)。RB树的统计性能要好于一般平衡二叉树,所以被STL选择作为了关联容器的内部结构。

 【关联型容器概述】

在学习序列式容器时,我们知道,容器中元素的顺序都是由程序决定的,程序可以随意指定新元素的插入位置,而对于关联型容器,它的所有元素都是经过排序的,关联型容器都是有序的。它的每一个元素都有一个键(key),容器中的元素是按照键的取值升序排列的。
关联型容器内部实现为一个二叉树,在二叉树中,每个元素都有一个父节点和两个子节点。左子树的所有元素都比自己小,右子树的所有元素都比自己大。

    A
   / \
  B   C
 / \    / \
  D E  F G

关联型容器内部结构都是以这种一叉树结构实现, 这也使得它可以高效地查找容器中的每一个元素,但却不能实现任意位置的操作。
标准库提供了四种关联型容器: set(集合)、multiset(多重集合)、map(映射)、multimap(多重映射),其中set与multiset 包含在头文件set中,map与multimap包含在头文件map中。

set与muliset的区别在于是否允许有重复元素,其他用法都很相似,因此将这两种容器放在一起进行讲解, 接下来我们就分 别讲解集合对象的创建及其常用的操作方法。

【set、muliset中常用的方法】
1、创建对象。

set与muliset中都重载了不同的构造函数,因此可以以不同的方式定义集合,set 集合的定义方式如下所示:
set<T> s;          //创建一个空的set集合,默认升序排列
set<T, op> s;        //创建一个空的set集合,按op规则排序
set<T> s(begin, end) ;     //创建一个集合,用[begin, end]区间为其 初始化
set<T,op> s (begin, end) ;    //创建集合,用[begin, end]区间为其初始化并按op规则排序
set<T> s(s1) ;       //创建一个空的set集合,用另一个集合s1初始化

set集合提供了五种重载构造函数,接下来我们分别用这五种方式定义不同的集合,代码
如下所示:
set<char> s1;
set<int, greater<int>()> s2;
set<float> s3(begin, end) ;
set<string,greater<string>()> s4 (begin, end) ;
set<int> s5(s2) ;
注:
geater<T>从大到小
less<T> 从小到大

上述代码分别用不同的方式定义了char、int等类型的集合,其中集合s2与s4中greater<T>则是排序规则,意指从大到小的顺序排列,如果没有排序规则,则默认规则是less<T>,意为从小到大排序,这是STL中定义的函数对象( functor),包含在头文件functional
与set集合一样,multiet也重载了这五种构造函数,接下来用这五种方式分别定史不同的multiset集合对象,代码如下所示:

multiset <char> ms1 ;
multiset <int, greater<int> ()> ms2;
multiset <float>ms3 (begin, end) ;
multiset <string, greater<string>()> ms4 (begin, end) ;
multiset <int> ms5(s2) ;

上述代码分别用五种不同的方式定义了五个multiset 集合对象,其定义中的参数与set集合一样,这里就不再赘述。

2、集合的大小,元素的查找和统计。

s.size();              //返回容器中元素的数目
s.max_size();       //返回容器中可容纳的最大元素数量
s.empty();      //判断容器是否为空

上述函数 调用中的s指集合容器,如无特殊说明,则s既可以是set容器也可以是multiset容器,即两个容器都提供了这样的函数。

s.find();      //查找函数

s.count();      //统计个数的函数

find( )函数的功能是返回key元素的位置,返回值是迭代器类型。count( )函数的功能是返回元素elem的个数,对于set集合来说,要么是0要么是1,而对于multiset来说,值可能大于1。

3、获取头尾部元素。

s.begin();     //返回容器中收元素的位置
s.end();      //返回容器中最后一个元素字后的迭代器

 

4、插入和删除元素。

s.insert(elem);     //在容器中插入元素elem
s.insert(pos, elem);    //在pos位置插入元素elem
s.insert(begin, end);    //在容器中插入[begin,end]区间的值

对于set容器来说,第一种形式的insert( )调用的返回值是pair<iterator, bool>对象,其第一个参数iterator 是迭代器,指示元素插入的位置;第二个参数bool类型的值代表元素是否插入成功。

这是因为set容器中不允许存在重复的元素,如果要插入一个容器中已存在的元素,则插入操作会失败,而pair中的bool值就是标识插入是否成功,而multiset不存在这样的情况,因此multiset返回的是-个 iterator。

set与multiset提供的erase( )函数也有几种实现形式,其函数调用形式如下所示:

s.erase (pos) ;          //删除pos位置上的元素
s.erase (begin, end) ;    //删除[begin, end) 区间上的元素
s.erase (elem) ;      / /删除元素elem
调用erase()函数可以删除某一个位置 上的元素,可以删除指定的元素,也可以删除指定范围的元素。

5、其他

equal_range() 返回一对定位器,分别表示第一个大于或等于给定关键值的元素和 第一个大于给定关键值的元素,这个返回值是一个pair类型,如果这一对定位器中哪个返回失败,就会等于end()的值。具体这个有什么用途我还没遇到过~~~
find() ,返回给定值值得定位器,如果没找到则返回end()。
lower_bound(key_value) ,返回第一个大于等于key_value的定位器
upper_bound(key_value),返回最后一个大于等于key_value的定位器


【示例代码】

 1 #include <iostream>
 2 #include <set>
 3 #include <functional>
 4 using namespace std;
 5 int main()
 6 {
 7     set<int, greater<int>> s;  //创建一个set容器,元素按降序排列
 8     multiset<char> ms;  //创建一个multiset容器
 9     cout << "s能容纳的最大元素数量" << s.max_size() << endl;
10     cout << "ms能容纳的最大元素数量" << ms.max_size() << endl;
11     //向s中插入元素
12     pair<set<int>::iterator, bool> ps;
13     ps = s.insert(12);
14     if (ps.second == true)
15         cout << "insert success" << endl;
16     s.insert(39);
17     s.insert(32);
18     s.insert(26);
19     //向ms中插入元素
20     ms.insert('a');
21     ms.insert('z');
22     ms.insert('T');
23     ms.insert('u');
24     ms.insert('u');
25     //输出两个容器中的元素
26     set<int>::iterator its; //创建s容器的迭代器,用于获取元素
27     cout << "s容器中元素:";
28     for (its = s.begin(); its != s.end(); its++)
29         cout << *its << " ";
30     cout << endl;
31     multiset<char>::iterator itms;  //创建ms容器的迭代器
32     cout << "ms容器中元素:";
33     for (itms = ms.begin(); itms != ms.end(); itms++)
34         cout << *itms << " ";
35     cout << endl;
36 
37     //查找两个容器中头尾元素
38     cout << "s头元素: " << *s.begin() << endl;
39     cout << "ms尾元素: " << *(--ms.end()) << endl;
40     //查找ms容器中u元素出现的次数
41     cout << "ms容器中u元素出现的次数:" << ms.count('u') << endl;
42     system("pause");
43     return 0;
44 }

运行结果如下

 

样例中创建了一个set容器s和一个multiset容器ms,其中容器s中的元素是按降序排列,代码9~ 10行调用max_ size( )函数分别算出两个容器的最大容量,代码12~24行分别调用insert( )函数向两个容器中插入元素,其中ms容器中插入了重复的元素u,代码26~35行分别创建相应的迭代器输出容器中的元素,由图8-14可知,s中的元素按降序排列,ms中的元素按升序排列。代码37~ 38行分别调用begin()与end( )函数输出s的头元素和ms的尾元素,由运行结果可知,两个元素输出成功。代码41行调用count( )函数输出ms容器中u元素的个数,由运行结果可知,ms容器中u元素有两个。

 

 

 最后我们用一到题来体会set的用处。

【问题描述】输入一个文本,找出所有不同的单词(连续的字母序列),按字典序从小到大输出。单词不区分大小写。

【样例输入】

Adventures in Disneyland

Two blondes were going to Disneyland when they came to a fork in the
road. The sign read: "Disneyland Left."

So they went home.

 

【样例输出】

a
adventures
blondes
came
disneyland
fork
going
home
in
left
read
road
sign
so
the
they
to
two
went
were
when

【代码如下】

 1 #include<iostream>
 2 #include<string>
 3 #include<set>
 4 #include<sstream>//stringstream要包含的头文件
 5 using namespace std;
 6 set<string> dict;//string 集合
 7 
 8 int main()
 9 {
10 
11     string  s, buf;
12     while (cin >> s)
13     {
14         for (int i = 0; i < s.length(); i++)
15             if (isalpha(s[i]))//是否是字母
16                 s[i] = tolower(s[i]);//变成小写
17             else
18                 s[i] = ' ';
19         stringstream ss(s);
20         //stringstream是字符串流。
21         //它将流与存储在内存中的string对象绑定起来。
22         //在多种数据类型之间实现自动格式化。
23         while (ss >> buf)
24             dict.insert(buf);//插入元素
25     }
26     for (set<string>::iterator it = dict.begin(); it != dict.end(); ++it)//循环输出
27         cout << *it << "\n";
28 
29     system("pause");
30     return 0;
31 }
View Code

 

posted @ 2018-06-23 08:59  底层码农  阅读(966)  评论(0编辑  收藏  举报