set和muliset
set就是数学上的集合——每个元素最多只能出现一次。
【关于set】
set是关联式容器。set作为一个容器也是用来存储同一数据类型的数据类型,并且能从一个数据集合中取出数据,在set中每个元素的值都唯一,而且系统能根据元素的值自动进行排序。应该注意的是set中数元素的值不能直接被改变。C++ STL中标准关联容器set, multiset, map, multimap内部采用的就是一种非常高效的平衡检索二叉树:红黑树,也称为RB树(Red-Black Tree)。RB树的统计性能要好于一般平衡二叉树,所以被STL选择作为了关联容器的内部结构。
【关联型容器概述】
在学习序列式容器时,我们知道,容器中元素的顺序都是由程序决定的,程序可以随意指定新元素的插入位置,而对于关联型容器,它的所有元素都是经过排序的,关联型容器都是有序的。它的每一个元素都有一个键(key),容器中的元素是按照键的取值升序排列的。
关联型容器内部实现为一个二叉树,在二叉树中,每个元素都有一个父节点和两个子节点。左子树的所有元素都比自己小,右子树的所有元素都比自己大。
A
/ \
B C
/ \ / \
D E F G
关联型容器内部结构都是以这种一叉树结构实现, 这也使得它可以高效地查找容器中的每一个元素,但却不能实现任意位置的操作。
标准库提供了四种关联型容器: set(集合)、multiset(多重集合)、map(映射)、multimap(多重映射),其中set与multiset 包含在头文件set中,map与multimap包含在头文件map中。
set与muliset的区别在于是否允许有重复元素,其他用法都很相似,因此将这两种容器放在一起进行讲解, 接下来我们就分 别讲解集合对象的创建及其常用的操作方法。
【set、muliset中常用的方法】
1、创建对象。
set与muliset中都重载了不同的构造函数,因此可以以不同的方式定义集合,set 集合的定义方式如下所示:
set<T> s; //创建一个空的set集合,默认升序排列
set<T, op> s; //创建一个空的set集合,按op规则排序
set<T> s(begin, end) ; //创建一个集合,用[begin, end]区间为其 初始化
set<T,op> s (begin, end) ; //创建集合,用[begin, end]区间为其初始化并按op规则排序
set<T> s(s1) ; //创建一个空的set集合,用另一个集合s1初始化
set集合提供了五种重载构造函数,接下来我们分别用这五种方式定义不同的集合,代码
如下所示:
set<char> s1;
set<int, greater<int>()> s2;
set<float> s3(begin, end) ;
set<string,greater<string>()> s4 (begin, end) ;
set<int> s5(s2) ;
注:
geater<T>从大到小
less<T> 从小到大
上述代码分别用不同的方式定义了char、int等类型的集合,其中集合s2与s4中greater<T>则是排序规则,意指从大到小的顺序排列,如果没有排序规则,则默认规则是less<T>,意为从小到大排序,这是STL中定义的函数对象( functor),包含在头文件functional中
与set集合一样,multiet也重载了这五种构造函数,接下来用这五种方式分别定史不同的multiset集合对象,代码如下所示:
multiset <char> ms1 ;
multiset <int, greater<int> ()> ms2;
multiset <float>ms3 (begin, end) ;
multiset <string, greater<string>()> ms4 (begin, end) ;
multiset <int> ms5(s2) ;
上述代码分别用五种不同的方式定义了五个multiset 集合对象,其定义中的参数与set集合一样,这里就不再赘述。
2、集合的大小,元素的查找和统计。
s.size(); //返回容器中元素的数目
s.max_size(); //返回容器中可容纳的最大元素数量
s.empty(); //判断容器是否为空
上述函数 调用中的s指集合容器,如无特殊说明,则s既可以是set容器也可以是multiset容器,即两个容器都提供了这样的函数。
s.find(); //查找函数
s.count(); //统计个数的函数
find( )函数的功能是返回key元素的位置,返回值是迭代器类型。count( )函数的功能是返回元素elem的个数,对于set集合来说,要么是0要么是1,而对于multiset来说,值可能大于1。
3、获取头尾部元素。
s.begin(); //返回容器中收元素的位置
s.end(); //返回容器中最后一个元素字后的迭代器
4、插入和删除元素。
s.insert(elem); //在容器中插入元素elem
s.insert(pos, elem); //在pos位置插入元素elem
s.insert(begin, end); //在容器中插入[begin,end]区间的值
对于set容器来说,第一种形式的insert( )调用的返回值是pair<iterator, bool>对象,其第一个参数iterator 是迭代器,指示元素插入的位置;第二个参数bool类型的值代表元素是否插入成功。
这是因为set容器中不允许存在重复的元素,如果要插入一个容器中已存在的元素,则插入操作会失败,而pair中的bool值就是标识插入是否成功,而multiset不存在这样的情况,因此multiset返回的是-个 iterator。
set与multiset提供的erase( )函数也有几种实现形式,其函数调用形式如下所示:
s.erase (pos) ; //删除pos位置上的元素
s.erase (begin, end) ; //删除[begin, end) 区间上的元素
s.erase (elem) ; / /删除元素elem
调用erase()函数可以删除某一个位置 上的元素,可以删除指定的元素,也可以删除指定范围的元素。
5、其他
equal_range() 返回一对定位器,分别表示第一个大于或等于给定关键值的元素和 第一个大于给定关键值的元素,这个返回值是一个pair类型,如果这一对定位器中哪个返回失败,就会等于end()的值。具体这个有什么用途我还没遇到过~~~
find() ,返回给定值值得定位器,如果没找到则返回end()。
lower_bound(key_value) ,返回第一个大于等于key_value的定位器
upper_bound(key_value),返回最后一个大于等于key_value的定位器
【示例代码】
1 #include <iostream> 2 #include <set> 3 #include <functional> 4 using namespace std; 5 int main() 6 { 7 set<int, greater<int>> s; //创建一个set容器,元素按降序排列 8 multiset<char> ms; //创建一个multiset容器 9 cout << "s能容纳的最大元素数量" << s.max_size() << endl; 10 cout << "ms能容纳的最大元素数量" << ms.max_size() << endl; 11 //向s中插入元素 12 pair<set<int>::iterator, bool> ps; 13 ps = s.insert(12); 14 if (ps.second == true) 15 cout << "insert success" << endl; 16 s.insert(39); 17 s.insert(32); 18 s.insert(26); 19 //向ms中插入元素 20 ms.insert('a'); 21 ms.insert('z'); 22 ms.insert('T'); 23 ms.insert('u'); 24 ms.insert('u'); 25 //输出两个容器中的元素 26 set<int>::iterator its; //创建s容器的迭代器,用于获取元素 27 cout << "s容器中元素:"; 28 for (its = s.begin(); its != s.end(); its++) 29 cout << *its << " "; 30 cout << endl; 31 multiset<char>::iterator itms; //创建ms容器的迭代器 32 cout << "ms容器中元素:"; 33 for (itms = ms.begin(); itms != ms.end(); itms++) 34 cout << *itms << " "; 35 cout << endl; 36 37 //查找两个容器中头尾元素 38 cout << "s头元素: " << *s.begin() << endl; 39 cout << "ms尾元素: " << *(--ms.end()) << endl; 40 //查找ms容器中u元素出现的次数 41 cout << "ms容器中u元素出现的次数:" << ms.count('u') << endl; 42 system("pause"); 43 return 0; 44 }
运行结果如下
样例中创建了一个set容器s和一个multiset容器ms,其中容器s中的元素是按降序排列,代码9~ 10行调用max_ size( )函数分别算出两个容器的最大容量,代码12~24行分别调用insert( )函数向两个容器中插入元素,其中ms容器中插入了重复的元素u,代码26~35行分别创建相应的迭代器输出容器中的元素,由图8-14可知,s中的元素按降序排列,ms中的元素按升序排列。代码37~ 38行分别调用begin()与end( )函数输出s的头元素和ms的尾元素,由运行结果可知,两个元素输出成功。代码41行调用count( )函数输出ms容器中u元素的个数,由运行结果可知,ms容器中u元素有两个。
最后我们用一到题来体会set的用处。
【问题描述】输入一个文本,找出所有不同的单词(连续的字母序列),按字典序从小到大输出。单词不区分大小写。
【样例输入】
Adventures in Disneyland
Two blondes were going to Disneyland when they came to a fork in the
road. The sign read: "Disneyland Left."
So they went home.
【样例输出】
a
adventures
blondes
came
disneyland
fork
going
home
in
left
read
road
sign
so
the
they
to
two
went
were
when
【代码如下】
1 #include<iostream> 2 #include<string> 3 #include<set> 4 #include<sstream>//stringstream要包含的头文件 5 using namespace std; 6 set<string> dict;//string 集合 7 8 int main() 9 { 10 11 string s, buf; 12 while (cin >> s) 13 { 14 for (int i = 0; i < s.length(); i++) 15 if (isalpha(s[i]))//是否是字母 16 s[i] = tolower(s[i]);//变成小写 17 else 18 s[i] = ' '; 19 stringstream ss(s); 20 //stringstream是字符串流。 21 //它将流与存储在内存中的string对象绑定起来。 22 //在多种数据类型之间实现自动格式化。 23 while (ss >> buf) 24 dict.insert(buf);//插入元素 25 } 26 for (set<string>::iterator it = dict.begin(); it != dict.end(); ++it)//循环输出 27 cout << *it << "\n"; 28 29 system("pause"); 30 return 0; 31 }