Multiset ------ 多重集合
Multiset的中文名是多重集合,其实就是集合的扩展版。唯一的不同是集合中一个值只能出现一次,而多重集合中一个值可以出现多次。
粗略看了看MSDN,在STL中,multiset和set的成员函数声明也是基本一样的,一些需要注意的地方是:
- set::insert(key)的返回值是一个pair<iterator, bool>,其中pair中的bool成员表明了key被插入之前,set中是否已存在相同的key。根据我在VS2010上的实验结果,如果set中已经存在相同key的元素,那么插入操作是会失败的,新的元素不会被插进去。而multiset::insert的返回值只是一个iterator,插入操作总是会成功的。
- multiset::count(key)的返回值可能大于1。
- multiset::size()的返回值是多重集合的势(cardinality),即multiset中元素的个数,而不是值的个数。比如,{1, 1, 2}的size是3,而不是2。
- multiset::erase(key)会将对应的key全部删掉,所以对{1, 1, 2}调用erase(1)之后,它就变成了{2}。
- 只要key存在于集合中,set::equal_range(key)的返回值pair<iterator1, iterator2>总是会有++iterator1 == iterator2。但是对multiset来说就不一定了。
什么时候需要用multiset?当然是需要用set,但是又允许重复key存在的时候了。什么时候用set?我的答案是:需要随时往容器中插入元素,随时对元素进行快速查找,又需要按某种顺序对元素进行遍历的时候——如果没有第三项需求的话可以用非标准库的hash_或标准库的unordered_开头的容器。
举一个Wikipedia上的例子:假设我们需要将一个很大的数n分解为多个质数因子的乘积,并将这些质数因子存储在容器中,供以后查询和遍历用。比如对于n = 120 = 2 x 2 x 2 x 3 x 5,我们可以将它的质数因子存储为primeFactorMultiset = { 2, 2, 2, 3, 5 }。当然也可以用map,将质数因子本身存为key,将该因子的出现次数存为value。但是考虑一下下面的需求:
-
我们想知道n可以分解为多少个质数因子的乘积。如果用map的话,代码如下:
- int numPrimeFactors = 0;
- for (auto iter = primeFactorMap.begin(); primeFactorMap.end() != iter; ++iter)
- {
- numPrimeFactors += iter->second;
- }
for循环执行完后的numPrimeFactors才是我们想要的结果。
如果用multiset,我们只需要调用primeFactorMultiset.size()。
-
我们想打印出2 2 2 3 5这样的序列。
用map要两重循环:
- for (auto iter = primeFactorMap.begin(); primeFactorMap.end() != iter; ++iter)
- {
- for (int i = 0; i < iter->second; ++i)
- {
- cout << iter->first << ' ';
- }
- }
用multiset只要一重循环,代码又简洁了一点:
- for (auto iter = primeFactorMultiset.begin(); primeFactorMultiset.end() != iter; ++iter)
- {
- cout << *iter << ' ';
- }