【c++ Prime 学习笔记】第11章 关联容器
11.1 使用关联容器
map
类型常称为关联数组
(字典
),但其下标不必是整数,且通过关键字而不是位置来查找值set
是关键字的简单集合,只想知道一个值是否存在或出现的次数时,很有用
使用map
- 关联容器也是模板
- 定义map,必须在模板参数中指定key和value类型
- map的元素都是pair类型,pair也是模板,保存两个public数据成员(first和second)。map使用的pair的first成员是关键字,second是值
map<string,size_t> word_count; //默认初始化字典
string word;
while(cin>>word)
++word_count[word]; //提取word的计数器并将其加1
for(const auto &w:word_count) //遍历字典元素
cout<<w.first<<" occurs "<<w.second //pair类型,first成员是key,second成员是value
<<((w.second>1)?" times":" time")<<endl;
使用set
- set是模板,使用时必须在模板参数中指定元素类型
- 可以对关联容器(set和map都可)做
列表初始化
- set的
find
方法返回一个迭代器,若给定关键字在set中则返回指向它的迭代器,否则返回end
map<string,size_t> word_count; //默认初始化字典
set<stirng> exclude={"The","But","And"}; //列表初始化集合
string word;
while(cin>>word)
if(exclude.find(word)==exclude.end()) //在集合中查找元素,返回迭代器若为end则未找到
++word_count[word];
11.2 关联容器概述
- 所有关联容器都支持表9.2中的通用容器操作,但不支持顺序容器特有的操作,例如push_front或push_back。原因是关联容器中元素是根据关键字存储的
- 关联容器支持顺序容器不支持的操作和类型别名
- 关联容器的迭代器都是
双向迭代器
11.2.1 定义关联容器
- 定义map时需在模板参数中给出key和value的类型,定义set时需在模板参数中给出关键字类型
- 定义关联容器的4种方法:
- 关联容器都有
默认构造函数
,生成空容器 - 可将关联容器初始化为另一个
同类型容器的拷贝
- 可用
元素范围初始化
关联容器,只要这些元素可转换为关联容器所需类型 - C++11允许对关联容器使用值初始化(
列表初始化
)
- 关联容器都有
- 对map做列表初始化时,每个元素也是一个花括号列表,其中包含两个值
{key, value}
pair<string, string> anon; // 空容器
set<stirng> exclude={"The","But","And"}; //列表初始化
pair<string, string> author = {{"James", "Joyce"},
{"Austen", "Jane"}}; // 也可为每个成员提供初始化器
初始化 multimap 和multiset
- map和set的关键字必唯一,但multimap和multiset允许多个元素有相同关键字
11.2.2 关键字类型的要求
- set的关键字就是元素,map的关键字是元素的first的类型
- 对于有序关联容器(map、multimap、set、multiset),关键字类型必须有序,默认使用元素类型的
<
算符。
有序容器的关键字类型
- 可提供自定义操作代替
<
算符,要求自定义操作在关键字类型上定义严格弱序
:- 两关键字不能同时“小于等于”对方
- “小于等于”具有传递性
- 若两关键字都不“小于等于”对方,则称为“等价”,“等价”具有传递性
- 若两关键字等价,则关联容器认为它们相等。用作map的key时,只能有一个value与这两个key关联,用任一个key访问都得到这个value
使用关键字类型的比较函数
- multiset<关键字类型>
- 若使用自定义的严格弱序函数,则定义关联容器时,必须在模板参数中给出
该函数指针类型
,在构造函数参数中给出该函数
//定义严格弱序
bool compareIsbn(const Sales_data &lhs, const Sales_data &rhs){
return lhs.isbn()<rhs.isbn();
}
using SalesSetType=multiset<Sales_data,decltype(compareIsbn) *>; //自定义了严格弱序的multiset类型
SalesSetType bookstore(compareIsbn); //自定义了严格弱序的multiset对象
11.2.3 pair 类型
pair
类型定义于utility
头文件中- 一个pair保存两个public的数据成员,分别叫first和second
- pair是模板,创建时需在模板参数中指定两个数据成员的类型,两个类型不要求一样
- pair的默认构造函数对数据成员做
值初始化
创建 pair 对象的函数
pair<string int> process(vector<string> &v){
if(!v.empty())
return {v.back(),v.back().size()}; //列表初始化返回值
else
return pair<string,int>(); //隐式构造返回值
}
if(!v.empty())
return make_pair(v.back(),v.back().size()); //列表初始化返回值
11.3 关联容器操作
关联容器额外的类型别名
key_type
此容器类型的关键字类型mapped_type
每个关键字关联的类型,只适用于mapvalue_type
对于set,与key_type相同;
对于map,为pair<const key_type, mapped_type>
11.3.1 关联容器迭代器
迭代器解引用
- 解引用关联容器迭代器时,得到一个类型为容器的
value_type
的引用。 - set迭代器解引用得到的都是关键字引用,都是const。虽然同时存在iterator和const_iterator类型,但都不可写
- map迭代器解引用得到的是pair的引用,first为const。其iterator可写second,const_iterator不可写
遍历关联容器
- map和set都有
begin
和end
成员函数,可得到迭代器用于遍历元素
关联容器和算法
- 关联容器很少使用
泛型算法
- 通常不对关联容器使用泛型算法。因为关键字是const,元素不可改变也不可重排。
- 关联容器只可使用只读算法,但这些算法在关联容器中搜索时效率低下。例如用关联容器的
find成员函数
比泛型find函数
快得多 - 如果真要对关联容器使用泛型算法,则只能把它当源序列,或当zuo目的位置用inserter插入
11.3.2 添加元素
- 对于无重复关键字的map和set,若插入元素的key在容器中已存在,则插入失败,insert不做任何事
- insert有两个版本
- 接受一对迭代器,这些迭代器指向的类型可转为该容器的value_type
- 接受initializer_list,即花括号列表,该列表用于构造一个value_type
vector<int> ivec={2,4,6,8,2,4,6,8};
set<int> set2;
set2.insert(ivec.begin(), ivec.end());//4个元素
set2.insert({1,3,5,7,1,3,5,7}); //8个元素
word_count.insert({word,1}); //花括号列表转为initializer_list
word_count.insert(make_pair(word,1)); //make_pair函数生成pair
word_count.insert(pair<string,size_t>(word,1)); //显式构造pair
word_count.insert(map<string,size_t>::value_type(word,1)); //显式构造value_type
检测 insert 的返回值
- insert/emplace的返回值依赖于容器类型和参数
- 向set/map添加单一元素,则insert/emplace返回一个
pair
,其first为迭代器,second为bool。- 若关键字不在容器中,则插入。first指向插入的元素,second为true
- 若关键字在容器中,则插入失败。first指向给定元素,second为false
map<string,size_t> word_count;
string word;
while(cin>>word){
//ret的类型是pair<map<string,size_t>::iterator,bool>
auto ret=word_count.insert({word,1}); //尝试插入关键字和初始计数值1
if(!ret.second) //如果插入失败,说明关键字已存在,只需将值递增
++ret.first->second; //ret.first指向插入的元素,其second是值
}
向multiset/multimap添加元素
- 向multiset/multimap添加单一元素,总是插入成功,insert/emplace返回一个迭代器指向插入的元素
11.3.3 删除元素
表:从关联容器删除元素
c.erase(k)
从c中删除每个关键字为k的元素。返回一个size_type值,指出删除的元素的数量c.erase(p)
从c中删除迭代器p指定的元素。p必须指向c中一个真实元素,不能等于c.end()。返回一个指向p之后元素的迭代器,若p指向c中的尾元素,则返回.end()c.erase(b, e)
删除迭代器b和e所表示的范围中的元素。返回e
11.3.4 map的下标操作
表:map和unorder_map的下标操作
c[k]
返回关键字为k的元素;如果k不在c中,添加一个关键字为k的元素,对其进行值初始化c.at[k]
访问关键字为k的元素,带参数检查;若k不在c中,抛出一个out_of_range异常- 只适用于关键字不可重复的map容器,set不支持下标:
- map和unordered_map都有下标算符和at函数
- multimap和unordered_multimap都不支持下标,因为一个关键字可能有多个值
- 所有的set类型都不支持下标,因为没有值
- map/unordered_map下标接受一个关键字,访问与其关联的值。若关键字不在容器中,则创建元素插入容器,关联值进行
值初始化
map<string,size_t> word_count;
word_count["Anna"]=1;
/*上一行的操作步骤:
*1、容器中搜索关键字"Anna",未找到
*2、创建新key-value对,key是const string,value被值初始化为0
*3、提取新插入的元素,为其赋值为1
*/
11.3.5 访问元素
c.find(k) // 返回一个迭代器,指向第一个关键字k的元素,如k不在容器中,则返回尾后迭代器
c.count(k) // 返回关键字等于k的元素的数量。对于不允许重复关键字的容器,返回值永远是0或1
c.lower_bound(k) // 返回一个迭代器,指向第一个关键字不小于k的元素;不适用于无序容器
c.upper_bound(k) // 返回一个迭代器,指向第一个关键字大于k的元素;不适用于无序容器
c.equal_bound(k) // 返回一个迭代器pair,表示关键字等于k的元素的范围。如k不存在,pair的两个成员均等于c.end()
对 map 使用 find 代替下标操作
- 查找时应用find而不是下标,因为下标的副作用会导致元素未找到时插入,即改变容器
在 multiset/multimap 中查找元素
- 若multiset/multimap中有重复关键字,则它们
相邻存放
,因此可找到第一个,然后递增迭代器
multimap<string,string> authors;
authors.insert({"Barth, John","Sot-Weed Factor"});
authors.insert({"Barth, John","Lost in the Funhouse"});
string search_item("Alain de Botton");
//法1:用find查找迭代器,count计数
auto entries=authors.count(search_item);
auto iter=authors.find(search_item);
while(entries){
cout<<iter->second<<endl;
++iter;
--entries;
}
lower_bound和upper_bound
-
lower_bound
和upper_bound
成员函数查找范围:- 若给定关键字在容器中,则lower_bound返回第一个匹配元素的迭代器,upper_bound返回最后一个匹配元素之后的迭代器
- 若给定关键字不在容器中,则lower_bound和upper_bound都返回指向第一个大于该关键字的元素的迭代器,该位置称为
安全插入点
,即在此处insert该关键字可保持容器中关键字的顺序 - lower_bound和upper_bound都不支持无序容器
//用lower_bound和upper_bound查找范围 for(auto beg=ahthors.lower_bound(search_item), end=ahthors.upper_bound(search_item); beg!=end;++beg) cout<<beg->second<<endl;
equal_range 函数
用equal_range查找范围
for(auto pos=authors.equal_range(search_item);
pos.first!=pos.second;++pos.first)
cout<<pos.first->second<<endl;
11.3.6 一个单词转换的map
缩写对照表示例:
brb be right back
k okay?
y why
r are
u you
pic picture
thk thanks!
l8r later
要转换文本示例:
where r u
y dont u send me a pic
k thk l8r
转换后的文本:
where are you
why dont you send me a picture
okay? thanks! later
//读取对照表,存为字典
map<string,string> buildMap(ifstream &map_file){
map<string,string> trans_map;
string key,value;
while(map_file>>key && getline(map_file,value)) //先读第一个单词存入key,再取行中剩下
if(value.size()>1) //若转换规则存在
trans_map[key]=value.substr(1); //取子串,忽略getline读到的第一个空格
else
throw runtime_error("no rule for "+key);
return trans_map;
}
//转换单个词语
const string &transform(const string &s, const map<string,string> &m){
auto map_it=m.find(s); //在字典中查找
if(map_it!=m.cend()) //不等于end则查找到
return map_it->second;
else
return s;
}
//读取对照表和输入,打印输出
void word_transform(ifstream &map_file, ifstream &input){
auto trans_map=buildMap(map_file); //对照表生成字典
string text;
while(getline(input,text)){ //逐行处理
istringstream stream(text); //一行字符串作为一个流处理
string word;
bool firstword=true;
while(stream>>word){ //逐个单词处理
if(firstword) firstword=false; //如果不是第一个单词,则输出之前打印空格
else cout<<" ";
cout<<transform(word,trans_map); //转换单词
}
cout<<endl;
}
}
11.4 无序容器
- C++11定义了4个无序关联容器,它们组织元素的方式不是关键字的序,而是
哈希函数
和==
算符 - 使用无序容器的情形:
- 关键字类型的元素没有明显的序关系
- 维护关键字的序代价较高
管理桶
- 无序容器在存储上组织为一组
桶
,每个桶中保存0个或多个元素。即,层次化的存储 - 无序容器使用一个
哈希函数
,将关键字映射到桶。访问元素时先计算关键字的哈希值来判断在哪个桶中,再在桶内搜索。 哈希值
相同的关键字放在同一桶中,因此关键字相同的元素都在同一桶中- 无序容器的性能依赖于:哈希函数的质量、桶数量、桶大小
- C++允许查询无序容器的状态,并可改变映射和存储的策略,管理桶的函数如表11.8:
无序容器对关键字类型的要求
- 默认情况下,无序容器用关键字类型的
==
算符比较元素,用hash<key_type>
类型的对象来生成元素的哈希值。 - 标准库为
内置类型(包括指针)
、string
、智能指针
提供了hash函数,因此可直接定义这些类型为无序容器的关键字 - 无序容器可使用自定义的==算符和哈希函数,只需在模板参数中给出函数指针类型,并在构造函数参数中给出函数指针即可
- 对于有==算符的类型,可以只自定义哈希函数
//定义哈希函数
size_t hasher(const Sales_data &sd){
return hash<string>()(sd.isbn()); //用一个成员的哈希作为该类的哈希
}
//定义==算符
bool eqOp(const Sales_data &lhs, const Sales_data &rhs){
return lhs.isbn()==rhs.isbn(); //用一个成员的==算符作为该类的==算符
}
//使用自定义的哈希函数和==算符定义类型并初始化
using SD_multiset=unordered_multiset<Sales_data, decltype(hasher) *, decltype(eqOp) *>;
SD_multiset bookstore(42,hasher,eqOp);
//如果类定义了==运算符,则可以只重载哈希函数
unordered_set<Foo, decltype(FooHash) *> fooSet(10, FooHash);
作者:砥才人
出处:https://www.cnblogs.com/shiroe
本系列文章为笔者整理原创,只发表在博客园上,欢迎分享本文链接,如需转载,请注明出处!