【c++ Prime 学习笔记】第11章 关联容器

11.1 使用关联容器

  • map类型常称为关联数组字典),但其下标不必是整数,且通过关键字而不是位置来查找值
  • set是关键字的简单集合,只想知道一个值是否存在或出现的次数时,很有用

使用map

  • 关联容器也是模板
  • 定义map,必须在模板参数中指定key和value类型
  • map的元素都是pair类型,pair也是模板,保存两个public数据成员(first和second)。map使用的pair的first成员是关键字,second是值
map<string,size_t> word_count;          //默认初始化字典
string word;
while(cin>>word)
    ++word_count[word];                 //提取word的计数器并将其加1
for(const auto &w:word_count)           //遍历字典元素
    cout<<w.first<<" occurs "<<w.second //pair类型,first成员是key,second成员是value
        <<((w.second>1)?" times":" time")<<endl;

使用set

  • set是模板,使用时必须在模板参数中指定元素类型
  • 可以对关联容器(set和map都可)做列表初始化
  • set的find方法返回一个迭代器,若给定关键字在set中则返回指向它的迭代器,否则返回end
map<string,size_t> word_count;              //默认初始化字典
set<stirng> exclude={"The","But","And"};    //列表初始化集合
string word;
while(cin>>word)
    if(exclude.find(word)==exclude.end())   //在集合中查找元素,返回迭代器若为end则未找到
        ++word_count[word];

11.2 关联容器概述

  • 所有关联容器都支持表9.2中的通用容器操作,但不支持顺序容器特有的操作,例如push_front或push_back。原因是关联容器中元素是根据关键字存储的
  • 关联容器支持顺序容器不支持的操作和类型别名
  • 关联容器的迭代器都是双向迭代器

11.2.1 定义关联容器

  • 定义map时需在模板参数中给出key和value的类型,定义set时需在模板参数中给出关键字类型
  • 定义关联容器的4种方法:
    • 关联容器都有默认构造函数,生成空容器
    • 可将关联容器初始化为另一个同类型容器的拷贝
    • 可用元素范围初始化关联容器,只要这些元素可转换为关联容器所需类型
    • C++11允许对关联容器使用值初始化(列表初始化
  • 对map做列表初始化时,每个元素也是一个花括号列表,其中包含两个值{key, value}
pair<string, string> anon; // 空容器

set<stirng> exclude={"The","But","And"};    //列表初始化

pair<string, string> author = {{"James", "Joyce"},
				 {"Austen", "Jane"}}; // 也可为每个成员提供初始化器

初始化 multimap 和multiset

  • map和set的关键字必唯一,但multimap和multiset允许多个元素有相同关键字

11.2.2 关键字类型的要求

  • set的关键字就是元素,map的关键字是元素的first的类型
  • 对于有序关联容器(map、multimap、set、multiset),关键字类型必须有序,默认使用元素类型的<算符。

有序容器的关键字类型

  • 可提供自定义操作代替<算符,要求自定义操作在关键字类型上定义严格弱序
    • 两关键字不能同时“小于等于”对方
    • “小于等于”具有传递性
    • 若两关键字都不“小于等于”对方,则称为“等价”,“等价”具有传递性
  • 若两关键字等价,则关联容器认为它们相等。用作map的key时,只能有一个value与这两个key关联,用任一个key访问都得到这个value

使用关键字类型的比较函数

  • multiset<关键字类型>
  • 若使用自定义的严格弱序函数,则定义关联容器时,必须在模板参数中给出该函数指针类型,在构造函数参数中给出该函数
//定义严格弱序
bool compareIsbn(const Sales_data &lhs, const Sales_data &rhs){
    return lhs.isbn()<rhs.isbn();
}
using SalesSetType=multiset<Sales_data,decltype(compareIsbn) *>;    //自定义了严格弱序的multiset类型
SalesSetType bookstore(compareIsbn);                                //自定义了严格弱序的multiset对象

11.2.3 pair 类型

  • pair类型定义于utility头文件中
  • 一个pair保存两个public的数据成员,分别叫first和second
  • pair是模板,创建时需在模板参数中指定两个数据成员的类型,两个类型不要求一样
  • pair的默认构造函数对数据成员做值初始化

image

创建 pair 对象的函数

pair<string int> process(vector<string> &v){
    if(!v.empty())
        return {v.back(),v.back().size()};  //列表初始化返回值
    else
        return pair<string,int>();          //隐式构造返回值
}

if(!v.empty())
        return make_pair(v.back(),v.back().size());  //列表初始化返回值

11.3 关联容器操作

关联容器额外的类型别名

  • key_type 此容器类型的关键字类型
  • mapped_type 每个关键字关联的类型,只适用于map
  • value_type 对于set,与key_type相同;
    对于map,为pair<const key_type, mapped_type>

11.3.1 关联容器迭代器

迭代器解引用

  • 解引用关联容器迭代器时,得到一个类型为容器的value_type的引用。
  • set迭代器解引用得到的都是关键字引用,都是const。虽然同时存在iterator和const_iterator类型,但都不可写
  • map迭代器解引用得到的是pair的引用,first为const。其iterator可写second,const_iterator不可写

遍历关联容器

  • map和set都有beginend成员函数,可得到迭代器用于遍历元素

关联容器和算法

  • 关联容器很少使用泛型算法
    • 通常不对关联容器使用泛型算法。因为关键字是const,元素不可改变也不可重排。
    • 关联容器只可使用只读算法,但这些算法在关联容器中搜索时效率低下。例如用关联容器的find成员函数泛型find函数快得多
    • 如果真要对关联容器使用泛型算法,则只能把它当源序列,或当zuo目的位置用inserter插入

11.3.2 添加元素

image

  • 对于无重复关键字的map和set,若插入元素的key在容器中已存在,则插入失败,insert不做任何事
  • insert有两个版本
    • 接受一对迭代器,这些迭代器指向的类型可转为该容器的value_type
    • 接受initializer_list,即花括号列表,该列表用于构造一个value_type
vector<int> ivec={2,4,6,8,2,4,6,8};
set<int> set2;
set2.insert(ivec.begin(), ivec.end());//4个元素
set2.insert({1,3,5,7,1,3,5,7}); //8个元素

word_count.insert({word,1});                            //花括号列表转为initializer_list
word_count.insert(make_pair(word,1));                       //make_pair函数生成pair
word_count.insert(pair<string,size_t>(word,1));             //显式构造pair
word_count.insert(map<string,size_t>::value_type(word,1));  //显式构造value_type

检测 insert 的返回值

  • insert/emplace的返回值依赖于容器类型和参数
  • 向set/map添加单一元素,则insert/emplace返回一个pair,其first为迭代器,second为bool。
    • 若关键字不在容器中,则插入。first指向插入的元素,second为true
    • 若关键字在容器中,则插入失败。first指向给定元素,second为false
map<string,size_t> word_count;
string word;
while(cin>>word){
    //ret的类型是pair<map<string,size_t>::iterator,bool>
    auto ret=word_count.insert({word,1});   //尝试插入关键字和初始计数值1
    if(!ret.second)                         //如果插入失败,说明关键字已存在,只需将值递增
        ++ret.first->second;                //ret.first指向插入的元素,其second是值
}

向multiset/multimap添加元素

  • 向multiset/multimap添加单一元素,总是插入成功,insert/emplace返回一个迭代器指向插入的元素

11.3.3 删除元素

表:从关联容器删除元素

  • c.erase(k)
    从c中删除每个关键字为k的元素。返回一个size_type值,指出删除的元素的数量
  • c.erase(p)
    从c中删除迭代器p指定的元素。p必须指向c中一个真实元素,不能等于c.end()。返回一个指向p之后元素的迭代器,若p指向c中的尾元素,则返回.end()
  • c.erase(b, e)
    删除迭代器b和e所表示的范围中的元素。返回e

11.3.4 map的下标操作

表:map和unorder_map的下标操作

  • c[k]
    返回关键字为k的元素;如果k不在c中,添加一个关键字为k的元素,对其进行值初始化
  • c.at[k]
    访问关键字为k的元素,带参数检查;若k不在c中,抛出一个out_of_range异常
  • 只适用于关键字不可重复的map容器,set不支持下标:
    • map和unordered_map都有下标算符和at函数
    • multimap和unordered_multimap都不支持下标,因为一个关键字可能有多个值
    • 所有的set类型都不支持下标,因为没有值
  • map/unordered_map下标接受一个关键字,访问与其关联的值。若关键字不在容器中,则创建元素插入容器,关联值进行值初始化
map<string,size_t> word_count;
word_count["Anna"]=1;
/*上一行的操作步骤:
 *1、容器中搜索关键字"Anna",未找到
 *2、创建新key-value对,key是const string,value被值初始化为0
 *3、提取新插入的元素,为其赋值为1
 */

11.3.5 访问元素

image

c.find(k)  // 返回一个迭代器,指向第一个关键字k的元素,如k不在容器中,则返回尾后迭代器
c.count(k)  // 返回关键字等于k的元素的数量。对于不允许重复关键字的容器,返回值永远是0或1
c.lower_bound(k)  // 返回一个迭代器,指向第一个关键字不小于k的元素;不适用于无序容器
c.upper_bound(k)  // 返回一个迭代器,指向第一个关键字大于k的元素;不适用于无序容器
c.equal_bound(k)  // 返回一个迭代器pair,表示关键字等于k的元素的范围。如k不存在,pair的两个成员均等于c.end()

对 map 使用 find 代替下标操作

  • 查找时应用find而不是下标,因为下标的副作用会导致元素未找到时插入,即改变容器

在 multiset/multimap 中查找元素

  • 若multiset/multimap中有重复关键字,则它们相邻存放,因此可找到第一个,然后递增迭代器
multimap<string,string> authors;
authors.insert({"Barth, John","Sot-Weed Factor"});
authors.insert({"Barth, John","Lost in the Funhouse"});
string search_item("Alain de Botton");
//法1:用find查找迭代器,count计数
auto entries=authors.count(search_item);
auto iter=authors.find(search_item);
while(entries){
    cout<<iter->second<<endl;
    ++iter;
    --entries;
}

lower_bound和upper_bound

  • lower_boundupper_bound成员函数查找范围:

    • 若给定关键字在容器中,则lower_bound返回第一个匹配元素的迭代器,upper_bound返回最后一个匹配元素之后的迭代器
    • 若给定关键字不在容器中,则lower_bound和upper_bound都返回指向第一个大于该关键字的元素的迭代器,该位置称为安全插入点,即在此处insert该关键字可保持容器中关键字的顺序
    • lower_bound和upper_bound都不支持无序容器
    //用lower_bound和upper_bound查找范围
    for(auto beg=ahthors.lower_bound(search_item),
    				end=ahthors.upper_bound(search_item);
        beg!=end;++beg)
        cout<<beg->second<<endl;
    

equal_range 函数

用equal_range查找范围
for(auto pos=authors.equal_range(search_item);
    pos.first!=pos.second;++pos.first)
    cout<<pos.first->second<<endl;

11.3.6 一个单词转换的map

缩写对照表示例:

brb be right back
k okay?
y why
r are
u you
pic picture
thk thanks!
l8r later

要转换文本示例:

where r u
y dont u send me a pic
k thk l8r
转换后的文本:
where are you
why dont you send me a picture
okay? thanks! later

//读取对照表,存为字典
map<string,string> buildMap(ifstream &map_file){
    map<string,string> trans_map;
    string key,value;
    while(map_file>>key && getline(map_file,value)) //先读第一个单词存入key,再取行中剩下
        if(value.size()>1)                          //若转换规则存在
            trans_map[key]=value.substr(1);         //取子串,忽略getline读到的第一个空格
        else
            throw runtime_error("no rule for "+key);
    return trans_map;
}

//转换单个词语
const string &transform(const string &s, const map<string,string> &m){
    auto map_it=m.find(s);  //在字典中查找
    if(map_it!=m.cend())    //不等于end则查找到
        return map_it->second;
    else
        return s;
}

//读取对照表和输入,打印输出
void word_transform(ifstream &map_file, ifstream &input){
    auto trans_map=buildMap(map_file);          //对照表生成字典
    string text;
    while(getline(input,text)){                 //逐行处理
        istringstream stream(text);             //一行字符串作为一个流处理
        string word;
        bool firstword=true;
        while(stream>>word){                    //逐个单词处理
            if(firstword)   firstword=false;    //如果不是第一个单词,则输出之前打印空格
            else            cout<<" ";
            cout<<transform(word,trans_map);    //转换单词
        }
        cout<<endl;
    }
}

11.4 无序容器

  • C++11定义了4个无序关联容器,它们组织元素的方式不是关键字的序,而是哈希函数==算符
  • 使用无序容器的情形:
    • 关键字类型的元素没有明显的序关系
    • 维护关键字的序代价较高

管理桶

  • 无序容器在存储上组织为一组,每个桶中保存0个或多个元素。即,层次化的存储
  • 无序容器使用一个哈希函数,将关键字映射到桶。访问元素时先计算关键字的哈希值来判断在哪个桶中,再在桶内搜索。
  • 哈希值相同的关键字放在同一桶中,因此关键字相同的元素都在同一桶中
  • 无序容器的性能依赖于:哈希函数的质量、桶数量、桶大小
  • C++允许查询无序容器的状态,并可改变映射和存储的策略,管理桶的函数如表11.8:

image

无序容器对关键字类型的要求

  • 默认情况下,无序容器用关键字类型的==算符比较元素,用hash<key_type>类型的对象来生成元素的哈希值。
  • 标准库为内置类型(包括指针)string智能指针提供了hash函数,因此可直接定义这些类型为无序容器的关键字
  • 无序容器可使用自定义的==算符和哈希函数,只需在模板参数中给出函数指针类型,并在构造函数参数中给出函数指针即可
  • 对于有==算符的类型,可以只自定义哈希函数
//定义哈希函数
size_t hasher(const Sales_data &sd){
    return hash<string>()(sd.isbn()); //用一个成员的哈希作为该类的哈希
}
//定义==算符
bool eqOp(const Sales_data &lhs, const Sales_data &rhs){
    return lhs.isbn()==rhs.isbn(); //用一个成员的==算符作为该类的==算符
}
//使用自定义的哈希函数和==算符定义类型并初始化
using SD_multiset=unordered_multiset<Sales_data, decltype(hasher) *, decltype(eqOp) *>;
SD_multiset bookstore(42,hasher,eqOp);

//如果类定义了==运算符,则可以只重载哈希函数
unordered_set<Foo, decltype(FooHash) *> fooSet(10, FooHash);
posted @ 2021-04-22 16:31  砥才人  阅读(189)  评论(0编辑  收藏  举报