map 类型

map 是键－值对的集合。map 类型通常可理解为关联数组（associative array）：

可使用键作为下标来获取一个值，正如内置数组类型一样。
而关联的本质在于元素的值与某个特定的键相关联，而并非通过元素在数组中的位置来获取。

[1. map 对象的定义]

要使用 map 对象，则必须包含 map 头文件。在定义 map 对象时，必须分别指明键和值的类型：

// count number of times each word occurs in the input
map<string, int> word_count; // empty map from string to int

// 表 10.3. map 的构造函数
map<k, v> m;　　　　　 创建一个名为 m 的空 map 对象，其键和值的类型分别为 k 和 v

map<k, v> m(m2);　　　创建 m2 的副本 m，m 与 m2 必须有相同的键类型和值类型

map<k, v> m(b, e);　　创建 map 类型的对象 m，存储迭代器 b 和 e 标记的范围内所有元素的副本。
　　　　　　　　　　　　 元素的类型必须能转换为 pair<const k, v>

键类型的约束

在使用关联容器时，它的键不但有一个类型，而且还有一个相关的比较函数。
默认情况下，标准库使用键类型定义的 < 操作符来实现键（key type）的比较。
后续篇章将会介绍如何重写默认的操作符，并提供自定义的操作符函数。

所用的比较函数必须在键类型上定义严格弱排序（strict weak ordering）。
所谓的严格弱排序可理解为键类型数据上的“小于”关系，虽然实际上可以选择将比较函数设计得更复杂。
但无论这样的比较函数如何定义，当用于一个键与自身的比较时，肯定会导致 false 结果。

此外，在比较两个键时，不能出现相互“小于”的情况，
而且，如果 k1“小于”k2，k2“小于”k3，则 k1 必然“小于”k3。
对于两个键，如果它们相互之间都不存在“小于”关系，则容器将之视为相同的键。
用做 map 对象的键时，可使用任意一个键值来访问相应的元素。

在实际应用中，键类型必须定义 < 操作符，而且该操作符应能“正确地工作”，这一点很重要。

对于键类型，唯一的约束就是必须支持 < 操作符，至于是否支持其他的关系或相等运算，则不作要求。

[2. map 定义的类型]

map 对象的元素是“键值对”，也即每个元素包含两个部分：键以及由键关联的值。

map 的 value_type 是存储元素的键以及值的 pair 类型，而且键为 const。
例如，word_count 数组的 value_type 为 pair<const string, int> 类型。

//表 10.4. map 类定义的类型
map<K, V>::key_type
在 map 容器中，用做索引的键的类型

map<K, V>::mapped_type
在 map 容器中，键所关联的值的类型

map<K, V>::value_type
一个 pair 类型，它的 first 元素具有 const map<K, V>::key_type 类型，
而 second 元素则为 map<K, V>::mapped_type 类型

需谨记: value_type 是 pair 类型，它的值成员可以修改，但键成员不能修改。

　　　　map 迭代器进行解引用将产生 pair 类型的对象。

对迭代器进行解引用时，将获得一个引用，指向容器中一个 value_type 类型的值。
对于 map 容器，其 value_type 是 pair 类型：

// get an iterator to an element in word_count
map<string, int>::iterator map_it = word_count.begin();

// *map_it is a reference to a pair<const string, int> object
cout << map_it->first; // prints the key for this element
cout << " " << map_it->second; // prints the value of the element
map_it->first = "new key"; // error: key is const
++map_it->second; // ok: we can change value through an iterator

对迭代器进行解引用将获得一个 pair 对象，它的 first 成员存放键，为 const，而 second 成员则存放值。

map 容器额外定义的类型别名（typedef）
map 类额外定义了两种类型：key_type 和 mapped_type，以获得键或值的类型。
如同顺序容器一样，可使用作用域操作符来获取类型成员，如 map<string, int>::key_type。

[3. 给 map 添加元素]

定义了 map 容器后，下一步工作就是在容器中添加键－值元素对。
该项工作可使用 insert 成员实现；或者，先用下标操作符获取元素，然后给获取的元素赋值。
在这两种情况下，一个给定的键只能对应于一个元素这一事实影响了这些操作的行为。

[4. 使用下标访问 map 对象]

如下编写程序时：

map <string, int> word_count; // empty map
// insert default initialzed element with key Anna; then assign 1 to its value
word_count["Anna"] = 1;

将发生以下事情：

1. 在 word_count 中查找键为 Anna 的元素，没有找到。
2. 将一个新的键－值对插入到 word_count 中。
　　它的键是 const string 类型的对象，保存 Anna。
　　而它的值则采用值初始化，本例中值为 0。
3. 将这个新的键－值对插入到 word_count 中。
4. 读取新插入的元素，并将它的值赋为 1。

使用下标访问 map 与使用下标访问数组或 vector 的行为截然不同：
用下标访问不存在的元素将导致在 map 容器中添加一个新元素，它的键即为该下标值。

如同其他下标操作符一样，map 的下标也使用索引（其实就是键）来获取该键所关联的值。
如果该键已在容器中，则 map 的下标运算与 vector 的下标运算行为相同：返回该键所关联的值。
只有在所查找的键不存在时，map 容器才为该键创建一个新的元素，并将它插入到此 map 对象中。
此时，所关联的值采用值初始化：类类型的元素用默认构造函数初始化，而内置类型的元素初始化为 0。

下标操作符返回值的使用
通常来说，下标操作符返回左值。它返回的左值是特定键所关联的值。可如下读或写元素：

cout << word_count["Anna"]; // fetch element indexed by Anna; prints 1
++word_count["Anna"]; // fetch the element and add one to it
cout << word_count["Anna"]; // fetch the element and print it; prints 2

map 下标操作符返回的类型与对 map 迭代器进行解引用获得的类型不相同。
显然，map 迭代器返回 value_type 类型的值，
包含 const key_type 和 mapped_type 类型成员的 pair 对象；
下标操作符则返回一个 mapped_type 类型的值。

下标行为的编程意义
对于 map 容器，如果下标所表示的键在容器中不存在，则添加新元素，这一特性可简化程序：

// count number of times each word occurs in the input
map<string, int> word_count; // empty map from string to int
string word;
while (cin >> word)
　　++word_count[word];

上述代码中最有趣的是，在输入的单词是第一次出现时，
会在 word_count 中创建并插入一个以该单词为索引的新元素，同时将它的值初始化为 0。
然后其值立即加 1，所以每次在 map 中添加新元素时，所统计的出现次数正好从 1 开始。

[5. map::insert 的使用]

map 容器的 insert 成员与顺序容器的类似，但有一点要注意：必须考虑键的作用。
键影响了实参的类型：插入单个元素的 insert 版本使用 “键值对” 类型的参数。
类似地，对于参数为一对迭代器的版本，迭代器必须指向 “键值对” 类型的元素。
另一个差别则是：map 容器的接受单个值的 insert 版本的返回类型。

// 表 10.5. map 容器提供的 insert 操作
m.insert(e)
e 是一个用在 m 上的 value_type 类型的值。
如果键（e.first）不在 m 中，则插入一个值为 e.second 的新元素；
如果该键在 m 中已存在，则保持 m 不变。
该函数返回一个 pair 类型对象，
包含指向键为 e.first 的元素的 map 迭代器，以及一个 bool 类型的对象，表示是否插入了该元素

m.insert(beg, end)
beg 和 end 是标记元素范围的迭代器，其中的元素必须为 m.value_type 类型的键－值对。
对于该范围内的所有元素，如果它的键在 m 中不存在，则将该键及其关联的值插入到 m。
返回 void 类型

m.insert(iter, e)
e 是一个用在 m 上的 value_type 类型的值。
如果键（e.first）不在 m 中，则创建新元素，并以迭代器 iter 为起点搜索新元素存储的位置。
返回一个迭代器，指向 m 中具有给定键的元素

5.1 以 insert 代替下标运算
使用下标给 map 容器添加新元素时，元素的值部分将采用值初始化。
通常，我们会立即为其赋值，其实就是对同一个对象进行初始化并赋值。

然而，添加元素还有另一个方法 —— 直接使用 insert 成员，其语法更紧凑。

// if Anna not already in word_count, inserts new element with value 1
word_count.insert(map<string, int>::value_type("Anna", 1));

这个 insert 函数版本的实参是一个新创建的 pair 对象，将直接插入到 map 容器中。

谨记 value_type 是 pair<const K, V> 类型的同义词，K 为键类型，而 V 是键所关联的值的类型。

insert 的实参创建了一个适当的 pair 类型新对象，该对象将插入到 map 容器。
在添加新 map 元素时，使用 insert 成员可避免使用下标操作符所带来的副作用：不必要的初始化。
传递给 insert 的实参相当笨拙。可用 2 种方法简化：

// 1. 使用 make_pair 
word_count.insert(make_pair("Anna", 1));

// 2. 使用 typedef
typedef map<string,int>::value_type valType;
word_count.insert(valType("Anna", 1));

5.2 检测 insert 的返回值
map 对象中一个给定键只对应一个元素。
如果试图插入的元素所对应的键已在容器中，则 insert 将不做任何操作。
含有一个或一对迭代器形参的 insert 函数版本并不说明是否有或有多少个元素插入到容器中。
但是，带有一个 “键值对” 形参的 insert 版本将返回一个值：
包含一个迭代器和一个 bool 值的 pair 对象，
(其中迭代器指向 map 中具有相应键的元素，而 bool 值则表示是否插入了该元素。)
如果该键已在容器中，则其关联的值保持不变，返回的 bool 值为 true。
在这两种情况下，迭代器都将指向具有给定键的元素。
下面是使用 insert 重写的单词统计程序：

 1 // count number of times each word occurs in the input
 2 map<string, int> word_count; // empty map from string to int
 3 string word;
 4 while (cin >> word) {
 5 　　// inserts element with key equal to word and value 1;
 6 　　// if word already in word_count, insert does nothing
 7 　　pair<map<string, int>::iterator, bool> ret =
 8 　　word_count.insert(make_pair(word, 1));
 9 　　if (!ret.second) // word already in word_count
10 　　　　++ret.first->second; // increment counter
11 }

View Code

对于每个单词，都尝试 insert 它，并将它的值赋 1。
if 语句检测 insert 函数返回值中的 bool 值。
如果该值为 false，则表示没有做插入操作，按 word 索引的元素已在 word_count 中存在。
此时，将该元素所关联的值加 1。

对第 10 行代码添加一些辅助用的括号：

++((ret.first)->second); // equivalent expression

这个自增语句获取指向按 word 索引的元素的迭代器，并将该元素的值加 1。

[6. 查找并读取 map 中的元素]

下标操作符给出了读取一个值的最简单方法：

map<string,int> word_count;
int occurs = word_count["foobar"];

在这个例子中，如果“foobar”不存在，则在 map 中插入具有该键的新元素，其关联的值为 0。
在这种情况下，occurs 获得 0 值。

然而，大多数情况下，我们只想知道某元素是否存在，而当该元素不存在时，并不想做做插入运算。
对于这种应用，则不能使用下标操作符来判断元素是否存在。

map 容器提供了两个操作：count 和 find，用于检查某个键是否存在而不会插入该键。

// 表 10.6. 不修改 map 对象的查询操作
m.count(k)   返回 m 中 k 的出现次数

m.find(k)    如果 m 容器中存在按 k 索引的元素，则返回指向该元素的迭代器。
　　　　　　　 如果不存在，则返回超出末端迭代器（第 3.4 节）

使用 count 检查 map 对象中某键是否存在

对于 map 对象，count 成员的返回值只能是 0 或 1。
map 容器只允许一个键对应一个实例，所以 count 可有效地表明一个键是否存在。
而对于 multimaps 容器，count 的返回值将有更多的用途，相关内容将会后续篇章中介绍。
如果返回值非 0，则可以使用下标操作符来获取该键所关联的值，而不必担心这样做会在 map 中插入新元素：

int occurs = 0;
if (word_count.count("foobar"))
occurs = word_count["foobar"];

当然，在执行 count 后再使用下标操作符，实际上是对元素作了两次查找。
如果希望当元素存在时就使用它，则应该用 find 操作。

读取元素而不插入该元素

find 操作返回指向元素的迭代器，如果元素不存在，则返回 end 迭代器：

int occurs = 0;
map<string,int>::iterator it = word_count.find("foobar");
if (it != word_count.end())
　　occurs = it->second;

[7. 从 map 对象中删除元素]

从 map 容器中删除元素的 erase 操作有三种变化形式（表 10.7）。

// 表 10.7. 从 map 对象中删除元素
m.erase(k)    　 删除 m 中键为 k 的元素。返回 size_type 类型的值，表示删除的元素个数

m.erase(p)    　 从 m 中删除迭代器 p 所指向的元素。
　　　　　　　　　　p 必须指向 m 中确实存在的元素，而且不能等于 m.end()。返回 void

m.erase(b, e)    从 m 中删除一段范围内的元素，该范围由迭代器对 b 和 e 标记。
　　　　　　　　　　b 和 e 必须标记 m 中的一段有效范围：
　　　　　　　　　　即 b 和 e 都必须指向 m 中的元素或最后一个元素的下一个位置。
　　　　　　　　　　而且，b 和 e 要么相等（此时删除的范围为空），、
　　　　　　　　　　要么 b 所指向的元素必须出现在 e 所指向的元素之前。返回 void 类型

与顺序容器一样，可向 erase 传递一个或一对迭代器，来删除单个元素或一段范围内的元素。
map 容器的 erase 操作返回 void，而顺序容器的 erase 操作则返回一个迭代器，指向被删除元素后面的元素。
除此之外，map 类型还提供了一种额外的 erase 操作，
其参数是 key_type 类型的值，如果拥有该键的元素存在，则删除该元素。
对于单词统计程序，可使用这个版本的 erase 函数来删除 word_count 中指定的单词，然后输出被删除的单词：

// erase of a key returns number of elements removed
if (word_count.erase(removal_word))
　　cout << "ok: " << removal_word << " removed\n";
else 
　　cout << "oops: " << removal_word << " not found!\n";

erase 函数返回被删除元素的个数。对于 map 容器，该值必然是 0 或 1。

[8. map 对象的迭代遍历]

与其他容器一样，map 同样提供 begin 和 end 运算，以生成用于遍历整个容器的迭代器。
例如，可如下将 map 容器 word_count 的内容输出：

// get iterator positioned on the first element
map<string, int>::const_iterator map_it = word_count.begin();
// for each element in the map
while (map_it != word_count.end()) {
　　// print the element key, value pairs
　　cout << map_it->first << " occurs "
　　　　　<< map_it->second << " times" << endl;
　　++map_it; // increment iterator to denote the next element
}

这段程序的循环体要比前面类似的程序更加复杂，原因在于对于 map 的每个元素都必须分别输出它的键和值。
这个单词统计程序依据字典顺序输出单词。
在使用迭代器遍历 map 容器时，迭代器指向的元素按键的升序排列。

[9. “单词转换” map 对象]

下面的程序说明如何创建、查找和迭代遍历一个 map 对象。
这个程序求解的问题是：给出一个 string 对象，把它转换为另一个 string 对象。
本程序的输入是两个文件。
第一个文件包括了若干单词对，每对的第一个单词将出现在输入的字符串中，
而第二个单词则是用于输出。
本质上，这个文件提供的是单词转换的集合——
在遇到第一个单词时，应该将之替换为第二个单词。第二个文件则提供了需要转换的文本。

 1 如果单词转换文件的内容是：
 2 'em        them
 3 cuz        because
 4 gratz     grateful
 5 i             I
 6 nah       no
 7 pos       supposed
 8 sez       said
 9 tanx      thanks
10 wuz      was
11 
12 而要转换的文本是：
13 nah i sez tanx cuz i wuz pos to
14 not cuz i wuz gratz
15 
16 则程序将产生如下输出结果：
17 no I said thanks because I was supposed to
18 not because I was grateful

单词转换程序

下面给出的解决方案是将单词转换文件的内容存储在一个 map 容器中，
将被替换的单词作为键，而用作替换的单词则作为其相应的值。
接着读取输入，查找输入的每个单词是否对应有转换。
若有，则实现转换，然后输出其转换后的单词，否则，直接输出原词。

该程序的 main 函数需要两个实参：

单词转换文件的名字以及需要转换的文件名。程序执行时，首先检查实参的个数。
第一个实参 argv[0] 是命令名，而执行该程序所需要的两个文件名参数则分别存储在 argv[1] 及 argv[2] 中。
如果 argv[1] 的值合法，则调用 open_file打开单词转换文件。
假设 open 操作成功，则读入“单词转换对”。
以“转换对”中的第一个单词为键，第二个为值，调用 insert 函数在容器中插入新元素。
while 循环结束后，trans_map 容器对象包含了转换输入文本所需的数据。
而如果该实参有问题，则抛出异常并结束程序的运行。
接下来，调用 open_file 打开要转换的文件。
第二个 while 循环使用 getline 函数逐行读入文件。
因为程序每次读入一行，从而可在输出文件的相同位置进行换行。
然后在内嵌的 while 循环中使用 istringstream 将每一行中的单词提取出来。

内层的 while 循环检查每个单词，判断它是否在转换的 map 中出现。
如果在，则从该 map 对象中取出对应的值替代此单词。
最后，无论是否做了转换，都输出该单词。
同时，程序使用 bool 值 firstword 判断是否需要输出空格。
如果当前处理的是这一行的第一个单词，则无须输出空格。

 1 /*
 2 * A program to transform words.
 3 * Takes two arguments: The first is name of the word transformation file
 4 * The second is name of the input to transform
 5 */
 6 int main(int argc, char **argv)
 7 {
 8 　　// map to hold the word transformation pairs:
 9 　　// key is the word to look for in the input; value is word to use in the output
10 　　map<string, string> trans_map;
11 　　string key, value;
12 　　if (argc != 3)
13 　　　　throw runtime_error("wrong number of arguments");
14 　　// open transformation file and check that open succeeded
15 　　ifstream map_file;
16 　　if (!open_file(map_file, argv[1]))
17 　　　　throw runtime_error("no transformation file");
18 　　// read the transformation map and build the map
19 　　while (map_file >> key >> value)
20 　　　　trans_map.insert(make_pair(key, value));
21 　　// ok, now we're ready to do the transformations
22 　　// open the input file and check that the open succeeded
23 　　ifstream input;
24 　　if (!open_file(input, argv[2]))
25 　　　　throw runtime_error("no input file");
26 　　string line; // hold each line from the input
27 　　// read the text to transform it a line at a time
28 　　while (getline(input, line)) {
29 　　　　istringstream stream(line); // read the line a word at a time
30 　　　　string word;
31 　　　　bool firstword = true; // controls whether a space is printed
32 　　　　while (stream >> word) {
33 　　　　　　// ok: the actual mapwork, this part is the heart of the program
34 　　　　　　map<string, string>::const_iterator map_it =
35 　　　　　　trans_map.find(word);
36 　　　　　　// if this word is in the transformation map
37 　　　　　　if (map_it != trans_map.end())
38 　　　　　　// replace it by the transformation value in the map
39 　　　　　　　　word = map_it->second;
40 　　　　　　if (firstword)
41 　　　　　　　　firstword = false;
42 　　　　　　else
43 　　　　　　　　cout << " "; // print space between words
44 　　　　　　cout << word;
45 　　　　}
46 　　　　cout << endl; // done with this line of input
47 　　}
48 　　return 0;
49 }

View Code

posted @ 2013-06-18 10:56 HandsomeDragon 阅读(855) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

LDragon

map 类型

公告