代码改变世界

实用算法实践-第 4 篇 散列表

2011-10-11 10:28  myjava2  阅读(167)  评论(0编辑  收藏  举报

4.1    直接寻址表

当关键字的全域比较小时,直接寻址时一种简单而有效的技术。

4.1.1   实例

PKU JudgeOnline, 1200, Crazy Search.

4.1.2   问题描述

给定一个有NC个不同字符的字符串,求出其长度为N的子字符串的个数。例如字符串“daababac”有5个长度为3的子字符串:“daa”、“aab”、“aba”、“bab”、“bac”。

输入保证子字符串的个数不超过16百万个。

4.1.3   输入

34

daababac

4.1.4   输出

5

4.1.5   分析

“输入保证子字符串的个数不超过16百万个”,这个已知条件非常重要。它意味着可以通过。。。。。。。

4.1.6   程序



4.2    除法散列表

除法散列发的散列函数为:H(k)= k mod m。其中k为关键字,H(k)将关键字k映射到m个槽的某一个去。

m的选择十分有讲究。可以选作m的值常常是与2的整数幂不太接近的质数。

4.2.1   实例

PKU JudgeOnline, 3349, Snowflake SnowSnowflakes.

4.2.2   问题描述

每个雪花有六个边。如果两个雪花的六个边的长度都一样的话,则它们是一样的。给出一些雪花的六条边,判断其中是不是有两个一样的雪花。

注意:雪花的六条边可能顺时针地给出,也可能逆时针地给出。

4.2.3   输入

2

12 3 4 5 6

4 3 2 1 6 5

4.2.4   输出

Twin snowflakes found.

4.2.5   分析

首先,对与同样的一个雪花,由于存在旋转和镜像的变化,使得给出的六条边的排列不一样。对于给定的一个六条边的各种等效的排列,必须将它映射到同一个唯一的排列。

映射的方法是:将所有等效的排列对应到等效排列中字典序最小的那个排列。

具体的实现方法是:首先找到最短的边,然后判断顺时针和逆时针哪个排列小,取较小的那个。然后继续找到其他最短的边,如果比当前的局部最小排列还小,则修改局部最小排列。如此继续,直到遍历完所有最短的边,所得的局部最小排列就是全局最小的了。

通过上述方法,可以保证的是同一个雪花的任意一种描述都能对应到唯一的一个排列。接下来的做法是将这个排列对应为一个整型关键字。然后使用这个关键字映射到散列中去即可。

采用的具体方法是,将六条边的长度之和作为关键字,并使用除法散列函数。m值取为99991:一个是与2的整数幂不太接近的质数。

4.2.6   程序

本文章欢迎转载,请保留原始博客链接http://blog.csdn.net/fsdev/article