DS博客作业05--查找

这个作业属于哪个班级	数据结构--网络2011/2012
这个作业的地址	DS博客作业05--查找
这个作业的目标	学习查找的相关结构
姓名	林进源

PTA得分截图

1.本周学习总结（0-5分）

1.1 查找的性能指标

ASL成功：找到某一记录合集中任一记录平均所要的关键字比较的次数。
ASL不成功：在某记录合集中找不到某一记录平均所要的关键字比较次数。
例：
比较次数：找到或者找不到某一记录的次数
移动次数：例如哈希表和哈希链有冲突时需要移位找到空的位置所需要的次数
时间复杂度：顺序查找：时间复杂度O(N)，二分查找：时间复杂度O(logN)

1.2 静态查找

顺序查找
顺序查找：从表的一端开始，顺序扫描线性表，将扫描到的关键字与给定的K值相比较。当前扫描到的关键字与k相等，则查找成功，如果扫描结束后仍未找到关键字，等于K的记录则查找失败。
ASL成功=(n+1)/2
ASL不成功=n
平均时间复杂度:O(n)
二分查找
二分查找要求线性表示有序表，以折半的方式进行查找
二分查找，时间复杂度O(logN)

二分查找转换为二叉树的形式，进行判断查找
ASL成功=（对应层数 * 对应层的结点个数，进行累加）/总的结点个数
ASL不成功=（对应层数 * 对应层的空结点个数，进行累加）/总的空结点个数

1.3 二叉搜索树

1.3.1 如何构建二叉搜索树（操作）

ASL成功=（1+2 * 2 + 3 * 3）/6
ASL不成功=(1 * 2 + 6 * 3)/7
ASL成功=（对应层数 * 对应层的结点个数，进行累加）/总的结点个数
ASL不成功=（对应层数 * 对应层的空结点个数，进行累加）/总的空结点个数

实现插入时，一般是在底层空结点的为止插入，通过比较找到符合条件的结点，插入要符合小在左，大在右的规律。

二叉树的删除分为三种情况：
第一种是删除叶子结点，直接将该节点为空即可
第二种是删除的结点只有左子树和右子树，删除该节点，将子树放在该节点对应位置
第三种是删除的结点有左子树和右子树，删除该节点，左子树的最大结点或者右子树的最小结点替代其对应位置，检查后序序列
上图对应三种情况

1.3.2 如何构建二叉搜索树（代码）

构建及构建：

void Insert(BinTree &T, int a)
{
	if (T == NULL)//该结点为空则新建
	{
		T = new TNode;
		T->data = a;
		T->left = NULL;
		T->right = NULL;
	}
	else
	{
		if (a > T->data)//进入右递归
		{
			return Insert(T->right, a);
		}
		else if (a < T->data)//进入左递归
		{
			return Insert(T->left, a);
		}
	}
}

进行边查边插入，为空时新建结点插入，小于结点值时进入左递归，大于结点值时进入右递归
时间复杂度为O(n)
删除：

BinTree Delete( BinTree BST, ElementType X )
{
    BinTree p;
    if (!BST )//树为空
    {
        printf("Not Found\n");
        return BST;
    }

    if ( BST->Data > X)//进入左递归查找
    {
        BST->Left = Delete( BST->Left, X);
    }
    else if ( BST->Data < X)//进入右递归查找
    {
        BST->Right = Delete( BST->Right, X);
    }
    else
    {
        if ( BST->Right && BST->Left )
        {
            p = FindMax( BST->Left );//找左子树的最大结点
            BST->Data = p->Data;//替代
            BST->Left = Delete( BST->Left, BST->Data );//删除左子树的最大结点
        }
        else
        {
            p = BST;
            if ( !BST->Left )//左子树为空
            {
                BST = BST->Right;
            }
            else if ( !BST->Right)//右子树为空
            {
                BST = BST->Left;
            }
            free(p);
        }
    }
    return BST;
}

边查边删除，结点值小于要删除的值时进入右递归，大于要删除的值进入左递归，找到后判断是三种情况的哪一种，若没有孩子则直接删除，若只有一个孩子，则该孩子取代它。若有两个孩子，则将左子树的最大结点和右子树的最小结点替代它
时间复杂度为O(n)
利用递归算法可以减少不必要的比较次数，以一条最优解的路线进行查找，减少时间复杂度

1.4 AVL树

AVL树可适当减少树的高度，减少查找次数，优化其结构，减少时间复杂度，提高运行效率。
特点：所有节点左右子树深度差的绝对值小于等于1
平均查找长度：最坏情况O(long2n)
平衡调整：

LL型调整

找到失衡结点进行分析，将失衡结点的左子树右上旋转作为根结点，原结点变为其右子树，并进行调整

RR型调整

找到失衡结点进行分析，将失衡结点的右子树左上旋转作为根结点，原结点变为其左子树，失衡结点的右子树的左孩子变为失衡结点的右孩子，并进行调整。

LR型调整

找到失衡结点进行分析，将失衡结点的左子树的右孩子上移变为根节点，失衡节点左子树变为其左孩子，失衡结点变为其右孩子，并进行调整。

RL型调整

找到失衡结点进行分析，将失衡结点的右子树的左孩子上移变为根节点，失衡结点右子树变为其右孩子，失衡节点变为其左孩子，并进行调整

AVL树结点个数最少满足的条件：O(1)=1,O(2)=2,O(H)=O(H-1)+O(H-2)+1
n个结点的AVL树满足:h=log2(N(h)+1)
平均查找长度为O(log2n)

map用法

可利用map形成映射进行一对一的匹配，可与树的结构进行联立，第一个可以称为关键字(key)，每个关键字只能在map中出现一次，第二个可能称为该关键字的值
模板：map<模板参数，模板参数>定义名称

#include <map>  //STL头文件没有扩展名.h

插入函数:

方法一insert插入
例：
users.insert(pair<long long, string>(num, code));
users.insert(pair<long long, string>(10, 5))
方法二直接插入
例：
user[10]=code;
user[10]='5'

查找函数:

map<long long, string>users;
map<long long, string>::iterator iter;
iter = users.find(num);
if (iter == users.end())//到达结尾没找到
{
	证明没找到;
}

其他基本函数(自己认为重要的):

clear(）        删除所有元素
empty()         如果map为空则返回true
erase()         删除一个元素
find()          查找一个元素
insert()        插入元素
size()          返回map中元素的个数

1.5 B-树和B+树

B-树
AVL由于一个结点只能存放一个关键字，若数据量太多会导致树的高度过高，B树的一个结点则可存放多个关键字，降低树的高度，减少查找时间。
一个m阶的B-树每个结点最多m个孩子结点，最多m-1个关键字。除了根节点外，其他结点至少m/2个孩子结点，至少m/2-1个关键字。根节点至少2个孩子。
B-树的查找是通过定义结点的孩子指针个数，通过比较该节点中的关键字，找到对应的孩子指针所指的元素，继续进行比较。

B-树的插入
插入过程要注意关键字的个数是否超过最大值，若超过了则要分裂，若有双亲结点，则中间值上移到双亲结点，若没有则新建一个双亲结点，树的高度加一。
例：

B-树的删除
删除时要注意关键字的个数是否少于最小值。若删除关键字后该节点的关键字个数仍然满足条件，则直接删除。若删除后不满足，则可观察其是否有孩子，若有孩子，且从其借一个关键字后仍满足条件，则可从其借一个孩子，若无法借到关键字，可合并孩子，重新进行分裂。
例：

B+树
与B-树的区别，若其结点有n棵子树则有n个关键字，所有的叶子结点中包含了全部关键字的信息，以及指向含这些关键字记录的指针，叶子结点本身依关键字的大小自小而则顶序链接。
可解决索引块系统一类的功能，例如文件查找索引

1.6 散列查找

哈希表（又称散列表），是一种存储结构，适用于记录的关键字与存储的地址存在某种关系的数据。设要存储的元素个数为n，再设计长度为m的连续内存单元，通过改变下标改变对应的映射关系，元素存储在内存单元中。
哈希表的设计：主要是为了解决哈希冲突。在实际应用中，哈希冲突是难以避免的，而它主要与三个因素有关。
哈希函数的构造方法可采用直接定址法和除留余数法，除留余数法中h(k)=k mod p,p取不大于m的素数时效果最好，减少发生冲突的可能。

哈希表
利用除留余数法确定对应的下标，当该位置已有元素时，自动往后一位移动，直至遇到空位，探测次数累次增加。
例题：

AVL成功=总的探测次数和/有效元素个数
AVL不成功=（从0开始到第p个单元格的不成功探测次数和，例如p为7，但建了大于7的单元格，只要计算0到6的单元格不成功探测次数即可）/p

哈希链
同样除留余数法确定对应的下标，但由于是建了链，当对应下标的链有元素时，采用头插法插入其中。
例题：

AVL成功=（按层来看，一列元素为一层，向外扩张。层数 * 对应层数的元素个数总和）/总元素个数
AVL不成功=元素总个数/p

2.PTA题目介绍（0--5分）

2.1 是否完全二叉搜索树（2分）

是否完全二叉树代码

思路：通过上图可观察到完全二叉搜索树与不完全二叉树的区别，在于空结点出现的位置，不完全二叉树的空结点位置提前了，所以从该空结点的位置入手，通过层次遍历和计数法进行计数，遇到空结点停止，之后将此时的计数和元素总数进行比较，相等证明为完全二叉树。

2.1.1 伪代码

/*建立平衡二叉树*/
void Insert(BinTree &T, int a)
{
	if (结点为空)
	{
		新建结并且初始化;
	}
	else
	{
		if (a < T值)进入右循环;
		if (a > T值)进入做循环;
	}
}
/*层次遍历*/
int falg = 0;
q.push(T);
while (!q.empty())
{
	if (遇到空结点)
	{
		flag = 1;
	}
	else
	{
		if (flag = 0)进行计数;
		左孩子入队;
		右孩子入队;
	}
}

2.1.2 提交列表

2.1.3 本题知识点

建立二叉排序树、层次遍历、flag计数法

2.2 航空公司VIP客户查询

航空公司VIP客户查询map写法
 航空公司VIP客户查询哈希链写法
思路：一开始看到这个题目，想用map函数来写，也比较清楚，结果在测试时间上被卡了点，所以用哈希链的形式,先对哈希链构造结构体，之后对每个用户进行取余分组，找到对应的位置用头插法插入，并且判断对应的距离，但是测试点只能过第一个，后面两个测试点不知道是什么意思，代码也改了好久还是改不出来。

2.2.1 伪代码

/*结构体*/
typedef struct node
{
	char id[20];
	int distance;
	struct Tnode *next;
}HashTnode,*HashList;
初始化哈希链;
输入数据;
/*取余求地址*/
int adr = 0;
for (int i = 12; i <= 16; i++)
{
	换成数据;
}
/*查找用户是否已存在*/
node = h[adr]->next;
while (遍历哈希链)
{
	比较用户名;
}
/*存放数据*/
if (用户存在)
{
	比较路程;
	存放数据;
}
else
{
	新建结点;
	比较路程存放数据;
}

2.2.2 提交列表

2.2.3本题知识点

构建哈希链结构体、取余求地址方法、头插法建链、map相关知识也可以适用本题

2.3基于词频的文件相似度

基于词频的文件相似度map写法

思路：这里采用了map的写法，定义map<string, bool>m[101]的形式，当第i个文件有word词组时，m[i][word]=true,这样就可以通过比较m[i]与m[其他]里面的其他词组，之后定义二维数组存放相似的词组个数，same[i][j]表示第i个文件与第j个文件中相同的词组个数。

2.3.1 伪代码

map<string, bool>m[101];//如果第i个文件存在单词word，则m[i][word] = true;
static int same[101][101];//定义二维数组存放是否有相似
static int num[101];
输入文件个数
for (到达文件个数)
{
	while (直到遇到'#')
	{
		全部字母变为大写;
		if (字母个数小于10)
			逐个放入数组;
		if (字母总个数大于3)
			则map[i][word] = true;
	}
	for (it = m[i].begin(); it != m[i].end(); it++)
	{
		for (j = 0; j <= i; j++)
		{
			if (m[j][it->first] == true)//i中的词组在j中出现
				same[i][j] = same[j][i] += 1;
		}
	}
	记录第i个文件的词组总数放入num[i]中;
}
遍历计算相似度；

2.3.2提交列表

2.3.3本题知识点

map相关知识和运用、map与矩阵相联立解题

posted @ 2021-06-14 19:27 稶郗阅读(46) 评论(0) 编辑收藏举报

刷新页面返回顶部

稶郗