简单树

树的定义及其概念
树的父亲表示法
树的孩子兄弟表示法
森林
二叉树
- 满二叉树
- 完全二叉树
二叉树的遍历

树的定义及其概念

什么是树？
(图片源自网络)

差不多了
我们给他加工一下
去掉大量树叶抽取主干树枝

倒立并美化一下

就变成了一棵树
（美化完还是好丑啊）
我们可以发现原来的“树根”到了上面，因为我给他倒立了。
然后从树根可以扩散出主干，每条主干又可以扩散出几条分支，分支又可以扩散出分支……最后不能扩散的分支连接的就是叶子。
如果我们让树根是第一层（你喜欢的话第零层也可以），那么所有和树根直接相连的点就是第二层。
除了树根之外所有和第二层相连的点构成第三层。
除了第二层的点之外所有和第三层相连的点构成第四层（我诚实我没画出来）
……
所以你就可以发现，除了第\(n-1\)层的点之外所有和第\(n\)层连接的点构成第\(n+1\)层
这就是树的基本定义（反正又不考这么简单的概念自己理解记忆就好了）

树还有一些专有名词。
比如说刚刚提到的树根
你会发现，在树中任意一个结点（就是那个圈）都可以作为树根，按照上面的关系确定各个结点对应的层，就可以构成一棵树。所以说一棵无根树（是指没有指定根的树，不是没有根的树）的形态不是固定的
我们现在选定一个结点为根，然后确定每个结点的层数
树根一般会叫做第一层，有时也会叫做第零层。本文中采用第一种。
我们规定和这个结点直接相连的，层数比这个结点大1的所有结点叫做当前结点的儿子。
那么对应的当前结点就是这些结点的父亲。
比如：

树根是所有第二层的点的父亲。
第二层的点的父亲是树根。
第二层的点是树根的儿子。
树根的儿子是第二层的所有点。
树的深度，就是树的层数。如果树最深那一层是第\(n\)层，那么树的深度就是n(根节点是第1层)。如果根节点是第0层，那么深度就应该是\(n+1\)
我们又可以发现，对于树中任意一个点，他的儿子数量不是确定的。可以没有（叶子结点），可以有一个，可以有两个，可以有很多个。
然而除了树根之外，所有结点都有且只有唯一一个确定的父亲。根结点没有父亲。
然后一棵树中每个点肯定都有一条连向父亲的边，除了根结点没有父亲。
所以一棵有\(n\)个点树里面有\(n-1\)条“树枝”，也就是边
反过来也是成立的，一个有\(n\)个点\(n-1\)条边的连通图一定是一棵树，满足每个点有且只有一个父亲的性质（除了树根）。
又因为树根可以任意取，所以做题的时候一般以1号结点作为树根。（题目有特殊说明就看题目）

树的父亲表示法

如果我们用一个数组\(fa_i\)来表示结点\(i\)的父亲
然后为了方便我们令\(\forall 0<i\leq n, fa_i<i\)，所以树根就应该是1号节点，再定义树根的父亲为0号节点（也就是不存在）
为什么要这样方便定义？因为我们没有存储儿子的信息，想要找到儿子就只能一个个遍历，每次都要遍历n个结点，很不爽。所以我们索性让儿子的索引号一定排在父亲后面，每次从父亲开始搜索，搜到\(fa_j=i\)就可以说明结点j是i的儿子。

~~个人觉得这种方法很不爽~~
~~所以我要超纲~~

树的孩子兄弟表示法

上面的方法太浪费时间了。
我们可以发现一旦一棵树的形态确定了下来，那么父亲的儿子就确定了
我们要保存这个节点的儿子，~~因为题目经常这样搞~~
但是每个节点的儿子数量是不一定的，我们如果统一开数组。。。很浪费空间。
我们参考一下链表
我们可以发现，父节点可以只保存第一个儿子的信息，然后让第一个儿子保存第二个儿子的信息，第二个保存第三个……
那么每个节点只需要保存：我的下一个兄弟，我的第一个儿子
空间上变成了两倍，但是时间上快了很多很多
（质的飞越）
这就是大名鼎鼎的链式前向星

struct Edge
{
/*
  这里用边来表示指向的节点
  @param: int v 这条边指向的节点的编号
          int u 指向下一个儿子的边的编号（可以找到下一个兄弟）
*/
  int u,v;
};
// 用来表示节点的第一个儿子，具体大小按需要自定
int head[];
void add(int a,int b)
{
/*
  用来增加一条从a连向b的边，即a是b的父亲
  @param: int a 父亲 int b 儿子
  @return: void
*/
  static int tot=0;                  // 表示使用这个函数加的边的总数，那么这个tot+1就是新边的编号了
  edge[++tot]=(Edge){head[a],b};     // 新的边指向b，下一个（上一个？差不多啦反正能找到所有的兄弟就可以了）兄弟的边的编号
  head[a]=tot;                       // 更新a的第一个儿子为b，也就是指向b的边，也就是新的边，就是更新后的tot
}

我们在加边的时候要注意只能是父亲连向儿子，不能儿子逆向连回父亲。
光说不做总不好，我们用题来说话
很明显，城堡是无根树，我们就令根为1
然后建树（主要理解这个步骤）
然后树上dp
设\(f_{i,j}\)表示在\(i\)节点放\((j=1)\)或不放\((j=0)\)时，这棵子树满足所有边都被看见的最小需要的士兵数量。
子树是什么……额……对于一棵树，任意一个节点和他的后代（儿子，儿子的儿子，儿子的儿子的儿子……）所构成的数（也一定是一棵树）叫做子树，这个节点叫做子树的根。跟子集是差不多的概念。但子树一般默认是非空真子树。
很明显，如果\(i\)是叶子节点，那么子树\(i\)（以\(i\)为根的子树）只有\(i\)一个节点，没有边，所以
\(f_{i,0}=f_{i,1}=0\),并不需要士兵。这也是递归的初始条件。
我们再来想想递推的结束条件，应该是整棵树满足条件所需要的最小士兵数量，也就是根为\(1\)的子树的\(f\)，即
\(\min(f_{1,0},f_{1,1})\),所需要的士兵就是整棵树满足条件所需要的最小士兵数，也就是递推边界
（不知道你们怎么理解反正我觉得动态规划就是递推）
然后再来想想状态转移方程
对于一个节点\(i\),如果是叶子结点，按照上面方式初始化。如果不是叶子结点，那么我们就分类讨论：

这个节点放置士兵
那么他的儿子放不放士兵都随便，看怎样便宜怎样来。
这个节点不放置士兵
那么他的所有儿子都必须放置士兵，代价（花费）就是所以儿子放置士兵，所有以儿子为根的子树都满足性质的最小代价和

写成方程就长这样：

\[\forall fa_j=i f_{i,0}=\sum f_{j,1} f_{i,1}=1+\sum \min(f_{j,0},f_{j,1}) \]

然后我们来讨论一下建树
首先用链式前向星存双向边，然后用dfs初始化，处理出每个节点的父亲。如果这条边是指向父亲的话就跳过或者直接删除这条边。否则这条边就是指向儿子的
然后就。。。不停递推

#include <bits/stdc++.h>
using namespace std;
struct Edge
{
	int u,v;
}edge[3000];		// 有1500个点，1499条边，建双向边就需要开3000数组
int head[1500];		// 储存每个节点连出去的第一条边（第一个儿子 

int n,fa[1500],a,b,k;
int dp[1500][2]; 
void add(int a,int b)
{
/*
	增加一条单向边
	@param: int a 单向边的起点
			int b 单向边的终点
	@return: void 
*/
	static int tot=0;
	edge[++tot]=(Edge){head[a],b}; head[a]=tot;
}

void init(int k,int f)
{
/*
	处理一个结点
	@param: int k 当前要处理的结点
			int f 这个结点的父亲 
	@return: void
*/
	fa[k]=f;
	dp[k][0]=0; dp[k][1]=1;			// 初始化，叶子结点不会执行下面的循环 
	for(int j=head[k];j;j=edge[j].u)
	{
		if(edge[j].v==fa[k]) continue;
		init(edge[j].v,k);			// 指向的不是父亲，先处理这个儿子，然后再维护自己 
		dp[k][0]+=dp[edge[j].v][1];
		dp[k][1]+=std::min(dp[edge[j].v][0],dp[edge[j].v][1]); 
	}
}

int main()
{
	std::cin>>n;
	for(int i=1;i<=n;++i)
	{
		std::cin>>a>>k;
		while(k--)
		{
			std::cin>>b;
			add(a,b);
			add(b,a);			// 建立双向边，正着反着都调用一次 
		}
	}
	init(1,-1);
	std::cout<<std::min(dp[1][0],dp[1][1])<<std::endl;
	return 0;
}

这里init函数是跳过版本的。如果需要调用的情况比较多，可以考虑把指向父亲的边删掉。
比如这样,通过链表的删除全部的方法删除。

void init(int k,int f)
{
/*
	处理一个结点
	@param: int k 当前要处理的结点
			int f 这个结点的父亲 
	@return: void
*/
	fa[k]=f;
	dp[k][0]=0; dp[k][1]=1;			// 初始化，叶子结点不会执行下面的循环 
	while(edge[head[k]].v==fa[k]) head[k]=edge[head[k]].u; 
	for(int j=head[k];j;j=edge[j].u)  // 从第一条边开始遍历所有的边。便利到最后j是0就表示遍历完了退出循环。
	{
		while(edge[edge[j].u].v==fa[k]) edge[j].u=edge[edge[j].u].u;
		init(edge[j].v,k);			// 指向的不是父亲，先处理这个儿子，然后再维护自己 
		dp[k][0]+=dp[edge[j].v][1];
		dp[k][1]+=std::min(dp[edge[j].v][0],dp[edge[j].v][1]); 
	}
}

但是你会发现用在这道题上面是TLE的
这是因为这道题有0号结点。有些结点的父亲就是0，然而如果这条边是0号边也就是不存在，这个边指向的点也是0，就会在while里面往复
所以我们加一个维护

void init(int k,int f)
{
/*
	处理一个结点
	@param: int k 当前要处理的结点
			int f 这个结点的父亲 
	@return: void
*/
	fa[k]=f;
	dp[k][0]=0; dp[k][1]=1;			// 初始化，叶子结点不会执行下面的循环 
	while(edge[head[k]].v==fa[k]&&head[k]) head[k]=edge[head[k]].u; 
	for(int j=head[k];j;j=edge[j].u)
	{
		while(edge[edge[j].u].v==fa[k]&&edge[j].u) edge[j].u=edge[edge[j].u].u;
		init(edge[j].v,k);			// 指向的不是父亲，先处理这个儿子，然后再维护自己 
		dp[k][0]+=dp[edge[j].v][1];
		dp[k][1]+=std::min(dp[edge[j].v][0],dp[edge[j].v][1]); 
	}
}

emmmm这里你听不懂没关系……反正是超纲的。

森林

就是一堆树放在一起的集合，叫做森林
单独的一棵树。。。应该也算吧
一棵树删除了根以及它所连的边之后就变成了森林。

二叉树

我们再来看看这棵树

emmm不是这幅

如果我们类似图的定义来定义一下树的度
就会有：
结点的度：一个结点的儿子的数量
树的度：树中所有结点的度的最大值
所以上面是度为3的树
那么二叉树是什么呢？
就是一棵度为2的树
那么就会有，对于这棵二叉树中的任意一个结点，他儿子的数量不是0就是1或者2
既然这样，那我们干脆就叫任意一个结点的两个儿子分别为左儿子和右儿子(专业术语)
如果这个结点没有左儿子，就说左儿子为空
显然，叶子结点左右儿子都为空
二叉树会满足一些性质：
在根节点为第1层的情况下：

第\(i\)层最多有\(2^{i-1}\)个结点
深度为\(h\)的二叉树最多有\(2^{h}-1\)个结点
若在任意一棵二叉树中，有\(n_0\)个叶子节点，有\(n_2\)个度为2的节点，则必有\(n_0=n_2+1\)
证明：对于一棵二叉树，\(n_0,n_2\)的值都是由他的左右儿子决定的。
特殊地，如果这个结点没有左右儿子，那么就是叶子结点，\(n_0=1,n_2=0\),满足条件
当这个结点不是叶子结点的时候：
定义这个结点\(rt\)的子树分别为\(A,B\),且\(A,B\)如果不为空，则满足上述性质
当其中一个子树为空的时候，这里假设\(B\)为空，有\(rt_0=A_0,rt_2=A_2\),因为\(A\)满足性质，所以\(rt\)也满足性质
当两个子树都不为空的时候，有\(rt_0=A_0+B_0,rt_2=A_2+B_2+1\)（因为两个子树都不为空，\(rt\)也是一个度为2的结点）
\(rt_0=A_0+B_0=A_2+1+B_2+1=A_2+B_2+1+1=rt_2+1\)
所以无论\(rt\)是什么结点，叶子结点也好，不是叶子结点也好，他都满足性质。
所以当\(rt\)为根节点的时候，满足性质，表现为整棵二叉树满足性质。
具有\(n\)个结点的二叉树最小深度为\(\lfloor log_2n\rfloor+1\)

满二叉树

对于所有非叶子结点度都为2，且叶子结点都在同一层的二叉树，我们叫做满二叉树（在不增加层数的情况下你插入不了结点了，就是满了）
百度定义：满二叉树：如果一棵二叉树只有度为0的结点和度为2的结点，并且度为0的结点在同一层上，则这棵二叉树为满二叉树。
然后我们可以给满二叉树的结点编号
一层一层编下来。
首先
第一层根节点给1
第二层只有两个节点，一个是1的左儿子，一个是1的右儿子。分别给2和3
第三层有四个结点，分别是2的左右儿子，3的左右儿子。对于2的左儿子按照顺序给4，右儿子给5。3的左儿子6，右儿子7
。。。。。。
第\(i\)层有\(2^{i-1}\)个结点，他们的编号分别是\(2^{i-1},2^{i-1}+1\dots 2^{i}-1\)
这个方法叫做顺序编号。就是先按照层的顺序，再按照层中从左到右的顺序给结点进行编号。
然后根据~~推理（反正我推不出来）~~观察，发现，对于编号为\(j\)的非叶子结点，它的左儿子编号为\(2j\),右儿子编号为\(2j+1\)
在C++中可以使用位运算符来加快运算速度

j<<1;      // 等价于j*2
j<<1|1;    // 等价于j*2+1

完全二叉树

是一棵残缺的满二叉树，但是满足顺序编号所有的结点在与满二叉树中对应的结点编号相同。
我觉得百度讲的比我清楚qwq

二叉树的遍历

遍历，就是按照一定顺序输出二叉树的结点所储存的信息而不是编号
首先插播一条超纲知识：
对于所有的树（所有的图，树是一种特殊的图），我们可以采用以下两种遍历方式：

深度优先遍历

就是一路dfs深搜下去，每搜索到一个结点就输出信息并标记已访问（树不会重复访问结点所以不用标记）。搜到叶子结点就返回，否则就dfs他的所有儿子
这种遍历方法输出的特点是同一子树内的结点会在一起被遍历到（如果你保存到数组里就是保存在连续的一段）
写成代码长成这样

void dfs(int k)
{
/*
  深度优先遍历
  @param: int k 当前遍历到的结点编号
  @return: void
*/
  print(val[k]);    // 用专门的输出函数来输出这个结点的数据（如果是普通数据可以直接输出，不必调用函数）
  static int tot=0;
  dat[++tot]=val[k];  // 保存到数组
  for(int j=head[i];j;j=edge[j].u)        // 链式前向星遍历儿子
  {
    // 如果访问过就跳过，这里vis是定义在一些神奇的地方（函数外啊，函数内啊随便。反正我没定义（逃）。。。）
    if(vis[edge[j].v]) continue;          // 图的写法，树可以改成if(edge[j].v==fa[k])
    dfs(edge[j].v);                        // 没有访问过，就遍历
  }
}

广度优先遍历

顾名思义就是用广度优先搜索算法遍历的，也叫做层次遍历/层序遍历（随便叫吧）
用queue的bfs实现的。每次从队头拿出一个结点，输出信息并标记访问（树不会重复访问所以不用标记），然后把这个结点的所有儿子都放进队列中。重复执行直到队列为空。
这种遍历方法输出的特点是同一层的结点会在一起被遍历到（如果保存到数组就是保存在连续的一段。）

void bfs(int rt)
{
/*
  广度优先遍历
  @param: int rt 树的根
  @return: void
*/
  queue<int> q;
  q.push(rt);            // 根节点入队
  static int tot=0;
  while(!q.empty())
  {
    int i=q.front(); q.pop();    // 取出队头结点
    print(val[i]);                // 输出
    dat[++tot]=val[i];            // 保存
    for(int j=head[i];j;j=edge[j].v)  // 搜索所有儿子
    {
      if(vis[edge[j].v]) continue;    // 访问过就跳过，图的写法，树可以改成if(edge[j].v==fa[k])
      q.push(edge[j].v);              // 没有访问过就入队
    }
  }
}

上面的遍历在二叉树中都可以用
现在来讲讲二叉树专有的遍历方式
首先给一棵来自百度百科的二叉树的图：

（如果图片显示不出来请复制上述网址粘贴到地址栏中查看）
这棵树的深度优先遍历可能是FCADBEHGM
广度优先遍历可能是FECGHADMB
具体取决于你建树时的细节操作和输出遍历时的操作
（也就是实现方法的不同会导致遍历结果的不同，但是一定满足遍历本身的性质）

但是接下来讲的三种遍历出来的序列是确定的：（因为你确定了左右儿子）

先序遍历/前序遍历

是基于深度优先遍历的遍历
每次遍历，先输出自己，然后输出左儿子的遍历序列，再输出右儿子的遍历序列
也就是遵循根左右原则

void dfs(int k)
{
/*
  输出先序遍历
  @param: int k 当前遍历到的结点
  @return: void
*/
  print(val[k]);
  // 定义lson[k],rson[k]分别表示k的左右儿子
  if(lson[k]) dfs(lson[k]);    // 如果有左儿子才输出左儿子的先序遍历
  if(rson[k]) dfs(rson[k]);    // 如果有右儿子才输出右儿子的先序遍历
}

如上图，先序遍历是FCADBEHGM

中序遍历

是基于深度优先遍历的遍历
每次遍历，先输出左儿子的遍历序列，再输出自己，最后输出右儿子的遍历序列
也就是遵循左根右原则

void dfs(int k)
{
/*
  输出中序遍历
  @param: int k 当前遍历到的结点
  @return: void
*/
  if(lson[k]) dfs(lson[k]);
  print(val[k]);
  if(rson[k]) dfs(rson[k]);
}

如上图，中序遍历是ACBDFHEMG

后序遍历

是基于深度优先遍历的遍历
每次遍历，先输出左儿子的遍历序列，再输出右儿子的遍历序列，最后输出自己
也就是遵循左右根原则

void dfs(int k)
{
/*
  输出后序遍历
  @param: int k 当前遍历到的结点
  @return: void
*/
  if(lson[k]) dfs(lson[k]);
  if(rson[k]) dfs(rson[k]);
  print(val[k]);
}

如上图，后序遍历是ABDCHMGEF

先序遍历，中序遍历，后序遍历的应用

我们可以知道，对于确定的二叉树，它的这三种遍历的序列都是唯一的。
反过来不成立，对于确定的某个序列，二叉树的形态不是唯一的。
但是，如果有确定的先序遍历和中序遍历或者确定的中序遍历和后序遍历，就可以确定一棵二叉树的形态
但是只有先序遍历和后序遍历就不行，这个时候题目就会问你：中序遍历可能是，你只需要排除掉不可能的剩下的就是可能的了。
~~（至于为什么我也不知道）~~

改自2013腾讯笔试题：（不能复制。。。我手敲好累）
已知二叉树的先序遍历为FBACDEGH,中序遍历为ABDCEFGH,则后序遍历为
A: ADECBHGF
B: ABDECGHF
C: GHADECBF
D: HGADECBF
E（我自己加的）: ABCDEF
首先这道题，有一个很白痴的问题（但是我一开始就跳进去了）
E是可以直接排掉的！！！
所以求可能的中序遍历的时候这也是一种要排除的选项。
（当时分析了好久）
然后我们看看这个先序遍历先
FBACDEGH
他告诉了我们什么
首先这个数有8个结点，非空（废话）。所以根据根左右原则，可以知道树根为F，那么BACDEGH就是左右子树的遍历序列。无论是哪个子树，无论形态长什么样，我们都可以知道B肯定是某个子树的根。
然后我们再看看中序遍历
ABDCEFGH
根节点F在中间，然后就由左根右知道F左边的ABDCE组成左子树的中序遍历序列，所以左子树由这5个结点组成（注意不是构成，现在还不知道具体形态），右子树由GH这2个结点组成
然后左子树的根是B，那么ABDCE又可以分成两段：A,DCE这时我们就知道，B的左儿子是A，右儿子是DCE组成的子树
那么这个右儿子是怎样的呢？
我们看看先序遍历中DCE的位置，是CDE，也就是C是根节点，那么DCE又被分成了两段:D,E所以C的左儿子是D,右儿子是E
那么ABDCE这棵左子树的形态我们就确定了
同样我们可以确定GH这棵右子树
先序遍历GH,中序遍历GH,所以G是根，H是右子树
综上，我们用(rt,A,B)表示一个结点\(rt\)的左子树\(A\),右子树\(B\)（对我懒得画图）
那么这棵树就可以表示成
(F,
(B, A, (C, D, E)),
(G, 0, H)
)
所以后序遍历就是ADECBHGF
所以选A
明白了吧？

posted @ 2021-10-29 10:50 IdanSuce 阅读(203) 评论(0) 收藏举报

刷新页面返回顶部

LASS

简单树