【核心算法4】广度优先遍历算法

广度优先遍历与深度优先遍历类似，也是查询的方法之一，他也是从某个状态出发查询可以到达的所有状态。

但不同与深度优先遍历，广度优先遍历总是先去查询距离初始状态最近的状态。

选课的智慧：如何确定选课的顺序
寻找制高点：寻找制高点，抢占有利地形
合法的括号：从非法括号中寻找合法括号序列
数的右侧：从树的侧边观察数的伟岸身躯

对比深度优先遍历算法，广度优先遍历算法在搜索所有答案的时候是采用由近及远的方式。先访问离起始点最近的点，再访问远一些的点，就好像先访问走一步可以到达的点，再访问走两步可以到达的点。

因此，广度优先遍历算法也叫做层次遍历算法，一层一层去找问题的答案。

选课的智慧

新学期，将要学习计算机基础、数学、英语、Python、算法等五门课程。其中学习算法之前要先学习Python和英语，在学习Python之前要学习数学和计算机基础

问题求解

广度优先遍历以队列为基础

开始选课时，只能选择没有先修课的科目。比如数学，在选择计算机基础，这样就可以学习Python。为了找出没有先修课的科目，需要建立一个数组来记录每门课的先修课数量，将每门的先修课数量初始化为0，课程数量为num_courses
接下来，需要通过先修课的二维数组pre_list来计算每门课的先修课数量
接下来，建立一个队列queue 存储目前可以选择的课程。将那些先修课数量为0的课程加入队列queue
综上，建立存放每门可曾先修数量的数组pre_list_count 和存放目前可以选修课程的队列queu。
最后使用广度优先遍历开始选课

代码实现

def bfs(num_courses, pre_list):
    # 初始化每门课的先修课数量 0
    pre_list_count = [0]*num_courses
    for line in pre_list:
        for i in range(len(line)):
            if line[i] == 1:
                pre_list_count[i] += 1

    queue = []
    for i in range(len(pre_list_count)):
        # 挑选先修课数量为0 的课程
        if pre_list_count[i] == 0:
            queue.append(i)

    class_task = []
    while len(queue) != 0:
        this_class = queue[0]
        del queue[0]
        class_task.append(this_class)

        for i in range(num_courses):
            if pre_list[this_class][i] == 1:
                pre_list_count[i] -= 1
                # 若一门课的先修课为0，就将其加入队列
                if pre_list_count[i] == 0:
                    queue.append(i)

    return class_task

# 课程与课程之间的依赖关系
pre_list = [
       # M, C, P, E, A
        [0, 0, 1, 0, 0],
        [0, 0, 1, 0, 0],
        [0, 0, 0, 0, 0],
        [0, 0, 0, 0, 1],
        [0, 0, 0, 0, 1],
       ]

class_map = {
    '0': 'Math',
    '1': 'Computer',
    '2': 'Python',
    '3': 'English',
    '4': 'Arithmetic',
}

class_task = bfs(5, pre_list)
for i in class_task:
    print(class_map[str(i)])

寻找制高点

拿到一张海拔图，上面有每个地理位置的海拔高度数据。为了描述这张图，使用同样一个M*N的二维数组表示

如图：

问题求解

若是从每个点出发来搜索是否能达到四个边缘，但不像迷宫问题，搜索的目标点不是单一的，而是所有边缘点，那么这种算法思路显然效率低下。

那么，如何优化算法呢？换个角度思考，以边缘作为起点向内部开始遍历搜索，看下一个节点的高低是否高于或者等于自身的高度，然后标记能够到达的点为True，继续搜索，直到不能走为止。

按照同样的思路分别标记从四个边缘出发可以到达的点，那么最终四者均为True，那，这个点就是我们寻找的制高点。

逆向思维方式很重要

标记地图上的每一个点，定义左上角为(0, 0), 右下角为(m-1, n-1)

首先，根据已知的数据(地图)，也就是一个二维数组。代码框架

# matrix 是存储地图的二维数组
def solve(matrix):
    if not matrix:
        return matrix
    # 相应逻辑

为了更好的表示可以移动的方向，使用一个二维数组存储上下左右四个方向

dir = [
    [0, 1], # x坐标+0，y坐标+1，即向下移动
    [0, -1],
    [1, 0],
    [-1, 0]
]

定义用来存储二维数组大小的变量
开始寻找制高点，队列是完成广度优先遍历必备的数据结构。所以，先把第一行的点全部放入队列，然后开始广度遍历

代码实现


def bfs(set, m, n, matrix):
    dir = [[0, 1], [0, -1], [1, 0], [-1, 0]]
    # list()函数创建queue 为set的队列版本
    queue = list(set)

    while len(queue) > 0:
        # 取出队列的头元素(x, y)
        x, y = queue.pop()
        # 循环遍历四个方向
        for d in dir:
            nx = x + d[0]
            ny = y + d[1]
            # 如果新的点在二维数组中
            if 0 <= nx and nx < m and 0 <= ny and ny < n:
                # 如果新的点原来点高
                if matrix[nx][ny] >= matrix[x][y]:
                    if (nx, ny) not in set:
                        queue.append((nx, ny))
                        set.add((nx, ny))


def solve(matrix):
    if not matrix:
        return matrix

    # 二维数组有多少行
    m = len(matrix)
    # 二维数组有多少列
    n = len(matrix[0])

    top_point = set([(0, y) for y in range(n)])
    left_point = set([(x, 0) for x in range(m)])
    bottom_point = set([(m-1, y) for y in range(n)])
    right_point = set([(x, n-1) for x in range(m)])

    bfs(top_point, m, n, matrix)
    bfs(left_point, m, n, matrix)
    bfs(bottom_point, m, n, matrix)
    bfs(right_point, m, n, matrix)

    res = top_point & left_point & bottom_point & right_point
    result = max(res)
    print('XY:', result)
    comm_height = matrix[result[0]][result[1]]
    return comm_height

matrix = [
    [1, 1, 3, 2, 3, 5, 3],
    [1, 3, 3, 4, 5, 6, 3],
    [2, 2, 3, 7, 4, 3, 2],
    [3, 5, 5, 2, 3, 2, 3]
]

s = solve(matrix)
print(s)

合法的括号

一段代码中充满了括号，为了更快的修改括号匹配问题，可以编写一段代码，来寻找正确的小括号组合。

即在给定的输入字符串中，移除掉最少量的错误括号，从而使得这个字符串变成有效的字符串，并返回

问题求解

对于括号匹配问题，最先想到的应该是栈来解决。常规操作就是遇到左括号的时候入栈，遇见有括号的时候出栈。而对于最短路径，广度优先遍历算法不仅可以找到合法的字符串，还可以找到经过最少变化就能得到合法字符串，所以广度优先遍历算法更适合解决。
首先，解决什么样的字符串是合法的字符串，为了判断一个字符串是否合法。可以使用一个变量来模拟栈，从头到尾扫描，只要遇到左括号就让变量加1，遇到右括号让变量减1，在这个过程中，某一步使得变量的值小于0，就说明该字符串是一个非法字符串，如果全部都通过的话，就说明它是一个合法的字符串。相比较传统的栈，能更节省内存
```
def isvalid(str):
    count = 0
    for i in str:
        if i == '(':
            count += 1
        elif i == ')':
            count -= 1
            if count < 0:
                return False
    return count == 0
```
将初始字符串加入队列，每次从队列中取出一个字符串，查看它是不是合法的，如果是，则把它加入结果集，返回结果就好，如果不是，遍历这个字符串，只要遇到左右括号字符的时候，就去掉该括号字符生成新的字符串，把它加入到队列中进行分析。对于括号数量为N的字符串，理论上，这一步要产生N-1个字符串，当然还要去除重复的数据，可能会小于N-1个字符串。可以放入一个哈希集合中，减少重复计算
找出所有合法的结果需要一直找到队列为空。如果发现合法的字符串，就不需要继续搜索下去，直接跳出循环，使用该技术称之为剪枝
对队列中的每个字符串都进行相同的操作，还有一种情况是知道队列为空还没找到合法的字符串，就返回空集合。
最后使用广度优先遍历算法对队列进行分析，分析完不是删除，而是留下来做数据处理。

代码实现

def isvalid(str):
    ''' 有效字符串'''
    # 记录括号的数量
    count = 0
    for i in str:
        if i == '(':
            count += 1
        elif i == ')':
            count -= 1
            if count < 0:
                return False
    if count != 0:
        return False
    return True

def bfs(string):
    # 存放最终结果
    res = []
    # 初始字符串加入队列
    queue = [string]

    # 队列不为空是开始进行广度优先遍历
    while len(queue) > 0:
        for i in range(len(queue)):
            if isvalid(queue[i]):
                # 收集合法字符串到结果集中
                res.append(queue[i])

        if len(res) > 0:
            # 合法字符串去重
            return list(set(res))

        # 临时结果集
        temp = []
        # 取出队列中每一个字符串
        for i in queue:
            # 对于每个字符串，分别查看每个字符
            for j in range(len(i)):
                # 如果为左右括号则生成新的字符串，并加入临时结果集
                if i[j] == '(' or i[j] == ')':
                    temp.append(i[: j] + i[j+1: ])

        queue = list(set(temp))
    return list(set(res))

s = '(a)(b))('

print(bfs(s))
### >>>
"""
['(a)(b)', '(a(b))']
"""

posted @ 2020-06-15 23:10 小教官vv 阅读(645) 评论(0) 收藏举报

刷新页面返回顶部

小教官vv

【核心算法4】广度优先遍历算法

选课的智慧

问题求解

代码实现

寻找制高点

问题求解

代码实现

合法的括号

问题求解

代码实现

公告