对快速排序的分析 Quick Sort

快速排序

快排的基本思想是:通过一趟排序将待排记录分割成独立的两部分,其中一部分记录的关键字均比另一部分记录的关键字小,则可分别对这两部分记录继续进行排序,以达到整个序列有序。通常可选第一个记录为基准来重新排列其余记录,另外它需要一个栈空间来实现递归。

通常用第一个记录作为基准的时候
最好情况:每次基准归位,刚好落在序列的中间,将序列均匀的划分为长度相等或相近的两个子序列。栈空间最大深度为log(n+1),1表示最外层参数进栈
时间复杂度:n·log(n)
空间复杂度:log(n)

最坏情况:初始序列已经有序或基本有序时,每趟排序之后基准落在子序列的一端,则为最坏情况。栈空间最大深度为n
时间复杂度:n^2
空间复杂度:n
数据量大且有序时,使用第一个记录为基准排序会很慢,在leetcode 215题中就体现出来了,因此需要用下面方法对最坏情况进行改进

改善基准的选取

1,随机选基准

随机选择基准可以提升最坏情况下的性能,但是在随机选择时也有最坏情况,即每次都选择了有序序列的一端,最坏时间复杂度也是O(N^2),但整体还是比上述以第一个为基准要好。

2,三者取中(a[0],a[-1],a[len(a)//2])

《严 · 数据结构》上推荐使用三者取中,可大大改善快速排序在最坏情况下的性能。

(3,BFPRT是不是也能优化快排的基准选择,如果用了BFPRT,基准每次都划分在序列中间位置,这样总的快排时间复杂度就是优化前的复杂度n·log(n),就不存在最坏O(N^2)的情况。)

改善快排的递归过程

以基准划分序列时,用两个boolean变量标记两指针向中间移动过程中是否进行过交换,若有哪一部分没有进行交换,则无需对这部分进行递归,进而提升了性能。

代码实现

import random


def partition(nums, left, right, base):
    '''基准归位'''
    if left == right:
        return
    temp = nums[base]
    nums[base], nums[right] = nums[right], nums[base]  # 和尾部节点交换

    max_index = left
    for i in range(left, right):
        if nums[i] < temp:
            nums[i], nums[max_index] = nums[max_index], nums[i]
            max_index += 1
    nums[max_index], nums[right] = nums[right], nums[max_index]
    return max_index


def quick_sort(nums, left, right):
    '''快速排序'''
    if left >= right:
        return

    base = random.randint(left, right)     # 随机选取基准
    base_index = partition(nums, left, right, base)

    quick_sort(nums, left, base_index-1)   # 递归左边
    quick_sort(nums, base_index+1, right)  # 递归右边


if __name__ == '__main__':
    nums = [6, 1, 8, 8, 8, 2, 7, 9, 3, 8, 8, 4, 5, 10]
    left, right = 0, len(nums) - 1

    quick_sort(nums, left, right)
    print(nums)

快速选择

和快排partition过程一致,分治过程只操作有用的一半,另一半不管。

时间复杂度:n, 最差n^2。(由于证明过程很繁琐,所以不在这里展开讲。具体证明可以参考《算法导论》第 9 章第 2 小节。最差就是快排最差情况。)
空间复杂度:log(n),最差n

import random


def partition(nums, left, right, base):
    '''基准归位'''
    if left == right:
        return
    temp = nums[base]
    nums[base], nums[right] = nums[right], nums[base]  # 和尾部节点交换

    max_index = left
    for i in range(left, right):
        if nums[i] < temp:
            nums[i], nums[max_index] = nums[max_index], nums[i]
            max_index += 1
    nums[max_index], nums[right] = nums[right], nums[max_index]
    return max_index


def quick_select(nums, left, right, K):
    '''快速选择'''
    if left == right:  # 分治的序列仅剩一个元素,那么就是它了
        return nums[left]

    base = random.randint(left, right)     # 随机选取基准
    base_index = partition(nums, left, right, base)

    if base_index == K:
        return nums[base_index]
    elif base_index > K:
        return quick_select(nums, left, base_index-1, K)   # 递归左边
    else:
        return quick_select(nums, base_index+1, right, K)  # 递归右边


if __name__ == '__main__':
    nums = [6, 1, 8, 8, 8, 2, 7, 9, 3, 8, 8, 4, 5, 10]
    nums = list(set(nums))
    print(nums)

    left, right = 0, len(nums) - 1
    K = 2  # 第K大

    ans = quick_select(nums, left, right, right-K+1)  # 等于N-K+1小,10-2+1=9
    print(ans)
posted @ 2019-12-12 08:27  961897  阅读(264)  评论(0编辑  收藏  举报