快速排序之python
快速排序( Quick sort)
快速排序的基本思想:通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录继续进行递归排序,以达到整个序列有序。
1.算法描述:
另一个分而治之
将数组划分为两个部分,然后独立地对部分进行排序:
- 首先选择一个数据透视,并从列表中删除(隐藏在最后)
- 然后这些元素被分成两部分.一个小于枢轴,另一个大于枢轴. 这种分区是通过交换价值来实现的
- 然后在中间恢复枢轴,并且这两个部分递归地快速排序
示例:
Pivot:中间枢纽 ( 5) , Portitiom:分区 , Two points:两个指针 ( i:左->右 j:左<-右)
2.算法属性:
- 时间复杂度:O(nlogn)
- 空间复杂度:O(nlogn)
- 稳定性:不稳定
3.代码实现
''' O(nlogn) pivot枢纽,low和high为起点终点 ''' #划分分区(非就地划分) def partition(nums=list): pivot = nums[0] #挑选枢纽 lo = [x for x in nums[1:] if x < pivot] #所有小于pivot的元素 hi = [x for x in nums[1:] if x >= pivot] #所有大于pivot的元素 return lo,pivot,hi #快速排序 def quick_sort(nums=list): #被分解的Nums小于1则解决了 if len(nums) <= 1: return nums #分解 lo,pivot,hi = partition(nums) # 递归(树),分治,合并 return quick_sort(lo) + [pivot] + quick_sort(hi) lis = [7, 5, 0, 6, 3, 4, 1, 9, 8, 2] print(quick_sort(lis)) #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
''' 两部分,第一部分封装快排函数,第二部分调用快排 取枢纽key为pivot 学习版本 ''' import time def _quick_sort(nums:list): if len(nums) <= 1: return nums pivot = nums[0] #取第一个值为枢纽 #pivot左右边分别调用_quick_sort自身 #找左半边比pivot小的 left_nums = _quick_sort([x for x in nums[1:] if x < pivot]) #找右半边比pivot大的(此处选择x>=pivot意为pivot放在后半边比它大的元素前面) right_nums = _quick_sort([x for x in nums[1:] if x >= pivot]) return left_nums + [pivot] + right_nums def quick_sort(nums:list,reverse=False): start = time.time() nums = _quick_sort(nums) if reverse: nums = nums[::-1] t = time.time() - start return nums,t lis = [1,3,5,7,9,2,5,3,6,8,0] lis = quick_sort(lis,reverse=False) print(lis) #输出结果 ([0, 1, 2, 3, 3, 5, 5, 6, 7, 8, 9], 0.0)
网上最多较多的版本
def quick_sort(array): #封装一层调用 def recursive(begin, end): #fecursive递归 if begin > end: return l, r = begin, end pivot = array[l] while l < r: while l < r and array[r] > pivot: r -= 1 while l < r and array[l] <= pivot: l += 1 array[l], array[r] = array[r], array[l] array[l], array[begin] = pivot, array[l] recursive(begin, l - 1) recursive(r + 1, end) recursive(0, len(array) - 1) return array
第三个版本
''' 使用对象实例化,原理还是一样的 ''' class SQList: def __init__(self, lis=None): self.r = lis def swap(self, i, j): #定义一个交换元素的方法,方便后面调用。 temp = self.r[i] self.r[i] = self.r[j] self.r[j] = temp def quick_sort(self): #调用入口 self.qsort(0, len(self.r)-1) def qsort(self, low, high): #递归调用 if low < high: pivot = self.partition(low, high) self.qsort(low, pivot-1) self.qsort(pivot+1, high) def partition(self, low, high): ''' 快速排序的核心代码。 其实就是将选取的pivot_key不断交换,将比它小的换到左边,将比它大的换到右边。 它自己也在交换中不断变换自己的位置,直到完成所有的交换为止。 但在函数调用的过程中,pivot_key的值始终不变。 :param low:左边界下标 :param high:右边界下标 :return:分完左右区后pivot_key所在位置的下标 ''' lis = self.r pivot_key = lis[low] while low < high: while low < high and lis[high] >= pivot_key: high -= 1 self.swap(low, high) while low < high and lis[low] <= pivot_key: low += 1 self.swap(low, high) return low def __str__(self): ret = "" for i in self.r: ret += " %s" % i return ret if __name__ == '__main__': sqlist = SQList([4, 1, 7, 3, 8, 5, 9, 2, 6, 0, 123, 22]) sqlist.quick_sort() print(sqlist)
4.快速排序可优化的地方:(以第三个版本举例)
1)优化选取的Pivot
前面我们每次选取Pivot的都是子序列的第一个元素,也就是lis[low],这就比较看运气。运气好时,该值处于整个序列的靠近中间值,则构造的树比较平衡,运气比较差,处于最大或最小位置附近则构造的树接近斜树。
为了保证pivot选取的尽可能适中,采取选取序列左中右三个特殊位置的值中,处于中间值的那个数为pivot,通常会比直接用lis[low]要好一点。在代码中,在原来的pivot = lis[low]这一行前面增加下面的代码:
m = low + int((high-low)/2) if lis[low] > lis[high]: self.swap(low, high) if lis[m] > lis[high]: self.swap(high, m) if lis[m] > lis[low]: self.swap(m, low)
如果觉得这样还不够好,还可以将整个序列先划分为3部分,每一部分求出个pivot_key,再对3个pivot_key再做一次上面的比较得出最终的pivot_key。这时的pivot_key应该很大概率是一个比较靠谱的值。
2)减少不必要的交换
原来的代码中pivot_key这个记录总是再不断的交换中,其实这是没必要的,完全可以将它暂存在某个临时变量中,如下所示:
def partition(self, low, high): lis = self.r m = low + int((high-low)/2) if lis[low] > lis[high]: self.swap(low, high) if lis[m] > lis[high]: self.swap(high, m) if lis[m] > lis[low]: self.swap(m, low) pivot_key = lis[low] # temp暂存pivot_key的值 temp = pivot_key while low < high: while low < high and lis[high] >= pivot_key: high -= 1 # 直接替换,而不交换了 lis[low] = lis[high] while low < high and lis[low] <= pivot_key: low += 1 lis[high] = lis[low] lis[low] = temp return low
3)优化小数组时的排序
快速排序算法的递归操作在进行大量数据排序时,其开销能被接受,速度较快。但进行小数组排序时则不如直接插入排序来得快,也就是杀鸡用牛刀,未必就比菜刀来得快。
因此,一种很朴素的做法就是根据数据的多少,做个使用哪种算法的选择而已,如下改写qsort方法:
def qsort(self, low, high): """根据序列长短,选择使用快速排序还是简单插入排序""" # 7是一个经验值,可根据实际情况自行决定该数值。 MAX_LENGTH = 7 if high-low < MAX_LENGTH: if low < high: pivot = self.partition(low, high) self.qsort(low, pivot - 1) self.qsort(pivot + 1, high) else: # insert_sort方法是我们前面写过的简单插入排序算法 self.insert_sort()
4)优化递归操作
可以采用尾递归的方式对整个算法的递归操作进行优化,改写qsort方法如下:
def qsort(self, low, high): """根据序列长短,选择使用快速排序还是简单插入排序""" # 7是一个经验值,可根据实际情况自行决定该数值。 MAX_LENGTH = 7 if high-low < MAX_LENGTH: # 改用while循环 while low < high: pivot = self.partition(low, high) self.qsort(low, pivot - 1) # 采用了尾递归的方式 low = pivot + 1 else: # insert_sort方法是我们前面写过的简单插入排序算法 self.insert_sort()