01: 数组

算法面试其他篇

1.1 简单数组题

　　1、去除列表中相加等于指定数后的列表(x+y=4)

　　　　　　[1,3,5,7,1,2] ==> [5,7,1,2] [1,3,3,5,7,1,2] ==> [3,5,7,1,2]

#! /usr/bin/env python
# -*- coding: utf-8 -*-
def func(l, tag=4):
    for i in range(len(l)):
        a = l[i]
        if a != None:
            b = tag - a
            try:
                index = l.index(b)
                if index != i:  # 避免 2 + 2 = 4只有一个2也没重置为None
                    l[i] = None
                    l[index] = None
                else:
                    if l.count(b) > 2:  # 如果有两个就都重置为 None
                        l[i] = None
                        l[l.index(b)] = None
            except Exception as e:
                pass
    print l  # [None, None, 5, 7, 1, 2]
    while None in l:
        l.remove(None)
    return l  # [5, 7, 1, 2]

l = [1,3,5,7,1,2]
print func(l, 4)
'''
[1,3,5,7,1,2]
[None, None, 5, 7, 1, 2]
[5, 7, 1, 2]
'''

去除列表中 x+y=4 的数

　　2、合并两个有序列表

#! /usr/bin/env python
# -*- coding: utf-8 -*-
def loop_merge_sort(l1, l2):
    tmp = []
    while len(l1) > 0 and len(l2) > 0:
        if l1[0] < l2[0]:
            tmp.append(l1[0])
            del l1[0]
        else:
            tmp.append(l2[0])
            del l2[0]
    tmp.extend(l1)
    tmp.extend(l2)
    return tmp

l1 = [1,4,5]
l2 = [2,3,6]
print loop_merge_sort(l1, l2)  # [1, 2, 3, 4, 5, 6]

合并两个有序列表（删除合并）

#! /usr/bin/env python
# -*- coding: utf-8 -*-
def loop_merge_sort(l1, l2):
    n1, n2 = 0, 0
    len1, len2 = len(l1), len(l2)
    tmp = []
    while n1 < len1  and n2 < len2:
        if l1[n1] < l2[n2]:
            tmp.append(l1[n1])
            n1 = n1 + 1
        else:
            tmp.append(l2[n2])
            n2 = n2 + 1
    else:
        while n1 < len1:
            tmp.append(l1[n1])
            n1 = n1 + 1
        while n2 < len2:
            tmp.append(l2[n2])
            n2 = n2 + 1
    return tmp

l1 = [1,4,5]
l2 = [2,3,6]
print loop_merge_sort(l1, l2)  # [1, 2, 3, 4, 5, 6]

合并两个有序列表（双游标）

#! /usr/bin/env python
# -*- coding: utf-8 -*-
def find_kth(l1, l2, k):
    val = None
    n = 1
    while len(l1) > 0 and len(l2) > 0:  # l1和l2都未取到最后一个数
        if l1[0] < l2[0]:
            val = l1[0]
            del l1[0]
        else:
            val = l2[0]
            del l2[0]
        if n == k:
            return val
        n = n + 1

    while len(l1) > 0:  # l2为空，l1不为空
        val = l1[0]
        del l1[0]
        if n == k:
            return val
        n = n + 1

    while len(l2) > 0:  # l1为空l2不为空
        val = l2[0]
        del l2[0]
        if n == k:
            return val
        n = n + 1

l1 = [1,4,5,11,12,13,18]
l2 = [2,3,6,7,8,9,10]
print find_kth(l1, l2, 14)  # 18

找两个有序列表第k大的数

　　3、一个有序列表找中位数

#! /usr/bin/env python
# -*- coding: utf-8 -*-
def get_median(data):
        data.sort()
        half = len(data) // 2
        return (data[half] + data[-1-half]) / float(2)
data = [1,2,3,4,5,6,7,8,9,10,11,12]
print get_median(data)

一个有序列表找中位数

　　4、找素数(除了1和他本身没有其他的约数)

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import math
def func(n):
    l = []
    for i in range(2, n+1):
        for j in range(2, int(math.sqrt(i))+1):
            if i%j == 0: #如果出现整除说明有因子
                break #跳出最外层for循环判断下一个
        else: #如果第二层循环结束还没有跳出的话
            l.append(i) #说明是素数，加到列表里
    return l

print func(20)  # [2, 3, 5, 7, 11, 13, 17, 19]

法1：普通方法

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import math
def func(n):
    l = [2,3,5]
    for i in range(6, n+1):
        for j in l:
            if j <= ( math.sqrt(i) + 1 ) and i%j == 0:
                break #跳出最外层for循环判断下一个
        else: #如果第二层循环结束还没有跳出的话
            l.append(i) #说明是素数，加到列表里
    return l

print func(10)  # [2, 3, 5, 7]
'''
说明：判断100是否是质素只需要对比4次
1、不需要循环[1,2,3,4,5,6,7,8,9,10]依次与100取余
2、只需要循环[2, 3, 5, 7] 依次与100取余即可
'''

法2：求素数时间复杂度最低方法

　　5、列表去重

#1、set去重
a=[1,2,3,4,1,2,3,4]
print( list(set(a)) )    # [1, 2, 3, 4]

#2、使用字典去重
b = {}
b=b.fromkeys(a).keys()
print(list(b))                #  [1, 2, 3, 4]

列表去重：改变顺序

a=[1,2,3,4,1,2,3,4]

#1、去重不改变顺序
d = {}
tmp = []
for i in a:
    if not d.get(i):
        tmp.append(i)
        d[i] = True
print(tmp)             #  [1, 2, 3, 4]

列表去重：不改变顺序

　　6、实现enumerate函数

l = [1,2,3,4]
def my_enumerate(l):
    n = 0
    for val in l:
        print(n,val)
        n += 1
my_enumerate(l)

实现enumerate函数

　　7、求两个列表交集、差集、并集

list_1 = set([1,2,3,4,5])
list_2 = set([4,5,6,7,8])

#1、交集（在list_1和list_2中都有的元素4,5）
print(list_1.intersection(list_2))                      #交集： {4, 5}

#2、差集
print(list_1.difference(list_2))                        #差集：在list_1中有在list_2中没有：   {1, 2, 3}
print(list_2.difference(list_1))                        #差集：在list_1中有在list_2中没有：   {8, 6, 7}

#3、并集（在list_1和list_2中的元素全部打印出来，重复元素仅打印一次）
print(list_1.union(list_2))                             #并集： {1, 2, 3, 4, 5, 6, 7, 8}

求两个列表交集、差集、并集

　　8、求股票最大利润

def maxProfit(prices):
    min_p, max_p = max(prices), 0
    for i in range(len(prices)):
        min_p = min(min_p, prices[i])  # 到目前为止最小买入价格
        max_p = max(max_p, prices[i] - min_p)  # 最大利润 = 当天价格 - 历史最小价格
    return max_p

l = [7,1,5,3,6,4]
print(maxProfit(l))  # 5

求股票最大利润

1.2 找两个有序列表中位数（难）

　　1、找中位数（两个列表）

　　　　　　参考博客：https://www.jb51.net/article/152061.htm
　　　　　　参考官网：https://leetcode-cn.com/problems/median-of-two-sorted-arrays/solution/

　　　　　　1）给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。

　　　　　　2）请你找出这两个有序数组的中位数，并且要求算法的时间复杂度为 O(log(m + n))。

#! /usr/bin/env python
# -*- coding: utf-8 -*-
def median(A, B):
    m, n = len(A), len(B)
    if m > n:
        A, B, m, n = B, A, n, m
    if n == 0:
        raise ValueError

    imin, imax, half_len = 0, m, (m + n + 1) / 2
    while imin <= imax:
        i = (imin + imax) / 2
        j = half_len - i
        if i < m and B[j-1] > A[i]:
            # i is too small, must increase it
            imin = i + 1
        elif i > 0 and A[i-1] > B[j]:
            # i is too big, must decrease it
            imax = i - 1
        else:
            # i is perfect

            if i == 0: max_of_left = B[j-1]
            elif j == 0: max_of_left = A[i-1]
            else: max_of_left = max(A[i-1], B[j-1])

            if (m + n) % 2 == 1:
                return max_of_left

            if i == m: min_of_right = B[j]
            elif j == n: min_of_right = A[i]
            else: min_of_right = min(A[i], B[j])

            return (max_of_left + min_of_right) / 2.0


nums1 = [1,2,4]
nums2 = [3,5,6]
print median(nums1, nums2)  # 3.5

找两个列表中位数最优解

1.3 从无序列表查找数组第K大的数(O(n))

　　 参考博客：https://blog.csdn.net/wenqiwenqi123/article/details/81669899

　　1、原理分析

　　　　　　1. 利用快排每次循环可以将元素分为左侧都比自己小，右侧都比自己大的思想

　　　　　　2. 找到k大概的位置，每次去一半即可

　　　　　　3. 为什么时间复杂度是O(n)而不是nlog(n)

　　　　　　　　1) 第一次排序需要遍历所有元素，时间复杂度为：n

　　　　　　　　2）第二次排序数量只有上次的一半：n/2

　　　　　　　　3) 所以总时间复杂度： n + n/2 + n/4 + n/8 + ...... + < 2n

　　　　　　注：这种方法如果又重复元素很容易导致死循环

#!/usr/bin/env python
# -*- coding:utf-8 -*-
def partition(num, low, high):
    cur = num[low]
    while low < high:
        while low < high and num[high] > cur:    # 从右向左比，直到遇到右边一个元素小于cur为止
            high -= 1
        while low < high and num[low] < cur:     # 从左向右比，直到遇到左边一个元素大于cur为止
            low += 1
        num[low],num[high] = num[high],num[low]  # 交互目前最大和最小位置
    num[low] = cur
    return low                                   # 找到当前二分查找中间的位置下标

def findkth(num, low, high, k):                      # 找到数组里第k个数
    index = partition(num, low, high)
    if index == k:                                   # 如果位置下标正好为k就已经找到
        return num[index]
    if index < k:                                    # 如果k大于index说明要找的值在右面
        return findkth(num, index + 1, high, k)
    else:                                            # 否则要找的k在左面
        return findkth(num, low, index - 1, k)


l = [2, 3, 1, 5, 4, 6]  # [1,2,3,4,5,6]
# pai = [2,2,2,2,2]  # [1,2,3,4,5,6]

print findkth(l, 0, len(l) - 1, 3)  # 第3号位置应该是：4

从无序列表中找第k大的元素（利用快排思想O(n)）

#!/usr/bin/env python
# -*- coding:utf-8 -*-
def heap_build(parent, heap):
    child = 2 * parent + 1
    while child < len(heap):
        if child + 1 < len(heap) and heap[child + 1] < heap[child]:
            child = child + 1
        if heap[parent] <= heap[child]:
            break
        heap[parent], heap[child] = heap[child], heap[parent]
        parent, child = child, 2 * child + 1
    return heap

def Find_heap_kth(array, k):
    if k > len(array):
        return None
    heap = array[:k]
    for i in range(k, -1, -1):
        heap_build(i, heap)
    for j in range(k, len(array)):
        if array[j] > heap[0]:
            heap[0] = array[j]
            heap_build(0, heap)
    return heap[0]

l = [2, 1, 4, 3, 5, 9, 8, 0, 1, 3, 2, 5]
print(Find_heap_kth(l, 6))

堆排 O(n * logk)

1.4 求丑数

　　1、丑数定义

　　　　　　1. 根据丑数的定义，丑数应该是另一个丑数乘以2、3或者5的结果（1除外）。

　　　　　　2. 因此我们可以创建一个数组，里面的数字是排好序的丑数。

　　　　　　3. 里面的每一个丑数是前面的丑数乘以2、3或者5得到的。

#! /usr/bin/env python
# -*- coding: utf-8 -*-
def finduglynum(n):
    uglynum = []
    i = 1
    count = 0
    while True:
        temp = i
        while temp % 2 == 0:
            temp = temp // 2
        while temp % 3 == 0:
            temp = temp // 3
        while temp % 5 == 0:
            temp = temp // 5
        if temp == 1:
            uglynum.append(i)
            count += 1
        if count >= n:
            break
        i += 1
    return uglynum


# 测试
print finduglynum(8)  # [1, 2, 3, 4, 5, 6, 8, 9]

方法一：简单粗暴，分解每一个数，看他的因数是不是只有2，3，5

#!usr/bin/env python
#encoding:utf-8

def finduglynum2(n):
    uglynum = [1]
    i = 1
    t2 = m2 = 0
    t3 = m3 = 0
    t5 = m5 = 0
    while i < n:
        for x in range(t2, len(uglynum)):
            m2 = uglynum[x] * 2
            if m2 > uglynum[-1]:
                t2 = x
                # print("t2:",t2)
                break
        for x in range(t3, len(uglynum)):
            m3 = uglynum[x] * 3
            if m3 > uglynum[-1]:
                t3 = x
                break
        for x in range(t5, len(uglynum)):
            m5 = uglynum[x] * 5
            if m5 > uglynum[-1]:
                t5 = x
                break
        uglynum.append(min(m2, m3, m5))
        i += 1
    return uglynum

# 测试
print finduglynum2(10)  # [1, 2, 3, 4, 5, 6, 8, 9, 10, 12]

方法二：优化算法

这种思路的关键在于怎样确保数组里面的丑数是排好序的。
我们假设数组中已经有若干个丑数，排好序后存在数组中,我们把现有的最大丑数记做M。
现在我们来生成下一个丑数，该丑数肯定是前面某一个丑数乘以2、3或者5的结果。
我们首先考虑把已有的每个丑数乘以2。
在乘以2的时候，能得到若干个结果小于或等于M的。
由于我们是按照顺序生成的，小于或者等于M肯定已经在数组中了，我们不需再次考虑；
我们还会得到若干个大于M的结果，但我们只需要第一个大于M的结果，因为我们希望丑数是按从小到大顺序生成的，其他更大的结果我们以后再说。
我们把得到的第一个乘以2后大于M的结果，记为M2。
同样我们把已有的每一个丑数乘以3和5，能得到第一个大于M的结果M3和M5。
那么下一个丑数应该是M2、M3和M5三个数的最小者。
前面我们分析的时候，提到把已有的每个丑数分别都乘以2、3和5，事实上是不需要的，因为已有的丑数是按顺序存在数组中的。
对乘以2而言，肯定存在某一个丑数T2，排在它之前的每一个丑数乘以2得到的结果都会小于已有最大的丑数
在它之后的每一个丑数乘以2得到的结果都会太大。
我们只需要记下这个丑数的位置，同时每次生成新的丑数的时候，去更新这个T2。对乘以3和5而言，存在着同样的T3和T5。

优化算法思路

1.5 最长递增子序列LIS的O(nlogn)的求法

　　1、说明

　　　　　　1. 最长递增子序列是指n个数的序列的最长单调递增子序列。

　　　　　　2. 比如，A = [1,3,6,7,9,4,10,5,6]的LIS是1 3 6 7 9 10。

　　2、实现一个复杂度O(nlogn)的算法

　　　　　　1. 如果 x 比所有的tails都大，说明x可以放在最长子序列的末尾形成一个新的自许下，那么就把他append一下，并且最长子序列长度增加1

　　　　　　2. 如果tails[i-1] < x <= tails[i]，说明x需要替换一下前面那个大于x的数字，以便保证tails是一个递增的序列，那么就更新tails[i]

　　　　　　3. 这样维护一个tails变量，最后的答案就是这个长度。

#! /usr/bin/env python
# -*- coding: utf-8 -*-
def lengthOfLIS(nums):
    tails = [0] * len(nums)
    size = 0
    for x in nums:
        low = 0
        high = size  # size  0 1 2 3 3 统计当前列表最大单调长度
        while low != high:
            mid = (low + high) // 2  # 使用二分法找到x应该的位置
            if tails[mid] < x:  # x第一次为tials中间位置，如果x比较大，去tails后面的一半列表比较
                                # 直到找到tails中大于x元素的下标位置
                low = mid + 1  # 使tails下标m加一（i加一后m就会加一）
            else:
                high = mid
        tails[low] = x  # 如果x比tails最后一个元素还大，就追加到tails末尾，否则替换嗲tials中第一个大于x的元素
        size = max(low + 1, size)
    return size

print lengthOfLIS([3, 4, 7, 2, 5])  # 3

最长递增子序列

比如我们的目标数组是[3, 4, 7, 2, 5]。
####1. 第一步：x = 3
'''
1）此时i = 0，直接令tails[0] = 3，tails = [3, 0, 0, 0, 0]。
2）说明到目前为止长度为1的递增子序列末尾最小为3。 
'''

####2. 第二步：x = 4
'''
1)此时i != j，但是x大于tails的末尾，直接另tail[1] = 4， tails = [3, 4, 0, 0, 0]。
2)说明到目前为止长度为1的递增子序列末尾最小为3，长度为2的递增子序列末尾最小为4。 
'''

####3. 第三步：x = 7
'''
1）大于tails的末尾，直接令tails[2] = 7，tails = [3, 4, 7, 0, 0]。
2）说明到目前为止长度为1的递增子序列末尾最小为3，长度为2的递增子序列末尾最小为4，长度为3的递增子序列末尾最小为7. 
'''

####4. x = 2
'''
1)此时x小于tails的末尾，需要用二分查找到比x大的最小的那个数更新之，
2)查找到tails中比2大的最小数是3，更新tail[0] = 2，此时tails = [2, 4, 7, 0, 0]。
3)说明到目前为止长度为1的递增子序列末尾最小为2，长度为2的递增子序列末尾最小为4，长度为3的递增子序列末尾最小为7。
'''

####对第四步重点说明：
'''
1)这一步理解很关键，[2, 4, 7, 0, 0]的存在并不是说目前为止的递增子序列是2 4 7，
2)而是长度分别为1，2， 3的递增子序列目前所能得到的最小结尾元素是2，4，7。
3)我们这样做的目的就是，通过维护tails中的元素，保证每次对于长度为i+1的一个子序列对应的tails[i]元素最小，

4)“虽然在我之前，你们形成了一个长度为m的递增序列，但是呢，你们长度为m这个序列的末尾最大的一个数比我还大，
5)不如把我和末尾最大的那个元素换一下，这样你看咱们还是一个递增序列，长度也不变，但是我和你们更亲近”,
6)别的元素一听是这么个道理啊，于是就踢出最后一个元素，换上了这个新的更小的元素。
'''

举例推演

tails的第i个位置记录nums中长度为i+1的所有递增子序列中，结尾最小的数字。 
我们很容易证明，tails是一个递增的数组。
首先，tails[0]一定是所有元素中最小的那个数字min1，因为长度为1的子序列中，结尾最小的数字就是序列中最小的那个。
同样，长度为2的子序列中，结尾最小的的那个子序列的结尾元素一定大于min1，
因为首先所有长度为2的递增子序列，第二个元素一定比第一个元素大，如果长度为2的子序列中某个子序列的结尾元素小于min1，
那么在第一次操作中，这个元素就会更新为min1。
对于长度为3的子序列，假设之前tails已经存储了前两个结尾最小数[a, b]，
若长度为三的子序列结尾数字c3小于b，即[c1, c2, c3]是一个递增子序列，且c3 < b，则必然有c2 < b，
这样和之前的结论b是长度为2的递增子序列结尾最小元素矛盾。
所以，通过这样的一步步的反证法，很容易证明tails一定是一个递增的数组。
那么很容易通过二分查找， 找到在tails数组中需要被更新的那个数。

原理说明

11111111

posted @ 2019-03-07 11:12 不做大哥好多年阅读(376) 评论(0) 收藏举报

刷新页面返回顶部