两个数组的交集 II [ LeetCode - 350 ]

 
原题地址:https://leetcode-cn.com/problems/intersection-of-two-arrays-ii/description/
 
给定两个数组,写一个方法来计算它们的交集。

例如:

给定 nums1 = [1, 2, 2, 1], nums2 = [2, 2], 返回 [2, 2].

注意:

  •    输出结果中每个元素出现的次数,应与元素在两个数组中出现的次数一致。
  •    我们可以不考虑输出结果的顺序。

跟进:

  • 如果给定的数组已经排好序呢?你将如何优化你的算法?
  • 如果 nums1 的大小比 nums2 小很多,哪种方法更优?
  • 如果nums2的元素存储在磁盘上,内存是有限的,你不能一次加载所有的元素到内存中,你该怎么办?

以上是原题

 
我们先按照常规思路解题,再逐步分析最后的集中特殊情况。
 
  思路:
  1、增加一个计数器,用来记录其中一个数组元素出现的次数。
  2、遍历另一个数组,如果该数组元素在计数器中有记录且记录的次数大于1,将该数字新增到结果数组中,同时计数器该数字记录的次数减1。
  实现代码如下:
 1     public int[] intersect(int[] nums1, int[] nums2) {
 2         Map<Integer, Integer> counter = new HashMap<>(); //计数器,key为数组中的数字,value为该数字在数组中出现的次数
 3         for (int i = 0; i < nums1.length; i++) {
 4             int num = nums1[i];
 5             if (counter.containsKey(num)) {
 6                 counter.put(num, counter.get(num) + 1);
 7             } else {
 8                 counter.put(num, 1);
 9             }
10         }
11         List<Integer> tempList = new ArrayList<>();
12         for (int i = 0; i < nums2.length; i++) {
13             int num = nums2[i];
14             if (counter.containsKey(num) && counter.get(num) > 0) {
15                 counter.put(num, counter.get(num) - 1); //计数器中记录该数字的次数减1
16                 tempList.add(num); //将该数字添加到list中
17             }
18         }
19         int[] result = new int[tempList.size()];
20         //为满足题目返回值类型,将list转换为int数组
21         for (int i = 0; i < result.length; i++) {
22             result[i] = tempList.get(i);
23         }
24         return result;
25     }

  OK,基本功能已经实现,下一步我们一起思考如何满足几个跟进问题:

  • 如果给定的数组已经排好序呢?你将如何优化你的算法?

  思路:因为两个数组都是有序的,那我们完全可以用两个指针c1和c2分别顺序扫描两个数组,得到两个数字m和n,有以下三种关系:

  1、m == n,则该数字是重复数字,将该数字添加到结果数组中,同时将两个指针分别后移一位。

  2、m > n,我们需要将c2指针后移一位。

  3、m < n,我们需要将c1指针后移一位。

  重复以上步骤,直到c1或c2其中一个指针已移动到数组末端。

  代码实现如下:

 1     public int[] intersect(int[] nums1, int[] nums2) {
 2         int cur1 = 0, cur2 = 0; // 定义指针,指向数组开始位置
 3         List<Integer> list = new ArrayList<>();
 4         while (cur1 < nums1.length && cur2 < nums2.length) { // 循环结束条件:任何一个指针指向对应数组的末端
 5             int num1 = nums1[cur1];
 6             int num2 = nums2[cur2];
 7             if (num1 == num2) { // 重复数字,加入结果列表中
 8                 list.add(num1);
 9                 cur1++;
10                 cur2++;
11             } else if (num1 < num2) { // 将cur1指针后移一位,继续下一次比较
12                 cur1++;
13             } else { // 将cur2指针后移一位,继续下一次比较
14                 cur2++;
15             }
16         }
17         int[] result = new int[list.size()];
18         // 为满足题目返回值类型,将list转换为int数组
19         for (int i = 0; i < list.size(); i++) {
20             result[i] = list.get(i);
21         }
22         return result;
23     }
  • 如果 nums1 的大小比 nums2 小很多,哪种方法更优?
  我们来对比上述两种方法:
  假设nums1和nums2的长度为l1, l2。
 
  第一种:
    不考虑结尾转换int数组的循环,一共有两处循环:
    1、第一次循环nums1初始化计数器。
    2、第二次循环nums2与计数器中存储的数值作比较。
    无论如何,这两种循环都需要完全执行,实际循环次数为 l1 + l2。
 
  第二种:
    不考虑结尾转换int数组的循环,一共有一处循环:
    1、每次循环同时在nums1和nums2中取值对比,如果相等,同时移动两个指针,一个指针结束后,循环结束。因为 l1 比 l2 小很多,只需要执行完l1次循环即可,实际消耗时间远远小于第一种方法。
 
    最差的情况:最差的情况是nums1和nums2中完全没有一个重复数字,且nums1中的最后一个元素大于nums2的倒数第二个元素,nums2的最后一个元素大于nums1的倒数第二个元素,在这种情况下,第二种方法的循环也同样需要执行 l1 + l2次。
 
  因此,只有在极端情况下,两种方法效率大约相等,其他任何情况下,第二种方法是要优于第一种方法的。
 
  • 如果nums2的元素存储在磁盘上,内存是有限的,你不能一次加载所有的元素到内存中,你该怎么办?

  如果nums2的元素多到无法一次性加载到内存中,那我们应该:

  1、将nums1中的数字初始化计数器。

  2、使用缓冲流读取文件的一部分数据,计数器中有记录且记录的次数大于1,将该数字新增到结果数组中,计数器中该数字记录的次数减1,这样完成了这一部分数据的统计。

  3、接着再读取文件中下一部分数据,重复步骤2。

  

OK,以上是这个问题的一些想法,如果朋友们有更好的方式,欢迎留言交流哈~

  

posted @ 2018-07-18 20:57  风追云影  阅读(4229)  评论(0编辑  收藏  举报