JavaScript数组去重的6个方法

方法一
无需思考，我们可以得到 O(n^2) 复杂度的解法。定义一个变量数组 res 保存结果，遍历需要去重的数组，如果该元素已经存在在 res 中了，则说明是重复的元素，如果没有，则放入 res 中。

 1 function unique(a) {
 2   var res = [];
 3 
 4   for (var i = 0, len = a.length; i < len; i++) {
 5     var item = a[i];
 6 
 7     (res.indexOf(item) === -1) && res.push(item);
 8   }
 9 
10   return res;
11 }
12 
13 var a = [1, 1, '1', '2', 1];
14 var ans = unique(a);
15 console.log(ans); // => [1, "1", "2"]

既然用了 indexOf，那么不妨再加上 filter。

 1 function unique(a) {
 2   var res = a.filter(function(item, index, array) {
 3     return array.indexOf(item) === index;
 4   });
 5   
 6   return res;
 7 }
 8 
 9 var a = [1, 1, '1', '2', 1];
10 var ans = unique(a);
11 console.log(ans); // => [1, "1", "2"]

方法二
法一是将原数组中的元素和结果数组中的元素一一比较，我们可以换个思路，将原数组中重复元素的最后一个元素放入结果数组中

 1 function unique(a) {
 2   var res = a.filter(function(item, index, array) {
 3     return array.indexOf(item) === index;
 4   });
 5   
 6   return res;
 7 }
 8 var a = [1, 1, '1', '2', 1];
 9 var ans = unique(a);
10 console.log(ans); // => [1, "1", "2"]

虽然复杂度还是 O(n^2)，但是可以看到结果不同，1 出现在了数组最后面，因为结果数组取的是元素最后一次出现的位置。

方法三（sort)
如果笔试面试时只答出了上面这样 O(n^2) 的方案，可能还不能使面试官满意，下面就来说几种进阶方案。
将数组用 sort 排序后，理论上相同的元素会被放在相邻的位置，那么比较前后位置的元素就可以了。

1 function unique(a) {
2   return a.concat().sort().filter(function(item, pos, ary) {
3     return !pos || item != ary[pos - 1];
4   });
5 }
6 
7 var a = [1, 1, 3, 2, 1, 2, 4];
8 var ans = unique(a);
9 console.log(ans); // => [1, 2, 3, 4]

但是问题又来了，1 和 "1" 会被排在一起，不同的 Object 会被排在一起，因为它们 toString() 的结果相同，所以会出现这样的错误：

1 function unique(a) {
2   return a.concat().sort().filter(function(item, pos, ary) {
3     return !pos || item != ary[pos - 1];
4   });
5 }
6 var a = [1, 1, 3, 2, 1, 2, 4, '1'];
7 var ans = unique(a);
8 console.log(ans); // => [1, 2, 3, 4]

当然你完全可以针对数组中可能出现的不同类型，来写这个比较函数。不过这似乎有点麻烦。

方法四（object）
用 JavaScript 中的 Object 对象来当做哈希表，这也是几年前笔试时的解法，跟 sort 一样，可以去重完全由 Number 基本类型组成的数组。

 1 function unique(a) {
 2   var seen = {};
 3   return a.filter(function(item) {
 4     return seen.hasOwnProperty(item) ? false : (seen[item] = true);
 5   });
 6 }
 7 
 8 var a = [1, 1, 3, 2, 1, 2, 4];
 9 var ans = unique(a);
10 console.log(ans); // => [1, 3, 2, 4]

还是和方法三一样的问题，因为 Object 的 key 值都是 String 类型，所以对于 1 和 "1" 无法分别，我们可以稍微改进下，将类型也存入 key 中。

 1 function unique(a) {
 2   var ret = [];
 3   var hash = {};
 4   for (var i = 0, len = a.length; i < len; i++) {
 5     var item = a[i];
 6 
 7     var key = typeof(item) + item;
 8 
 9     if (hash[key] !== 1) {
10       ret.push(item);
11       hash[key] = 1;
12     }
13   }
14   return ret;
15 }
16 
17 var a = [1, 1, 3, 2, '4', 1, 2, 4, '1'];
18 var ans = unique(a);
19 console.log(ans); // => [1, 3, 2, "4", 4, "1"]

虽然解决了讨厌的 1 和 "1" 的问题，但是还有别的问题！

 1 function unique(a) {
 2   var ret = [];
 3   var hash = {};
 4   for (var i = 0, len = a.length; i < len; i++) {
 5     var item = a[i];
 6 
 7     var key = typeof(item) + item;
 8 
 9     if (hash[key] !== 1) {
10       ret.push(item);
11       hash[key] = 1;
12     }
13   }
14   return ret;
15 }
16 
17 var a = [{name: "hanzichi"}, {age: 30}, new String(1), new Number(1)];
18 var ans = unique(a);
19 console.log(ans); // => [Object, String]

但是如果数组元素全部是基础类型的 Number 值，键值对法应该是最高效的！

方法五（ES6）
ES6 部署了 Set 以及 Array.from 方法，太强大了！如果浏览器支持，完全可以这样：

1 function unique(a) {
2   return Array.from(new Set(a));
3 }
4 
5 var a = [{name: "hanzichi"}, {age: 30}, new String(1), new Number(1)];
6 var ans = unique(a);
7 console.log(ans); // => [Object, Object, String, Number]

_.unique
最后来看看 underscore 对此的实现方式，underscore 将此封装到了 _.unique 方法中，调用方式为 _.unique(array, [isSorted], [iteratee])。其中第一个参数是必须的，是需要去重的数组，第二个参数可选，如果数组有序，则可以传入布尔值 true，第三个参数可选，如果需要对数组迭代的结果去重，则可以传入一个迭代函数。而数组元素去重是基于 === 运算符的。
其实很简单，underscore 中的实现方式和上面的方法一相似。
我们来看它的核心代码：

 1 for (var i = 0, length = getLength(array); i < length; i++) {
 2   var value = array[i],
 3       // 如果指定了迭代函数
 4       // 则对数组每一个元素进行迭代
 5       computed = iteratee ? iteratee(value, i, array) : value;
 6   // 如果是有序数组，则当前元素只需跟上一个元素对比即可
 7   // 用 seen 变量保存上一个元素
 8   if (isSorted) {
 9     // 如果 i === 0，则直接 push
10     // 否则比较当前元素是否和前一个元素相等
11     if (!i || seen !== computed) result.push(value);
12     // seen 保存当前元素，供下一次对比
13     seen = computed;
14   } else if (iteratee) {
15     // 如果 seen[] 中没有 computed 这个元素值
16     if (!_.contains(seen, computed)) {
17       seen.push(computed);
18       result.push(value);
19     }
20   } else if (!_.contains(result, value)) {  
21     // 如果不用经过迭代函数计算，也就不用 seen[] 变量了
22     result.push(value);
23   }
24 }

外面的循环遍历数组元素，对于每个元素，如果数组有序，则和前一个元素比较，如果相同，则已经出现过，不加入到结果数组中，否则则加入。而如果有迭代函数，则计算传入迭代函数后的值，对值去重，调用 .contains 方法，而该方法的核心就是调用.indexOf 方法，和我们上面说的方法一异曲同工。

文章来源于：http://www.qdfuns.com/notes/23908/df7b338047a8c9fefcca8c2168b2f0cd.html

posted @ 2017-02-28 16:24 神奇的小胖子阅读(326) 评论(0) 编辑收藏举报

刷新页面返回顶部

joyco

JavaScript数组去重的6个方法

公告