数组去重
JavaScript学习笔记:数组去重
话说面试常会碰到面试官会问JavaScript实现数组去重的问题,整理了一些有关于JavaScript数组去重的方法。下面这些数组去重的方法是自己收集和整理的。
双重循环去重
这个方法使用了两个for
循环做遍历。整个思路是:
- 构建一个空数组用来存放去重后的数组
- 外面的
for
循环对原数组做遍历,每次从数组中取出一个元素与结果数组做对比 - 如果原数组取出的元素与结果数组元素相同,则跳出循环;反之则将其存放到结果数组中
代码如下:
1 Array.prototype.unique1 = function () { 2 // 构建一个新数组,存放结果 3 var newArray = [this[0]]; 4 // for循环,每次从原数组中取出一个元素 5 // 用取出的元素循环与结果数组对比 6 for (var i = 1; i < this.length; i++) { 7 var repeat = false; 8 for (var j=0; j < newArray.length; j++) { 9 // 原数组取出的元素与结果数组元素相同 10 if(this[i] == newArray[j]) { 11 repeat = true; 12 break; 13 } 14 } 15 if(!repeat) { 16 // 如果结果数组中没有该元素,则存放到结果数组中 17 newArray.push(this[i]); 18 } 19 } 20 return newArray; 21 }
假设我们有一个这样的数组:
1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1',`2`]; 2 3 arr.unique1(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5]
据说这种方法比较耗时,费性能。简单做个测试(测试方法写得比较拙逼):
1 function test () { 2 var arr = []; 3 for (var i = 0; i < 1000000; i++) { 4 arr.push(Math.round(Math.random(i) * 10000)); 5 } 6 doTest(arr, 1); 7 } 8 function doTest(arr, n) { 9 var tStart = (new Date()).getTime(); 10 var re = arr.unique1(); 11 var tEnd = (new Date()).getTime(); 12 console.log('双重循环去重方法使用时间是:' + (tEnd - tStart) + 'ms'); 13 return re; 14 } 15 test();
在Chrome控制器运行上面的代码,测试双重循环去重所费时间:11031ms
。
上面的方法可以使用forEach()
方法和indexOf()
方法模拟实现:
1 function unique1() { 2 var newArray = []; 3 this.forEach(function (index) { 4 if (newArray.indexOf(index) == -1) { 5 newArray.push(index); 6 } 7 }); 8 return newArray; 9 }
通过unique1.apply(arr)
或unique1.call(arr)
调用。不过这种方法效率要快得多,同样的上面测试代码,所费时间5423ms
,几乎快了一半。
排序遍历去重
先使用sort()
方法对原数组做一个排序,排完序之后对数组做遍历,并且检查数组中的第i
个元素与结果数组中最后一个元素是否相同。如果不同,则将元素放到结果数组中。
1 Array.prototype.unique2 = function () { 2 // 原数组先排序 3 this.sort(); 4 // 构建一个新数组存放结果 5 var newArray = []; 6 for (var i = 1; i < this.length; i++) { 7 // 检查原数中的第i个元素与结果中的最后一个元素是否相同 8 // 因为排序了,所以重复元素会在相邻位置 9 if(this[i] !== newArray[newArray.length - 1]) { 10 // 如果不同,将元素放到结果数组中 11 newArray.push(this[i]); 12 } 13 } 14 return newArray; 15 }
例如:
1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2']; 2 arr.unique2(); // ["1", 1, 2, "2", 3, 32, 34, 4, 5, 56, "a", "b", "c"]
这种方法有两个特色:
- 去重后的数组会做排序,主要是因为原数在去重前做了排序
- 去重后的数组,与数字相同的数字字符无法区分,比如
'1'
和1
使用同样的方法,测试所费时间:1232ms
。
对象键值对法
这种去重方法实现思路是:
- 创建一个JavaScript对象以及新数组
- 使用
for
循环遍历原数组,每次取出一个元素与JavaScript对象的键做对比 - 如果不包含,将存入对象的元素的值推入到结果数组中,并且将存入
object
对象中该属性名的值设置为1
代码如下:
1 Array.prototype.unique3 = function () { 2 // 构建一个新数组存放结果 3 var newArray = []; 4 // 创建一个空对象 5 var object = {}; 6 // for循环时,每次取出一个元素与对象进行对比 7 // 如果这个元素不重复,则将它存放到结果数中 8 // 同时把这个元素的内容作为对象的一个属性,并赋值为1, 9 // 存入到第2步建立的对象中 10 for (var i = 0; i < this.length; i++){ 11 // 检测在object对象中是否包含遍历到的元素的值 12 if(!object[typeof(this[i]) + this[i]]) { 13 // 如果不包含,将存入对象的元素的值推入到结果数组中 14 newArray.push(this[i]); 15 // 如果不包含,存入object对象中该属性名的值设置为1 16 object[typeof(this[i]) + this[i]] = 1; 17 } 18 } 19 return newArray; 20 }
运行前面的示例:
1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2']; 2 arr.unique3(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5, "1", "2"]
同样的,不同的键可能会被误认为一样;例如: a[1]
、a["1"]
。这种方法所费时间:621ms
。 这种方法所费时间是最短,但就是占用内存大一些。
除了上面几种方法,还有其他几种方法如下:
1 // 方法四 2 Array.prototype.unique4 = function () { 3 // 构建一个新数组存放结果 4 var newArray = []; 5 // 遍历整个数组 6 for (var i = 0; i < this.length; i++) { 7 // 遍历是否有重复的值 8 for (j = i + 1; j < this.length; j++) { 9 // 如果有相同元素,自增i变量,跳出i的循环 10 if(this[i] === this[j]) { 11 j = ++i; 12 } 13 } 14 // 如果没有相同元素,将元素推入到结果数组中 15 newArray.push(this[i]); 16 } 17 return newArray; 18 }
Chrome测试结果
1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2']; 2 arr.unique4(); // ["a", 1, 3, 4, 56, 32, 34, 2, "b", "c", 5, "1", "2"]
同样的,1
和'1'
无法区分。
1 // 方法五 2 Array.prototype.unique5 = function () { 3 // 构建一个新数组存放结果 4 var newArray = []; 5 // 遍历整个数组 6 for (var i = 0; i < this.length; i++) { 7 // 如果当前数组的第i值保存到临时数组,那么跳过 8 var index = this[i]; 9 // 如果数组项不在结果数组中,将这个值推入结果数组中 10 if (newArray.indexOf(index) === -1) { 11 newArray.push(index); 12 } 13 } 14 return newArray; 15 }
Chrome测试结果:
1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2']; 2 arr.unique6(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5, "1", "2"]
同样的,类似于1
和'1'
无法区分。所费时间:14361ms
。
// 方法六 Array.prototype.unique6 = function () { return this.reduce(function (newArray, index) { if(newArray.indexOf(index) < 0) { newArray.push(index); } return newArray; },[]); }
测试结果如下:
1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2']; 2 arr.unique6(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5, "1", "2"]
所费时间:16490ms
。
1 // 方法七 2 Array.prototype.unique7 = function(){ 3 var newArray; 4 newArray = this.filter(function (ele,i,arr) { 5 return arr.indexOf(ele) === i; 6 }); 7 return newArray; 8 }
测试结果:
1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2']; 2 arr.unique6(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5, "1", "2"]
所费时间:13201ms
。
方法虽然很多种,但相比下来,下面这种方法是较为优秀的方案:
1 Array.prototype.unique3 = function () { 2 // 构建一个新数组存放结果 3 var newArray = []; 4 // 创建一个空对象 5 var object = {}; 6 // for循环时,每次取出一个元素与对象进行对比 7 // 如果这个元素不重复,则将它存放到结果数中 8 // 同时把这个元素的内容作为对象的一个属性,并赋值为1, 9 // 存入到第2步建立的对象中 10 for (var i = 0; i < this.length; i++){ 11 // 检测在object对象中是否包含遍历到的元素的值 12 if(!object[typeof(this[i]) + this[i]]) { 13 // 如果不包含,将存入对象的元素的值推入到结果数组中 14 newArray.push(this[i]); 15 // 如果不包含,存入object对象中该属性名的值设置为1 16 object[typeof(this[i]) + this[i]] = 1; 17 } 18 } 19 return newArray; 20 }
但在ES6去重还有更简单,更优化的方案,比如:
1 // ES6 2 function unique (arr) { 3 const seen = new Map() 4 return arr.filter((a) => !seen.has(a) && seen.set(a, 1)) 5 } 6 // or 7 function unique (arr) { 8 return Array.from(new Set(arr)) 9 }