Java ArrayList使用技巧 - 两个ArrayList去除重复的元素

方法一、ArrayList中提供的removeAll方法（效率最低）

List1.removeAll(mSubList);

方法二、双重循环（比方法一效率高）

双重循环分为内外两层循环，经过测试，将元素多的list放在外层循环效率更高（mSubList中的元素可能比List1多）（被删除元素的列表List1放在外层循环和内层循环的实现方式有些差别），这里的测试数据是List1中的元素多，实现如下：

int maxSize = List1.size();
for (int i = maxSize-1; i >=0; i--) {
    int size = mSubList.size();
    while (size > 0) {
        String s = mSubList.get(size-1);
        if (s.equals(List1.get(i))) {
            mSubList.remove(size-1);
            List1.remove(i);
            break;
        }
        size--;
    }
}

方法三、利用HashMap（效率最高）

//第一步：构建list的HashMap,将list中的元素作为键，将list中的元素对应的位置作为值
// 如果不是String类，需要实现hashCode,equals方法,equals不一定要调用，但是一定要书写

Map<String, Integer> map = new HashMap<>();
for (int i = 0; i < List1.size(); i++) {
    map.put(List1.get(i), i);
}
//第二步：利用map遍历mSubList，查找重复元素
//把List1中所有查到的重复元素的位置置空
for (int i = 0; i < mSubList.size(); i++) {
    Integer pos = map.get(mSubList.get(i));
    if (pos==null) {
        continue;
    }
    List1.set(pos, null);
}
//第三步：把List1中所有的空元素移除
for (int i = List1.size()-1; i>=0; i--) {
    if (List1.get(i)==null) {
        List1.remove(i);
    }
}

方法三的一些说明

方法三中初始化HashMap的时候已经知道了容量大小，理论上直接指定HashMap的大小避免扩容可以提高效率，但是测试发现并没有提高，100000条数据都是几十毫秒
虽然方法三中HashMap存的值是整数，但是不要使用int pos = map.get(mSubList.get(i));取值，会崩溃
第二步中，使用Integer pos = map.get(mSubList.get(i));取值，然后判断 pos 是否是空来判断map中是否包含键是mSubList.get(i)的值，比用map.containsKey(key)来判断然后get取值少访问一次哈希表
第三步中，从List1尾部开始遍历移除

posted @ 2019-10-10 10:42 凌霜寒雪阅读(1468) 评论(0) 编辑收藏举报

刷新页面返回顶部

凌雪寒霜

Java ArrayList使用技巧 - 两个ArrayList去除重复的元素

方法一、ArrayList中提供的removeAll方法（效率最低）

方法二、双重循环（比方法一效率高）

方法三、利用HashMap（效率最高）

方法三的一些说明

公告