java集合遍历删除指定元素异常分析总结

在使用集合的过程中,我们经常会有遍历集合元素,删除指定的元素的需求,而对于这种需求我们往往使用会犯些小错误,导致程序抛异常或者与预期结果不对,本人很早之前就遇到过这个坑,当时没注意总结,结果前段时间又遇到了这个问题,因此,总结下遍历集合的同时如何删除集合中指定的元素;

1.错误场景复原

public class ListRemoveTest {

	public static void main(String[] args) {
		List<User> users = new ArrayList<User>();
		users.add(new User("liu1",24));
		users.add(new User("liu2",24));
		users.add(new User("liu3",24));
		users.add(new User("liu4",24));
		
		Iterator<User> iterator = users.iterator();
		while(iterator.hasNext()) {
			User user = iterator.next();
			if(user.getName().equals("liu2")) {
				users.remove(user);
			}
			System.out.println(user);
		}
	}
}

 或者如下代码

public class ListRemoveTest {

	public static void main(String[] args) {
		List<User> users = new ArrayList<User>();
		users.add(new User("liu1",24));
		users.add(new User("liu2",24));
		users.add(new User("liu3",24));
		users.add(new User("liu4",24));
		
	        for (User user : users) {
			if(user.getName().equals("liu2")) {
				users.remove(user);
			}
			System.out.println(user);
		}
	}
}

 以上两种用法都会跑出如下异常:

2.原因分析

上面两种错误,我想很多人都遇到过,这是我们很容易犯的错误,但是为啥会出现上述异常呢,我们又该如何正确遍历集合的同时,删除指定的元素呢!

2.1 原因解析

首先,对于foreach循环遍历,本质上还是迭代器的模式,上面的for语句等价于如下代码:

for (Iterator<User> iterator = users.iterator(); iterator.hasNext();) {
	User user = iterator.next();
	if(user.getName().equals("liu2")) {
		users.remove(user);
	}
	System.out.println(user);
}

 因此,上述错误的本质,就要看迭代器iterator的源码啦

在ArrayList中,它的修改操作(add/remove)都会对modCount这个字段+1,modCount可以看作一个版本号,每次集合中的元素被修改后,都会+1(即使溢出)。

  public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }

 private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }

接下来再看看AbsrtactList中iteraor方法

public Iterator<E> iterator() {
    return new Itr();
}

它返回一个内部类,这个类实现了iterator接口,代码如下:

private class Itr implements Iterator<E> {
    int cursor = 0;

    int lastRet = -1;

    int expectedModCount = modCount;

    public boolean hasNext() {
        return cursor != size();
    }

    public E next() {
        checkForComodification();
        try {
            E next = get(cursor);
            lastRet = cursor++;
            return next;
        } catch (IndexOutOfBoundsException e) {
            checkForComodification();
            throw new NoSuchElementException();
        }
    }

    public void remove() {
        if (lastRet == -1)
            throw new IllegalStateException();
        checkForComodification();

        try {
            AbstractList.this.remove(lastRet);
            if (lastRet < cursor)
                cursor--;
            lastRet = -1;
            // 修改expectedModCount 的值
            expectedModCount = modCount;
            } catch (IndexOutOfBoundsException e) {
            throw new ConcurrentModificationException();
        }
    }

    final void checkForComodification() {
        if (modCount != expectedModCount)
            throw new ConcurrentModificationException();
    }
    }

在内部类Itr中,有一个字段expectedModCount ,初始化时等于modCount,即当我们调用list.iterator()返回迭代器时,该字段被初始化为等于modCount。在类Itr中next/remove方法都有调用checkForComodification()方法,在该方法中检测modCount == expectedModCount,如果不相等则抛出ConcurrentModificationException。

前面说过,在集合的修改操作(add/remove)中,都对modCount进行了+1。

在迭代过程中,执行list.remove(val),使得modCount+1,当下一次循环时,执行 it.next(),checkForComodification方法发现modCount != expectedModCount,则抛出异常。

2.2 预期结果不对,但是不抛异常

注意:还有一种更坑的场景,当删除集合的倒数第二个元素时,程序不会抛出任何异常,只是结果与预期的不相符,如果在应用过程中不认真观察,很难发现该错误!

错误实例如下:

public static void main(String[] args) {
	List<User> users = new ArrayList<User>();
	users.add(new User("liu1",24));
users.add(new User("liu2",24)); users.add(new User("liu3",24));
users.add(new User("liu4",24)); Iterator<User> iterator = users.iterator();
        while(iterator.hasNext()) {
            User user = iterator.next();
            if(user.getName().equals("liu3")) {
                users.remove(user);
            }
            System.out.println(user);
        } }

 运行结果如下:

遍历过程删除了倒数第二个元素,那么最后一个元素就永远遍历不到了,这个主要原因就是Iterator源码中hasNext方法中,判断当前元素下标和集合大小是否相等

   public boolean hasNext() {
            return cursor != size;
        }

当删除倒数第二个元素后,当前元素下标和集合的大小相等了,跳出了循环,就会遍历最后一个集合元素了;

3.正确用法

要想在集合遍历的过程中删除指定元素,就务必使用迭代器自身的remove方法;
再来看看内部类Itr的remove()方法,在删除元素后,有这么一句expectedModCount = modCount,同步修改expectedModCount 的值。所以,如果需要在使用迭代器迭代时,删除元素,可以使用迭代器提供的remove方法。 其他集合(Map/Set)使用迭代器迭代也是一样。

所以 Iterator 在工作的时候是不允许被迭代的对象被改变的。
但你可以使用 Iterator 本身的方法 remove() 来删除对象, Iterator.remove() 方法会在删除当前迭代对象的同时维护索引的一致

具体正确用法代码如下:

public class ListRemoveTest {

    public static void main(String[] args) {
        List<User> users = new ArrayList<User>();
        users.add(new User("liu1",24));
        users.add(new User("liu2",24));
        users.add(new User("liu3",24));
        users.add(new User("liu4",24));
        
        Iterator<User> iterator = users.iterator();
        while(iterator.hasNext()) {
            User user = iterator.next();
            if(user.getName().equals("liu2")) {
                iterator.remove();
            }
            System.out.println(user);
        }
        System.out.println(users);
    }
}

 运行结果如下:

与预期结果一致;

 

posted @ 2018-07-15 12:46  HappyCowboy  阅读(5199)  评论(0编辑  收藏  举报