随笔分类

随笔档案

为什会有 Copy On Write

COW 在不同的操作系统，或者框架中都会有相应的实现

优点

COW 技术可以减少分配和赋值大量资源带来的瞬时延迟
COW 可以减少不必要的资源分配。比如 fork 进程时，并不是所有的页面都需要赋值。父进程的代码段和只读数据段都不被允许修改，所以无需复制

缺点

如果在 fork 之后，父子进程都还需要继续进行写操作，那么会产生大量的分页错误，这样就得不偿失

回顾

我们都知道 ArrayList 是用于替代 Vector，Vector 是线程安全的容器。因为它几乎在每个方法声明处都加了 synchronized 关键字来保证容器安全。

如果使用 Collections.synchronizedList(new ArrayList()) 来使 ArrayList 变成线程安全的话，也就是每个方法都加上 synchronized 关键字，只不过不是在方法的声明处，而是在方法的内部

下面有一段代码

public static Object getLast(Vector list){
    int lastIndex = list.size() - 1;
    return list.get(lastIndex);
}

public static void deleteLast(Vector list){
    int lastIndex = list.size() - 1;
    return list.remove(lastIndex);
}

在多线程下是否有问题

答案是有的，因为这两个方法并不是原子性的，要保证这个线程安全不能仅仅给方法加锁，还要在遍历前给 vector 加锁。在遍历中，假设对 vector 的结构进行了破坏，例如 clear，则后续的操作可能并没有第一时间可见，继续进行操作，例如 get 读取数据，从而造成程序异常，所以最好的方法是遍历前个给 vector 加锁。

什么是 COW

多个调用者同时请求相同的资源，它们会共同获取相应的指针指向相同的资源，知道某个调用者试图修改资源内容时，系统才会真正赋值一个专用副本给调用者，而其他调用者所见到的最初的资源任然保持不变。

在 Java 中 COW 的一个应用就是 CopyOnWriteArrayList

CopyOnWriteArrayList 相对于 ArrayList 线程安全，底层通过复制数组的方式来实现
在遍历使用时不会抛出 ConcurrentmodificationException 并且便利的时候就不用额外加锁
元素可以为 null

Java 中 CopyOnWriteArrayList 的实现

在 CopyOnWriteArrayList 中

@SuppressWarnings("unchecked")
private E get(Object[] a, int index) {
    return (E) a[index];
}

对于 get 方法，直接返回数据

而对于 add 方法

public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        Object[] elements = getArray();
        int len = elements.length;
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        newElements[len] = e;
        setArray(newElements);
        return true;
    } finally {
        lock.unlock();
    }
}

clear 方法

public void clear() {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        setArray(new Object[0]);
    } finally {
        lock.unlock();
    }
}

set 方法

public E set(int index, E element) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        Object[] elements = getArray();
        E oldValue = get(elements, index);
        if (oldValue != element) {
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len);
            newElements[index] = element;
            setArray(newElements);
        } else {
            // Not quite a no-op; ensures volatile write semantics
            setArray(elements);
        }
        return oldValue;
    } finally {
        lock.unlock();
    }
}

都要进行上锁，add 和 set 方法中还执行了 ArrayCopy 方法，进行拷贝，返回的是一个副本。

为什么在遍历时不需要显式加锁

查看源码发现 CopyOnWriteArrayList 实现 Iterator 的具体是 COWIterator

@SuppressWarnings("unchecked")
public E next() {
    if (! hasNext())
        throw new NoSuchElementException();
    return (E) snapshot[cursor++];
}

在返回数据的时候是 snapshot 这个数组中的数据就，这个数组是快照(snapshot)吗？

private COWIterator(Object[] elements, int initialCursor) {
    cursor = initialCursor;
    snapshot = elements;
}

很明显不是的，构造函数中传入的就是原来的那个数组

CopyOnWriteArrayList你都不知道，怎么拿offer？

原文在这里，我还是不太明白

想了想，解释一下

因为对 List 具有结构性改变的操作都是按照 COW 实现的，即都是对数组的副本进行操作。

而我们遍历的时候用的是源本的数组，所以遍历的时候并不会造成影响

这篇文章也解决了我一直在意的一件事，为什么在对表遍历的时候，会抛出异常

其 COWIterator 的内部类实现如下

/**
 * Not supported. Always throws UnsupportedOperationException.
 * @throws UnsupportedOperationException always; {@code remove}
 *         is not supported by this iterator.
 */
public void remove() {
    throw new UnsupportedOperationException();
}
/**
 * Not supported. Always throws UnsupportedOperationException.
 * @throws UnsupportedOperationException always; {@code set}
 *         is not supported by this iterator.
 */
public void set(E e) {
    throw new UnsupportedOperationException();
}
/**
 * Not supported. Always throws UnsupportedOperationException.
 * @throws UnsupportedOperationException always; {@code add}
 *         is not supported by this iterator.
 */
public void add(E e) {
    throw new UnsupportedOperationException();
}

全部抛出不支持操作异常，怪不得

CopyOnWriteArrayList 的缺点

CopyOnWriteArrayList 同样有 COW 的缺点，本文开始就说了，只不过那时在操作系统中

COW 会造成数据错误，不能实时保证数据一致性，但是可以保证最终一致性，可以保证最终一致性

例如一个线程 get 了一个 value 走了，另外一个进去 remove 了同一个 value,

实时上这个里面没有这个 value，但别的线程继续拿着这个 value 进行处理。
因为设计表结构的操作都要 copy，所以会造成内存占用偏高

CopyOnWriteArraySet

两者原理相同

public CopyOnWriteArraySet() {
    al = new CopyOnWriteArrayList<E>();
}

作者：Draper
链接：https://www.jianshu.com/p/cc69ddb4632b
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

posted on 2022-03-27 16:18 好好学习一天天向上阅读(283) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· CopyOnWriteArrayList

· CopyOnWriteArraySet

· CopyOnWriteArrayList 的使用与源码分析

· jdk11源码-COW

· CopyOnWriteArrayList

阅读排行：
· 全程使用 AI 从 0 到 1 写了个小工具
· 快收藏！一个技巧从此不再搞混缓存穿透和缓存击穿
· AI 插件第二弹，更强更好用
· Blazor Hybrid适配到HarmonyOS系统
· 支付宝 IoT 设备入门宝典（下）设备经营篇

导航

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论