从源码深入理解读写锁(golang-RWMutex)

环境：go 1.19.8

在读多写少的情况下，即使一段时间内没有写操作，大量并发的读访问也不得不在Mutex的保护下变成串行访问，这种情况下，使用Mutex，对性能影响比较大。
所以就要区分读写操作。如果某个读操作的g持有了锁，其他读操作的g就不必等待了，可以并发的访问共享变量，这样就可以将串行的读变成并行的读，提高读操作的性能。可理解为共享锁。
当写操作的g持有锁，它是一个排他锁，不管其他的g是写操作还是读操作，都需要阻塞等待持有锁的g释放锁。

什么是RWMutex？

reader/writer互斥锁，在某一时刻只能由任意数量的reader持有，或者是只被单个writer持有。
RWMutex实现了5个方法：

Lock/Unlock：写操作时调用。如果锁已经被reader或者writer持有，那么，Lock方法会一直阻塞，直到能获取到锁；Unlock是对应的释放锁方法
RLock/RUnlock：读操作时调用。如果锁已经被writer持有，RLock方法会一直阻塞，直到能获取锁，否则直接return；Rnlock是对应的释放锁方法
RLocker：这个方法的作用是为读操作返回一个 Locker 接口的对象

案例：计数器，1writer n reader

使用场景

如果可以明确区分 reader 和 writer goroutine ，且有大量的并发读，少量的并发写，并且有强烈的性能要求，可以考虑使用读写锁RWMutex替换Mutex

实现原理

RWMutex 是很常见的并发原语，很多编程语言的库都提供了类似的并发类型。RWMutex
一般都是基于互斥锁、条件变量（condition variables）或者信号量（semaphores）等
并发原语来实现。Go 标准库中的 RWMutex 是基于 Mutex 实现的。
reader-writers 问题，一般有三类，基于对读和写操作的优先级，读写锁的设计和实现也分成三类

Read-Preferring：读优先的设计可以提供很高的并发性。但在竞争激烈的情况下会导致写饥饿
Write-Preferring：如果有一个writer在等待请求锁，它会阻止新来请求锁reader获取到锁，优先保障writer。当然，如果reader已经获得锁，新请求的writer也需要等待已持有锁的reader释放锁。写优先级设计中的优先权是针对新来的请求而言的。这种设计主要避免了 writer 的饥饿问题。
不指定优先级：这种设计比较简单，不区分 reader 和 writer 优先级，某些场景下这种不指定优先级的设计反而更有效，因为第一类优先级会导致写饥饿，第二类优先级可能会导致读饥饿，这种不指定优先级的访问不再区分读写，大家都是同一个优先级，解决了饥饿的问题。

Go 标准库中的 RWMutex 设计是 Write-preferring 方案。一个正在阻塞的 Lock 调用
会排除新的 reader 请求到锁。

源码解析

上锁解锁流程以及数值变化情况

rwmutexMaxReaders 的数量被初始化为1<<30，理想中，写锁不会持续很久，不会导致readerCount 自动从负值自动+1回到正值。

RLock/RUnlock实现

type RWMutex struct {
	w           sync.Mutex // hold if there are pending writers
	writerSem   uint32     // 写 阻塞信号
	readerSem   uint32     // 读 阻塞信号
	readerCount int32      // 正在读的调用者数量/ 当为负数时 表示有write持有锁
	readerWait  int32      // writer持有锁之前正等待解锁的数量
}

const rwmutexMaxReaders = 1 << 30

func (rw *RWMutex) RLock() {
	if atomic.AddInt32(&rw.readerCount, 1) < 0 {
		// 写端 持有锁， 读端阻塞
		runtime_SemacquireMutex(&rw.readerSem, false, 0)
	}
}

func (rw *RWMutex) RUnlock() {
	if r := atomic.AddInt32(&rw.readerCount, -1); r < 0 {
		rw.rUnlockSlow(r)
	}
}

func (rw *RWMutex) rUnlockSlow(r int32) {
	if r+1 == 0 || r+1 == -rwmutexMaxReaders {
		fatal("sync: RUnlock of unlocked RWMutex")
	}

	if atomic.AddInt32(&rw.readerWait, -1) == 0 {
		// 无读者等待，唤醒写端等待者
		runtime_Semrelease(&rw.writerSem, false, 1)
	}
}

RLock

第11行，上读锁，首先对readerCount进行原子加1，如果小于0则表示存在写锁，直接阻塞。为什么readerCount会存在负值？这个要看readerCount除了在RLock中处理，还在哪里被处理了。可以看到在获取写锁时有响应代码。后面在解释。如果原子加大于等于0，则表示获取读锁成功。

RUnlock

第18行，读解锁，对readerCount进行原子减1，如果小于零，则表示存在活跃的reader(即当前获得互斥锁的写锁之前获取到读锁权限的读者数量)，readerWait 字段就减 1，直到所有的活跃的 reader 都释放了读锁，才会唤醒这个 write

Lock/Unlock

func (rw *RWMutex) Lock() {
	// 1. 先尝试获取互斥锁
	rw.w.Lock()
	// 2. 看是否有其他正持有锁的读者，有则阻塞
	r := atomic.AddInt32(&rw.readerCount, -rwmutexMaxReaders) + rwmutexMaxReaders
	if r != 0 && atomic.AddInt32(&rw.readerWait, r) != 0 {
		// rc - rwmutexMaxReaders + rwmutexMaxReaders > 0说明还有等待者, 写端阻塞
		runtime_SemacquireMutex(&rw.writerSem, false, 0)
	}
}

func (rw *rwMutex) Unlock() {
	r := atomic.AddInt32(&rw.readerCount, rwmutexMaxReaders)
	if r >= rwmutexMaxReaders {
		fatal("sync: Unlock of unlocked RWMutex")
	}

	// 如果有等待的读者，先唤醒
	for i := 0; i < int(r); i++ {
		runtime_Semrelease(&rw.readerSem, false, 0)
	}

	// 释放互斥锁
	rw.w.Unlock()
}

Lock

先获取互斥锁
成功获取后，r=readerCount-rwmutexMaxReaders，得到的数值就是一个负数，在加上rwmutexReaders就表示写锁等待者的数量，此时，如果r不等于0，且readerWait+r!=0，则表示有读等待者，写锁阻塞

我们知道，写操作要等待读操作结束后才可以获得锁，写操作等待期间可能还有新的读操作持续到来，如果写操作等待所有读操作结束，就会出现饥饿现象。然而，通过readerWait可完美解决这个问题。

写操作到来时，会把readerCount值拷贝到readerWait中，用于标记排在写操作之前到读者个数。
当读操作结束后，除了会递减readerCount，还会递减readerWait的值，当readerWait值变为0时会唤醒写操作。

写操作之后产生的读操作会加入到readerCount中，阻塞知道写锁释放。

Unlock

上面说过，写锁之后来的读者会被阻塞，所以在写锁释放之际，会看是否有需要唤醒的读者，再释放互斥锁

场景讨论

写操作如何阻塞写操作

读写锁包含一个互斥锁(Mutex)，写锁必须先获取该互斥锁，如果互斥锁已被协程A获取，意味者其他协程只能阻塞等待互斥锁释放

写操作是如何阻塞读操作

readerCount是个整型值，用于表示读者数量，不考虑写操作的情况下，每次获取读锁，将该值加1，每次解锁将其减1，所以readerCount的取值为[0, N]，最大可支持2^30个并发读者。

当写锁定进行时，会先将readerCount -= rwmutextMaxReaders(2^30)，此时 readerCount负数。这时再有读者到了，检测到readerCount为负值，则表示有写操作正在进行，后来到读者阻塞等待。等待者的数量即 reaerCount + 2^30

读操作是如何阻止写操作的

写操作时，会把readerCount的值拷贝到readerWait中，用于标记在写操作前面读者的个数，前面的写锁释放后，会递减readerCount，readerWait，当readerWait值变为0时唤醒写操作

3个踩坑点

不可复制

rwmutex是由一个互斥锁和四个辅助字段组成的，与互斥锁一样，读写锁也是不能复制的。
一旦读写锁被使用，它的字段就会记录它当前的一些状态，如果此时去复制这把锁，就会把它的状态也复制过去。但原来的锁在释放的时候，并不会修改复制出来的读写锁，会导致复制出来的读写锁状态异常，可能永远无法释放锁。

重入导致死锁

读写锁重入，或者递归调用，导致的死锁情况很多

读写锁内部基于互斥锁实现对writer并发控制，而互斥锁本身就有重入问题，所以，writer重入调用Lock，会导致死锁

func foo(l *sync.RWMutex) {
    fmt.Println("lock in foo")
    l.Lock()
    bar(l)
    l.Unlock()
}

func bar(l *sync.RWMutex) {
    fmt.Println("lock in bar")
    l.Lock()
    l.Unlock()
}

func main() {
    l := &sync.RWMutex{}
    foo(l)
}

当一个 writer 请求锁的时候，如果已经有一些活跃的 reader，它会等待这些活跃的reader 完成，才有可能获取到锁，但是，如果之后活跃的 reader 再依赖新的 reader 的话，这些新的 reader 就会等待 writer 释放锁之后才能继续执行，这就形成了一个环形依赖： writer 依赖活跃的 reader -> 活跃的 reader 依赖新来的 reader -> 新来的 reader依赖 writer。

func main() {
    var mu sync.RWMutex

    go func() {
        time.Sleep(200*time.Millisecond)
        mu.Lock()
        fmt.Println("Lock")
        time.Sleep(100*time.Millisend)
        mu.Unlock()
        fmt.Println("Unlock")
    }

    go func() {
        factorial(&mu, 10) // 计算10的阶乘
    }

    select {}
}

// 
func factorial(m *sync.RWMutex, n int) {
    if n < 1 {
        return 0
    }
    
    fmt.Println("RLock")
    m.RLock()
    defer func() {
        fmt.Println("RUnlock")
        m.RUnlock()
    }

    time.Sleep(100*time.Millisecond)
    return factorial(m, n-1) * n
}

factorial 方法是一个递归计算阶乘的方法，我们用它来模拟 reader。为了更容易地制造出死锁场景，在这里加上了 sleep 的调用，延缓逻辑的执行。这个方法会调用读锁（第 27
行），在第 33 行递归地调用此方法，每次调用都会产生一次读锁的调用，所以可以不断地产生读锁的调用，而且必须等到新请求的读锁释放，这个读锁才能释放。同时，我们使用另一个 goroutine 去调用 Lock 方法，来实现 writer，这个 writer 会等待200 毫秒后才会调用 Lock，这样在调用 Lock 的时候，factoria 方法还在执行中不断调用
RLock。这两个 goroutine 互相持有锁并等待，谁也不会退让一步，满足了“writer 依赖活跃的reader -> 活跃的 reader 依赖新来的 reader -> 新来的 reader 依赖 writer”的死锁条件，所以就导致了死锁的产生。

释放未加锁的RWMutex

锁都是成对出现的，Lock和RLock的多余调用会导致锁没有被释放，可能会出现死锁。
而Unlock和RUnlock多余调用会导致panic

参考

go中sync.RWMutex源码解读

posted @ 2023-05-05 10:32 JonPan 阅读(854) 评论(0) 收藏举报

刷新页面返回顶部

JonPan