pthread与tbb中各种锁的对比测试

 pthread中提供的锁有:pthread_mutex_t, pthread_spinlock_t, pthread_rwlock_t。
    pthread_mutex_t是互斥锁,同一瞬间只能有一个线程能够获取锁,其他线程在等待获取锁的时候会进入休眠状态。因此pthread_mutex_t消耗的CPU资源很小,但是性能不高,因为会引起线程切换。
    pthread_spinlock_t是自旋锁,同一瞬间也只能有一个线程能够获取锁,不同的是,其他线程在等待获取锁的过程中并不进入睡眠状态,而是在CPU上进入“自旋”等待。自旋锁的性能很高,但是只适合对很小的代码段加锁(或短期持有的锁),自旋锁对CPU的占用相对较高。
    pthread_rwlock_t是读写锁,同时可以有多个线程获得读锁,同时只允许有一个线程获得写锁。其他线程在等待锁的时候同样会进入睡眠。读写锁在互斥锁的基础上,允许多个线程“读”,在某些场景下能提高性能。
   诸如pthread中的pthread_cond_t, pthread_barrier_t, semaphone等,更像是一种同步原语,不属于单纯的锁。

    TBB中提供的锁有:
         mutex                      互斥锁,等同于pthread中的互斥锁(实际上就是对pthread_mutex_t进行封装)
         recurisive_mutex     可重入的互斥锁,在pthread_mutex_t的基础上加了一个可重入的属性
         spin_metux             自旋锁,与pthread_spinlock_t类似,但是性能比pthread_spinlock_t低28%
         queuing_metux       公平的互斥锁,严格按照等待锁的先后顺序获得锁
         spin_rw_mutex        读写自旋锁,功能与pthread_rwlock_t一致,但是性能比pthread_rwlock_t高很多
         queuing_rw_mutex 公平的读写读写锁,也是严格按照等待锁的先后顺序获得锁

    以下是我对一个拥有3667527个节点的HASH表进行读操作所花费的时间,可以说明各种锁的性能:
    (多线程的环境为:4CPU的电脑上使用四个线程进行同样的度操作,然后取四个线程读取的平均时间)
·单线程不加锁:0.818845s
·多线程使用pthread_mutex_t:120.978713s   (很离谱吧…………我也吓了一跳)
·多线程使用pthread_rwlock_t:10.592172s   (多个线程加读锁)
·多线程使用pthread_spinlock_t:4.766012s
·多个线程使用tbb::spin_mutex:6.638609s     (从这里可以看出pthread的自旋锁比TBB的自旋锁性能高出28%)
·多个线程使用tbb::spin_rw_mutex:3.471757s (并行读的环境下,这是所有锁中性能最高的)

    OK,有了以上的测试结果,何种环境该使用何种锁,不辨自明。

posted @ 2024-02-28 08:52  阿风小子  阅读(58)  评论(0编辑  收藏  举报