图解--队列、并发队列

提到队列,我们会在很多地方听到或者看到,

那我们来看一下这位不太说话的老朋友,

从栈很容易联想到队列的实现

  • 栈是先进后出的数据结构,队列而言它是先进先出。
  • 对栈而言,在栈顶有一个指针即可。
  • 队列是需要两个指针,一个在队头,一个在队尾。对应着入队操作和出队操作。
  • 基于数组实现的是顺序队列,基于链表实现的是链式队列。

 

一个数组实现的顺序队列,在 入队了 AA 、BB 、CC 后,

队头指针 head=0,队尾指针 tail=3。如下图:

 

紧接着,又有两次出队,同样,对于出队head指针往后移动两个:

 

以上两个图对应的如队出队操作,也是很容易看出问题所在:

随着入队出队一波操作,tail指针很容易移动到最后的位置,表面上不能再入队了。

但是极有可能如图二一样,头指针head前面有大片空地。

怎么办?搬!我在出队之后,后面的数据往前挪,我们可以称之为移动补位。

 

但是每一次出队操作都去搬数据,时间复杂度想想就会很高 O(n)

怎么优化?

tail指针抵达末尾,同时head指针不在队头。也就是tail到了最后,且head前面有空。

此时触发数据搬移,过程如下:

 

人的思想不断进步,并且思考如何做得更加轻巧灵活。

我们会思考,可不可以不用搬移数据呢?

可以,接下来轮到循环队列登场了。。。。。。

循环队列,顾名思义。首尾相连形成环。哝,就是这个样子:

 

长得这么好看,一定要对得起我们对它的期望。

经过一番出队入队,头部索引=2,尾部指针指向最后一个位置,即将接受FF入队,

 

此时看上去又到了挪动数组的时候了?

环形的存在就是为了避免队列的数据搬移,我想你已经想到了它的灵巧之处。

对,就是将数据FF填充到索引=5处,tail指针移动到下一个,也就是索引=0处,就成了这样:

 

队列在平时工作时用的机会场景比较少,但是在一些偏底层系统中确实应用比较广泛。

比如:阻塞队列、并发队列

阻塞队列,就是在队空时,取数据会被直接拒绝。直到有数据才会允许被访问。

这种模型类似于 生产-消费关系,对的,这也是很多的消息队列的思想和应用。

这种阻塞队列可以协调生产和消费的关系。当然,也可以生产的i消息被多个消费。

 

这又产生了一个线程并发问题,我们如何保证线程安全呢?这就需要并发队列。

基于数组的循环队列+CAS原子操作,可以很好的实现无锁并发队列。

 

基于以上,微软给我们所提供的这些源码:

  • 队列 Queue ;
  • 泛型队列 Queue<T>;
  • 阻塞泛型集合 BlockingCollection<T>
  • 以及微软强大的并行库中的并发泛型队列 ConcurrentQueue<T>

 我们着重看一下泛型队列和并发泛型队列


队列 Queue 、泛型队列 Queue<T>

我们直接看一下泛型版本的:

0、注释说明:这是一个基于数组实现的环形队列,也就是循环队列

1、初始定义

 

2、重要的私有变量

 

3、入队:分为两块主逻辑,一个是队满,一个是正常插入。

 

 第0步已经注释说明这是一个循环队列,所以我们借此机会分析一下这个循环队列。

  • 队满 
    if (_size == _array.Length)  2倍扩容并且有最小装载量判断。
  • 正常
   _tail = (_tail + 1) % _array.Length; 下面我们来看看这句话怎么来的。

 对于非循环队列,头尾指针和数组的关系好确认。

 而循环队列,因为是一个环,所以怎样定位移动后的指针位置才是关键的。

 

数组长度=6

当我入队FF,原来尾部指针=5,当前尾部指针=0;

接着入队GG,  原来尾部指针=0,当前尾部指针=1;

当我入队HH,原来尾部指针=1,当前尾部指针=2;

规律:当前指针 = (原来指针 +1) % 数组长度 

4、出队同3

 

ConcurrentQueue<T>

注释说的很明白,这是一个无锁并发队列

我们在看源码之前先来了解一些定义

对于现在的多CPU、以及超线程概念的操作系统来说,CPU和内存之前存在处理速度上的差距,所以中间加了寄存器和高速缓存来缓冲。

多线程并发情况下,多核计算机,一个CPU读取的是在寄存器中的值,另一个CPU读取的是内存中的值,这就造成了数据不同步。

对于产生的并发问题,我们来看看并发队列对这些的处理。

我们先来理解接下代码中涉及到的名词:

1、易失结构 volatile : 告诉编译器和CLR不需要优化代码顺序,使得代码可控。不用将字段缓存到寄存器,缓存早内存中就行。

2、互锁结构  Interlocked : CAS保证原子性读取操作

3、自旋锁 :原地打转,直到达到条件才离开。对于线程来讲,一直持有资源不撒手。

4、线程类提供了几个方法:

  • Thread.Sleep(0):挂起自身,让出剩余的时间片,强迫系统调度其他同级或者更高级的线程。
  • Thread.Sleep(1):强迫进行一次上下文切换
  • Thread.Ylied():提前结束剩余的时间片,使得同级或者低级线程可能被调度。
  • Thread.SpinWait():超线程CPU模式下,强迫自身暂停,允许CPU调度其他线程。

5、CAS理论:compare and swap 比较并交换。该操作通过将内存中的值与指定数据进行比较,当数值一样时将内存中的数据替换为新的值。

 

天也不早了,人也不少了,让我们干点正事。简单看看入队和出队操作。

入队:

需求是怎样保证入队的原子性?

通过 Interlocked 声明同步块,只允许一个线程抢占资源进行入队,其他线程使用自旋锁进行原地等待。

等当前线程释放同步块,其他线程再次抢占同步块,然后入队。直到队满跳出。 

 

  • 下面这是声明了自旋锁,线程进行入队抢占。

 

  • m_high =-1 

 

  • m_high 通过 Interlicked CAS原子操作,递增。进行入队或者队满判断。

 

出队:也是类似,通过自旋锁,抢占同步块进行原子性出队操作。

 

最后我们再来悄悄看看 自旋锁自旋逻辑:

自旋至少10次,然后进行相应的自旋等待,并且相应的让出自己的时间片,让其他低级别线程可以得到调度。

 

总体来说,并发队列通过CAS进行原子性入队和出队,并结合自旋锁进行抢占资源。

也就是很多的线程并发入队或者出队,同一时刻只有一个可以进行原子性入队出队。

 

posted @ 2018-12-20 00:57  K战神  阅读(2945)  评论(0编辑  收藏  举报