第四章:并发编程

并行计算导论

顺序算法与并行算法

  • 顺序算法:所有步骤通过单个任务依次执行,每次执行一个步骤,当所有步骤执行完成时,算法结束。
  • 并行算法:cobegin-coend代码块来指定独立任务,所有任务都是并行执行的,紧接着cobegin-coend代码块的下一个步骤将只在所有这些任务完成之后执行。

并行性与并发性

  • 在理想情况下,并行算法中的所有任务都应该同时实时执行。
  • 真正的并行执行只能在有多个处理组件的系统中实现,比如多处理器或多核系统。
  • 在单CPU系统中,一次只能执行一个任务。在这种情况下,不同的任务只能并发执行,即在逻辑上并行执行。

线程

线程的原理

  • 线程是某进程同一地址空间上的独立执行单元。创建某个进程就是在一个唯一地址空间创建一个主线程。当某进程开始时,就会执行该进程的主线程。

线程的优点

  • 线程创建和切换速度更快
  • 线程的响应速度更快
  • 线程更适合并行运算

线程的缺点

  • 由于地址空间共享,线程需要来自用户的明确同步
  • 许多库函数可能对线程不安全
  • 在单CPU系统上,使用线程解决问题实际上要比使用顺序程序慢

线程操作

  • 线程的执行轨迹与进程类似,线程可在内核模式或用户模式下执行。
  • 在用户模式下,线程在进程的相同地址空间中执行,但每个线程都有自己的执行堆栈。

线程管理函数

创建线程

  • 使用pthread_create()创建线程函数
    int pthread_create(pthread_t *pthread_id,pthread_attr_t *attr,void *(*func)(void*),void *arg)
    • pthread_id是指向pthread_t类型变量的指针
    • attr是指向另一种不透明数据类型的指针,attr如果是NULL,将使用默认属性创建线程
    • func是要执行的新线程函数的入口地址
  • attr 参数的使用步骤
    • (1)定义一个pthread属性变量pthread attr tattr。
    • (2)用pthread attrinit (&attr)初始化属性变量。
    • (3)设置属性变量并在pthread create0)调用中使用。
    • (4)必要时,通过pthread attr destroy (&attr)释放attr 资源。

线程ID

  • 线程ID是一种不透明的数据类型,取决于现实情况
    int pthread_equal(pthread_t t1,pthread_t t2);
  • 如果是不同的线程,返回0,否则返回非0

线程终止

  • 线程函数结束后,线程即终止
    int pthread_exit(void *status);
  • 进行显式终止,其中状态是线程的退出状态。0退出值表示正常终止,非0表示异常

线程连接

  • int pthread_join(pthread_t thread,void **status_ptr)
  • 终止线程的退出状态以status_ptr返回。

线程同步

互斥量

  • 最简单的同步工具是锁,它允许执行实体仅在有锁的情况下才能继续执行。在 Pthread中,锁被称为互斥量,意思是相互排斥。
  • 初始化互斥量
    • 静态方法
    • 动态方法,使用pthread_mutex_init()函数,可通过attr参数设置互斥属性
pthread_mutex_lock(&m);
access shared data object;
pthread_mutex_unlock(&m);

死锁预防

  • 互斥量使用封锁协议。
  • 在任何封锁协议中,误用加锁可能会产生一些问题。
  • 死锁是一个状态,在这种状态下,许多执行实体相互等待,无法继续进行下去.

条件变量

  • 静态方法初始化
  • 动态方法初始化

生产者——消费者问题

  • 共享全局变量
int buf[NBUF];
int head,tail;
int data;
#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#define NBUF 5
#define N	10
// shared global variables 
int buf[NBUF];	// circular buffers
int head, tail;	// indices
int data;	// number of full buffers
pthread_mutex_t mutex; 
pthread_cond_t empty, full;

int init()
{
    head = tail = data = 0; 
    pthread_mutex_init(&mutex, NULL); 
    pthread_cond_init(&full, NULL); 
    pthread_cond_init(&empty, NULL);
}

void *producer() 
{
    int i;
    pthread_t me = pthread_self();
    for (i=0; i<N; i++) // try to put N items into buf[]
    {
        pthread_mutex_lock(&mutex);	// lock mutex
        if (data == NBUF)
        {
            printf ("producer %lu: all bufs FULL: wait\n", me);
            pthread_cond_wait(&empty, &mutex); // wait
        }
        buf[head++] = i+1;
        head %= NBUF;
        data++;
        printf("producer %lu: data=%d value=%d\n", me, data, i+1);
        pthread_mutex_unlock (&mutex); 
        pthread_cond_signal(&full);
    }
    printf("producer %lu: exit\n", me);
}

void *consumer()
{
    int i, c;
    pthread_t me = pthread_self();
    for (i=0; i<N; i++)
    {
        pthread_mutex_lock(&mutex);	// lock mutex
        if (data == 0)
        {
            printf ("consumer %lu: all bufs EMPTY: wait\n", me); 
            pthread_cond_wait(&full, &mutex); // wait
        }
        c = buf[tail++];	// get an item
        tail %= NBUF;
        data--;	// dec data by 1
        printf("consumer %lu: value=%d\n", me, c); 
        pthread_mutex_unlock(&mutex);	// unlock mutex
        pthread_cond_signal(&empty);	// unblock a producer, if any
    }
    printf("consumer %lu: exit\n", me);
}

int main ()
{
    pthread_t pro, con;
    init();
    printf("main: create producer and consumer threads\n");
    pthread_create(&pro, NULL, producer, NULL);
    pthread_create(&con, NULL, consumer, NULL);
    printf("main: join with threads\n");
    pthread_join(pro, NULL);
    pthread_join(con, NULL);
    printf("main: exit\n");
}

信号量

  • 信号量是进程同步的一般机制。
  • 在使用信号量之前,必须使用一个初始值和一个空等待队列进行初始化。

屏障

  • 线程连接操作允许某线程等待其他线程终止
  • 在pthread中可以采用的机制是屏障以及一系列屏障函数

Linux中的线程

  • Linux不区分进程和线程。
  • 对于Linux内核,线程只是一个与其他进程共享某些资源的进程。
  • 在 Linux 中,进程和线程都是由 clone()系统调用创建的:
    int clone(int (*fn)(void*),void *child_stack,int flags,void *arg)

苏格拉底提问








遇到的问题

屏障实现线程同步的具体机制是啥

屏障(Barrier)是一种线程同步机制,它可以用于在多个线程中进行同步,并确保这些线程在某一点上同时达到。
在实现上,屏障通常由一个计数器和一个等待队列组成。当一个线程到达屏障时,它会将计数器加一,并检查计数器是否达到了预定的值。如果计数器还未达到预定值,该线程会进入等待队列,等待其他线程的到来。当计数器达到预定值时,表示所有参与屏障的线程已经到达,在这个点上进行同步操作,然后所有线程被释放,继续执行后面的任务。
屏障的典型应用场景是需要等待所有线程完成某个阶段的工作,然后再继续执行下一个阶段。例如,在并行计算中,可以使用屏障来确保所有子任务都完成了计算,然后进行合并和汇总。