线程及线程间同步

线程概念

什么是线程

LWPlight weight process 轻量级的进程,本质仍是进程(Linux环境下)

进程:独立地址空间,拥有PCB

线程:也有PCB,但没有独立的地址空间(共享)

区别:在于是否共享地址空间。 独居(进程);合租(线程)

Linux下: 线程:最小的执行单位

  进程:最小分配资源单位,可看成是只有一个线程的进程。

 

Linux内核线程实现原理

Unix系统中早期是没有“线程”概念的,80年代才引入,借助进程机制实现出了线程的概念。因此在这类系统中,进程和线程关系密切。

1. 轻量级进程(light-weight process),也有PCB,创建线程使用的底层函数和进程一样,都是clone

2. 从内核里看进程和线程是一样的,都有各自不同的PCB,但是PCB中指向内存资源的三级页表是相同的

3. 进程可以蜕变成线程

4. 线程可看做寄存器和栈的集合

5. linux下,线程最是小的执行单位;进程是最小的分配资源单位

察看LWP号:ps –Lf pid 查看指定线程的lwp

 

 

三级映射:进程PCB --> 页目录(可看成数组,首地址位于PCB) --> 页表 --> 物理页面 --> 内存单元

参考:《Linux内核源代码情景分析》 ----毛德操

对于进程来说,相同的地址(同一个虚拟地址)在不同的进程中,反复使用而不冲突。原因是他们虽虚拟址一样,但,页目录、页表、物理页面各不相同。相同的虚拟址,映射到不同的物理页面内存单元,最终访问不同的物理页面。

但!线程不同!两个线程具有各自独立的PCB,但共享同一个页目录,也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。

实际上,无论是创建进程的fork,还是创建线程的pthread_create,底层实现都是调用同一个内核函数clone

如果复制对方的地址空间,那么就产出一个“进程”;如果共享对方的地址空间,就产生一个“线程”。

因此:Linux内核是不区分进程和线程的。只在用户层面上进行区分。所以,线程所有操作函数 pthread_* 是库函数,而非系统调用。

 

线程共享资源

1.文件描述符表

2.每种信号的处理方式

3.当前工作目录

4.用户ID和组ID

5.内存地址空间 (.text/.data/.bss/heap/共享库)

线程非共享资源

1.线程id

2.处理器现场和栈指针(内核栈)

3.独立的栈空间(用户空间栈)

4.errno变量

5.信号屏蔽字

6.调度优先级

线程优、缺点

优点: 1. 提高程序并发性 2. 开销小 3. 数据通信、共享数据方便

缺点: 1. 库函数,不稳定 2. 调试、编写困难、gdb不支持 3. 对信号支持不好

优点相对突出,缺点均不是硬伤。Linux下由于实现方法导致进程、线程差别不是很大。

线程控制原语

pthread_self函数

获取线程ID。其作用对应进程中 getpid() 函数。

pthread_t pthread_self(void); 返回值:成功:0 失败:无!

线程IDpthread_t类型,本质:在Linux下为无符号整数(%lu),其他系统中可能是结构体实现

线程ID是进程内部,识别标志。(两个进程间,线程ID允许相同)

注意:不应使用全局变量 pthread_t tid,在子线程中通过pthread_create传出参数来获取线程ID,而应使用pthread_self

pthread_create函数

创建一个新线程。 其作用,对应进程中fork() 函数。

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);

返回值:成功:0 失败:错误号 -----Linux环境下,所有线程特点,失败均直接返回错误号。

参数:

pthread_t:当前Linux中可理解为:typedef unsigned long int pthread_t。

1. 传出参数,保存系统为我们分配好的线程ID

2. 通常传NULL,表示使用线程默认属性。若想使用具体属性也可以修改该参数。

3. 函数指针,指向线程主函数(线程体),该函数运行结束,则线程结束。

4. 线程主函数执行期间所使用的参数。

在一个线程中调用pthread_create()创建新的线程后,当前线程从pthread_create()返回继续往下执行,而新的线程所执行的代码由我们传给pthread_create的函数指针start_routine决定。start_routine函数接收一个参数,是通过pthread_createarg参数传递给它的,该参数的类型为void *,这个指针按什么类型解释由调用者自己定义。start_routine的返回值类型也是void *,这个指针的含义同样由调用者自己定义。start_routine返回时,这个线程就退出了,其它线程可以调用pthread_join得到start_routine的返回值,类似于父进程调用wait(2)得到子进程的退出状态,稍后详细介绍pthread_join

pthread_create成功返回后,新创建的线程的id被填写到thread参数所指向的内存单元。我们知道进程id的类型是pid_t,每个进程的id在整个系统中是唯一的,调用getpid(2)可以获得当前进程的id,是一个正整数值。线程id的类型是thread_t,它只在当前进程中保证是唯一的,在不同的系统中thread_t这个类型有不同的实现,它可能是一个整数值,也可能是一个结构体,也可能是一个地址,所以不能简单地当成整数用printf打印,调用pthread_self(3)可以获得当前线程的id

attr参数表示线程属性,本节不深入讨论线程属性,所有代码例子都传NULLattr参数,表示线程属性取缺省值,感兴趣的读者可以参考APUE

例:创建一个新线程,打印线程ID。注意:链接线程库 -lpthread pthrd_crt.c

 

#include <stdio.h>
#include <pthread.h>
#include <unistd.h>

void *tfn(void *arg)
{
    printf("I'm thread, Thread_ID = %lu\n", pthread_self());
    return NULL;
}

int main(void)
{
    pthread_t tid;

    pthread_create(&tid, NULL, tfn, NULL);
    sleep(1);
    printf("I am main, my pid = %d\n", getpid());

    return 0;
}

 

 

 

由于pthread_create的错误码不保存在errno中,因此不能直接用perror(3)打印错误信息,可以先用strerror(3)把错误码转换成错误信息再打印。如果任意一个线程调用了exit_exit,则整个进程的所有线程都终止,由于从main函数return也相当于调用exit,为了防止新创建的线程还没有得到执行就终止,我们在main函数return之前延时1秒,这只是一种权宜之计,即使主线程等待1秒,内核也不一定会调度新创建的线程执行,下一节我们会看到更好的办法。

例:循环创建多个线程,每个线程打印自己是第几个被创建的线程。(类似于进程循环创建子进程)     more_pthrd.c

 

#include <pthread.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

void *tfn(void *arg)
{
    int i;

    i = (int)arg;
    sleep(i);     //通过i来区别每个线程
    printf("I'm %dth thread, Thread_ID = %lu\n", i+1, pthread_self());

    return NULL;
}

int main(int argc, char *argv[])
{
    int n = 5, i;
    pthread_t tid;

    if (argc == 2)
        n = atoi(argv[1]);

    for (i = 0; i < n; i++) {
        pthread_create(&tid, NULL, tfn, (void *)i);
        //将i转换为指针,在tfn中再强转回整形。
    }
    sleep(n);
    printf("I am main, and I am not a process, I'm a thread!\n" 
            "main_thread_ID = %lu\n", pthread_self());

    pthread_exit(NULL);
}

 

 

 

 

拓展思考:将pthread_create函数参4修改为(void *)&i, 将线程主函数内改为 i=*((int *)arg) 是否可以。

答:不可以,因为i取得的是地址空间中的值,取出来的可能不是想象的数据了

线程与共享

牢记】:线程默认共享数据段、代码段等地址空间,常用的是全局变量。而进程不共享全局变量,只能借助mmap

例:设计程序,验证线程之间共享全局数据。 glb_var_pthrd.c

 

#include <stdio.h>
#include <pthread.h>
#include <stdlib.h>
#include <unistd.h>

int var = 100;

void *tfn(void *arg)
{
	var = 200;
	printf("thread\n");

	return NULL;
}

int main(void)
{
	printf("At first var = %d\n", var);

	pthread_t tid;
	pthread_create(&tid, NULL, tfn, NULL);
	sleep(1);

	printf("after pthread_create, var = %d\n", var);

	return 0;
}

 

  

 

pthread_exit函数

将单个线程退出

void pthread_exit(void *retval); 参数:retval表示线程退出状态,通常传NULL

例:使用exit将指定线程退出,可以吗? pthrd_exit.c

 

#include <pthread.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

void *tfn(void *arg)
{
	int i;

	i = (int)arg;//强转。
	if (i == 2)
		pthread_exit(NULL);

	sleep(i);	 //通过i来区别每个线程
	printf("I'm %dth thread, Thread_ID = %lu\n", i+1, pthread_self());

	return NULL;
}

int main(int argc, char *argv[])
{
	int n = 5, i;
	pthread_t tid;

	if (argc == 2)
		n = atoi(argv[1]);

	for (i = 0; i < n; i++) {
		pthread_create(&tid, NULL, tfn, (void *)i);
		//将i转换为指针,在tfn中再强转回整形。
	}
	sleep(n);
	printf("I am main, I'm a thread!\n" 
			"main_thread_ID = %lu\n", pthread_self());

	return 0;
}

 

  

 

结论:线程中,禁止使用exit函数,会导致进程内所有线程全部退出。

在不添加sleep控制输出顺序的情况下。pthread_create在循环中,几乎瞬间创建5个线程,但只有第1个线程有机会输出(或者第2个也有,也可能没有,取决于内核调度)如果第3个线程执行了exit,将整个进程退出了,所以全部线程退出了。

所以,多线程环境中,应尽量少用,或者不使用exit函数,取而代之使用pthread_exit函数,将单个线程退出。任何线程里exit导致进程退出,其他线程未工作结束,主控线程退出时不能returnexit

另注意,pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的,不能在线程函数的栈上分配,因为当其它线程得到这个返回指针时线程函数已经退出了。

例:编写多线程程序,总结exitreturnpthread_exit各自退出效果。

return:返回到调用者那里去。

pthread_exit():将调用该函数的线程退出

exit: 将进程退出。

pthread_join函数

阻塞等待线程退出,获取线程退出状态 其作用,对应进程中 waitpid() 函数。

int pthread_join(pthread_t thread, void **retval); 成功:0;失败:错误号

参数:thread:线程ID (【注意】:不是指针);retval:存储线程结束状态。

对比记忆

进程中:main返回值、exit参数-->int;等待子进程结束 wait 函数参数-->int *

线程中:线程主函数返回值、pthread_exit-->void *;等待线程结束 pthread_join 函数参数-->void **

例:参数 retval 非空用法。 pthrd_exit_join.c

 

#include <stdio.h>
#include <unistd.h>
#include <pthread.h>
#include <stdlib.h>

typedef struct{
	int a;
	int b;
} exit_t;

void *tfn(void *arg)
{
	exit_t *ret;
	ret = malloc(sizeof(exit_t)); 

	ret->a = 100;
	ret->b = 300;
	pthread_exit((void *)ret);

	return NULL; //should not be here.
}

int main(void)
{
	pthread_t tid;
	exit_t *retval;

	pthread_create(&tid, NULL, tfn, NULL);
	/*调用pthread_join可以获取线程的退出状态*/
	pthread_join(tid, (void **)&retval);
	printf("a = %d, b = %d \n", retval->a, retval->b);

	return 0;
}

 

  

 

调用该函数的线程将挂起等待,直到idthread的线程终止。thread线程以不同的方法终止,通过pthread_join得到的终止状态是不同的,总结如下:

  1. 如果thread线程通过return返回,retval所指向的单元里存放的是thread线程函数的返回值。
  2. 如果thread线程被别的线程调用pthread_cancel异常终止掉,retval所指向的单元里存放的是常数PTHREAD_CANCELED
  3. 如果thread线程是自己调用pthread_exit终止的,retval所指向的单元存放的是传给pthread_exit的参数。
  4. 如果对thread线程的终止状态不感兴趣,可以传NULLretval参数。

 

例】:使用pthread_join函数将循环创建的多个子线程回收。 pthrd_loop_join.c】

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>

int var = 100;

void *tfn(void *arg)
{
    int i;
    i = (int)arg;
    
    sleep(i);
    if (i == 1) {    //i = 0  100  333  333  777  777  
        var = 333;
        printf("var = %d\n", var);
        pthread_exit((void *)var);

    } else  if (i == 3) {
        var = 777;
        printf("I'm %dth pthread, pthread_id = %lu\n var = %d\n", i+1, pthread_self(), var);
        pthread_exit((void *)var);

    } else  {

        printf("I'm %dth pthread, pthread_id = %lu\n var = %d\n", i+1, pthread_self(), var);
        pthread_exit((void *)var);
    }

    return NULL;
}

int main(void)
{
    pthread_t tid[5];
    int i, *ret[5];

    for (i = 0; i < 5; i++)
        pthread_create(&tid[i], NULL, tfn, (void *)i);

    for (i = 0; i < 5; i++) {
        pthread_join(tid[i], (void **)&ret[i]);
        printf("-------%d 's ret = %d\n", i, (int)ret[i]);
    }
    printf("I'm main pthread tid = %lu\t var = %d\n", pthread_self(), var);

    pthread_exit(NULL);
}

  

 

pthread_detach函数

实现线程分离

int pthread_detach(pthread_t thread); 成功:0;失败:错误号

线程分离状态:指定该状态,线程主动与主控线程断开关系。线程结束后,其退出状态不由其他线程获取,而直接自己自动释放。网络、多线程服务器常用。

进程若有该机制,将不会产生僵尸进程。僵尸进程的产生主要由于进程死后,大部分资源被释放,一点残留资源仍存于系统中,导致内核认为该进程仍存在。

也可使用 pthread_create函数参2(线程属性)来设置线程分离。

例:使用pthread_detach函数实现线程分离 pthrd_detach.c

 

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <unistd.h>
#include <string.h>

void *tfn(void *arg)
{
	int n = 3;
	while (n--) {
		printf("thread count %d\n", n);
		sleep(1);
	}
	return (void *)1;
}

int main(void)
{
	pthread_t tid;
	void *tret;
	int err;

#if 1

	pthread_attr_t attr;			/*通过线程属性来设置游离态*/

	pthread_attr_init(&attr);

	pthread_attr_setdetachstate(&attr,	PTHREAD_CREATE_DETACHED);

	pthread_create(&tid, &attr, tfn, NULL);

    pthread_attr_destroy(&attr);

#else

	pthread_create(&tid, NULL, tfn, NULL);
	pthread_detach(tid);        

#endif

	while (1) {
		err = pthread_join(tid, &tret);
		if (err != 0)
			fprintf(stderr, "thread %s\n", strerror(err));
		else
			fprintf(stderr, "thread exit code %d\n", (int)tret);
		sleep(1);
	}

	return 0;
}

 

  

 

一般情况下,线程终止后,其终止状态一直保留到其它线程调用pthread_join获取它的状态为止。但是线程也可以被置为detach状态,这样的线程一旦终止就立刻回收它占用的所有资源,而不保留终止状态。不能对一个已经处于detach状态的线程调用pthread_join,这样的调用将返回EINVAL。如果已经对一个线程调用了pthread_detach就不能再调用pthread_join了。

pthread_cancel函数

杀死(取消)线程 其作用,对应进程中 kill() 函数。

int pthread_cancel(pthread_t thread); 成功:0;失败:错误号

【注意】:线程的取消并不是实时的,而又一定的延时。需要等待线程到达某个取消点(检查点)

类似于玩游戏存档,必须到达指定的场所(存档点,如:客栈、仓库、城里等)才能存储进度。杀死线程也不是立刻就能完成,必须要到达取消点。

取消点:是线程检查是否被取消,并按请求进行动作的一个位置。通常是一些系统调用creatopenpauseclosereadwrite.....    ——参 APUE.12.7 取消选项。

可粗略认为一个系统调用(进入内核)即为一个取消点。

被取消的线程,退出值,定义在Linuxpthread库中常数PTHREAD_CANCELED的值是-1。可以在头文件pthread.h中找到它的定义:#define PTHREAD_CANCELED ((void *) -1)

例:终止线程的三种方法。注意“取消点”的概念。 pthrd_endof3.c

 

#include <stdio.h>
#include <unistd.h>
#include <pthread.h>
#include <stdlib.h>

void *tfn1(void *arg)
{
	printf("thread 1 returning\n");
	return (void *)111; 
}

void *tfn2(void *arg)
{
	printf("thread 2 exiting\n");
	pthread_exit((void *)222);
}

void *tfn3(void *arg)
{
	while (1) {
//		printf("thread 3: I'm going to die 1 seconds after...\n");
//		sleep(1);
		pthread_testcancel();	//自己添加取消点
	}
}

int main(void)
{
	pthread_t tid;
	void *tret = NULL;

	pthread_create(&tid, NULL, tfn1, NULL);
	pthread_join(tid, &tret);
	printf("thread 1 exit code = %d\n\n", (int)tret);

	pthread_create(&tid, NULL, tfn2, NULL);
	pthread_join(tid, &tret);
	printf("thread 2 exit code = %d\n\n", (int)tret);

	pthread_create(&tid, NULL, tfn3, NULL);
	sleep(3);
	pthread_cancel(tid);
	pthread_join(tid, &tret);
	printf("thread 3 exit code = %d\n", (int)tret);

	return 0;
}

 

  

 

终止线程方式

总结:终止某个线程而不终止整个进程,有三种方法:

  1. 从线程主函数return。这种方法对主控线程不适用,从main函数return相当于调用exit
  2. 一个线程可以调用pthread_cancel终止同一进程中的另一个线程。
  3. 线程可以调用pthread_exit终止自己。

pthread_equal函数

比较两个线程ID是否相等。

int pthread_equal(pthread_t t1, pthread_t t2);

有可能Linux在未来线程ID pthread_t 类型被修改为结构体实现。

控制原语对比

进程 线程

fork pthread_create

exit pthread_exit

wait pthread_join

kill pthread_cancel

getpid pthread_self 命名空间

线程属性

本节作为指引性介绍,linux下线程的属性是可以根据实际项目需要,进行设置,之前我们讨论的线程都是采用线程的默认属性,默认属性已经可以解决绝大多数开发时遇到的问题。如我们对程序的性能提出更高的要求那么需要设置线程属性,比如可以通过设置线程栈的大小来降低内存的使用,增加最大线程个数。

typedef struct

{

int etachstate; //线程的分离状态

int schedpolicy; //线程调度策略

struct sched_param schedparam; //线程的调度参数

int inheritsched; //线程的继承性

int scope; //线程的作用域

size_t guardsize; //线程栈末尾的警戒缓冲区大小

int stackaddr_set; //线程的栈设置

void* stackaddr; //线程栈的位置

size_t stacksize; //线程栈的大小

} pthread_attr_t;

主要结构体成员:

1. 线程分离状态

2. 线程栈大小(默认平均分配)

3. 线程栈警戒缓冲区大小(位于栈末尾) APUE.12.3 线程属性

4. 线程栈最低地址

属性值不能直接设置,须使用相关函数进行操作,初始化的函数为pthread_attr_init,这个函数必须在pthread_create函数之前调用。之后须用pthread_attr_destroy函数来释放资源。

线程属性主要包括如下属性:作用域(scope)、栈尺寸(stack size)、栈地址(stack address)、优先级(priority)、分离的状态(detached state)、调度策略和参数(scheduling policy and parameters)。默认的属性为非绑定、非分离、缺省的堆栈、与父进程同样级别的优先级。

线程属性初始化

注意先初始化线程属性,再pthread_create创建线程

初始化线程属性

int pthread_attr_init(pthread_attr_t *attr); 成功:0;失败:错误号

销毁线程属性所占用的资源

int pthread_attr_destroy(pthread_attr_t *attr); 成功:0;失败:错误号

线程的分离状态

线程的分离状态决定一个线程以什么样的方式来终止自己。

非分离状态:线程的默认属性是非分离状态,这种情况下,原有的线程等待创建的线程结束。只有当pthread_join()函数返回时,创建的线程才算终止,才能释放自己占用的系统资源。

分离状态:分离线程没有被其他的线程所等待,自己运行结束了,线程也就终止了,马上释放系统资源。应该根据自己的需要,选择适当的分离状态。

线程分离状态的函数:

设置线程属性,分离or非分离

int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate);

获取程属性,分离or非分离

  pthread_attr_getdetachstate(pthread_attr_t *attr, int *detachstate);

参数: attr:已初始化的线程属性

detachstate PTHREAD_CREATE_DETACHED(分离线程)

PTHREAD _CREATE_JOINABLE(非分离线程)

这里要注意的一点是,如果设置一个线程为分离线程,而这个线程运行又非常快,它很可能在pthread_create函数返回之前就终止了,它终止以后就可能将线程号和系统资源移交给其他的线程使用,这样调用pthread_create的线程就得到了错误的线程号。要避免这种情况可以采取一定的同步措施,最简单的方法之一是可以在被创建的线程里调用pthread_cond_timedwait函数,让这个线程等待一会儿,留出足够的时间让函数pthread_create返回。设置一段等待时间,是在多线程编程里常用的方法。但是注意不要使用诸如wait()之类的函数,它们是使整个进程睡眠,并不能解决线程同步的问题。

线程的栈地址

POSIX.1定义了两个常量_POSIX_THREAD_ATTR_STACKADDR _POSIX_THREAD_ATTR_STACKSIZE检测系统是否支持栈属性。也可以给sysconf函数传递_SC_THREAD_ATTR_STACKADDR_SC_THREAD_ATTR_STACKSIZE来进行检测。

当进程栈地址空间不够用时,指定新建线程使用由malloc分配的空间作为自己的栈空间。通过pthread_attr_setstackpthread_attr_getstack两个函数分别设置和获取线程的栈地址。

int pthread_attr_setstack(pthread_attr_t *attr, void *stackaddr, size_t stacksize); 成功0;失败:错误号

int pthread_attr_getstack(pthread_attr_t *attr, void **stackaddr, size_t *stacksize); 成功0;失败:错误号

参数: attr:指向一个线程属性的指针

stackaddr:返回获取的栈地址

stacksize:返回获取的栈大小

线程的栈大小

当系统中有很多线程时,可能需要减小每个线程栈的默认大小,防止进程的地址空间不够用,当线程调用的函数会分配很大的局部变量或者函数调用层次很深时,可能需要增大线程栈的默认大小。

函数pthread_attr_getstacksizepthread_attr_setstacksize提供设置。

int pthread_attr_setstacksize(pthread_attr_t *attr, size_t stacksize); 成功0;失败:错误号

int pthread_attr_getstacksize(pthread_attr_t *attr, size_t *stacksize); 成功0;失败:错误号

参数: attr:指向一个线程属性的指针

stacksize:返回线程的堆栈大小

线程属性控制示例

【pthrd_attr_change.c】

#include <pthread.h>

 

#define SIZE 0x100000

void *th_fun(void *arg)

{

while (1)

sleep(1);

}

int main(void)

{

pthread_t tid;

int err, detachstate, i = 1;

pthread_attr_t attr;

size_t stacksize;

void *stackaddr;

 

pthread_attr_init(&attr);

pthread_attr_getstack(&attr, &stackaddr, &stacksize);

pthread_attr_getdetachstate(&attr, &detachstate);

 

if (detachstate == PTHREAD_CREATE_DETACHED)

printf("thread detached\n");

else if (detachstate == PTHREAD_CREATE_JOINABLE)

printf("thread join\n");

else

printf("thread unknown\n");

 

pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);

 

while (1) {

stackaddr = malloc(SIZE);

if (stackaddr == NULL) {

perror("malloc");

exit(1);

}

stacksize = SIZE;

pthread_attr_setstack(&attr, stackaddr, stacksize);

err = pthread_create(&tid, &attr, th_fun, NULL);

if (err != 0) {

printf("%s\n", strerror(err));

exit(1);

}

printf("%d\n", i++);

}

pthread_attr_destroy(&attr);

return 0;

} 

  

NPTL

1.察看当前pthread库版本getconf GNU_LIBPTHREAD_VERSION

2.NPTL实现机制(POSIX)Native POSIX Thread Library

3.使用线程库时gcc指定 –lpthread

线程使用注意事项

  1. 主线程退出其他线程不退出,主线程应调用pthread_exit
  2. 避免僵尸线程

pthread_join

pthread_detach

pthread_create指定分离属性

join线程可能在join函数返回前就释放完自己的所有内存资源,所以不应当返回被回收线程栈中的值;

  1. mallocmmap申请的内存可以被其他线程释放
  2. 应避免在多线程模型中调用fork除非,马上exec,子进程中只有调用fork的线程存在,其他线程在子进程中均pthread_exit
  3. 信号的复杂语义很难和多线程共存,应避免在多线程引入信号机制

 

 

同步概念

所谓同步即同时起步,协调一致。不同的对象同步的理解方式略有不同,设备同步,是指在两个设备之间规定一个共同的时间参考数据库同步是指让两个或多个数据库内容保持一致,或者按需要部分保持一致文件同步是指让两个或多个文件夹里的文件保持一致。等等

编程中通信中所说的同步与生活中大家印象中的同步概念略有差异字应是指协同、协助、互相配合。主旨在协同步调,按预定的先后次序运行。

线程同步

同步即协同步调,按预定的先后次序运行。

线程同步,指一个线程发出某一功能调用时,在没有得到结果之前,该调用不返回。同时其它线程为保证数据一致性,不能调用该功能。

举例1 银行存款 5000。柜台,折:取3000;提款机,卡:取 3000。剩余:2000

举例2: 内存中100字节,线程T1欲填入全1, 线程T2欲填入全0。但如果T1执行了50个字节失去cpuT2执行,会将T1写过的内容覆盖。当T1再次获得cpu继续 从失去cpu的位置向后写入1,当执行结束,内存中的100字节,既不是全1,也不是全0

产生的现象叫做“与时间有关的错误”(time related)。为了避免这种数据混乱,线程需要同步。

“同步”的目的,是为了避免数据混乱,解决与时间有关的错误。实际上,不仅线程间需要同步,进程间、信号间等等都需要同步机制。

因此,所有“多个控制流,共同操作一个共享资源”的情况,都需要同步。

数据混乱原因:

1. 资源共享(独享资源则不会)

2. 调度随机(意味着数据访问会出现竞争)

3. 线程间缺乏必要的同步机制。

以上3点中,前两点不能改变,欲提高效率,传递数据,资源必须共享。只要共享资源,就一定会出现竞争。只要存在竞争关系,数据就很容易出现混乱。

所以只能从第三点着手解决。使多个线程在访问共享资源的时候,出现互斥。

互斥量mutex

Linux中提供一把互斥锁mutex(也称之为互斥量)。

每个线程在对资源操作前都尝试先加锁,成功加锁才能操作,操作结束解锁。

资源还是共享的,线程间也还是竞争的,

但通过“锁”就将资源的访问变成互斥操作,而后与时间有关的错误也不会再产生了。

 

但,应注意:同一时刻,只能有一个线程持有该锁。

A线程对某个全局变量加锁访问,B在访问前尝试加锁,拿不到锁,B阻塞。C线程不去加锁,而直接访问该全局变量,依然能够访问,但会出现数据混乱。

所以,互斥锁实质上是操作系统提供的一把“建议锁”(又称“协同锁”),建议程序中有多线程访问共享资源的时候使用该机制。但,并没有强制限定。

因此,即使有了mutex,如果有线程不按规则来访问数据,依然会造成数据混乱。

主要应用函数:

pthread_mutex_init函数

pthread_mutex_destroy函数

pthread_mutex_lock函数

pthread_mutex_trylock函数

pthread_mutex_unlock函数

以上5个函数的返回值都是:成功返回0, 失败返回错误号。

pthread_mutex_t 类型,其本质是一个结构体。为简化理解,应用时可忽略其实现细节,简单当成整数看待。

pthread_mutex_t mutex; 变量mutex只有两种取值10

pthread_mutex_init函数

初始化一个互斥锁(互斥量) ---> 初值可看作1

int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);

1:传出参数,调用时应传 &mutex

restrict关键字:只用于限制指针,告诉编译器,所有修改该指针指向内存中内容的操作,只能通过本指针完成。不能通过除本指针以外的其他变量或指针修改

2:互斥量属性。是一个传入参数,通常传NULL,选用默认属性(线程间共享)。 参APUE.12.4同步属性

  1. 静态初始化:如果互斥锁 mutex 是静态分配的(定义在全局,或加了static关键字修饰),可以直接使用宏进行初始化。e.g.  pthead_mutex_t muetx = PTHREAD_MUTEX_INITIALIZER;
  2. 动态初始化:局部变量应采用动态初始化。e.g.  pthread_mutex_init(&mutex, NULL)

pthread_mutex_destroy函数

销毁一个互斥锁

int pthread_mutex_destroy(pthread_mutex_t *mutex);

pthread_mutex_lock函数

加锁。可理解为将mutex--(或-1)

int pthread_mutex_lock(pthread_mutex_t *mutex);

pthread_mutex_unlock函数

解锁。可理解为将mutex ++(或+1

int pthread_mutex_unlock(pthread_mutex_t *mutex);

pthread_mutex_trylock函数

尝试加锁

int pthread_mutex_trylock(pthread_mutex_t *mutex);

加锁与解锁

lockunlock

lock尝试加锁,如果加锁不成功,线程阻塞,阻塞到持有该互斥量的其他线程解锁为止。

unlock主动解锁函数,同时将阻塞在该锁上的所有线程全部唤醒,至于哪个线程先被唤醒,取决于优先级、调度。默认:先阻塞、先唤醒。

例如:T1 T2 T3 T4 使用一把mutex锁。T1加锁成功,其他线程均阻塞,直至T1解锁。T1解锁后,T2 T3 T4均被唤醒,并自动再次尝试加锁。

可假想mutexinit成功初值为1 lock 功能是将mutex-- unlockmutex++

locktrylock

lock加锁失败会阻塞,等待锁释放。

trylock加锁失败直接返回错误号(如:EBUSY),不阻塞。

加锁步骤测试:

看如下程序:该程序是非常典型的,由于共享、竞争而没有加任何同步机制,导致产生于时间有关的错误,造成数据混乱:

pthrd_shared.c】

#include <stdio.h>

#include <pthread.h>

#include <unistd.h>

 

void *tfn(void *arg)

{

    srand(time(NULL));

    while (1) {

 

        printf("hello ");

        sleep(rand() % 3); /*模拟长时间操作共享资源,导致cpu易主,产生与时间有关的错误*/

        printf("world\n");

        sleep(rand() % 3);

    }

    return NULL;

}

int main(void)

{

    pthread_t tid;

    srand(time(NULL));

    pthread_create(&tid, NULL, tfn, NULL);

    while (1) {

        printf("HELLO ");

        sleep(rand() % 3);

        printf("WORLD\n");

        sleep(rand() % 3);

    }

    pthread_join(tid, NULL);

    return 0;

} 

 

修改该程序,使用mutex互斥锁进行同步。

  1. 定义全局互斥量,初始化init(&m, NULL)互斥量,添加对应的destry
  2. 两个线程while中,两次printf前后,分别加lockunlock
  3. unlock挪至第二个sleep后,发现交替现象很难出现。

线程在操作完共享资源后本应该立即解锁,但修改后,线程抱着锁睡眠。睡醒解锁后又立即加锁,这两个库函数本身不会阻塞。

所以在这两行代码之间失去cpu的概率很小。因此,另外一个线程很难得到加锁的机会。

  1. main 中加flag = 5 flgwhile--  这时,主线程输出5次后试图销毁锁,但子线程未将锁释放,无法完成。
  2. main 中加pthread_cancel()将子线程取消。 pthrd_mutex.c

 

#include <stdio.h>
#include <string.h>
#include <pthread.h>
#include <stdlib.h>
#include <unistd.h>

pthread_mutex_t m;

void err_thread(int ret, char *str)
{
    if (ret != 0) {
        fprintf(stderr, "%s:%s\n", str, strerror(ret));
        pthread_exit(NULL);
    }
}

void *tfn(void *arg)
{
    srand(time(NULL));

    while (1) {
        pthread_mutex_lock(&m);     // m--

        printf("hello ");
        sleep(rand() % 3);    /*模拟长时间操作共享资源,导致cpu易主,产生与时间有关的错误*/
        printf("world\n");
        pthread_mutex_unlock(&m);   // m++
        sleep(rand() % 3);

    }

    return NULL;
}

int main(void)
{
    pthread_t tid;
    srand(time(NULL));
    int flag  = 5;

    pthread_mutex_init(&m, NULL);        // 1
    int ret = pthread_create(&tid, NULL, tfn, NULL);
    err_thread(ret, "pthread_create error");

    
    while (flag--) {
        pthread_mutex_lock(&m);     // m--

        printf("HELLO ");
        sleep(rand() % 3);
        printf("WORLD\n");
        pthread_mutex_unlock(&m);     // m--

        sleep(rand() % 3);

    }
    pthread_cancel(tid);
    pthread_join(tid, NULL);

    pthread_mutex_destroy(&m);

    return 0;
}

/*线程之间共享资源stdout*/

 

 

 

 

结论:

在访问共享资源前加锁,访问结束后立即解锁。锁的“粒度”应越小越好。

死锁

1. 线程试图对同一个互斥量A加锁两次。

2. 线程1拥有A锁,请求获得B锁;线程2拥有B锁,请求获得A

 

读写锁

与互斥量类似,但读写锁允许更高的并行性。其特性为:写独占,读共享。

 

读写锁状态:

一把读写锁具备三种状态

1. 读模式下加锁状态 (读锁)

2. 写模式下加锁状态 (写锁)

3. 不加锁状态

读写锁特性:

  1. 读写锁是“写模式加锁”时, 解锁前,所有对该锁加锁的线程都会被阻塞。
  2. 读写锁是“读模式加锁”时, 如果线程以读模式对其加锁会成功;如果线程以写模式加锁会阻塞。
  3. 读写锁是“读模式加锁”时, 既有试图以写模式加锁的线程,也有试图以读模式加锁的线程。那么读写锁会阻塞随后的读模式锁请求。优先满足写模式锁。读锁、写锁并行阻塞,写锁优先级高

读写锁也叫共享-独占锁。当读写锁以读模式锁住时,它是以共享模式锁住的;当它以写模式锁住时,它是以独占模式锁住的。写独占、读共享。

读写锁非常适合于对数据结构读的次数远大于写的情况。

主要应用函数:

pthread_rwlock_init函数

pthread_rwlock_destroy函数

pthread_rwlock_rdlock函数  

pthread_rwlock_wrlock函数

pthread_rwlock_tryrdlock函数

pthread_rwlock_trywrlock函数

pthread_rwlock_unlock函数

以上7 个函数的返回值都是:成功返回0, 失败直接返回错误号。

pthread_rwlock_t类型 用于定义一个读写锁变量。

pthread_rwlock_t rwlock;

pthread_rwlock_init函数

初始化一把读写锁

int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, const pthread_rwlockattr_t *restrict attr);

2attr表读写锁属性,通常使用默认属性NULL即可

pthread_rwlock_destroy函数

销毁一把读写锁

int pthread_rwlock_destroy(pthread_rwlock_t *rwlock);

pthread_rwlock_rdlock函数

以读方式请求读写锁。(常简称为:请求读锁)

    int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock);

pthread_rwlock_wrlock函数

以写方式请求读写锁。(常简称为:请求写锁)

    int pthread_rwlock_wrlock(pthread_rwlock_t *rwlock);

pthread_rwlock_unlock函数

解锁

int pthread_rwlock_unlock(pthread_rwlock_t *rwlock);

pthread_rwlock_tryrdlock函数

非阻塞以读方式请求读写锁(非阻塞请求读锁)

int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwlock);

pthread_rwlock_trywrlock函数

非阻塞以写方式请求读写锁(非阻塞请求写锁)

int pthread_rwlock_trywrlock(pthread_rwlock_t *rwlock);

读写锁示例

看如下示例,同时有多个线程对同一全局数据读、写操作。

rwlock.c

 

#include <stdio.h>

#include <unistd.h>

#include <pthread.h>

 

int counter;

pthread_rwlock_t rwlock;

 

/* 3个线程不定时写同一全局资源,5个线程不定时读同一全局资源 */

void *th_write(void *arg)

{

    int t, i = (int)arg;

    while (1) {

        pthread_rwlock_wrlock(&rwlock);

        t = counter;

        usleep(1000);

        printf("=======write %d: %lu: counter=%d ++counter=%d\n", i, pthread_self(), t, ++counter);

        pthread_rwlock_unlock(&rwlock);

        usleep(10000);

    }

    return NULL;

}

void *th_read(void *arg)

{

    int i = (int)arg;

 

    while (1) {

        pthread_rwlock_rdlock(&rwlock);

        printf("----------------------------read %d: %lu: %d\n", i, pthread_self(), counter);

        pthread_rwlock_unlock(&rwlock);

        usleep(2000);

    }

    return NULL;

}

int main(void)

{

    int i;

    pthread_t tid[8];

    pthread_rwlock_init(&rwlock, NULL);

 

    for (i = 0; i < 3; i++)

        pthread_create(&tid[i], NULL, th_write, (void *)i);

    for (i = 0; i < 5; i++)

        pthread_create(&tid[i+3], NULL, th_read, (void *)i);

    for (i = 0; i < 8; i++)

        pthread_join(tid[i], NULL);

 

    pthread_rwlock_destroy(&rwlock);

    return 0;

} 

 

 

 

#include <stdio.h>
#include <unistd.h>
#include <pthread.h>

int counter;
pthread_rwlock_t rwlock;

/* 3个线程不定时写同一全局资源,5个线程不定时读同一全局资源 */
void *th_write(void *arg)
{
    int t;
    int i = (int)arg;
    while (1) {
        pthread_rwlock_wrlock(&rwlock);
        t = counter;   
        usleep(1000);
        printf("=======write %d: %lu: counter=%d ++counter=%d\n", i, pthread_self(), t, ++counter);
        pthread_rwlock_unlock(&rwlock);
        usleep(10000);
    }
    return NULL;
}
void *th_read(void *arg)
{
    int i = (int)arg;

    while (1) {
        pthread_rwlock_rdlock(&rwlock);
        printf("----------------------------read %d: %lu: %d\n", i, pthread_self(), counter);
        pthread_rwlock_unlock(&rwlock);
        usleep(2000);
    }
    return NULL;
}

int main(void)
{
    int i;
    pthread_t tid[8];

    pthread_rwlock_init(&rwlock, NULL);

    for (i = 0; i < 3; i++)
        pthread_create(&tid[i], NULL, th_write, (void *)i);

    for (i = 0; i < 5; i++)
        pthread_create(&tid[i+3], NULL, th_read, (void *)i);

    for (i = 0; i < 8; i++)
        pthread_join(tid[i], NULL);

    pthread_rwlock_destroy(&rwlock);

    return 0;
}

 

条件变量:

条件本身不是锁!但它也可以造成线程阻塞。通常与互斥锁配合使用。给多线程提供一个会合的场所。

主要应用函数:

pthread_cond_init函数

pthread_cond_destroy函数

pthread_cond_wait函数

pthread_cond_timedwait函数

pthread_cond_signal函数

pthread_cond_broadcast函数

以上6 个函数的返回值都是:成功返回0, 失败直接返回错误号。

pthread_cond_t类型 用于定义条件变量

pthread_cond_t cond;

pthread_cond_init函数

初始化一个条件变量

int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);

2attr表条件变量属性,通常为默认值,传NULL即可

也可以使用静态初始化的方法初始化条件变量

pthread_cond_t cond = PTHREAD_COND_INITIALIZER;

pthread_cond_destroy函数

销毁一个条件变量

int pthread_cond_destroy(pthread_cond_t *cond);

pthread_cond_wait函数

阻塞等待一个条件变量

    int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);

函数作用:

  1. 阻塞等待条件变量cond(参1)满足
  2. 释放已掌握的互斥锁(解锁互斥量)相当于pthread_mutex_unlock(&mutex);

 1.2.两步为一个原子操作。

  1. 当被唤醒,pthread_cond_wait函数返回时,解除阻塞并重新申请获取互斥锁pthread_mutex_lock(&mutex);

pthread_cond_timedwait函数

限时等待一个条件变量

int pthread_cond_timedwait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex, const struct timespec *restrict abstime);

3

struct timespec {

time_t tv_sec; /* seconds */

long   tv_nsec; /* nanosecondes*/ 纳秒

}

形参abstime:绝对时间。

如:time(NULL)返回的就是绝对时间。而alarm(1)是相对时间,相对当前时间定时1秒钟。

struct timespec t = {1, 0};

sem_timedwait(&sem, &t); 这样只能定时到 197011日  00:00:01(早已经过去)

正确用法:

time_t cur = time(NULL); 获取当前时间

struct timespec t; 定义timespec 结构体变量t

t.tv_sec = cur+1; 定时1

pthread_cond_timedwait (&cond, &t); 传参 APUE.11.6线程同步条件变量小节

在讲解setitimer函数时我们还提到另外一种时间类型:

        struct timeval {

             time_t      tv_sec;  /* seconds */ 秒

             suseconds_t tv_usec; /* microseconds */ 微秒

        };

pthread_cond_signal函数

唤醒至少一个阻塞在条件变量上的线程

int pthread_cond_signal(pthread_cond_t *cond);

pthread_cond_broadcast函数

唤醒全部阻塞在条件变量上的线程

       int pthread_cond_broadcast(pthread_cond_t *cond);

生产者消费者条件变量模型

线程同步典型的案例即为生产者消费者模型,而借助条件变量来实现这一模型,是比较常见的一种方法。假定有两个线程,一个模拟生产者行为,一个模拟消费者行为。两个线程同时操作一个共享资源(一般称之为汇聚),生产向其中添加产品,消费者从中消费掉产品。

看如下示例,使用条件变量模拟生产者、消费者问题:

 conditionVar_product_consumer.c

 

#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>

struct msg {
    struct msg *next;
    int num;
};
struct msg *head;

pthread_cond_t has_product = PTHREAD_COND_INITIALIZER;
pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER;

void *consumer(void *p)
{
    struct msg *mp;
    for (;;) {
        pthread_mutex_lock(&lock);
        while (head == NULL) {           //头指针为空,说明没有节点    可以为if吗
            pthread_cond_wait(&has_product, &lock);
        }
        mp = head;      
        head = mp->next;    			//模拟消费掉一个产品
        pthread_mutex_unlock(&lock);

        printf("-Consume ---%d\n", mp->num);
        free(mp);
        sleep(rand() % 5);
    }
}
void *producer(void *p)
{
    struct msg *mp;
    while (1) {
        mp = malloc(sizeof(struct msg));
        mp->num = rand() % 1000 + 1;        //模拟生产一个产品
        printf("-Produce ---%d\n", mp->num);

        pthread_mutex_lock(&lock);
        mp->next = head;
        head = mp;
        pthread_mutex_unlock(&lock);

        pthread_cond_signal(&has_product);  //将等待在该条件变量上的一个线程唤醒
        sleep(rand() % 5);
    }
}
int main(int argc, char *argv[])
{
    pthread_t pid, cid;
    srand(time(NULL));

    pthread_create(&pid, NULL, producer, NULL);
    pthread_create(&cid, NULL, consumer, NULL);

    pthread_join(pid, NULL);
    pthread_join(cid, NULL);
    return 0;
}		

 

  

 

 

 

 

 

/*借助条件变量模拟 生产者-消费者 问题*/
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>
#include <stdio.h>

/*链表作为公享数据,需被互斥量保护*/
struct msg {
    struct msg *next;
    int num;
};
struct msg *head;

/* 静态初始化 一个条件变量 和 一个互斥量*/
pthread_cond_t has_product = PTHREAD_COND_INITIALIZER;
pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER;

void *consumer(void *p)
{
    struct msg *mp;

    for (;;) {
        pthread_mutex_lock(&lock);
        while (head == NULL) {           //头指针为空,说明没有节点    可以为if吗
            pthread_cond_wait(&has_product, &lock);
        }

        mp = head;      
        head = mp->next;                //模拟消费掉一个产品
        pthread_mutex_unlock(&lock);

        printf("-Consume %lu---%d\n", pthread_self(), mp->num);
        free(mp);
        sleep(rand() % 4);
    }
}

void *producer(void *p)
{
    struct msg *mp;

    for (;;) {
        mp = malloc(sizeof(struct msg));
        mp->num = rand() % 1000 + 1;        //模拟生产一个产品
        printf("-Produce -------------%d\n", mp->num);

        pthread_mutex_lock(&lock);
        mp->next = head;
        head = mp;
        pthread_mutex_unlock(&lock);

        pthread_cond_signal(&has_product);  //将等待在该条件变量上的一个线程唤醒

        sleep(rand() % 4);
    }
}

int main(int argc, char *argv[])
{
    pthread_t pid, cid;
    srand(time(NULL));

    pthread_create(&pid, NULL, producer, NULL);

    pthread_create(&cid, NULL, consumer, NULL);
    pthread_create(&cid, NULL, consumer, NULL);
    pthread_create(&cid, NULL, consumer, NULL);
    pthread_create(&cid, NULL, consumer, NULL);

    pthread_join(pid, NULL);
    pthread_join(cid, NULL);

    return 0;
}

 

 

 

条件变量的优点:

相较于mutex而言,条件变量可以减少竞争。

如直接使用mutex,除了生产者、消费者之间要竞争互斥量以外,消费者之间也需要竞争互斥量,但如果汇聚(链表)中没有数据,消费者之间竞争互斥锁是无意义的。有了条件变量机制以后,只有生产者完成生产,才会引起消费者之间的竞争。提高了程序效率。

信号量

进化版的互斥锁(1 --> N

由于互斥锁的粒度比较大,如果我们希望在多个线程间对某一对象的部分数据进行共享,使用互斥锁是没有办法实现的,只能将整个数据对象锁住。这样虽然达到了多线程操作共享数据时保证数据正确性的目的,却无形中导致线程的并发性下降。线程从并行执行,变成了串行执行。与直接使用单进程无异。

信号量,是相对折中的一种处理方式,既能保证同步,数据不混乱,又能提高线程并发。

主要应用函数:

sem_init函数

sem_destroy函数

sem_wait函数

sem_trywait函数

sem_timedwait函数

sem_post函数

以上6 个函数的返回值都是:成功返回0, 失败返回-1,同时设置errno(注意,它们没有pthread前缀)

sem_t类型,本质仍是结构体。但应用期间可简单看作为整数,忽略实现细节(类似于使用文件描述符)。

sem_t sem; 规定信号量sem不能 < 0。头文件 <semaphore.h>

信号量基本操作:

sem_wait: 1. 信号量大于0,则信号量-- (类比pthread_mutex_lock

  | 2. 信号量等于0,造成线程阻塞

对应

  |

sem_post 将信号量++,同时唤醒阻塞在信号量上的线程 (类比pthread_mutex_unlock

但,由于sem_t的实现对用户隐藏,所以所谓的++--操作只能通过函数来实现,而不能直接++--符号。

信号量的初值,决定了占用信号量的线程的个数。

sem_init函数

初始化一个信号量

int sem_init(sem_t *sem, int pshared, unsigned int value);

1sem信号量

2pshared0用于线程间;取非0用于进程间

3value指定信号量初值

sem_destroy函数

销毁一个信号量

int sem_destroy(sem_t *sem);

sem_wait函数

给信号量加锁 --

int sem_wait(sem_t *sem);

sem_post函数

给信号量解锁 ++

 int sem_post(sem_t *sem);

sem_trywait函数

尝试对信号量加锁 -- (sem_wait的区别类比locktrylock)

 int sem_trywait(sem_t *sem);

sem_timedwait函数

限时尝试对信号量加锁 --

int sem_timedwait(sem_t *sem, const struct timespec *abs_timeout);

2abs_timeout采用的是绝对时间。

定时1秒:

time_t cur = time(NULL); 获取当前时间

struct timespec t; 定义timespec 结构体变量t

t.tv_sec = cur+1; 定时1

sem_timedwait(&sem, &t); 传参

生产者消费者信号量模型

【例】:使用信号量完成线程间同步,模拟生产者,消费者问题。

 

sem_product_consumer.c

 

/*信号量实现 生产者 消费者问题*/
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>
#include <stdio.h>
#include <semaphore.h>

#define NUM 5               

int queue[NUM];                                     //全局数组实现环形队列
sem_t blank_number, product_number;                 //空格子信号量, 产品信号量
void *producer(void *arg)
{
    int i = 0;
    while (1) {
        sem_wait(&blank_number);                    //生产者将空格子数--,为0则阻塞等待
        queue[i] = rand() % 1000 + 1;               //生产一个产品
        printf("----Produce---%d\n", queue[i]);        
        sem_post(&product_number);                  //将产品数++

        i = (i+1) % NUM;                            //借助下标实现环形
        sleep(rand()%1);
    }
}

void *consumer(void *arg)
{
    int i = 0;
    while (1) {
        sem_wait(&product_number);                  //消费者将产品数--,为0则阻塞等待
        printf("-Consume---%d       %lu\n", queue[i], pthread_self());
        queue[i] = 0;                               //消费一个产品 
        sem_post(&blank_number);                    //消费掉以后,将空格子数++

        i = (i+1) % NUM;
        sleep(rand()%1);
    }
}

int main(int argc, char *argv[])
{
    pthread_t pid, cid;

    sem_init(&blank_number, 0, NUM);                //初始化空格子信号量为5
    sem_init(&product_number, 0, 0);                //产品数为0

    pthread_create(&pid, NULL, producer, NULL);
    
    pthread_create(&cid, NULL, consumer, NULL);
    pthread_create(&cid, NULL, consumer, NULL);

    pthread_join(pid, NULL);
    pthread_join(cid, NULL);

    sem_destroy(&blank_number);
    sem_destroy(&product_number);

    return 0;
}

 

 

 

分析:

规定: 如果□中有数据,生产者不能生产,只能阻塞。

如果□中没有数据,消费者不能消费,只能等待数据。

定义两个信号量:S= 0S= 1 S满代表满格的信号量,S空表示空格的信号量,程序起始,格子一定为空)

所以有: T生产者主函数 { T消费者主函数 {

      sem_wait(S);      sem_wait(S);

     生产....        消费....

      sem_post(S);      sem_post(S);

} }

假设: 线程到达的顺序是:T生、T生、T消。

那么: T1 到达,将S-1,生产,将S+1

T2 到达,S空已经为0, 阻塞

T消  到达,将S-1,消费,将S+1

三个线程到达的顺序是:T1T2T消。而执行的顺序是T1T消、T2

这里,S空 表示空格子的总数,代表可占用信号量的线程总数-->1。其实这样的话,信号量就等同于互斥锁。

但,如果S=234……就不一样了,该信号量同时可以由多个线程占用,不再是互斥的形式。因此我们说信号量是互斥锁的加强版。

 理解上述模型,推演,如果是两个消费者,一个生产者,是怎么样的情况。

【例】:结合生产者消费者信号量模型,揣摩sem_timedwait函数作用。编程实现,一个线程读用户输入, 另一个线程打印“hello world”。如果用户无输入,则每隔5秒向屏幕打印一个“hello world”;如果用户有输入,立刻打印“hello world”到屏幕。

进程间同步

互斥量mutex

进程间也可以使用互斥锁来达到同步的目的。但应在pthread_mutex_init初始化之前修改其属性为进程间共享mutex的属性修改函数主要有以下几个。

主要应用函数:

pthread_mutexattr_t mattr 类型: 用于定义mutex锁的【属性】

pthread_mutexattr_init函数初始化一个mutex属性对象

int pthread_mutexattr_init(pthread_mutexattr_t *attr);

pthread_mutexattr_destroy函数销毁mutex属性对象 (而非销毁锁)

int pthread_mutexattr_destroy(pthread_mutexattr_t *attr);

pthread_mutexattr_setpshared函数修改mutex属性。

int pthread_mutexattr_setpshared(pthread_mutexattr_t *attr, int pshared);

2pshared取值:

线程锁:PTHREAD_PROCESS_PRIVATE (mutex的默认属性即为线程锁,进程间私有)

进程锁:PTHREAD_PROCESS_SHARED

进程间mutex示例

进程间使用mutex来实现同步:

#include <fcntl.h>

#include <pthread.h>

#include <sys/mman.h>

#include <sys/wait.h>

 

struct mt {

    int num;

    pthread_mutex_t mutex;

    pthread_mutexattr_t mutexattr;

};

 

int main(void)

{

    int fd, i;

    struct mt *mm;

    pid_t pid;

 

    fd = open("mt_test", O_CREAT | O_RDWR, 0777);

    ftruncate(fd, sizeof(*mm));

    mm = mmap(NULL, sizeof(*mm), PROT_READ|PROT_WRITE, MAP_SHARED, fd, 0);

    close(fd);

    unlink("mt_test");

    //mm = mmap(NULL, sizeof(*mm), PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANON, -1, 0);

    memset(mm, 0, sizeof(*mm));

 

    pthread_mutexattr_init(&mm->mutexattr);                                  //初始化mutex属性对象

    pthread_mutexattr_setpshared(&mm->mutexattr, PTHREAD_PROCESS_SHARED);    //修改属性为进程间共享

    pthread_mutex_init(&mm->mutex, &mm->mutexattr);                          //初始化一把mutex

 

    pid = fork();

    if (pid == 0) {

        for (i = 0; i < 10; i++) {

            pthread_mutex_lock(&mm->mutex);

            (mm->num)++;

            printf("-child----num++   %d\n", mm->num);

            pthread_mutex_unlock(&mm->mutex);

            sleep(1);

        }

    } else if (pid > 0) {

        for ( i = 0; i < 10; i++) {

            sleep(1);

            pthread_mutex_lock(&mm->mutex);

            mm->num += 2;

            printf("-parent---num+=2  %d\n", mm->num);

            pthread_mutex_unlock(&mm->mutex);

        }

        wait(NULL);

    }

 

    pthread_mutexattr_destroy(&mm->mutexattr);          //销毁mutex属性对象

    pthread_mutex_destroy(&mm->mutex);                //销毁mutex

    munmap(mm,sizeof(*mm));                          //释放映射区

    return 0;

} process_mutex.c

文件锁

借助 fcntl函数来实现锁机制。 操作文件的进程没有获得锁时,可以打开,但无法执行readwrite操作。

fcntl函数: 获取、设置文件访问控制属性。

int fcntl(int fd, int cmd, ... /* arg */ );

2

F_SETLK (struct flock *) 设置文件锁(trylock

F_SETLKW (struct flock *) 设置文件锁(lockW --> wait

F_GETLK (struct flock *) 获取文件锁

3

        struct flock {

              ...

              short l_type;     锁的类型:F_RDLCK F_WRLCK F_UNLCK

              short l_whence;   偏移位置:SEEK_SETSEEK_CURSEEK_END

              off_t l_start;    起始偏移:

              off_t l_len;      长度:0表示整个文件加锁

              pid_t l_pid;      持有该锁的进程ID(F_GETLK only)

              ...

         };

进程间文件锁示例

多个进程对加锁文件进行访问:

#include <stdio.h>

#include <fcntl.h>

#include <unistd.h>

 

void sys_err(char *str)

{

    perror(str); exit(1);

}

int main(int argc, char *argv[])

{

    int fd;

    struct flock f_lock;

 

    if (argc < 2) {

        printf("./a.out filename\n"); exit(1);

    }

    if ((fd = open(argv[1], O_RDWR)) < 0)

        sys_err("open");

 

    //f_lock.l_type = F_WRLCK;        /*选用写琐*/

    f_lock.l_type = F_RDLCK;          /*选用读琐*/

 

    f_lock.l_whence = SEEK_SET;

    f_lock.l_start = 0;

    f_lock.l_len = 0;               /* 0表示整个文件加锁 */

 

    fcntl(fd, F_SETLKW, &f_lock);

    printf("get flock\n");

    sleep(10);

 

    f_lock.l_type = F_UNLCK;

    fcntl(fd, F_SETLKW, &f_lock);

    printf("un flock\n");

 

    close(fd);  return 0;

} file_lock.c

依然遵循“读共享、写独占”特性。但!如若进程不加锁直接操作文件,依然可访问成功,但数据势必会出现混乱。

【思考】:多线程中,可以使用文件锁吗?

多线程间共享文件描述符,而给文件加锁,是通过修改文件描述符所指向的文件结构体中的成员变量来实现的。因此,多线程中无法使用文件锁。

哲学家用餐模型分析

多线程版:

选用互斥锁mutex,如创建5个, pthread_mutex_t m[5];

模型抽象:

5个哲学家 --> 5个线程; 5支筷子 --> 5把互斥锁 int left(左手)right(右手)

5个哲学家使用相同的逻辑,可通用一个线程主函数,void *tfn(void *arg),使用参数来表示线程编号:int i = (int)arg;

哲学家线程根据编号知道自己是第几个哲学家,而后选定锁,锁住,吃饭。否则哲学家thinking

                  A   B   C   D   E

5支筷子,在逻辑上形成环: 0   1   2   3   4   分别对应5个哲学家:

 

 

所以有:

if(i == 4)

left = i, right = 0;

else

left = i, right = i+1;

振荡:如果每个人都攥着自己左手的锁,尝试去拿右手锁,拿不到则将锁释放。过会儿五个人又同时再攥着左手锁尝试拿右手锁,依然拿不到。如此往复形成另外一种极端死锁的现象——振荡。

避免振荡现象:只需5个人中,任意一个人,拿锁的方向与其他人相逆即可(如:E,原来:左:4,右:0 现在:左:0, 右:4)

所以以上if else语句应改为:

if(i == 4)

left = 0, right = i;

else

left = i, right = i+1;

而后, 首先应让哲学家尝试加左手锁:

while {

pthread_mutex_lock(&m[left]); 如果加锁成功,函数返回再加右手锁,

如果失败,应立即释放左手锁,等待。

若,左右手都加锁成功 --> --> 吃完 --> 释放锁(应先释放右手、再释放左手,是加锁顺序的逆序)

}

主线程(main)中,初始化5把锁,销毁5把锁,创建5个线程(并将i传递给线程主函数),回收5个线程。

避免死锁的方法:

1. 当得不到所有所需资源时,放弃已经获得的资源,等待。

2. 保证资源的获取顺序,要求每个线程获取资源的顺序一致。如:A获取顺序123B顺序应也是123。若B321则易出现死锁现象。

多进程版

相较于多线程需注意问题:

需注意如何共享信号量 (注意:坚决不能使用全局变量 sem_t s[5])

实现:

main函数中:

循环 sem_init(&s[i], 0, 1); 将信号量初值设为1,信号量变为互斥锁。

循环 sem_destroy(&s[i]);

循环 创建 5 个子进程。 if(i < 5) 中完成子进程的代码逻辑。

循环 回收 5 个子进程。

子进程中:

if(i == 4)  

left = 0, right == 4;

else

left = i, right = i+1;

while (1) {

使用 sem_wait(&s[left]) 锁左手,尝试锁右手,若成功 --> 吃; 若不成功 --> 将左手锁释放。

吃完后, 先释放右手锁,再释放左手锁。

}

【重点注意】:

直接将sem_t s[5]放在全局位置,试图用于子进程间共享是错误的!应将其定义放置与mmap共享映射区中。main中:

sem_t *s = mmap(NULL, sizeof(sem_t) * 5, PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANON-10);

使用方式:将s当成数组首地址看待,与使用数组s[5]没有差异。

 

posted @ 2019-07-18 11:47  白伟碧一些小心得  阅读(1448)  评论(0编辑  收藏  举报