Linux多线程编程
前言:有这样一道面试题(来自http://blog.csdn.net/morewindows/article/details/7392749):
“编写一个程序,开启3个线程,这3个线程的ID分别为A、B、C,每个线程将自己的ID在屏幕上打印10遍,要求输出结果必须按ABC的顺序显示;如:ABCABC….依次递推。”
我们就从这样一题出发,认识多线程,了解其同步机制,最后正确解答这一类题目。本文框架如下:
- 进程与线程
- 多线程的优越性
- 线程基本函数
- 多线程同步
- 题目代码
一.进程与线程
进程的定义:进程是为了描述程序在并发执行时对系统资源的共享,所需的一个描述程序执行时动态特征的概念。进程是具有独立功能的程序关于某个数据集合上的一次运行活动,是系统进行资源分配、调度和保护的独立单位。
线程的定义:线程也成为轻量级进程,是进程中的一个运行实体,作为CPU的调度单位。一个进程由多个线程组成,线程与同属一个进程的其他的线程共享进程所拥有的全部资源。
同一进程内的所有线程除了共享全局变量外还共享:
- 进程指令;
- 大多数数据;
- 打开的文件(即描述符);
- 信号处理函数和信号处置;
- 当前工作目录;
- 用户ID和组ID。
每个线程拥有各自的:
- 线程ID;
- 寄存器集合,包括程序计数器和栈指针;
- 栈(用于存放局部变量和返回地址);
- errno;
- 信号掩码;
- 优先级。
结构上的不同可以让我们更加了解进程和线程的相异之处:
(1)进程是资源分配的基本单位;线程与资源分配无关,它属于某一个进程,并与进程内的其他线程共享进程的资源。
(2)当进程发生调度时,不同的进程拥有不同的虚拟地址空间,而同一进程内的不同线程共享同一地址空间。
(3)线程只由先关堆栈(系统栈或用户栈)寄存器和线程控制块组成。寄存器用来存储线程内的局部变量,但不能存储其他线程的相关变量。
(4)进程切换时涉及有关资源指针的保存和地址空间的变化;线程切换时,由于处于同一进程内,所以不涉及资源信息的保存和地址空间的变化,从而减少了操作系统的时间开销。
二.多线程的优越性
在传统的UNIX模型中,当一个进程需要另一个实体来完成某事,它就fork一个子进程并让子进程去处理。但是fork的调用有如下缺点:
(1)fork的代价是昂贵的。fork要把父进程的内存印象复制到子进程,并在子进程中复制所有描述符等。
(2)fork返回之后父子进程之间信息的传递需要进程通信机制。调用fork之前父进程向尚未存在的子进程传递信息相当容易,因为子进程将从父进程数据空间及所有描述符的一个副本开始运行,但是从子进程向父进程返回信息却比较费力。
针对这两点,多线程技术相应而生,它具有如下优越性:
(1)它是一种非常"节俭"的多任务操作方式。而运行于一个进程中的多个线程,它们彼此之间使用相同的地址空间,共享大部分数据,启动一个线程所花费的空间远远小于启动一个进程所花费的空间,而且,线程间彼此切换所需的时间也远远小于进程间切换所需要的时间。
(2)线程间方便的通信更加方便。由于同一进程下的线程之间共享数据空间,所以一个线程的数据可以直接为其它线程所用,这不仅快捷,而且方便。但是,同一进程内的所有线程共享相同的全局内存,这样线程之间的通信就变得相当简单,随之而来的就是同步问题。
三.基本线程函数
1.pthread_create函数,创建线程
int pthread_create(pthread_t *tid, const pthread_attr_t *attr, void *(*func)(void *), void *arg);
pthread_t *tid:一个进程内的各个线程是由线程ID标识的,如果新线程创建成功,返回tid指针。
const pthread_attr_t *attr:每个线程有多个属性,包括优先级、初始栈大小、是否是一个守护线程等等。
void *(*func)(void *):线程启动函数,线程从调用这个函数开始,或显示结束(调用pthread_exit()),或隐式结束(让该函数返回)。
void *arg:线程执行func函数的传递参数。
2.pthread_join函数,等待一个线程终止
int pthread_join(pthread_t *tid, void **status);
void **status:二级指针,如果status指针非空,那么所等待线程的返回值将存放在status指向的位置。
3.pthread_self函数,返回线程ID
int pthread_self(void);
跟进程比较,相当于getpid。
4.pthread_detach函数,线程分离
int pthread_detach(pthread_t tid);
线程或者是可汇合的(joinable),或者是脱离的(detach)。当可汇合的线程终止时,线程ID和退出状态将保留,知道另外一个线程调用pthread_join。脱离的线程终止时,释放所有的资源,因此我们不能等待它终止。若要一个线程知道另一个线程的终止时间,我们就要保留第二个线程的可汇合性。
5.pthread_exit函数,线程终止
int pthread_exit(void **status);
若线程未脱离,那么它的线程ID和退出状态将保留到另外一个线程调用pthread_join为止。
四.多线程的同步
有了上面的基本函数还不足以完成本题的要求,为什么呢?因为题目要求按照ABCABC...的方式打印,而3个线程却在抢占资源,所以无法控制排列顺序。这时就需要用到多线程编程中的同步技术。
对于多线程编程来说,同步就是同一时间只允许一个线程访问资源,而其他线程不能访问。多线程有3种同步方式:
- 互斥锁
- 条件变量
- 读写锁
1.互斥锁
互斥锁是最基本的同步方式,它用来保护一个“临界区”,保证任何时刻只由一个线程在执行其中的代码。这个“临界区”通常是线程的共享数据。
下面三个函数给一个互斥锁上锁和解锁:
int pthread_mutex_lock(pthread_mutex_t *mptr); int pthread_mutex_trylock(pthread_mutex_t *mptr); int pthread_mutex_unlock(pthread_mutex_t *mptr);
假设线程2要给已经被线程1锁住的互斥锁(mutex)上锁(即执行pthread_mutex_lock(mutex)),那么它将一直阻塞直到到线程1解锁为止(即释放mutex)。
如果互斥锁变量时静态分配的,通常初始化为常值PTHREAD_MUTEX_INITIALIZER,如果互斥锁是动态分配的,那么在运行时调用pthread_mutex_init函数来初始化。
2.条件变量
互斥锁用于上锁,而条件变量则用于等待,通常它都会跟互斥锁一起使用。
int pthread_cond_wait(pthread_cond_t *cptr,pthread_mutex_t *mptr); int pthread_cond_signal(pthread_cond_t *cptr);
通常pthread_cond_signal只唤醒等待在相应条件变量上的一个线程,若有多个线程需要被唤醒呢,这就要使用下面的函数了:
int pthread_cond_broadcast(pthread_cond_t *cptr);
3.读写锁
互斥锁将试图进入连你姐去的其他简称阻塞住,而读写锁是将读和写作了区分,读写锁的分配规则如下:
(1)只要没有线程持有某个给定的读写锁用于写,那么任意数目的线程可以持有该读写锁用于读;
(2)仅当没有线程持有某个给定的读写锁用于读或用于写时,才能分配该读写锁用于写。
int pthread_rwlock_rdlock(pthread_relock_t *rwptr); int pthread_rwlock_wrlock(pthread_relock_t *rwptr); int pthread_rwlock_unlock(pthread_relock_t *rwptr);
五.题目代码
分析此题:
1.主线程main创建3个线程tid0,tid1,tid2;
2.设一个全局变量num,互斥锁mutex保护此临界区保证每次只有一个线程访问num;
3.若抢占到资源的线程tid并不是我们需要的,那么让它阻塞;
4.若抢占到资源的线程tid正好是我们需要的,那么就打印相应字母;
5.解锁,唤醒其他两个等待线程;
6.main函数等待3个线程打印结束才结束。
代码如下:
#include<stdio.h> #include<stdlib.h> #include<error.h> #include<unistd.h> #include<pthread.h> int num=0; static pthread_mutex_t mutex=PTHREAD_MUTEX_INITIALIZER; static pthread_cond_t cond=PTHREAD_COND_INITIALIZER; void *func(void *); int main() { pthread_t tid[3]; int ret=0,i; for(i=0;i<3;i++) if((ret=pthread_create(&tid[i],NULL,func,(void*)i))!=0) printf("create thread_%c error\n",i+'A'); for(i=0;i<3;i++) pthread_join(tid[i],NULL); printf("\n"); return 0; } void *func(void *argc) { int i; for(i=0;i<10;i++) { pthread_mutex_lock(&mutex); while(num!=(int)argc) pthread_cond_wait(&cond,&mutex); printf("%c",num+'A'); num=(num+1)%3; pthread_mutex_unlock(&mutex); pthread_cond_broadcast(&cond); } pthread_exit(0); }
参考资料:
1. 《UNIX网络编程卷2》
2.http://www.cnblogs.com/skynet/archive/2010/10/30/1865267.html
3.http://www.cnblogs.com/vamei/archive/2012/10/09/2715393.html