并发编程
应用级并发:
- 访问慢速I/O设备
- 与人交互
- 通过推迟工作以降低延迟
- 服务多个网络客户端
- 在多核机器上进行并行计算
三种基本构造并发程序方法:
- 进程:每个逻辑控制流是一个进程,由内核进行调度,进程有独立的虚拟地址空间
- I/O多路复用:逻辑流被模型化为状态机,所有流共享同一个地址空间
- 线程:运行在单一进程上下文中的逻辑流,由内核进行调度,共享同一个虚拟地址空间
基于进程的并发编程
一个构造并发服务器的自然方法:
在父进程中接受客户端连接请求,然后创建一个新的子进程来为每个新客户端提供服务。
常用函数:fork、exec、waitpid
基于进程的并发服务器
注意:
- 必须要包括一个SIGCHLD处理程序来回收僵死子进程的资源
- 父子进程必须关闭各自的connfd拷贝,避免存储器泄漏
- 直到父子进程的connfd都关闭了,到客户端的连接才会终止
关于进程的优劣
共享文件表而不共享用户地址空间
优点:进程不可能相互覆盖虚拟存储器。
缺点:共享状态信息变得困难,必须使用现实的IPC机制;因为进程控制和IPC消耗很高导致其很慢。
基于I/O多路复用的并发编程
使用select函数要求内核挂起进程,只有在一个或多个I/O事件发生后,才将控制返回给应用程序。
基于I/O多路复用的并发事件驱动服务器
事件驱动程序:将逻辑流模型化为状态机。
状态机:
- 状态
- 输入事件
- 转移
整体的流程是:
- select函数检测到输入事件
- add_client函数创建新状态机
- check_clients函数执行状态转移(在课本的例题中是回送输入行),并且完成时删除该状态机。
几个需要注意的函数:
- init_pool:初始化客户端池
- add_client:添加一个新的客户端到活动客户端池中
- check_clients:回送来自每个准备好的已连接描述符的一个文本行
I/O多路复用技术的优劣
优点:
- 更多的对程序行为的控制
- 运行在单一进程上下文中,因此每个逻辑流都能访问该进程的全部地址空间,流之间共享数据变得更容易
- 高效,因为不需要进程上下文切换来调度新的流
缺点:
复杂,只要某个逻辑流正忙于读一个文本行,其它逻辑流就不可能有进展,使得事件驱动服务器在“故意只发送部分文件然后就停止”的恶意客户端的攻击面前显得脆弱。
基于线程的并发编程
线程就是运行在进程上下文中的逻辑流,它集合了上述两种流的特性。
同进程一样由内核自动调度,并且内核通过一个整数ID来识别线程。
同基于I/O多路复用的流一样,多个线程运行在单一进程的上下文中,因此共享这个进程虚拟地址空间的整个内容,包括它的代码、数据、堆、共享库和打开的文件。
线程执行模型
主线程:
在每个进程开始生命周期时都是单一线程——主线程,与其他进程的区别仅有:它总是进程中第一个运行的线程。
对等线程:
- 某时刻主线程创建,之后两个线程并发运行
- 每个对等线程都能读写相同的共享数据
主线程切换到对等线程:
- 主线程执行一个慢速系统调用,如read或sleep
- 被系统的间隔计时器中断
- 切换方式是上下文切换
- 对等线程执行一段时间后会控制传递回主线程,以此类推
线程和进程的区别
- 线程的上下文切换比进程快得多
- 进程具有严格的父子层次,而一个进程相关线程组成对等(线程)池,和其他进程的线程独立开来。一个线程可以杀死它的任意对等线程,或者等待他的任意对等线程终止
Posix线程
Posix线程是C程序中处理线程的一个标准接口:
- 线程的代码和本地数据被封装在一个线程例程中
- 每个线程例程都以一个通用指针为输入,并返回一个通用指针
创建线程
创建线程:
pthread_create函数
#include <pthread.h>
typedef void *(func)(void *);
int pthread_create(pthread_t *tid, pthread_attr_t *attr, func *f, void *arg); 成功返回0,出错返回非0
创建一个新的线程,带着一个输入变量arg,在新线程的上下文运行线程例程f。
attr默认为NULL
参数tid中包含新创建线程的ID
查看线程ID:
pthread_self函数
#include <pthread.h>
pthread_t pthread_self(void);
返回调用者的线程ID(TID)
终止线程
终止线程的几个方式:
-
隐式终止:顶层的线程例程返回
-
显示终止:调用pthread_exit函数,如果主线程调用,会先等待所有其他对等线程终止,再终止主线程和整个进程,返回值为pthread_return
-
某个对等线程调用Unix的exit函数,会终止进程与其相关线程
-
另一个对等线程通过以当前线程ID作为参数调用pthread_cancle来终止当前线程
pthread_exit函数
#include <pthread.h>
void pthread_exit(void *thread_return);
若成功返回0,出错为非0
pthread_cancle函数
#include <pthread.h>
void pthread_cancle(pthread_t tid);
若成功返回0,出错为非0
回收已终止线程的资源
pthread_join函数:
#include <pthread.h>
int pthread_join(pthread_t tid,void **thrad_return);
这个函数会阻塞,知道线程tid终止,将线程例程返回的(void*)指针赋值为thread_return指向的位置,然后回收已终止线程占用的所有存储器资源。
分离线程
在任何一个时间点上,线程是可结合的,或是分离的。
可结合的线程:
-
能够被其他线程收回其资源和杀死
-
被收回钱,它的存储器资源没有被释放
-
每个可结合线程要么被其他线程显式的收回,要么通过调用pthread_detach函数被分离
分离的线程:
-
不能被其他线程回收或杀死
-
存储器资源在它终止时由系统自动释放
pthread_detach函数
#include <pthread.h>
void pthread_detach(pthread_t tid);
若成功返回0,出错为非0
这个函数可以分离可结合线程tid。
线程能够通过以pthread_self()为参数的pthread_detach调用来分离他们自己。
每个对等线程都应该在他开始处理请求之前分离他自身,以使得系统能在它终止后回收它的存储器资源。
初始化线程
pthread_once函数
#include <pthread.h>
pthread_once_t once_control = PTHREAD_ONCE_INIT;
int pthread_once(pthread_once_t *once_control, void (*init_routine)(void));
总是返回0
参考:http://www.cnblogs.com/20135202yjx/p/5023754.html