(九) 一起学 Unix 环境高级编程 (APUE) 之 线程
C 语言线程有很多标准,POSIX 是其中的一种。
POSIX 是一套标准,而不是一种实现。
正因为 POSIX 是一套标准而不是实现,所以 POSIX 只是规定了 pthread_t 作为线程标识符,但是并没有规定它必须是由什么类型组成的,所以在有的平台上它可能是 int,有些平台上它可能是 struct,还有些平台上它可能是 union,所以不要直接操作这个类型,而是要使用 POSIX 规定的各种线程函数来操作它。
有木有觉得像标准 IO 里 FILE 的赶脚?没错,标准制定出来的很多东西都是这种风格的,它为你提供一个数据类型而不让你直接对这个类型操作,要通过它定义的一系列函数来实现对这个类型的操作,这样就在各个平台上实现统一的接口了,所以这样做才能让标准制定出来的东西具有较好的可移植性。
pthread_t 是个很重要的东西,我们所有使用 PSOIX 标准的线程操作都是围绕着它来进行的,通过它配合各种函数就可以对线程进行各种花样作死的玩了。:)
我记得在前面进程的博文中 LZ 介绍过几种 ps(1) 命令的使用方式,用来观察进程的关系和状态。在本篇开始之前 LZ 再补充一个 ps(1) 命令的组合,用来查看线程的情况,方便我们调试程序。
>$ ps ax -L PID LWP TTY STAT TIME COMMAND 1 1 ? Ss 0:02 /sbin/init 2 2 ? S 0:00 [kthreadd] 3 3 ? S 0:00 [ksoftirqd/0] 877 877 ? Ss 0:06 dbus-daemon --system --fork 948 948 ? Ssl 0:00 /usr/sbin/ModemManager 948 965 ? Ssl 0:00 /usr/sbin/ModemManager 948 975 ? Ssl 0:00 /usr/sbin/ModemManager 956 956 ? Ss 0:00 /usr/sbin/bluetoothd >$
PID 是进程号,LWP 是线程 ID。
这里看到的 PID 为 948 的进程有三个 LWP,它们就是三个线程。
1. pthread_equal(3)
1 pthread_equal - compare thread IDs 2 3 #include <pthread.h> 4 5 int pthread_equal(pthread_t t1, pthread_t t2); 6 7 Compile and link with -pthread.
第一个要介绍的函数是 pthread_equal(3),比较两个线程标识符是否相同。为什么不能使用 if (t1 == t2) 的方式比较两个线程标识符呢?就像我们上面说的,因为你不知道 pthread_t 是什么类型的,所以永远不要自己直接操作它。
2. pthread_self(3)
1 pthread_self - obtain ID of the calling thread 2 3 #include <pthread.h> 4 5 pthread_t pthread_self(void); 6 7 Compile and link with -pthread.
大家还记得一个进程可以通过 getpid(2) 函数获得当前进程的 ID 号吧?pthread_self(3) 就是获得当前线程 ID 的函数。
3. pthread_create(3)
1 pthread_create - create a new thread 2 3 #include <pthread.h> 4 5 int pthread_create(pthread_t *thread, const pthread_attr_t *attr, 6 void *(*start_routine) (void *), void *arg); 7 8 Compile and link with -pthread.
pthread_create(3) 函数的作用就是创建一个新线程。
attr:线程属性,在本篇博文(第 11 章)中,所有的属性都是使用 NULL,也就是使用默认属性。
start_routine:线程的执行函数;入参是 void*,返回值是 void*,恭喜你,这两个值的类型都是百搭的,任何类型你都可以在这使用了。
arg:传递给 start_routine 的 void* 参数。
返回值:成功返回 0;失败返回 errno。为什么线程函数返回的是 errno 呢?因为在一些平台上 error 是全局变量,如果大家都使用同一个全局变量,在多线程的情况下就可能会出现竞争,所以 POSIX 的线程函数一般在失败的时候都是直接返回 errno 的,这样就避免了某些平台 errno 的缺陷了。
新线程被创建之后,这两个线程哪个先执行是不确定的,由调度器来决定。如果你希望哪个线程一定先执行,那么就在其它线程中使用类似 sleep(3) 的函数让它们等一会儿再运行。
4. pthread_exit(3)
1 pthread_exit - terminate calling thread 2 3 #include <pthread.h> 4 5 void pthread_exit(void *retval); 6 7 Compile and link with -pthread.
在线程执行函数中调用,作用是退出当前线程,并将返回值通过 retval 参数返回给调用 pthread_join(3) 函数的地方,如果不需要返回值可以传入 NULL。
pthread_join(3) 是为线程收尸的函数,我们会在下面详细介绍。
1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <pthread.h> 4 #include <string.h> 5 #include <unistd.h> 6 7 static void *func(void *p) 8 { 9 puts("Thread is working."); 10 11 sleep(10); // 延时是为了方便我们使用 ps(1) 命令验证线程是否被创建了 12 13 pthread_exit(NULL); 14 // return NULL; 15 } 16 17 int main() 18 { 19 pthread_t tid; 20 int err; 21 22 puts("Begin!"); 23 24 // 创建线程 25 err = pthread_create(&tid,NULL,func,NULL); 26 if(err) 27 { 28 fprintf(stderr,"pthread_create():%s\n",strerror(err)); 29 exit(1); 30 } 31 32 // 为线程收尸 33 pthread_join(tid,NULL); 34 35 puts("End!"); 36 37 exit(0); 38 }
编译并运行,同时使用 LZ 上面介绍过的 ps(1) 命令验证线程是否被创建成功了。
>$ gcc -Wall create.c -o create -pthread >$ ./create Begin! Thread is working. End! >$ # 在线程结束之前打开另一个终端,验证线程的状态 >$ ps ax -L PID LWP TTY STAT TIME COMMAND 4354 4354 pts/1 Sl+ 0:00 ./create 4354 4355 pts/1 Sl+ 0:00 ./create >$
通过 ps(1) 命令的验证,可以看到这两个线程拥有同一个 PID 不同的 LWP,所以可以直观的看出来我们的线程创建成功了!
大家注意,编译 POSIX 线程程序的时候需要使用 -pthread 参数,这个其实在 man 手册里已经说得很清楚了,但是还是总有童鞋在编译的时候没有加这个参数然后还问我为什么编译不通过,鄙视你们这帮粗心的家伙。。
5. pthread_cancel(3)
1 pthread_cancel - send a cancellation request to a thread 2 3 #include <pthread.h> 4 5 int pthread_cancel(pthread_t thread); 6 7 Compile and link with -pthread.
pthread_cancel(3) 函数的作用是取消同一个进程中的其它线程线程。
注意 pthread_cancel(3) 并不等待线程终止,它仅仅提出请求。
6. pthread_join(3)
1 pthread_join - join with a terminated thread 2 3 #include <pthread.h> 4 5 int pthread_join(pthread_t thread, void **retval); 6 7 Compile and link with -pthread.
为线程收尸,在上面的栗子中大家已经见到了。不像 wait(2) 函数,线程之间谁都可以为别人收尸,它们之间是没有父子关系的。而 wait(2) 函数只能是由父进程对子进程收尸。
retval:这个二级指针是什么呢?它就是线程在退出的时候的返回值(pthread_exit(3) 的参数),它会把线程的返回值的地址回填到这个参数中。
7.线程清理处理程序(thread cleanup handler)
1 pthread_cleanup_push, pthread_cleanup_pop - push and pop thread cancellation clean-up handlers 2 3 #include <pthread.h> 4 5 void pthread_cleanup_push(void (*routine)(void *), void *arg); 6 void pthread_cleanup_pop(int execute); 7 8 Compile and link with -pthread.
就像在进程级别使用 atexit(3) 函数挂钩子函数一样,线程可能也需要在结束时执行一些清理工作,这时候就需要派出线程清理处理程序上场了。钩子函数的调用顺序也是逆序的,也就是执行顺序与注册顺序相反。
这两个是带参的宏而不是函数,所以必须成对使用,而且必须先使用 pthread_cleanup_push 再使用 pthread_cleanup_pop,否则会报语法错误,括号不匹配。
execute:0 不调用该钩子函数;1 调用该钩子函数。
pthread_cleanup_pop 写到哪都行,只要写了让语法不报错就行,就算你把它写到 pthread_exit(3) 下面也没问题,但是 execute 参数就看不到了,所以无论 pthread_cleanup_pop 的参数是什么,所有注册过的钩子函数都会被执行。
1 #include <pthread.h> 2 3 void routine (void *p) {} 4 5 void* fun (void *p) 6 { 7 pthread_cleanup_push(routine, NULL); 8 这里是其它代码 9 pthread_cleanup_pop(1); 10 }
>$ gcc -E cleanup.c void routine (void *p) {} void* fun (void *p) { do { __pthread_unwind_buf_t __cancel_buf; void (*__cancel_routine) (void *) = (routine); void *__cancel_arg = (((void *)0)); int not_first_call = __sigsetjmp ((struct __jmp_buf_tag *) (void *) __cancel_buf.__cancel_jmp_buf, 0); if (__builtin_expect (not_first_call, 0)) { __cancel_routine (__cancel_arg); __pthread_unwind_next (&__cancel_buf); } __pthread_register_cancel (&__cancel_buf); do {; 这里是其它代码 do { } while (0); } while (0); __pthread_unregister_cancel (&__cancel_buf); if (1) __cancel_routine (__cancel_arg); } while (0); }
通过预编译可以看出来 pthread_cleanup_push 和 pthread_cleanup_pop 两个宏被替换了,并且每个宏仅定义了一半,如果不成对写另一个宏编译的时候就会报括号不匹配的错误。
8. pthread_detach(3)
1 pthread_detach - detach a thread 2 3 #include <pthread.h> 4 5 int pthread_detach(pthread_t thread); 6 7 Compile and link with -pthread.
pthread_detach(3) 函数用于分离线程,被分离的线程是不能被收尸的。
在介绍互斥量之前我们先思考一个问题:如何让 20 个线程同时从一个文件中读取数字,累加 1 然后再写入回去,并且保证程序运行之后文件中的数值比运行程序之前大 20?
1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <fcntl.h> 4 #include <unistd.h> 5 #include <pthread.h> 6 #include <string.h> 7 8 #include <sys/types.h> 9 #include <sys/stat.h> 10 11 #define BUFSIZE 32 12 13 static pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER; 14 15 static void *fun (void *p) 16 { 17 int fd = -1; 18 long long n = 0; 19 char buf[BUFSIZE] = ""; 20 21 fd = open(p, O_RDWR | O_CREAT, 0664); 22 /* if err */ 23 24 pthread_mutex_lock(&mutex); 25 26 read(fd, buf, BUFSIZE); 27 lseek(fd, 0, SEEK_SET); 28 n = atoll(buf); 29 snprintf(buf, BUFSIZE, "%lld\n", ++n); 30 write(fd, buf, strlen(buf)); 31 32 close(fd); 33 34 pthread_mutex_unlock(&mutex); 35 36 pthread_exit(NULL); 37 } 38 39 int main (int argc, char **argv) 40 { 41 pthread_t tids[20]; 42 int i = 0; 43 44 if (argc < 2) { 45 fprintf(stderr, "Usage %s <filename>\n", argv[0]); 46 return -1; 47 } 48 49 for (i = 0; i < 20; i++) { 50 pthread_create(&tids[i], NULL, fun, argv[1]); 51 /* if err */ 52 } 53 54 for (i = 0; i < 20; i++) { 55 pthread_join(tids[i], NULL); 56 } 57 58 pthread_mutex_destroy(&mutex); 59 60 return 0; 61 }
程序中每一个线程都要做:读取文件 --- 累加 1 --- 写入文件 的动作,如果 20 个线程同时做这件事,那么就很有可能多个线程读到的数据是相同的,这样累加的结果也就是相同的了,就没办法保证 20 个线程每个人读到的数据都是独一无二的了。
怎么样才能让 20 个线程读到独一无二的数值呢?很简单,让 读取文件 --- 累加 1 --- 写入文件 的这个动作同一时刻只能有一个线程来做,这样每个线程读取到的数值都是上一个线程写入的数值了。那么 读取文件 --- 累加 1 --- 写入文件 这段代码(也就是发生竞争的这段区域)就叫做“临界区”。
与 ptread_t 一样,互斥量也使用一种数据类型来表示,它使用 pthread_mutex_t 类型来表示。
2)使用 pthread_mutex_init(3) 函数初始化,可以为互斥量指定属性。
pthread_mutex_t 使用完成之后需要使用 pthread_mutex_destroy(3) 函数销毁,否则会导致内存泄漏。
1 /* 定义并赋值 */ 2 type name = value; // 定义并赋值。使用 PTHREAD_MUTEX_INITIALIZER 宏初始化互斥量必须在这种情况时。 3 4 /* 先定义再赋值 */ 5 type name; // 定义 6 name = valu; // 赋值。这种情况不允许使用 PTHREAD_MUTEX_INITIALIZER 宏初始化互斥量,只能使用 pthread_mutex_init(3) 函数初始化互斥量。
1 pthread_mutex_lock, pthread_mutex_trylock, pthread_mutex_unlock - lock and unlock a mutex 2 3 #include <pthread.h> 4 5 int pthread_mutex_lock(pthread_mutex_t *mutex); 6 int pthread_mutex_trylock(pthread_mutex_t *mutex); 7 int pthread_mutex_unlock(pthread_mutex_t *mutex);
_lock() 是阻塞加锁,当抢锁的时候被抢不到就死等,直到别人通过 _unlock() 把这把锁解锁再抢。
_trylock() 是尝试加锁,无论能否抢到锁都返回。
了解了互斥量之后,我们再来看一道经典的面试题:用 4 个线程疯狂的打印 abcd 持续 5 秒钟,但是要按照顺序打印,不能是乱序的。
1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <pthread.h> 4 #include <string.h> 5 #include <unistd.h> 6 7 #define THRNUM 4 8 9 static pthread_mutex_t mut[THRNUM]; 10 11 static int next(int a) 12 { 13 if(a+1 == THRNUM) 14 return 0; 15 return a+1; 16 } 17 18 static void *thr_func(void *p) 19 { 20 int n = (int)p; 21 int ch = n + 'a'; 22 23 while(1) 24 { 25 pthread_mutex_lock(mut+n); 26 write(1,&ch,1); 27 pthread_mutex_unlock(mut+next(n)); 28 } 29 pthread_exit(NULL); 30 } 31 32 int main() 33 { 34 int i,err; 35 pthread_t tid[THRNUM]; 36 37 for(i = 0 ; i < THRNUM ; i++) 38 { 39 pthread_mutex_init(mut+i,NULL); 40 41 pthread_mutex_lock(mut+i); 42 43 err = pthread_create(tid+i,NULL,thr_func,(void *)i); 44 if(err) 45 { 46 fprintf(stderr,"pthread_create():%s\n",strerror(err)); 47 exit(1); 48 } 49 50 } 51 52 53 pthread_mutex_unlock(mut+0); 54 55 alarm(5); 56 57 58 for(i = 0 ; i < THRNUM ; i++) 59 pthread_join(tid[i],NULL); 60 61 62 exit(0); 63 }
首先定义 4 个互斥量,然后创建 4 个线程,每个互斥量对应一个线程,每个线程负责打印一个字母。4 个线程刚刚被创建好时,4 把锁都处于锁定状态,4 个线程全部都阻塞在临界区之外,等 4 个线程全部都创建好之后解锁其中一把锁。被解锁的线程首先将自己的互斥量上锁,然后打印字符再解锁下一个线程对应的互斥量,然后再次等待自己被解锁。如此往复,使 4 个线程有条不紊的循环执行 锁定自己 --- 打印字符 -- 解锁下一个线程 的步骤,这样打印到控制台上的 abcd 就是有序的了。
1 /* mytbf.h */ 2 #ifndef MYTBF_H__ 3 #define MYTBF_H__ 4 5 #define MYTBF_MAX 1024 6 7 typedef void mytbf_t; 8 9 mytbf_t *mytbf_init(int cps,int burst); 10 11 int mytbf_fetchtoken(mytbf_t *,int); 12 13 int mytbf_returntoken(mytbf_t *,int ); 14 15 void mytbf_destroy(mytbf_t *); 16 17 18 #endif
1 /* mytbf.c */ 2 #include <stdio.h> 3 #include <stdlib.h> 4 #include <unistd.h> 5 #include <sys/types.h> 6 #include <sys/stat.h> 7 #include <fcntl.h> 8 #include <errno.h> 9 #include <pthread.h> 10 #include <string.h> 11 12 #include "mytbf.h" 13 14 /* 每一个令牌桶 */ 15 struct mytbf_st 16 { 17 int cps; // 速率 18 int burst; // 令牌上限 19 int token; // 可用令牌数量 20 int pos; // 当前令牌桶在 job 数组中的下标 21 pthread_mutex_t mut; // 用来保护令牌竞争的互斥量 22 }; 23 24 /* 所有的令牌桶 */ 25 static struct mytbf_st *job[MYTBF_MAX]; 26 /* 用来保护令牌桶数组竞争的互斥量 */ 27 static pthread_mutex_t mut_job = PTHREAD_MUTEX_INITIALIZER; 28 /* 添加令牌的线程 ID */ 29 static pthread_t tid; 30 /* 初始化添加令牌的线程 */ 31 static pthread_once_t init_once = PTHREAD_ONCE_INIT; 32 33 /* 线程处理函数:负责定时向令牌桶中添加令牌 */ 34 static void *thr_alrm(void *p) 35 { 36 int i; 37 38 while(1) 39 { 40 pthread_mutex_lock(&mut_job); 41 // 遍历所有的桶 42 for(i = 0 ; i < MYTBF_MAX; i++) 43 { 44 // 为可用的桶添加令牌 45 if(job[i] != NULL) 46 { 47 pthread_mutex_lock(&job[i]->mut); 48 job[i]->token += job[i]->cps; 49 // 桶中可用的令牌不能超过上限 50 if(job[i]->token > job[i]->burst) 51 job[i]->token = job[i]->burst; 52 pthread_mutex_unlock(&job[i]->mut); 53 } 54 } 55 pthread_mutex_unlock(&mut_job); 56 57 // 等待一秒钟后继续添加令牌 58 sleep(1); 59 } 60 61 pthread_exit(NULL); 62 } 63 64 static void module_unload(void) 65 { 66 int i; 67 68 pthread_cancel(tid); 69 pthread_join(tid,NULL); 70 71 pthread_mutex_lock(&mut_job); 72 for(i = 0 ; i < MYTBF_MAX ; i++) 73 { 74 if(job[i] != NULL) 75 { 76 // 互斥量使用完毕不要忘记释放资源 77 pthread_mutex_destroy(&job[i]->mut); 78 free(job[i]); 79 } 80 } 81 82 pthread_mutex_unlock(&mut_job); 83 84 pthread_mutex_destroy(&mut_job); 85 86 } 87 88 static void module_load(void) 89 { 90 int err; 91 92 err = pthread_create(&tid,NULL,thr_alrm,NULL); 93 if(err) 94 { 95 fprintf(stderr,"pthread_create():%s\n",strerror(err)); 96 exit(1); 97 } 98 99 atexit(module_unload); 100 } 101 102 /* 103 * 为了不破坏调用者对令牌桶操作的原子性, 104 * 在该函数内加锁可能会导致死锁, 105 * 所以该函数内部无法加锁, 106 * 必须在调用该函数之前先加锁。 107 */ 108 static int get_free_pos_unlocked(void) 109 { 110 int i; 111 112 for(i = 0 ; i < MYTBF_MAX; i++) 113 if(job[i] == NULL) 114 return i; 115 return -1; 116 } 117 118 mytbf_t *mytbf_init(int cps,int burst) 119 { 120 struct mytbf_st *me; 121 int pos; 122 123 pthread_once(&init_once,module_load); 124 125 me = malloc(sizeof(*me)); 126 if(me == NULL) 127 return NULL; 128 129 me->cps = cps; 130 me->burst = burst; 131 me->token = 0; 132 pthread_mutex_init(&me->mut,NULL); 133 134 pthread_mutex_lock(&mut_job); 135 136 pos = get_free_pos_unlocked(); 137 if(pos < 0) 138 { 139 // 带锁跳转不要忘记先解锁再跳转 140 pthread_mutex_unlock(&mut_job); 141 free(me); 142 return NULL; 143 } 144 145 me->pos = pos; 146 147 job[pos] = me; 148 149 pthread_mutex_unlock(&mut_job); 150 151 return me; 152 } 153 154 static inline int min(int a,int b) 155 { 156 return (a < b) ? a : b; 157 } 158 159 int mytbf_fetchtoken(mytbf_t *ptr,int size) 160 { 161 int n; 162 struct mytbf_st *me = ptr; 163 164 if(size < 0) 165 return -EINVAL; 166 167 pthread_mutex_lock(&me->mut); 168 // 令牌数量不足,等待令牌被添加进来 169 while(me->token <= 0) 170 { 171 // 先解锁,出让调度器让别人先跑起来,然后再抢锁检查令牌是否够用 172 pthread_mutex_unlock(&me->mut); 173 sched_yield(); 174 pthread_mutex_lock(&me->mut); 175 } 176 177 n = min(me->token,size); 178 179 me->token -= n; 180 181 pthread_mutex_unlock(&me->mut); 182 183 return n; 184 } 185 186 /* 令牌用不完要归还哟,可不能浪费了 */ 187 int mytbf_returntoken(mytbf_t *ptr,int size) 188 { 189 struct mytbf_st *me = ptr; 190 191 // 逗我玩呢? 192 if(size < 0) 193 return -EINVAL; 194 195 pthread_mutex_lock(&me->mut); 196 197 me->token += size; 198 if(me->token > me->burst) 199 me->token = me->burst; 200 201 pthread_mutex_unlock(&me->mut); 202 203 return size; 204 } 205 206 void mytbf_destroy(mytbf_t *ptr) 207 { 208 struct mytbf_st *me = ptr; 209 210 pthread_mutex_lock(&mut_job); 211 job[me->pos] = NULL; 212 pthread_mutex_unlock(&mut_job); 213 214 pthread_mutex_destroy(&me->mut); 215 free(ptr); 216 }
上面这个令牌桶库可以支持最多 1024 个桶,也就是可以使用多线程同时操作这 1024 个桶来获得不同的速率,每个桶的速率是固定的。
这 1024 个桶保存在一个数组中,所以每次访问桶的时候都需要对它进行加锁,避免多个线程同时访问发生竞争。
写互斥量的代码一定要注意临界区内的所有的跳转,通常在跳转之前需要解锁,避免产生死锁。常见的跳转包括 continue; break; return; goto; longjmp(3); 等等,甚至函数调用也是一种跳转。
当某个函数内包含临界区,也就是需要加锁再进入临界区,但是从程序的布局来看该函数无法加锁,那么根据 POSIX 标准的约定,这种函数的命名规则是必须以 _unlocked 作为后缀,所以大家在看到这样的函数时在调用之前一定要先加锁。总结起来说就是以这个后缀命名的函数表示函数内需要加锁但是没有加锁,所以调用者需要先加锁再调用,例如上面代码中的 get_free_pos_unlocked() 函数。
LZ 来解释一下上面这个令牌桶中用过的几个没见过的函数。
1 sched_yield — yield the processor 2 3 #include <sched.h> 4 5 int sched_yield(void);
sched_yield(2) 这个函数的作用是出让调度器。在用户态无法模拟它的实现,它会让出当前线程所占用的调度器给其它线程使用,而不必等待时间片耗尽才切换调度器,大家暂时可以把它理解成一个很短暂的 sleep(3) 。一般用于在使用一个资源时需要同时获得多把锁但是却没法一次性获得全部的锁的场景下,只要有任何一把锁没有抢到,那么就立即释放已抢到的锁,并让出自己的调度器让其它线程有机会获得被自己释放的锁。当再次调度到自己时再重新抢锁,直到能一次性抢到所有的锁时再进入临界区,这样就避免了出现死锁的情况。
1 pthread_once - dynamic package initialization 2 3 #include <pthread.h> 4 5 int pthread_once(pthread_once_t *once_control, 6 void (*init_routine)(void)); 7 pthread_once_t once_control = PTHREAD_ONCE_INIT;
pthread_once(3) 函数一般用于动态单次初始化,它能保证 init_routine 函数仅被调用一次。
pthread_once_t 只能使用 PTHREAD_ONCE_INIT 宏初始化,没有提供其它初始化方式。这个与我们前面见到的初始化 pthread_t 和 pthread_nutex_t 不一样。
上面的代码中,向令牌桶添加令牌的线程只需要启动一次,而初始化令牌桶的函数却在开启每个令牌桶的时候都需要调用。为了在初始化令牌桶的函数中仅启动一次添加令牌的线程,采用 pthread_once(3) 函数来创建线程就可以了。这样之后在第一次调用 mytbf_init() 函数的时候会启动新线程添加令牌,而后续再调用 mytbf_init() 的时候就不会启动添加令牌的线程了。
上面代码中调用 pthread_once(3) 相当于下面的伪代码:
1 lock(); 2 3 if (init_flag) 4 5 { 6 init_flag = 0; 7 // do sth 8 } 9 10 unlock();
上面的程序经过测试,发现 CPU 正在满负荷工作,说明程序中出现了忙等, 是哪里出现了忙等呢?其实就是 mytbf_fetchtoken() 函数获得锁的时候采用了忙等的方式。前面我们提到过,异步程序有两种处理方式,一种是通知法,一种是查询法,我们这里用的就是查询法,下面我们把它修改成个通知法来实现。
1 /* mytbf.c */ 2 #include <stdio.h> 3 #include <stdlib.h> 4 #include <unistd.h> 5 #include <sys/types.h> 6 #include <sys/stat.h> 7 #include <fcntl.h> 8 #include <errno.h> 9 #include <pthread.h> 10 #include <string.h> 11 12 #include "mytbf.h" 13 14 /* 每一个令牌桶 */ 15 struct mytbf_st 16 { 17 int cps; // 速率 18 int burst; // 令牌上限 19 int token; // 可用令牌数量 20 int pos; // 当前令牌桶在 job 数组中的下标 21 pthread_mutex_t mut; // 用来保护令牌竞争的互斥量 22 pthread_cond_t cond; // 用于在令牌互斥量状态改变时发送通知 23 }; 24 25 /* 所有的令牌桶 */ 26 static struct mytbf_st *job[MYTBF_MAX]; 27 /* 用来保护令牌桶数组竞争的互斥量 */ 28 static pthread_mutex_t mut_job = PTHREAD_MUTEX_INITIALIZER; 29 /* 添加令牌的线程 ID */ 30 static pthread_t tid; 31 /* 初始化添加令牌的线程 */ 32 static pthread_once_t init_once = PTHREAD_ONCE_INIT; 33 34 /* 线程处理函数:负责定时向令牌桶中添加令牌 */ 35 static void *thr_alrm(void *p) 36 { 37 int i; 38 39 while(1) 40 { 41 pthread_mutex_lock(&mut_job); 42 // 遍历所有的桶 43 for(i = 0 ; i < MYTBF_MAX; i++) 44 { 45 // 为可用的桶添加令牌 46 if(job[i] != NULL) 47 { 48 pthread_mutex_lock(&job[i]->mut); 49 job[i]->token += job[i]->cps; 50 // 桶中可用的令牌不能超过上限 51 if(job[i]->token > job[i]->burst) 52 job[i]->token = job[i]->burst; 53 // 令牌添加完毕之后,通知所有等待使用令牌的线程准备抢锁 54 pthread_cond_broadcast(&job[i]->cond); 55 pthread_mutex_unlock(&job[i]->mut); 56 } 57 } 58 pthread_mutex_unlock(&mut_job); 59 60 // 等待一秒钟后继续添加令牌 61 sleep(1); 62 } 63 64 pthread_exit(NULL); 65 } 66 67 static void module_unload(void) 68 { 69 int i; 70 71 pthread_cancel(tid); 72 pthread_join(tid,NULL); 73 74 pthread_mutex_lock(&mut_job); 75 for(i = 0 ; i < MYTBF_MAX ; i++) 76 { 77 if(job[i] != NULL) 78 { 79 // 互斥量和条件变量使用完之后不要忘记释放资源 80 pthread_mutex_destroy(&job[i]->mut); 81 pthread_cond_destroy(&job[i]->cond); 82 free(job[i]); 83 } 84 } 85 86 pthread_mutex_unlock(&mut_job); 87 88 pthread_mutex_destroy(&mut_job); 89 90 } 91 92 static void module_load(void) 93 { 94 int err; 95 96 err = pthread_create(&tid,NULL,thr_alrm,NULL); 97 if(err) 98 { 99 fprintf(stderr,"pthread_create():%s\n",strerror(err)); 100 exit(1); 101 } 102 103 atexit(module_unload); 104 } 105 106 /* 107 * 为了不破坏调用者对令牌桶操作的原子性, 108 * 在该函数内加锁可能会导致死锁, 109 * 所以该函数内部无法加锁, 110 * 必须在调用该函数之前先加锁。 111 */ 112 static int get_free_pos_unlocked(void) 113 { 114 int i; 115 116 for(i = 0 ; i < MYTBF_MAX; i++) 117 if(job[i] == NULL) 118 return i; 119 return -1; 120 } 121 122 mytbf_t *mytbf_init(int cps,int burst) 123 { 124 struct mytbf_st *me; 125 int pos; 126 127 pthread_once(&init_once,module_load); 128 129 me = malloc(sizeof(*me)); 130 if(me == NULL) 131 return NULL; 132 133 me->cps = cps; 134 me->burst = burst; 135 me->token = 0; 136 pthread_mutex_init(&me->mut,NULL); 137 pthread_cond_init(&me->cond,NULL); 138 139 pthread_mutex_lock(&mut_job); 140 141 pos = get_free_pos_unlocked(); 142 if(pos < 0) 143 { 144 pthread_mutex_unlock(&mut_job); 145 free(me); 146 return NULL; 147 } 148 149 me->pos = pos; 150 151 job[pos] = me; 152 153 pthread_mutex_unlock(&mut_job); 154 155 return me; 156 } 157 158 static inline int min(int a,int b) 159 { 160 return (a < b) ? a : b; 161 } 162 163 int mytbf_fetchtoken(mytbf_t *ptr,int size) 164 { 165 int n; 166 struct mytbf_st *me = ptr; 167 168 if(size < 0) 169 return -EINVAL; 170 171 pthread_mutex_lock(&me->mut); 172 // 令牌数量不足,等待令牌被添加进来 173 while(me->token <= 0) 174 { 175 /* 176 * 原子化的解锁、出让调度器再抢锁以便工作或等待 177 * 它会等待其它线程发送通知再唤醒 178 * 放在循环中是因为可能同时有多个线程再使用同一个桶, 179 * 被唤醒时未必就能拿得到令牌,所以要直到能拿到令牌再出去工作 180 */ 181 pthread_cond_wait(&me->cond,&me->mut); 182 183 // pthread_mutex_unlock(&me->mut); 184 // sched_yield(); 185 // pthread_mutex_lock(&me->mut); 186 } 187 188 n = min(me->token,size); 189 190 me->token -= n; 191 192 pthread_mutex_unlock(&me->mut); 193 194 return n; 195 } 196 197 /* 令牌用不完要归还哟,可不能浪费了 */ 198 int mytbf_returntoken(mytbf_t *ptr,int size) 199 { 200 struct mytbf_st *me = ptr; 201 202 // 逗我玩呢? 203 if(size < 0) 204 return -EINVAL; 205 206 pthread_mutex_lock(&me->mut); 207 208 me->token += size; 209 if(me->token > me->burst) 210 me->token = me->burst; 211 212 /* 213 * 令牌归还完毕,通知其它正在等待令牌的线程赶紧起床,准备抢锁 214 * 这两行谁在上面谁在后面都无所谓 215 * 如果先发通知再解锁,收到通知的线程发现锁没有释放会等待锁释放再抢; 216 * 如果先解锁再发通知,反正已经出了临界区了, 217 * 就算有线程在通知发出之前抢到了锁也不会发生竞争, 218 * 大不了其它被唤醒的线程起床之后发现没有锁可以抢,那就继续睡呗。 219 */ 220 pthread_cond_broadcast(&me->cond); 221 pthread_mutex_unlock(&me->mut); 222 223 return size; 224 } 225 226 void mytbf_destroy(mytbf_t *ptr) 227 { 228 struct mytbf_st *me = ptr; 229 230 pthread_mutex_lock(&mut_job); 231 job[me->pos] = NULL; 232 pthread_mutex_unlock(&mut_job); 233 234 pthread_mutex_destroy(&me->mut); 235 pthread_cond_destroy(&me->cond); 236 free(ptr); 237 }
大家不难看出这两段代码的差别,把查询法(忙等)修改为通知法(非忙等)仅仅加一个条件变量(pthread_cond_t) 就行了。
1 pthread_cond_destroy, pthread_cond_init - destroy and initialize condition variables 2 3 #include <pthread.h> 4 5 int pthread_cond_destroy(pthread_cond_t *cond); 6 int pthread_cond_init(pthread_cond_t *restrict cond, 7 const pthread_condattr_t *restrict attr); 8 pthread_cond_t cond = PTHREAD_COND_INITIALIZER;
与互斥量一样,条件变量也有两种方式初始化,一种是使用 pthread_cond_init(3) 函数,另一种是使用 PTHREAD_COND_INITIALIZER 宏。这两种方式的使用场景也与互斥量相同,这里就不再赘述了。
条件变量在使用完毕之后不要忘记用 pthread_cond_destroy(3) 函数释放资源,否则会导致内存泄漏!
1 pthread_cond_broadcast, pthread_cond_signal - broadcast or signal a condition 2 3 #include <pthread.h> 4 5 int pthread_cond_broadcast(pthread_cond_t *cond); 6 int pthread_cond_signal(pthread_cond_t *cond);
pthread_cond_signal(3) 函数用于唤醒当前多个等待的线程中的任何一个。虽然名字上有 signal,但是跟系统中的信号没有任何关系。
pthread_cond_broadcast(3) 惊群,将现在正在等待的线程全部唤醒。
1 pthread_cond_timedwait, pthread_cond_wait - wait on a condition 2 3 #include <pthread.h> 4 5 int pthread_cond_timedwait(pthread_cond_t *restrict cond, 6 pthread_mutex_t *restrict mutex, 7 const struct timespec *restrict abstime); 8 int pthread_cond_wait(pthread_cond_t *restrict cond, 9 pthread_mutex_t *restrict mutex);
这几个函数与上面的两个函数的作用是成对的,上面的两个函数用于唤醒线程,唤醒什么线程呢?当然是唤醒 _wait() 等待条件满足的线程啦。
当一个线程做某件事之前发现条件不满足,那就使用这几个 _wait() 函数进入等待状态,当某个线程使条件满足了就要用上面的两个函数唤醒等待的线程继续工作了。
pthread_cond_wait(3) 在临界区外阻塞等待某一个条件发生变化,直到有一个通知到来打断它的等待。这种方式是死等。
pthread_cond_timedwait(3) 增加了超时功能的等待,超时之后无论能否拿到锁都返回。这种方式是尝试等。
pthread_cond_wait(3) 相当于下面三行代码的原子操作:
1 pthread_mutex_unlock(mutex); 2 3 sched_yield(); 4 5 pthread_mutex_lock(mutex);
还记得我们上面提到的面试题吗?用锁链实现的疯狂的有序的打印 abcd 5 秒钟。
上面我们说了,锁链的办法并不是这道题的考点,这道题真正的考点其实是使用互斥量 + 条件变量的方式来实现。
你想出来如何实现了吗?自己先写写,写完了再看 LZ 给出的实现。
1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <pthread.h> 4 #include <string.h> 5 #include <unistd.h> 6 7 #define THRNUM 4 8 9 static pthread_mutex_t mut_num = PTHREAD_MUTEX_INITIALIZER; 10 static pthread_cond_t cond_num = PTHREAD_COND_INITIALIZER; 11 static int num = 0; 12 13 static int next(int a) 14 { 15 if(a+1 == THRNUM) 16 return 0; 17 return a+1; 18 } 19 20 static void *thr_func(void *p) 21 { 22 int n = (int)p; 23 int ch = n + 'a'; 24 25 while(1) 26 { 27 // 先抢锁,能抢到锁就可以获得打印的机会 28 pthread_mutex_lock(&mut_num); 29 while(num != n) 30 { 31 // 抢到锁但是发现不应该自己打印,那就释放锁再出让调度器,让别人尝试抢锁 32 pthread_cond_wait(&cond_num,&mut_num); 33 } 34 write(1,&ch,1); 35 num = next(num); 36 /* 37 * 自己打印完了,通知别人你们抢锁吧 38 * 因为不知道下一个应该运行的线程是谁, 39 * 所以采用惊群的方式把它们全都唤醒, 40 * 让它们自己检查是不是该自己运行了。 41 */ 42 pthread_cond_broadcast(&cond_num); 43 pthread_mutex_unlock(&mut_num); 44 } 45 pthread_exit(NULL); 46 } 47 48 int main() 49 { 50 int i,err; 51 pthread_t tid[THRNUM]; 52 53 for(i = 0 ; i < THRNUM ; i++) 54 { 55 // 直接启动 4 个线程,让它们自己判断自己是否应该运行,而不用提前锁住它们 56 err = pthread_create(tid+i,NULL,thr_func,(void *)i); 57 if(err) 58 { 59 fprintf(stderr,"pthread_create():%s\n",strerror(err)); 60 exit(1); 61 } 62 63 } 64 65 66 alarm(5); 67 68 69 for(i = 0 ; i < THRNUM ; i++) 70 pthread_join(tid[i],NULL); 71 72 73 exit(0); 74 }
代码中注释写得已经比较清晰了,所以 LZ 就不解释了,小伙伴们要是有什么看不懂的就在评论中留言讨论。
那么应该在什么场景中选择使用 pthread_cond_signal(3) 还是使用 pthread_cond_broadcast(3) 呢?
这个其实没有固定的套路,要根据具体的场景来选择。一般只有一个线程在等待或者明确知道哪个线程应该被唤醒的时候使用 _signal() 函数,如果有多个线程在等待并且不确定应该由谁起来工作的时候使用惊群。
LZ 说的不确定是指业务上不能确定哪个线程应该工作,而不是你作为程序猿稀里糊涂的不知道哪个线程该工作。程序猿应该保证了解你的每一行代码在做什么,而不要写出一坨自己都不知道它在做什么的代码。
这段应该补充一个栗子,但是 LZ 忘记案例是什么了,所以先划掉,等 LZ 想起来了再补充上来。
A -> B
1 5c
2 15c
3 5c
一个进程能够创建多少个线程呢?主要受两个因素影响,一个是 PID 耗尽,一个是我们在之前的博文中画 C 程序地址空间布局时的阴影区域被栈空间占满了 。(不记得那副图了,去前面的博文里找找。)
PID 看上去是进程 ID,但是在之前讨论进程的博文中我们讨论过,内核的最小执行单元其实是线程,实际上是线程在消耗 PID。一个系统中的线程可以有很多,所以 PID 被耗尽也是有可能的。
使用 ulimit(1) 命令可以查看栈空间的大小,阴影区剩余空间的大小 / 栈空间的大小 == 就是我们能创建的线程数量。
大家可以自己写个程序测试一下一个进程最多能够创建多少个线程,然后使用 ulimit(1) 命令修改栈的大小再测试几次,看看能有什么发现。代码很简单,LZ 就不贴出来了。
