线程基础

1、线程与进程比较

进程是资源分配的最小单位，线程是CPU调度的最小单位。

多进程：编程方便，简化逻辑。

多线程：简化逻辑；减少开销（创建、切换和调度）；通信方便。

1）Linux下线程是轻量级进程

linux实现Posix线程有两种方式：LinuxThreads(旧的，glibc2.4起就不再支持了）和NPTL（Native POSIX Threads Library, glibc 2.3.2, kernel 2.6)。

NPTL创建线程的同时，创建manager线程，负责回收分离状态线程。

安装manpages-posix-dev可man thread相关函数，ubuntu下安装方法：

sudo apt-get install manpages-posix-dev

2）多线程共享资源

同一地址空间（包括代码段，数据段，自然包括全局变量）。

进程id和父进程id，进程组id和session ID

用户id和组id

文件描述符表

每种信号处理方式(SIG_IGN, SIG_DFL或自定义信号处理函数）

当前工作目录

3）线程独有

线程id（递减）

上下文，包括各种寄存器的值，程序计数器和栈指针。

栈空间

errno变量

信号屏蔽字（新线程将继承进程(主线程)的信号屏蔽字，但新线程的未决信号集被清空，以防同一信号被多个线程处理）

调度优先级

注：线程安全函数不一定为可重入函数（线程安全函数可只读全局变量而不写，可重入函数不可访问全局变量）。

2、线程函数

man pthreads了解线程相关内容。

线程函数成功返回0，失败返回错误码，不设置errno。POSIX.1-2001指出线程函数绝不会（never）返回EINTR（不会因EINTR而失败）。

1）线程创建

#include<pthead.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,  void * (*start_routine)(void *), void * restrict arg);

attr一般为NULL，采用系统默认属性。

       int pthread_attr_init(pthread_attr_t *attr);
       int pthread_attr_destroy(pthread_attr_t *attr);

>>默认创建的线程是joinable的，可通过函数pthread_attr_setdetachstate()设置attr从而创建detached的线程。

>>可通过pthread_attr_setstacksize()设置attr从而创建指定栈大小的线程。pthread_attr_getstacksize()获取当线程栈大小。

成功返回0，失败返回错误号。

pthread_t无符号整型 typedef unsigned long int pthread_t

pthread库的函数都是通过返回值返回错误号，虽然每个线程都有一个errno，但并不使用它。因此不能调用perror打印错误信息，可先用strerror把返回值（错误码）转化为错误信息再打印。

注：线程函数参数和返回值都是void*，且函数返回的指针所指向的内存单元必须是全局的或者malloc分配的。

 void * (*start_routine)(void *)

2）线程终止

终止线程有三种方法：

从线程函数return。
调用pthread_cancel()终止同一进程中的另一个线程。
线程可调用pthread_exit()终止自己。

    void pthread_exit(void *value_ptr);

无返回值，总是成功。

注：pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者malloc分配的，不能在线程函数的栈上分配。

    int pthread_cancel(pthread_t thread);

成功返回0，失败返回非零错误号。

被终止的线程的响应取决于可终止状态和类型（cancelability state and type)。

int pthread_setcancelstate(int state, int *oldstate);
int pthread_setcanceltype(int type, int *oldtype);

// redis bio
/* Make the thread killable at any time, so that bioKillThreads() can work reliably. */
pthread_setcancelstate(PTHREAD_CANCEL_ENABLE, NULL);
pthread_setcanceltype(PTHREAD_CANCEL_ASYNCHRONOUS, NULL);

注：系统并不会马上关闭被取消线程，只有在被取消线程下次系统调用时（Cancellation points），才会真正结束线程。或调用pthread_testcancel（如没有系统调用），让内核去检测是否需要取消当前线程。被取消的线程，退出值，定义在Linux的pthread库中常数PTHREAD_CANCELED的值是-1。参考：https://blog.csdn.net/huangshanchun/article/details/47420961

注：如果任意一个线程调用exit或_exit，则整个进程的所有线程都终止。

3）获取终止状态

int pthread_join(pthread_t thread, void **retval);

等待线程终止，并获取线程退出状态。该线程必须是joinable。调用该函数的线程将挂起等待，直到id为thread的线程终止。阻塞函数

函数调用时注意参数：定义为void *res; 调用pthread_join(&res)；最终调用参数（char *）res。

retval：

1）如果thread线程通过return返回，thread线程函数返回值。

2）pthread_cancel()异常终止，则retval所指向的单元存放常量PTHREAD_CANCELED（-1）。

3）自己调用pthread_exit()终止，retval存放pthread_exit参数。

4）分离线程

#include<pthread.h>
int pthread_detach(pthread_t thread);

标记线程thread为分离状态。当一个分离状态的线程终止时，它的资源自动释放给系统，不需要其他线程join。

成功返回0，失败返回错误号。

注：让线程自己pthread_detach（线程函数内调用）不好，库函数不是原子的。

注：不能对一个已经处于detach状态的线程调用pthread_join.==>EINVAL.

注：不能对同一线程调用两次pthread_join或pthread_detach，或者一个线程已经调用pthread_detach就不能再调用pthread_join了。

注：线程创建时，都应该调用pthread_join()或pthread_detach()，以使系统资源释放。

示例：pthread_detach(pthread_self());

5）获取线程id

pthread_t pthread_self(void);

函数总是成功，返回id。

pthread_t是不适合作为线程的标识的。pthread_t是由POSIX pthread库内部提供的，只在进程内部有意义，无法关联操作系统的任务调度之类的信息。比方说在/proc查找不到关于pthread_t得到的task。

glibc的Pthreads实现实际上把pthread_t作为一个结构体指针，指向一块动态分配的内存，但是这块内存是可以反复使用的，也就是说很容易造成pthread_t的重复。也就是说pthreads只能保证同一进程内，同一时刻的各个线程不同；不能保证同一个进程全程时段每个线程具有不同的id，不能保证线程id的唯一性。

在LINUX系统中，建议使用gettid系统调用的返回值作为线程id，这么做的原因：返回值是一个pid_t，其值是一个很小的整数，方便输出。

在linux系统中，它直接标识内核任务调度id，可通过/proc文件系统中找到对应项：/proc/tid 或者 /proc/pid/task/tid，方便定位到具体线程。

任何时刻都是唯一的，并且由于linux分配新的pid采用递增轮回办法，短时间内启动多个线程也会具有不同的id。

#define gettid() syscall(__NR_gettid)

6）信号函数

线程信号用pthread_sigmask, pthread_kill。

int pthread_kill(pthread_t thread, int sig);
int pthread_sigmask(int how, const sigset_t *set, sigset_t *oldset);

pthread_sigmask()参数与sigprocmask()等同。

pthread_kill() 成功:0，线程不存在：ESRCH，信号不合法：EINVAL

给线程发送一个0就可以判断线程是否存在pthread_kill(tid, 0)。

    int kill_ret1 = pthread_kill(tid1,0);
    if(kill_ret1 ==ESRCH)
    {
        printf("线程1不存在 id = %x \n",thread_id1);
    }else if(kill_ret1 == 0){
        printf("线程1存活 id = %x \n",thread_id1);
    }

7）读写文件

ssize_t pread(int fd, void *buf, size_t count, off_t offset);
ssize_t pwrite(int fd, const void *buf, size_t count, off_t offset);

线程读写用pread/pwrite(文件偏移不改变）。

The pread() and pwrite() system calls are especially useful in multithreaded applications. They allow multiple threads to perform I/O on the same file
descriptor without being affected by changes to the file offset by other threads.

3、线程信号

1）根据APUE 12.8，进程的处理函数与处理方式是进程中所有线程共享的。

2）根据APUE 12.8，如果进程接收到信号，该信号只会被递送到某一个单独线程。一般情况下由那个线程引起信号则递送到那个线程。如果没有线程引发信号，信号被发送到任意线程。

线程信号处理函数编程时要注意死锁问题（同一线程如果重复申请同一个互斥锁那么必然会死锁）。

如下代码会死锁：

#include <stdio.h>
#include <unistd.h>
#include <pthread.h>
#include <signal.h>

pthread_mutex_t mmutex = PTHREAD_MUTEX_INITIALIZER;

void *thread_run(void *p)
{
    printf("thread...\n");
    pthread_mutex_lock(&mmutex);
    int i;
    for(i = 0; i < 10; i++){
        sleep(1);
        printf("thread run [%d]!\n", i);
    }
    pthread_mutex_unlock(&mmutex);

    return NULL;
}

void signal_handler(int signo)
{
    printf("signal...\n");

    pthread_mutex_lock(&mmutex);
    int i;
    for(i = 0; i < 5; i++){
        sleep(1);
        printf("signal run [%d]!\n", i);
    }
    pthread_mutex_unlock(&mmutex);
}


int main()
{
    signal(SIGUSR1, signal_handler);
    pthread_t p;
//    pthread_create(&p, NULL, thread_run, NULL);
    sleep(2);
    //raise(SIGUSR1);
    pthread_create(&p, NULL, thread_run, NULL);
    pthread_kill(p, SIGUSR1);

    while(1){
        printf("main...\n");
        sleep(1);
    }

    pthread_join(p, NULL);
    pthread_mutex_destroy(&mmutex);

    return 0;
}

sighandler和main函数默认使用相同的堆栈空间，所有函数或变量均可使用。多线程时每个线程与该线程的信号处理函数共享栈空间，虽然各个线程处理函数相同，堆空间所有线程和信号处理函数共享，但每个线程执行信号处理函数时是在线程的栈空间。但为了程序稳定性，在信号处理函数中应使用可重入函数（如sleep）。

上述代码中同一线程中调用了pthread_mutex_lock()后再在该线程信号处理函数中调用，必然死锁。

如果是两个线程空间，则在主线程触发信号后主线程会阻塞到信号处理函数，等待其他线程释放互斥锁。

4、示例

manpage示例

#include <ctype.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#include <pthread.h>
#include <errno.h>

#define handle_error_en(en, msg) \
    do{ errno = en; perror(msg); exit(EXIT_FAILURE); } while(0)
#define handle_error(msg) \
    do { perror(msg); exit(EXIT_FAILURE); } while(0)

struct thread_info{
    pthread_t thread_id;
    int thread_num;
    char *argv_string;
};

static void * t1(void *arg){    
    struct thread_info *tinfo = arg;
    char *uargv, *p; 

    printf("Thread %d: top of stack near %p; argv_string=%s\n", 
        tinfo->thread_num, &p, tinfo->argv_string);

    uargv = strdup(tinfo->argv_string);
    if(uargv == NULL)
        printf("strdup error.\n");

    for(p = uargv; *p != '\0'; p++)
        *p = toupper(*p);
    
    return uargv;
}

int main(int argc, char ** argv)
{
    int s, tnum, opt, num_threads;
    struct thread_info *tinfo;
    pthread_attr_t attr;
    int stack_size;
    void *res;

    /* the "-s" option specifies a stack size for our threads */

    stack_size = -1;
    while((opt = getopt(argc, argv, "s:")) != -1){
        switch(opt){
            case 's':
                stack_size = strtoul(optarg, NULL, 0);
                break;
            default:
                fprintf(stderr, "Usage: %s [-s stack-size] arg ...\n",
                    argv[0]);
                exit(EXIT_FAILURE);
        }
    }

    num_threads = argc - optind;

    s = pthread_attr_init(&attr);
    if(s != 0)
        handle_error_en(s, "pthread_attr_init");

    if(stack_size > 0){
        s = pthread_attr_setstacksize(&attr, stack_size);
        if(s != 0)
            handle_error_en(s, "pthread_attr_setstacksize");
    }

    tinfo = calloc(num_threads, sizeof(struct thread_info));
    if(tinfo == NULL)
        handle_error("calloc");

    for(tnum = 0; tnum < num_threads; tnum++){
        tinfo[tnum].thread_num = tnum +1;
        tinfo[tnum].argv_string = argv[optind + tnum];

        s = pthread_create(&tinfo[tnum].thread_id, &attr, &t1, &tinfo[tnum]);
        if(s != 0)
            handle_error_en(s, "pthread_create");
    }

    s = pthread_attr_destroy(&attr);
    if(s != 0)
        handle_error_en(s, "pthread_attr_destroy");

    for(tnum = 0; tnum < num_threads; tnum++){
        s = pthread_join(tinfo[tnum].thread_id, &res);
        if(s != 0)
            handle_error_en(s, "pthread_join");

        printf("Joined with thread %d; returned value was %s\n",
            tinfo[tnum].thread_num, (char*)res);
        free(res);
    }

    free(tinfo);
    exit(EXIT_SUCCESS);
}

执行：

yuxi@ubuntu:~/test/pthread$ ./a.out 
yuxi@ubuntu:~/test/pthread$ ./a.out -s 0x100000 abc def CHA
Thread 3: top of stack near 0x7f7be5184f20; argv_string=CHA
Thread 2: top of stack near 0x7f7be5285f20; argv_string=def
Thread 1: top of stack near 0x7f7be5a74f20; argv_string=abc
Joined with thread 1; returned value was ABC
Joined with thread 2; returned value was DEF
Joined with thread 3; returned value was CHA

参考：

1.Linux下多线程编程详解简介

posted @ 2015-12-23 22:38 yuxi_o 阅读(267) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

线程基础

1、线程与进程比较

2、线程函数

3、线程信号

4、示例

公告