Linux多线程

文章参考：爱编程的大丙 (subingwen.cn)

一. 线程概述

线程是一种轻量级的，在Linux环境下，由于Linux内核起初并未设计线程，只有进程，因此将线程本质上仍是进程。而在实际处理中，进程是操作系统最小的分配资源单位，而线程是操作系统最小的调度执行单位。

区别如下：

空间上：每一个进程都有自己独立的空间，而线程可以多个线程共用一个空间。
- 线程更加节省系统资源，效率上更有保证。
- 一片地址空间上线程独自拥有的是：栈区、寄存器（内核管理）。
- 一片地址空间上线程共享的部分：代码区、堆区、全局数据区、打开的文件。
管理上：线程是程序最小的执行单位，而进程是操作系统分配资源的最小单位：
- 一个进程对应一个虚拟地址空间，而一个虚拟地址空间只能抢一个CPU时间片。
- 一个地址空间中可以有多个线程，因此在有限的自愿基础上，可以抢占更多的CPU时间片。
CPU调度和切换上：线程的上下文切换比进程要快的多。

所谓上下文切换是指：进程/线程在使用CPU时遵循分时复用原则，在切换之前会将上一个人物的状态进行保存，以便下次切换回这个任务是，可以继续该任务。其中任务从保存到再次加载这个过程就是一次上下文切换。线程的启动、退出速度更快，对系统资源的冲击也更小。

线程数量考量：

线程数量并不是越多越好，过多的线程导致频繁的切换，还可能有一些线程一直都抢不到时间片。一般对于线程个数的使用，取决于使用场景：

文件IO操作：文件IO对CPU的使用率不高（CPU包含控制器和运算器，主要负责逻辑控制和运算），因此可以对CPU进行分时复用。当线程个数=CPU核心数*2时，效率最高。
复杂运算：此时对CPU压力较大，线程的个数=CPU的核心数（效率最高）。

二. 创建线程

1. 函数

线程ID：

每一个线程都有一个唯一的ID，其类型为pthread_t，是一个无符号的长整型数，用于表示当前线程的ID。

获取当前线程ID：

#include <pthread.h>
pthread_t pthread_self();	// 返回当前线程的线程ID
// Compile and link with -pthread, 线程库的名字叫pthread, 全名: libpthread.so libptread.a。这是一个linux提供的动态链接库，注意在编译时指明库名

创建：

在一个进程中调用函数创建一个线程，该线程就成为了进程的子线程。需要注意的是：每一个子线程都有一个处理函数，用于指定该子线程的工作。

#include <pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
                   void *(*start_routine) (void *), void *arg);

其中：

thread：传出参数，类型为无符号长整形数，如果线程创建成功，会将新创建的线程的ID写入到这个这个指针指向的内存中。
attr：线程的属性。一般默认即可，即填入NULL。
start_routine：处理函数，类型为函数指针，系统通过指针来调用该函数，从而让子线程进行工作。其返回值和参数类型都是void *，也就是泛型。
arg：处理函数的参数，将会作为实参传递到处理函数中。
-返回值：返回线程是否创建成功。成功返回0，失败会返回相应的错误编号。

2. 生命周期

当前进程创建除子线程后，当前进程就成为了主线程，其生命周期如下：

主线程结束，则子线程也会死亡。因为主线程和子线程共用一片内存，而该内存一开始是是操作系统分配给主线程的，因此当主线程结束后，空间回收了，子线程自然也会随之死亡。
子线程结束，不影响主线程继续运行。同样的道理，内存的存亡取决于主线程，而非子线程。

如何在子线程结束之前，不让主线程结束：

阻塞线程：将主线程阻塞掉。例如使用sleep方法，让线程休眠一会。（注意：线程阻塞后会释放抢占的CPU资源，但不会释放锁资源。而通过wait，让线程进入等待状态，可以让线程释放CPU资源和锁资源。）
线程退出：就是使用pthread_exit()函数，详情见第三节。

3. 实例

代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <unistd.h>

// 子线程任务函数
void* work(void* args){
    printf("我是子线程，ID=%ld\n", pthread_self());
    for (int i = 0; i < 10; ++i) {
        printf("child.i == %d \n", i);
    }
    return NULL;
}

int main(){
   // 创建一个子线程
    pthread_t tid;
    pthread_create(&tid, NULL, work, NULL);
    // 主线程输出
    printf("主线程ID==%ld\n", pthread_self());
    for (int i = 0; i < 10; i++) {
        printf("main.i == %d\n", i);
    }
    sleep(1);   // 位于unistd头文件中的函数，用于线程休眠，单位是秒，防止主线程内存释放过早导致子线程死亡。
    return 0;
}

编译：
```
gcc thread.c -o app 
```
结果发现报错：
```
/usr/bin/ld: /tmp/ccvJmTRf.o: in function `main':
thread.c:(.text+0x8d): undefined reference to `pthread_create'
collect2: error: ld returned 1 exit status
```
原因是pthread.h使用了linux提供的动态库，因此在编译时需要指定动态库的名字（这里因为是linux提供的，也就是说动态库文件已经在相应目录下了，因此无需指定目录），库的名字是：libpthread.so。将名字掐头去尾，因此指令改为：
```
gcc thread.c -o app -l pthread
```

三. 线程退出

1. 概述

在编写多线程程序时，有时我们有如下需求：让线程退出的同时不释放虚拟地址空间（针对主线程），从而避免子线程随之死亡。这时我们就可以使用线程库中的线程退出函数。它可以让线程结束的同时不影响其它线程的正常运行，不论是在主线程还是在子线程中都可以使用。

注意：默认属性的线程执行结束之后并不会立即释放占用的资源，直到整个进程执行结束，所有线程的资源以及整个进程占用的资源才会被操作系统回收。

2. 函数

#include <pthread.h>
void pthread_exit(void *retval);

其中：

retavl：传出参数，用于在线程退出时携带数据，当前子线程的主线程会得到该数据。如果不需要，可以定义为NULL。

3. 实例

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <unistd.h>

// 子线程任务函数
void* work(void* args){
    printf("我是子线程，ID=%ld\n", pthread_self());
    for (int i = 0; i < 10; ++i) {
        if (i == 6) {
            pthread_exit(NULL);
        }
        printf("当前线程ID=%ld,i == %d \n", pthread_self(),i);
    }
    return NULL;
}

int main(){
   // 创建一个子线程
    pthread_t tid;
    pthread_create(&tid, NULL, work, NULL);
    printf("子线程创建成功，ID==%ld\n", tid);
    // 主线程输出
    printf("主线程ID==%ld\n", pthread_self());
    for (int i = 0; i < 10; i++) {
        printf("当前线程ID=%ld, i == %d\n", pthread_self(), i);
    }
    // 主线程通过线程退出函数退出，进程的地址空间不会被释放
    pthread_exit(NULL);
    return 0;
}

四. 线程回收

1. 函数

线程和进程一样，子线程退出的时候其内核资源主要由主线程进行回收，线程库中提供的函数为pthread_join()。

函数原型：

#include <pthread.h>
int pthread_join(pthread_t thread, void **retval);

参数：
- thread：需要回收线程的ID。
- retval：双重指针，是一个传出参数，这个地址中存储了pthread_exit()传递出的数据，如果不需要该参数，可以指定为NULL。
特点：
- 是一个阻塞函数，通过该函数回收一个子线程，如果该子线程还在运行，那么主线程就会被堵塞。
- 该函数一次只能回收一个子线程资源，如果有多个，只能一个一个的回收

2. 回收子线程数据

pthread_join函数可以通过传出参数，获取pthread_exit传出的数据，但问题在于：pthread_exit会让子线程结束，此时子线程的数据还存在吗？如果存在，在哪？如果不存在，又怎么向主线程传输数据？通过下面的讨论，可以得知：

2.1 通过子线程栈

代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <unistd.h>
#include <string.h>

struct Node{
    int id;
    char name[20];
};
// 子线程任务函数
void* work(void* args){
    printf("我是子线程，ID=%ld\n", pthread_self());
    for (int i = 0; i < 10; ++i) {
        if (i == 6) {
            // 将数据存储在栈区
            struct Node node;
            node.id = 2;
            strcpy(node.name, "liSi");
            pthread_exit(&node);
        }
    }
    return NULL; 
}

int main(){
   // 创建一个子线程
    pthread_t tid;
    pthread_create(&tid, NULL, work, NULL);
    printf("子线程创建成功，ID==%ld\n", tid);
    // 主线程输出
    printf("主线程ID==%ld\n", pthread_self());
    // join回收子线程资源
    void *retval = NULL;    // 传出的数据，注意使用void类型
    pthread_join(tid, &retval);
    struct Node *data = (struct Node*)retval;
    printf("子传出数据：id = %d, name = %s\n", data->id, data->name);
    printf("子线程资源成功回收\n");
    return 0;
}

编译运行：

gcc thread.c -o app -l pthread
beasts777@ubuntu:~/Coding/Practice/Thread$ ./app
子线程创建成功，ID==140107111216896
主线程ID==140107111221056
我是子线程，ID=140107111216896
子传出数据：id = 0, name = 		# 可以看到，这里的数据与设定的数据不一致
子线程资源成功回收

此时发现：输出的数据不正确。这是由于在多线程中，多个线程公用一个虚拟地址空间，每个线程在栈区都有一块属于自己的内存。当子线程退出时，该线程在栈内的空间就被回收了，写入到该线程站内的数据自然也就找不到了。

2.2 使用主线程栈

分析：

虽然每个线程都有自己的栈空间，但位于同一个地址空间的多个线程可以互相访问对方的栈空间。因此我们可以让子线程中返回的数据存储在主线程的栈区中，这让即使子线程的栈空间被回收，数据依旧不会丢失。

代码：

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <unistd.h>
#include <string.h>

struct Node{
    int id;
    char name[20];
};
// 子线程任务函数
void* work(void* args){
    // 获取主线程传递过来的参数
    struct Node * node = (struct Node*)args;
    printf("我是子线程，ID=%ld\n", pthread_self());
    for (int i = 0; i < 10; ++i) {
        if (i == 6) {
            // 将数据存储在栈区
            node->id = 2;
            strcpy(node->name, "liSi");
            pthread_exit(node);
        }
    }
    return NULL; 
}

int main(){
   // 创建一个子线程
    pthread_t tid;
    // 主线程在栈空间内开辟一块空间，并交给子线程的工作函数使用。
    struct Node temp;
    pthread_create(&tid, NULL, work, &temp);
    printf("子线程创建成功，ID==%ld\n", tid);
    // 主线程输出
    printf("主线程ID==%ld\n", pthread_self());
    // join回收子线程资源
    void *retval = NULL;    // 传出的数据，注意使用void类型
    pthread_join(tid, &retval);
    struct Node *data = (struct Node*)retval;
    printf("子传出数据：id = %d, name = %s\n", data->id, data->name);
    printf("子线程资源成功回收\n");
    return 0;
}

编译运行：

# 编译运行
gcc thread.c -o app -l pthread
./app
# 输出结果
子线程创建成功，ID==140224493106944
主线程ID==140224493111104
我是子线程，ID=140224493106944
子传出数据：id = 2, name = liSi
子线程资源成功回收

程序执行成功。

2.3 其它方式

使用堆区
使用全局变量

五. 线程分离

1. 需求分析

根据第四节中的描述，主线程使用pthread_join()回收子线程，如果子线程还没有退出，会导致主线程堵塞。但有时主线程有自己的任务，我们不希望主线程被阻塞，这会导致主线程的任务无法顺利进行，怎么办？

线程库中为我们提供了线程分离函数pthread_detach()，调用该函数后，子线程可以和主线程分离，当子线程退出时，其占用的内核资源就被系统的其它进程接管并回收。也就是说，此时子线程的内核资源不再由主线程继续回收，因此主线程也就无需使用pthread_join()函数，用了也会收不到子线程的资源了。

注意：这种分离只是状态上的分离，内存上还是和主线程共用一处，因此如果主线程return导致内存被回收，子线程仍会死亡。

2. 函数

#include <pthread.h>
int pthread_detch(pthread_t thread);

其中：

thread参数：要与主线程分离的子线程ID。
返回值：分离成功为0，分离失败返回错误号。

3. 实例

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <unistd.h>
#include <string.h>

struct Node{
    int id;
    char name[20];
};
// 子线程任务函数
void* work(void* args){
    // 获取主线程传递过来的参数
    printf("我是子线程，ID=%ld\n", pthread_self());
    for (int i = 0; i < 10; ++i) {
        printf("子线程输出：%d\n", i);
    }
    return NULL; 
}

int main(){
   // 创建一个子线程
    pthread_t tid;
    pthread_create(&tid, NULL, work, NULL);
    printf("子线程创建成功，ID==%ld\n", tid);
    // 主线程输出
    printf("主线程ID==%ld\n", pthread_self());
    for (int i = 0; i < 5; ++i) {
        printf("主线程输出：%d\n", i);
    }
    // 线程分离
    pthread_detach(tid);
    // 主线程退出
    pthread_exit(NULL);
    return 0;
}

经测试，运行成功。

六. 其它线程函数

1. 线程取消

1.1 简介

顾名思义，就是在某些特定的情况下在一个线程中杀死另一个线程。函数起作用分为两步：

在线程A中调用线程取消函数pthread_cancel()，杀死线程B，这时候线程B是死不了的。
在线程B中进行一次系统调用（从用户态转到内核态），否则线程B不会被结束。

系统调用：有两种实现方式：

直接调用Linux系统函数。
调用标准C库函数，而有些C库函数会调用相关的系统函数。如printf()，会调用输出的系统函数。

1.2 函数

#include <pthread.h>
int pthread_cancel(pthread_t thread);

其中：

thread参数：要杀死的线程的ID。
返回值：调用成功返回0，调用失败返回错误码。

1.3 实例

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <pthread.h>

// 子线程的处理代码
void* working(void* arg)
{
    int j=0;
    for(int i=0; i<9; ++i)
    {
        j++;
    }
    // 这个函数会调用系统函数, 因此这是个间接的系统调用
    printf("我是子线程, 线程ID: %ld\n", pthread_self());
    for(int i=0; i<9; ++i)
    {
        printf(" child i: %d\n", i);
    }

    return NULL;
}

int main()
{
    // 1. 创建一个子线程
    pthread_t tid;
    pthread_create(&tid, NULL, working, NULL);

    printf("子线程创建成功, 线程ID: %ld\n", tid);
    // 2. 子线程不会执行下边的代码, 主线程执行
    printf("我是主线程, 线程ID: %ld\n", pthread_self());
    for(int i=0; i<3; ++i)
    {
        printf("i = %d\n", i);
    }

    // 杀死子线程, 如果子线程中做系统调用, 子线程就结束了
    pthread_cancel(tid);

    // 让主线程自己退出即可
    pthread_exit(NULL);
    
    return 0;
}

2. 线程比较

Linux中线程ID本质是一个无符号长整形，因此可以使用操作符进行直接比较。但是线程库是可以跨平台使用的，在某些平台上，pthread_t并不是一个单纯的整形，因此为了应对这种情况，在对线程ID进行比较时需要使用比较函数。

#include <pthread.h>
int pthread_equal(pthead_t t1, pthread_t t2);

其中：

t1、t2：参与比较的两个线程的ID。
返回值：两个线程相等返回非0值。如果不相等，返回0。

posted @ 2023-11-22 11:15 BinaryPrinter 阅读(120) 评论(0) 收藏举报

刷新页面返回顶部

beasts777

Linux多线程

一. 线程概述

二. 创建线程

1. 函数

2. 生命周期

3. 实例

三. 线程退出

1. 概述

2. 函数

3. 实例

四. 线程回收

1. 函数

2. 回收子线程数据

2.1 通过子线程栈

2.2 使用主线程栈

2.3 其它方式

五. 线程分离

1. 需求分析

2. 函数

3. 实例

六. 其它线程函数

1. 线程取消

1.1 简介

1.2 函数

1.3 实例

2. 线程比较

公告