Linux 获取线程id

目录

    Linux中,我们知道getpid(2) 可以获取调用进程的pid,那么如何获取一个线程的id呢

    可以用系统调用gettid(2)获取内核中的线程id ,POSIX线程库提供的pthread_self(3)方法获取分配的线程id。C++11 std::thread的get_id()方法,封装的也是POSIX pthread线程库的线程id。

    内核中的线程id,与pthread线程库的线程id有何区别?
    在Linux中,线程本质上是一个进程(实现),也就是说,通过系统调用gettid获取的线程id跟进程id是一样的。

    glibc的Pthreads实现,把pthread_self返回值类型pthread_t用作一个结构体指针(类型为unsigned long),指向一个动态分配的内存,而且该内存是反复使用的。这也就是说,pthread_t的值很容易重复。Pthreads只能保证同一个进程内,同一时刻的各个线程id不同;但不能保证同一进程先后多个线程具有不同id,不能保证一台机器上多个进程间的id不同。

    因此,pthread_t不适合作为程序中对线程的标识符。建议用gettid(2)系统调用返回值作为线程id,好处在于:

    • 类型是pid_t,其值是一个小整数(最大值/proc/sys/kernel/pid_max,默认32768),便于log输出;
    • 表示内核的任务调度id,在/proc文件系统中,可以找到对应项:/proc/tid,或/prod/pid/task/tid;
    • 在其他系统工具中容易定位到具体某个线程,如top(1)命令中,可以按线程列出任务,然后找出CPU使用率最高的线程id,再根据log判断到底哪个线程在耗费CPU;
    • 任何时刻都是全局唯一的,且由于Linux分配新pid采用递增轮回办法,短时间内启动的多个线程也会具有不同的线程id;
    • 0是非法值,因为操作系统的第一个进程init的pid是1,而gettid采用的线程tid本质上是进程pid,因此不能再为1。

    示例

    // 通过pthread线程库获取tid
    void* threadFunc(void* arg)
    {
        pthread_t id = pthread_self(); // 获取Pthreads线程id
        printf("pthread id=%lx\n", id);
    }
    int main()
    {
        pthread_t th;
        pthread_create(&th, NULL, threadFunc, NULL);
        pthread_join(th, NULL);
        return 0;
    }
    
    // C++11 std::thread通过get_id获取tid
    void threadFunc()
    {
        cout << th.get_id() << endl; // 获取Pthreads线程id
    }
    int main()
    {
        std::thread th(threadFunc);
        th.join();
        return 0;
    }
    
    // 通过系统调用gettid获取线程id
    pid_t gettid()
    {
        return static_cast<pid_t>(::syscall(SYS_gettid));
    }
    

    利用thread local缓存线程id
    由于系统调用会陷入内核,频繁系统调用可能会影响系统性能,有没有办法可以避免这个问题?
    答案是有的。考虑到线程id在线程创建后,并不会随意改变,因此可以用每个线程自带的thread local(__thread)变量来缓存其线程id值,初值设为0或负数即可。

    // C++11 利用__thread缓存线程id
    __thread int t_tid = 0;
    
    // 用户接口:获取线程id
    inline int tid()
    {
        if (t_tid == 0)
        {
            cacheTid();
        }
        return t_tid;
    }
    
    void cacheTid()
    {
        if (t_tid == 0)
        {
            t_tid = gettid();
        }
    }
    
    // 通过系统调用gettid获取线程id
    pid_t gettid()
    {
        return static_cast<pid_t>(::syscall(SYS_gettid));
    }
    

    参考
    [1]陈硕. Linux多线程服务端编程:使用muduo C++网络库[M]. 电子工业出版社, 2013.

    posted @ 2022-02-24 10:22  明明1109  阅读(7496)  评论(0编辑  收藏  举报