Linux 获取线程id

Linux中，我们知道getpid(2) 可以获取调用进程的pid，那么如何获取一个线程的id呢？

1）系统调用gettid(2)获取内核中的线程id ；
2）POSIX线程库提供的pthread_self(3)方法获取分配的线程id；
3）C++11 std::thread的get_id()方法，封装的也是POSIX pthread线程库的线程id。

内核中的线程id，与pthread线程库的线程id有何区别？

Linux中，线程本质是一个进程（实现），i.e. 通过系统调用gettid获取的线程id跟进程id一样。

glibc的Pthreads实现，把pthread_self返回值类型pthread_t用作一个结构体指针（类型unsigned long），指向一个动态分配的内存，而且内存是反复使用的。i.e. pthread_t的值容易重复。Pthreads只能保证同一进程内，同一时刻的各个线程id不同，但不能保证同一进程先后多个线程具有不同id，不能保证一台机器上多个进程间的id不同。

因此，pthread_t不适合作为程序中对线程的标识符。建议用gettid(2)系统调用返回值作为线程id，好处：

类型pid_t，值小整数（最大值/proc/sys/kernel/pid_max，默认32768），便于log输出；
表示内核的任务调度id，在/proc文件系统中，对应项：/proc/tid，或/prod/pid/task/tid；
在其他系统工具中容易定位到具体某个线程，如top(1)命令中，可按线程列出任务，然后找出CPU使用率最高的线程id，再根据log判断到底哪个线程在耗费CPU；
任何时刻都是全局唯一的，且由于Linux分配新pid采用递增轮回办法，短时间内启动的多个线程会具有不同的线程id；
1是非法值，因为操作系统的第一个进程init的pid是1，而gettid采用的线程tid本质是进程pid，因此不能再为1。

示例

// 通过pthread线程库获取tid
void* threadFunc(void* arg)
{
    pthread_t id = pthread_self(); // 获取Pthreads线程id
    printf("pthread id=%lx\n", id);
}
int main()
{
    pthread_t th;
    pthread_create(&th, NULL, threadFunc, NULL);
    pthread_join(th, NULL);
    return 0;
}

// C++11 std::thread通过get_id获取tid
void threadFunc()
{
    cout << th.get_id() << endl; // 获取Pthreads线程id
}
int main()
{
    std::thread th(threadFunc);
    th.join();
    return 0;
}

// 通过系统调用gettid获取线程id
pid_t gettid()
{
    return static_cast<pid_t>(::syscall(SYS_gettid));
}

利用thread local缓存线程id
由于系统调用会陷入内核，频繁系统调用可能会影响系统性能。有无办法避免该问题？
答案：有。考虑到线程id在线程创建后，并不会随意改变，因此可用每个线程自带的thread local (__thread)变量来缓存其线程id值，初值设为0或负数即可。

// C++11 利用__thread缓存线程id
__thread int t_tid = 0;

// 用户接口：获取线程id
inline int tid()
{
    if (t_tid == 0)
    {
        cacheTid();
    }
    return t_tid;
}

void cacheTid()
{
    if (t_tid == 0)
    {
        t_tid = gettid();
    }
}

// 通过系统调用gettid获取线程id
pid_t gettid()
{
    return static_cast<pid_t>(::syscall(SYS_gettid));
}

参考
[1]陈硕. Linux多线程服务端编程:使用muduo C++网络库[M]. 电子工业出版社, 2013.

posted @ 2022-02-24 10:22 明明1109 阅读(7702) 评论(0) 编辑收藏举报

刷新页面返回顶部

明明1109

Linux 获取线程id

公告