Linux 获取线程id
目录
Linux中,我们知道getpid(2) 可以获取调用进程的pid,那么如何获取一个线程的id呢?
1)系统调用gettid(2)获取内核中的线程id ;
2)POSIX线程库提供的pthread_self(3)方法获取分配的线程id;
3)C++11 std::thread的get_id()方法,封装的也是POSIX pthread线程库的线程id。
内核中的线程id,与pthread线程库的线程id有何区别?
Linux中,线程本质是一个进程(实现),i.e. 通过系统调用gettid获取的线程id跟进程id一样。
glibc的Pthreads实现,把pthread_self返回值类型pthread_t用作一个结构体指针(类型unsigned long),指向一个动态分配的内存,而且内存是反复使用的。i.e. pthread_t的值容易重复。Pthreads只能保证同一进程内,同一时刻的各个线程id不同,但不能保证同一进程先后多个线程具有不同id,不能保证一台机器上多个进程间的id不同。
因此,pthread_t不适合作为程序中对线程的标识符。建议用gettid(2)系统调用返回值作为线程id,好处:
- 类型pid_t,值小整数(最大值/proc/sys/kernel/pid_max,默认32768),便于log输出;
- 表示内核的任务调度id,在/proc文件系统中,对应项:/proc/tid,或/prod/pid/task/tid;
- 在其他系统工具中容易定位到具体某个线程,如top(1)命令中,可按线程列出任务,然后找出CPU使用率最高的线程id,再根据log判断到底哪个线程在耗费CPU;
- 任何时刻都是全局唯一的,且由于Linux分配新pid采用递增轮回办法,短时间内启动的多个线程会具有不同的线程id;
- 1是非法值,因为操作系统的第一个进程init的pid是1,而gettid采用的线程tid本质是进程pid,因此不能再为1。
示例
// 通过pthread线程库获取tid
void* threadFunc(void* arg)
{
pthread_t id = pthread_self(); // 获取Pthreads线程id
printf("pthread id=%lx\n", id);
}
int main()
{
pthread_t th;
pthread_create(&th, NULL, threadFunc, NULL);
pthread_join(th, NULL);
return 0;
}
// C++11 std::thread通过get_id获取tid
void threadFunc()
{
cout << th.get_id() << endl; // 获取Pthreads线程id
}
int main()
{
std::thread th(threadFunc);
th.join();
return 0;
}
// 通过系统调用gettid获取线程id
pid_t gettid()
{
return static_cast<pid_t>(::syscall(SYS_gettid));
}
利用thread local缓存线程id
由于系统调用会陷入内核,频繁系统调用可能会影响系统性能。有无办法避免该问题?
答案:有。考虑到线程id在线程创建后,并不会随意改变,因此可用每个线程自带的thread local (__thread)变量来缓存其线程id值,初值设为0或负数即可。
// C++11 利用__thread缓存线程id
__thread int t_tid = 0;
// 用户接口:获取线程id
inline int tid()
{
if (t_tid == 0)
{
cacheTid();
}
return t_tid;
}
void cacheTid()
{
if (t_tid == 0)
{
t_tid = gettid();
}
}
// 通过系统调用gettid获取线程id
pid_t gettid()
{
return static_cast<pid_t>(::syscall(SYS_gettid));
}
参考
[1]陈硕. Linux多线程服务端编程:使用muduo C++网络库[M]. 电子工业出版社, 2013.