Linux 线程局部存储

Linux有2种方法可以实现线程局部存储:
1)使用NTPL提供的函数;
2)使用编译器扩展的__thread关键字。

NPTL(Native POSIX Thread Library),顾名思义,本地POSIX线程库。

1. 使用NPTL库函数实现线程局部存储

NPTL提供实现线程局部存储功能的接口:

#include <pthread.h>

int pthread_key_create(pthread_key_t* key, void (*destructor)(void*));

int pthread_key_delete(pthread_key_t key);

int pthread_setspecific(pthread_key_t key, const void* value);

void* pthread_getspecific(pthread_key_t key);

pthread_key_create 为线程局部存储创建一个新键,并通过给key赋值,返回给用户。而参数key需要给进程中所有线程使用,因此key应指向一个全局变量。

参数destructor指向一个自定义函数,主要用于释放value指向的资源:

void destructor(void *value)
{
    // 释放value指向的资源
}

pthread_key_delete 删除由pthread_key_create 创建的线程局部存储的数据。参数key由pthread_key_create 赋值。

pthread_setspecific和pthread_getspecific用于线程局部数据管理:
pthread_getspecific返回绑定到key绑定的value;
pthread_setspecific用于绑定value到key。
key由pthread_key_create 创建,不同的线程可以绑定不同的value到相同的key。
而value是一个指向动态分配的内存块,为调用线程独有。

NPTL创建线程局部存储过程

NPTL实现下,一个进程中,由pthread_key_create 创建的key(对应一个槽位)最多1024个。pthread_key_create 调用成功时,会将一个<1024的值,填入第一个传入参数key指向的pthread_key_t变量中。
也就是说,记录槽位分配区块的数据结构pthread_keys是进程唯一的。槽位初始值为0。

一个1024个槽位:pthread_keys[0...1023]。

此时,各线程还没数据和该key相关联。接下来,需要用pthread_setspecific绑定key和线程关联的数据,用pthread_getspecific得到与key绑定的、跟线程关联的数据。

示例:
使用NPTL创建的线程局部存储,分别在多个线程中设置、访问,并写入文件。

#include <malloc.h>
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>

/* 为每个线程保存文件指针的TSD键值,根据键值可以找到线程各自的Data */
static pthread_key_t thread_log_key;

void write_to_thread_log(const char* message)
{
    FILE* thread_log = (FILE*) pthread_getspecific(thread_log_key);
    fprintf(thread_log, "%s\n", message);
}

void fn_close_thread_log(void* thread_log)
{
    fclose((FILE*)thread_log);
}

void* thread_function(void* arg)
{
    char thread_log_filename[128];
    FILE* thread_log;

    snprintf(thread_log_filename, sizeof(thread_log_filename),
             "thread%ld.log", (unsigned long)pthread_self());
    thread_log = fopen(thread_log_filename, "w");

    /* 将文件指针保存在thread_log_key标识的TSD中 */
    pthread_setspecific(thread_log_key, thread_log);

    write_to_thread_log("Thread starting.");
    return NULL;
}

int main()
{
    int i;
    pthread_t threads[5];

    pthread_key_create(&thread_log_key, fn_close_thread_log);
    for (i = 0; i < 5; ++i) {
        pthread_create(&(threads[i]), NULL, thread_function, NULL);
    }

    for (i = 0; i < 5; ++i) {
        pthread_join(threads[i], NULL);
    }
    return 0;
}

运行结果:
在可执行目标文件所指目录中,生成多个线程对应的文件,每个文件名对应一个线程tid。

2. 使用__thread实现线程局部存储

NTPL提供的函数太过繁琐,有人想到在编译器中添加通过添加关键字__thread,以增进新功能,隐式构造线程局部变量。
例如,下面的声明,表示val在当前进程的每个线程中,都会有该变量的一个拷贝,直到线程退出为止。

__thread int val = 0;

有几点需要注意:

  • 如果变量声明中用来关键字static extern,那么关键字__thread应该紧随其后。
  • 声明时,可以正常初始化。
  • 可以通过取地址操作符(&),获取到线程局部变量的地址。

将1)中使用NPTL实现线程局部存储的示例,用__thread改写:

#include <malloc.h>
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>

__thread FILE* thread_log = NULL;
void write_to_thread_log(const char* message)
{
    fprintf(thread_log, "%s\n", message);
}

void *thread_function(void* arg)
{
    char thread_log_filename[128];
    sprintf(thread_log_filename, "thread%ld.log", (unsigned long)pthread_self());

    thread_log = fopen(thread_log_filename, "w");
    write_to_thread_log("Thread starting.");

    fclose(thread_log);
    return NULL;
}

int main()
{
    int i;
    pthread_t threads[5];

    for (i = 0; i < 5; ++i)
        pthread_create(&(threads[i]), NULL, thread_function, NULL);
    for (i = 0; i < 5; ++i)
        pthread_join(threads[i], NULL);
    return 0;
}

3. C++中通过ThreadLocal实现封装线程局部存储

自定义一个class ThreadLocal,用RAII方式管理pthread_key,以简化线程局部存储的使用。

template <typename T>
class ThreadLocal : noncopyable
{
public:
    ThreadLocal()
    {
        pthread_key_create(&pkey_, &ThreadLocal::destructor);
    }

    ~ThreadLocal()
    {
        pthread_key_delete(pkey_);
    }

    T& value()
    {
        T* perThreadValue = static_cast<T*>(pthread_getspecific(pkey_));
        if (!perThreadValue)
        {
            T* newObj = new T();
            pthread_setspecific(pkey_, newObj);
            perThreadValue = newObj;
        }
        return *perThreadValue;
    }

private:
    static void destructor(void *x)
    {
        T* obj = static_cast<T*>(x);
        typedef char T_must_be_complete_type[sizeof(T) == 0 ? -1 : 1];
        T_must_be_complete_type dummy; (void)dummy;
        delete obj;
    }

    pthread_key_t pkey_;
};

使用ThreadLocal,为每个线程分配一个局部存储class Test,包装了名称字符串(name_)

#include "muduo/base/ThreadLocal.h"
#include "muduo/base/CurrentThread.h"
#include "muduo/base/Thread.h"

#include <stdio.h>

class Test : muduo::noncopyable
{
public:
    Test()
    {
        printf("tid=%d, constructing %p\n", muduo::CurrentThread::tid(), this);
    }
    ~Test()
    {
        printf("tid=%d, destructing %p %s\n", muduo::CurrentThread::tid(), this, name_.c_str());
    }

    const muduo::string& name() const { return name_; }
    void setName(const muduo::string& n) { name_ = n; }


private:
    muduo::string name_;
};

muduo::ThreadLocal<Test> t_testObj1;
muduo::ThreadLocal<Test> t_testObj2;

void print()
{
    printf("tid=%d, obj1 %p name=%s\n",
           muduo::CurrentThread::tid(),
           &t_testObj1.value(),
           t_testObj1.value().name().c_str());
    printf("tid=%d, obj2 %p name=%s\n",
           muduo::CurrentThread::tid(),
           &t_testObj2.value(),
           t_testObj2.value().name().c_str());
}

void threadFunc()
{
    print();
    t_testObj1.value().setName("changed 1");
    t_testObj2.value().setName("changed 2");
    print();
}

int main()
{
    t_testObj1.value().setName("main one");
    print();
    muduo::Thread t1(threadFunc);
    t1.start();
    t1.join();
    t_testObj2.value().setName("main two");
    print();
    return 0;
}

运行结果:
ThreadLocal变量,虽然名称一样,在main线程和t1线程中,存储的空间和值是不一样的。

tid=104305, constructing 0x19d2c50
tid=104305, obj1 0x19d2c50 name=main one
tid=104305, constructing 0x19d2c70
tid=104305, obj2 0x19d2c70 name=

tid=104306, constructing 0x7f7c300008c0
tid=104306, obj1 0x7f7c300008c0 name=
tid=104306, constructing 0x7f7c300008e0
tid=104306, obj2 0x7f7c300008e0 name=
tid=104306, obj1 0x7f7c300008c0 name=changed 1
tid=104306, obj2 0x7f7c300008e0 name=changed 2
tid=104306, destructing 0x7f7c300008c0 changed 1
tid=104306, destructing 0x7f7c300008e0 changed 2

tid=104305, obj1 0x19d2c50 name=main one
tid=104305, obj2 0x19d2c70 name=main two

4. 线程单例对象ThreadLocalSingleton

结合前面的单例对象,如何让每个线程拥有同一个类的不同单例对象?
可以用ThreadLocalSingleton类,所有线程共享一个ThreadLocalSingleton::instance,但每个线程都持有一个不同的t_value_(线程局部存储,NPTL实现的TSD)。

template<typename T>
class ThreadLocalSingleton : noncopyable
{
public:
    static T& instance()
    {
        if (!t_value_)
        {
            t_value_ = new T();
            deleter_.set(t_value_);
        }
        return *t_value_;
    }

    static T* pointer()
    {
        return t_value_;
    }

private:
    ThreadLocalSingleton();
    ~ThreadLocalSingleton();
    
    static void destructor(void* obj)
    {
        assert(obj == t_value_ );
        typedef char T_must_be_complete_type[sizeof(T) == 0 ? -1 : 1];
        T_must_be_complete_type dummy; (void) dummy;
        delete t_value_;
        t_value_ = 0;
    }

    class Deleter
    {
    public:
        Deleter()
        {
            pthread_key_create(&pkey_, &ThreadLocalSingleton::destructor);
        }

        ~Deleter()
        {
            pthread_key_delete(pkey_);
        }

        void set(T* newObj)
        {
            assert(pthread_getspecific(pkey_) == NULL);
            pthread_setspecific(pkey_, newObj);
        }

        pthread_key_t pkey_;
    };

    static __thread T* t_value_;
    static Deleter deleter_;
};

// static变量定义, 类内只是声明
template<typename T>
__thread * ThreadLocalSingleton<T>::t_value_ = 0;

template<typename T>
typename ThreadLocalSingleton<T>::Deleter ThreadLocalSingleton<T>::deleter_;

使用ThreadLocalSingleton

void threadFunc(const char* changeTo)
{
    printf("tid=%d, %p name=%s\n", 
            muduo::CurrentThread::tid(),
            &muduo::ThreadLocalSingleton<Test>::instance(),
            muduo::ThreadLocalSingleton<Test>::instance().name().c_str());
    muduo::ThreadLocalSingleton<Test>::instance().setName(changeTo)
    printf("tid=%d, %p name=%s\n", 
            muduo::CurrentThread::tid(),
            &muduo::ThreadLocalSingleton<Test>::instance(),
            muduo::ThreadLocalSingleton<Test>::instance().name.c_str());
// 没必要手动delete
// muduo::ThreadLocalSingleton<Test>::destructor(); 会销毁
}

int main()
{
    muduo::ThreadLocalSingleton<Test>::instance().setName("main one");
    muduo::Thread t1(std::bind(threadFunc, "thread1"));
    muduo::Thread t2(std::bind(threadFunc, "thread2"));
    t1.start();
    t2.start();
    t1.join();
    printf("tid=%d, %p name=%s\n",
            muduo::CurrentThread::tid(),
            &muduo::ThreadLocalSingleton<Test>::instance(),
            muduo::ThreadLocalSingleton<Test>::instance().name().c_str());
    t2.join();
    return 0;
}

小结

对于线程本地存储TLS,什么时候使用NPTL库提供的TSD机制,什么使用__thread?
NPTL库提供的TSD机制,更通用。对于POD数据类型,可以用__thread。

参考

[1]高峰, 李彬. Linux环境编程:从应用到内核[M]. 机械工业出版社, 2016.
[2]陈硕. Linux多线程服务端编程:使用muduo C++网络库[M]. 电子工业出版社, 2013.

posted @ 2022-02-24 23:24  明明1109  阅读(381)  评论(0编辑  收藏  举报