BERT预训练tensorflow模型转换为pytorch模型

在Bert的预训练模型中,主流的模型都是以tensorflow的形势开源的。但是huggingface在Transformers中提供了一份可以转换的接口(convert_bert_original_tf_checkpoint_to_pytorch.py)。
但是如何在windows的IDE中执行呢?

  • 首先,需要安装transformers (可以挂国内清华、豆瓣源之类的加速)
pip install transformers
  • 其次,下载tf版本的bert预训练模型goole的预训练模型,下载的模型文件解压后如下:
    image
  • 写tf2torch.py脚本且放在模型同目录中,脚本内容如下:
    image
import transformers.models.bert.convert_bert_original_tf_checkpoint_to_pytorch as con


con.convert_tf_checkpoint_to_pytorch(
    r'.\bert_model.ckpt',
    r'.\bert_config.json',
    r'.\pytorch_bert.bin'
)

convert_tf_checkpoint_to_pytorch中三个参数分别是:bert模型名称、config文件地址,输出的pytorch文件保存地址

  • 然后运行tf2torch.py文件得到如下文件,多了一个pytorch_bert.bin文件
    image
  • 最后注意:可以忽略TensorFlow checkpoint(以bert_model.ckpt开头的三个文件),但是一定要保留配置文件(bert_config.json)和词汇表文件(vocab.txt),因为PyTorch模型也需要这些文件。
posted @ 2022-03-20 22:54  时光如你般美好  阅读(1138)  评论(0编辑  收藏  举报