BERT预训练tensorflow模型转换为pytorch模型

2022/3/20 23:27:55

本文主要是介绍BERT预训练tensorflow模型转换为pytorch模型,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

在Bert的预训练模型中,主流的模型都是以tensorflow的形势开源的。但是huggingface在Transformers中提供了一份可以转换的接口(convert_bert_original_tf_checkpoint_to_pytorch.py)。
但是如何在windows的IDE中执行呢?

  • 首先,需要安装transformers (可以挂国内清华、豆瓣源之类的加速)
pip install transformers
  • 其次,下载tf版本的bert预训练模型goole的预训练模型,下载的模型文件解压后如下:
    image
  • 写tf2torch.py脚本且放在模型同目录中,脚本内容如下:
    image
import transformers.models.bert.convert_bert_original_tf_checkpoint_to_pytorch as con


con.convert_tf_checkpoint_to_pytorch(
    r'.\bert_model.ckpt',
    r'.\bert_config.json',
    r'.\pytorch_bert.bin'
)

convert_tf_checkpoint_to_pytorch中三个参数分别是:bert模型名称、config文件地址,输出的pytorch文件保存地址

  • 然后运行tf2torch.py文件得到如下文件,多了一个pytorch_bert.bin文件
    image
  • 最后注意:可以忽略TensorFlow checkpoint(以bert_model.ckpt开头的三个文件),但是一定要保留配置文件(bert_config.json)和词汇表文件(vocab.txt),因为PyTorch模型也需要这些文件。


这篇关于BERT预训练tensorflow模型转换为pytorch模型的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程