Fork me on GitHub
摘要: 一般使用transformers做bert finetune时,经常会编写如下类似的代码: 在BertModel(BertPreTrainedModel)中,对返回值outputs的解释如下: 这里的pooler_output指的是输出序列最后一个隐层,即CLS标签。查看forward函数的源码,最 阅读全文
posted @ 2020-01-08 18:04 webberg 阅读(6690) 评论(5) 推荐(1) 编辑