Transformers--4-37-中文文档-二十四-

Transformers 4.37 中文文档（二十四）

原文：huggingface.co/docs/transformers

MPNet

原文链接：huggingface.co/docs/transformers/v4.37.2/en/model_doc/mpnet

概述

MPNet 模型由 Kaitao Song，Xu Tan，Tao Qin，Jianfeng Lu，Tie-Yan Liu 在MPNet: Masked and Permuted Pre-training for Language Understanding中提出。

MPNet 采用一种新颖的预训练方法，称为掩码和置换语言建模，以继承掩码语言建模和置换语言建模在自然语言理解方面的优势。

该论文的摘要如下：

BERT 采用了掩码语言建模（MLM）进行预训练，是最成功的预训练模型之一。由于 BERT 忽略了预测标记之间的依赖关系，XLNet 引入了置换语言建模（PLM）进行预训练以解决这个问题。然而，XLNet 没有利用句子的完整位置信息，因此在预训练和微调之间存在位置差异。在本文中，我们提出了 MPNet，一种新颖的预训练方法，继承了 BERT 和 XLNet 的优势，并避免了它们的局限性。MPNet 通过置换语言建模（与 BERT 中的 MLM 相比）利用了预测标记之间的依赖关系，并将辅助位置信息作为输入，使模型看到完整的句子，从而减少位置差异（与 XLNet 中的 PLM 相比）。我们在大规模数据集（超过 160GB 文本语料库）上对 MPNet 进行预训练，并在各种下游任务（GLUE，SQuAD 等）上进行微调。实验结果表明，MPNet 在这些任务上的表现远远优于 MLM 和 PLM，并在相同的模型设置下与先前最先进的预训练方法（例如 BERT，XLNet，RoBERTa）相比取得了更好的结果。

原始代码可以在这里找到。

使用提示

MPNet 没有token_type_ids，您不需要指示哪个标记属于哪个段落。只需用分隔标记tokenizer.sep_token（或[sep]）分隔您的段落。

资源

文本分类任务指南
标记分类任务指南
问答任务指南
掩码语言建模任务指南
多项选择任务指南

龙哥盟

掠夺·扩张·投机·博弈

Transformers--4-37-中文文档-二十四-

Transformers 4.37 中文文档（二十四）

MPNet

概述

使用提示

资源

MPNetConfig

class transformers.MPNetConfig

MPNetTokenizer

class transformers.MPNetTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

save_vocabulary

MPNetTokenizerFast

class transformers.MPNetTokenizerFast

create_token_type_ids_from_sequences

MPNetModel

class transformers.MPNetModel

forward

MPNetForMaskedLM

class transformers.MPNetForMaskedLM

forward

MPNetForSequenceClassification

class transformers.MPNetForSequenceClassification

forward

MPNetForMultipleChoice

class transformers.MPNetForMultipleChoice

forward

MPNetForTokenClassification

class transformers.MPNetForTokenClassification

forward

MPNetForQuestionAnswering

class transformers.MPNetForQuestionAnswering

forward

TFMPNetModel

class transformers.TFMPNetModel

call

TFMPNetForMaskedLM

class transformers.TFMPNetForMaskedLM

call

TFMPNetForSequenceClassification

class transformers.TFMPNetForSequenceClassification

call

TFMPNetForMultipleChoice

class transformers.TFMPNetForMultipleChoice

call

TFMPNetForTokenClassification

class transformers.TFMPNetForTokenClassification

call

TFMPNetForQuestionAnswering

class transformers.TFMPNetForQuestionAnswering

call

MPT

概述

使用提示

资源

MptConfig

class transformers.MptConfig

MptModel

class transformers.MptModel

forward

MptForCausalLM

class transformers.MptForCausalLM

MptForSequenceClassification

class transformers.MptForSequenceClassification

forward

MptForTokenClassification

class transformers.MptForTokenClassification

forward

MptForQuestionAnswering

class transformers.MptForQuestionAnswering

forward

MRA

概述

MraConfig

class transformers.MraConfig

MraModel

`class transformers.MPNetConfig`

`class transformers.MPNetTokenizer`

`build_inputs_with_special_tokens`

`get_special_tokens_mask`

`create_token_type_ids_from_sequences`

`save_vocabulary`

`class transformers.MPNetTokenizerFast`

`create_token_type_ids_from_sequences`

`class transformers.MPNetModel`

`forward`

`class transformers.MPNetForMaskedLM`

`forward`

`class transformers.MPNetForSequenceClassification`

`forward`

`class transformers.MPNetForMultipleChoice`

`forward`

`class transformers.MPNetForTokenClassification`

`forward`

`class transformers.MPNetForQuestionAnswering`

`forward`

`class transformers.TFMPNetModel`

`call`

`class transformers.TFMPNetForMaskedLM`

`call`

`class transformers.TFMPNetForSequenceClassification`

`call`

`class transformers.TFMPNetForMultipleChoice`

`call`

`class transformers.TFMPNetForTokenClassification`

`call`

`class transformers.TFMPNetForQuestionAnswering`

`call`

`class transformers.MptConfig`

`class transformers.MptModel`

`forward`

`class transformers.MptForCausalLM`

`class transformers.MptForSequenceClassification`

`forward`

`class transformers.MptForTokenClassification`

`forward`

`class transformers.MptForQuestionAnswering`

`forward`

`class transformers.MraConfig`

`class transformers.MraModel`

`forward`

`class transformers.MraForMaskedLM`

`forward`

`class transformers.MraForSequenceClassification`

`前向`

`class transformers.MraForMultipleChoice`

`forward`

`class transformers.MraForTokenClassification`

`forward`

`class transformers.MraForQuestionAnswering`

`forward`

`class transformers.MT5Config`

`class transformers.T5Tokenizer`

`build_inputs_with_special_tokens`

`convert_tokens_to_string`

`create_token_type_ids_from_sequences`

`get_special_tokens_mask`

`tokenize`

`class transformers.T5TokenizerFast`

`build_inputs_with_special_tokens`

`create_token_type_ids_from_sequences`

`class transformers.MT5Model`

`deparallelize`

`forward`

`parallelize`

`class transformers.MT5ForConditionalGeneration`

`deparallelize`

`forward`

`parallelize`

`class transformers.MT5EncoderModel`

`deparallelize`

`forward`

`parallelize`

`class transformers.MT5ForSequenceClassification`

`forward`

`class transformers.MT5ForQuestionAnswering`