Transformers--4-37-中文文档-十七-

Transformers 4.37 中文文档（十七）

原文：huggingface.co/docs/transformers

ErnieM

原始文本：huggingface.co/docs/transformers/v4.37.2/en/model_doc/ernie_m

概述

ErnieM 模型是由欧阳璇、王硕欢、庞超、孙宇、田浩、吴华、王海峰在ERNIE-M:通过将跨语言语义与单语语料库对齐来增强多语言表示中提出的。

论文摘要如下：

最近的研究表明，预训练的跨语言模型在下游跨语言任务中取得了令人印象深刻的性能。这种改进得益于学习大量的单语和平行语料库。尽管普遍认为平行语料对于提高模型性能至关重要，但现有方法往往受到平行语料规模的限制，特别是对于低资源语言。在本文中，我们提出了 ERNIE-M，一种新的训练方法，鼓励模型将多种语言的表示与单语语料库对齐，以克服平行语料规模对模型性能的限制。我们的关键见解是将反向翻译集成到预训练过程中。我们在单语语料库上生成伪平行句对，以便学习不同语言之间的语义对齐，从而增强跨语言模型的语义建模。实验结果表明，ERNIE-M 优于现有的跨语言模型，并在各种跨语言下游任务中取得了新的最先进结果。此模型由Susnato Dhar贡献。原始代码可以在这里找到。

使用提示

Ernie-M 是类似 BERT 的模型，因此是堆叠的 Transformer 编码器。
作者们没有像 BERT 那样使用 MaskedLM 进行预训练，而是使用了两种新技术：交叉注意力遮蔽语言建模和反向翻译遮蔽语言建模。目前这两个 LMHead 目标在这里没有实现。
这是一个多语言语言模型。
下一句预测在预训练过程中没有使用。

资源

文本分类任务指南
标记分类任务指南
问答任务指南
多项选择任务指南

龙哥盟

掠夺·扩张·投机·博弈

Transformers--4-37-中文文档-十七-

Transformers 4.37 中文文档（十七）

ErnieM

概述

使用提示

资源

ErnieM 配置

class transformers.ErnieMConfig

ErnieMTokenizer

class transformers.ErnieMTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

save_vocabulary

ErnieMModel

class transformers.ErnieMModel

forward

ErnieMForSequenceClassification

class transformers.ErnieMForSequenceClassification

forward

ErnieMForMultipleChoice

class transformers.ErnieMForMultipleChoice

forward

ErnieMForTokenClassification

class transformers.ErnieMForTokenClassification

forward

ErnieM 用于问答

class transformers.ErnieMForQuestionAnswering

forward

ErnieMForInformationExtraction

class transformers.ErnieMForInformationExtraction

forward

ESM

概述

使用提示

资源

EsmConfig

class transformers.EsmConfig

to_dict

EsmTokenizer

class transformers.EsmTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

save_vocabulary

EsmModel

类 transformers.EsmModel

前进

EsmForMaskedLM

class transformers.EsmForMaskedLM

forward

EsmForSequenceClassification

class transformers.EsmForSequenceClassification

forward

EsmForTokenClassification

class transformers.EsmForTokenClassification

forward

EsmForProteinFolding

class transformers.EsmForProteinFolding

forward

TFEsmModel

class transformers.TFEsmModel

call

TFEsmForMaskedLM

class transformers.TFEsmForMaskedLM

call

TFEsmForSequenceClassification

class transformers.TFEsmForSequenceClassification

call

TFEsmForTokenClassification

class transformers.TFEsmForTokenClassification

call

Falcon

概述

转换自定义检查点

FalconConfig

class transformers.FalconConfig

FalconModel

`class transformers.ErnieMConfig`

`class transformers.ErnieMTokenizer`

`build_inputs_with_special_tokens`

`get_special_tokens_mask`

`create_token_type_ids_from_sequences`

`save_vocabulary`

`class transformers.ErnieMModel`

`forward`

`class transformers.ErnieMForSequenceClassification`

`forward`

`class transformers.ErnieMForMultipleChoice`

`forward`

`class transformers.ErnieMForTokenClassification`

`forward`

`class transformers.ErnieMForQuestionAnswering`

`forward`

`class transformers.ErnieMForInformationExtraction`

`forward`

`class transformers.EsmConfig`

`to_dict`

`class transformers.EsmTokenizer`

`build_inputs_with_special_tokens`

`get_special_tokens_mask`

`create_token_type_ids_from_sequences`

`save_vocabulary`

`类 transformers.EsmModel`

`前进`

`class transformers.EsmForMaskedLM`

`forward`

`class transformers.EsmForSequenceClassification`

`forward`

`class transformers.EsmForTokenClassification`

`forward`

`class transformers.EsmForProteinFolding`

`forward`

`class transformers.TFEsmModel`

`call`

`class transformers.TFEsmForMaskedLM`

`call`

`class transformers.TFEsmForSequenceClassification`

`call`

`class transformers.TFEsmForTokenClassification`

`call`

`class transformers.FalconConfig`

`class transformers.FalconModel`

`forward`

`class transformers.FalconForCausalLM`

`forward`

`class transformers.FalconForSequenceClassification`

`forward`

`class transformers.FalconForTokenClassification`

`forward`

`class transformers.FalconForQuestionAnswering`

`forward`

`class transformers.FastSpeech2ConformerConfig`

`class transformers.FastSpeech2ConformerHifiGanConfig`

`class transformers.FastSpeech2ConformerWithHifiGanConfig`

`class transformers.FastSpeech2ConformerTokenizer`

`call`

`save_vocabulary`

`decode`

`batch_decode`

`class transformers.FastSpeech2ConformerModel`

`forward`

`class transformers.FastSpeech2ConformerHifiGan`

`forward`

`class transformers.FastSpeech2ConformerWithHifiGan`

`forward`

`class transformers.FlaubertConfig`

`class transformers.FlaubertTokenizer`

`build_inputs_with_special_tokens`

`convert_tokens_to_string`

`create_token_type_ids_from_sequences`

`get_special_tokens_mask`

`class transformers.FlaubertModel`

`forward`

`class transformers.FlaubertWithLMHeadModel`

`forward`

`class transformers.FlaubertForSequenceClassification`

`forward`