prompt（提示）

软提示：

　　通过引入可学习的张量，与输入嵌入向量结合，显著减少了需要训练的参数数量，同时保持了模型在不同任务上的适应性。

硬提示

　　虽然简单直观，但由于其需要手工制作，因此不如软提示方法高效和灵活。

软提示方法包括以下几种，这些方法都被集成在了🤗 PEFT（Parameter-Efficient Fine-Tuning）库中：

Prompt Tuning

蓝色的是预训练模型。

模型调优（Model Tuning）：
- 左侧部分表示模型调优的过程。
- 首先，有一个预训练的模型，包含110亿参数。
- 针对每个任务（任务A、任务B、任务C），有相应的训练数据批次（如任务A的a1和a2，任务B的b1，任务C的c1和c2）。
- 对于每个任务，预训练模型被分别微调，生成不同的任务特定模型（任务A模型、任务B模型、任务C模型），每个模型仍然包含110亿参数。
提示调优（Prompt Tuning）：
- 右侧部分表示提示调优的过程。
- 提示调优使用相同的预训练模型（110亿参数），而不对模型本身进行修改。
- 不同任务的数据被混合成一个批次（Mixed-task Batch）。
- 每个任务都有自己的提示（Task Prompts），每个提示包含2万参数。
- 这些任务提示和相应的数据一起输入预训练模型，模型根据提示调整其行为以完成特定任务。

Prompt tuning 是专为文本分类任务开发的一种方法，最初应用于 T5 模型。其核心思想是将所有下游任务转换为文本生成任务。

假设我们有一个文本分类任务，要将输入句子分类为“积极”或“消极”。在传统方法中，模型会直接输出一个类别标签。而在提示调优中，输入句子前会加上提示标记，模型生成的输出则是表示类别标签的标记，例如：“这是一条[积极]评论”或“这是一条[消极]评论”。

还是多个模型减少到一个模型

微调（Fine-tuning）：
- 上半部分表示微调的过程。
- 对于每个任务（如翻译、摘要、表格到文本），有单独的Transformer模型。
- 每个任务的Transformer模型都经过专门的训练，以适应该任务的数据。
- 输入（Input）是带有特定格式的文本，例如“name Starbucks type coffee shop”。
- 模型生成相应的输出（Output），例如“Starbucks serves coffee”。
前缀调优（Prefix-tuning）：
- 下半部分表示前缀调优的过程。
- 只使用一个预训练的Transformer模型，不针对每个任务单独微调整个模型。
- 每个任务有自己的前缀（Prefix），这些前缀是相对较小的参数集，分别用于不同的任务（如翻译、摘要、表格到文本）。
- 输入（Input）与微调类似，但在输入之前附加了任务特定的前缀。
- 预训练的Transformer模型根据输入和前缀生成相应的输出（Output）

Prefix tuning 是为自然语言生成（NLG）任务而设计的，特别应用于 GPT 模型。其工作原理与 Prompt Tuning 类似，都是在输入前添加一系列特定任务的向量，这些向量可以在保持预训练模型参数不变的情况下进行训练和更新

假设我们有一个生成任务，需要 GPT 模型根据输入文本生成相应的输出。在 Prefix tuning 中，我们会在输入前添加一系列特定任务的向量，这些向量会贯穿整个模型的所有层，确保在不改变预训练模型参数的情况下，优化生成的输出。