大语言模型

LLM

AI（人工智能）、NLP（自然语言处理）和 Transformer 是现代人工智能领域中三个重要概念，它们之间有着密切的关系。以下是对它们的逐一解释，以及它们之间的联系。

1. 人工智能（AI）：

人工智能（Artificial Intelligence，AI） 是计算机科学的一个分支，致力于创建能够执行通常需要人类智能的任务的机器或软件。AI 包括许多子领域，目标是使机器能够模仿或执行诸如学习、推理、规划、自然语言理解、感知和决策等任务。

子领域：

AI 包括的子领域有很多，主要包括：
- 机器学习（Machine Learning）：通过数据和经验让计算机自动改善其行为的技术。
- 深度学习（Deep Learning）：一种基于神经网络的大规模学习方法，能够处理复杂的模式识别任务，如图像、语音和文本处理。
- 自然语言处理（NLP）：让计算机理解、生成和操作自然语言的技术。

2. 自然语言处理（NLP）：

自然语言处理（Natural Language Processing，NLP） 是 AI 的一个子领域，旨在让计算机能够理解、生成、翻译和与人类的自然语言进行交互。NLP 涉及一系列任务，如：

文本分类：根据文本的内容将其分配到预定义的类别中（例如垃圾邮件分类）。
命名实体识别（NER）：识别文本中的关键实体，如人名、地点名、组织名等。
情感分析：识别文本中表达的情感（如积极、消极、中立）。
机器翻译：将一种语言的文本翻译成另一种语言。
对话系统：理解用户的语言输入并生成适当的回应，如聊天机器人、虚拟助手等。

NLP 涉及对语言的分析和理解，它是实现人类与机器语言交互的核心技术。

3. Transformer：

Transformer 是一种深度学习模型架构，最早由 Vaswani 等人在 2017 年提出，并且迅速成为 NLP 中最重要的模型架构。它的核心创新是自注意力机制（Self-Attention），使得模型能够在处理输入序列时同时考虑到输入的所有部分，而不依赖于传统的递归神经网络（RNN）或卷积神经网络（CNN）。

Transformer 的核心特点：

自注意力机制（Self-Attention）：能够处理输入序列中所有位置的相互关系，允许模型在处理一个词时考虑到该词与序列中其他所有词的关系。
并行处理：与 RNN 不同，Transformer 能够并行处理整个输入序列，而不需要逐步传递信息，这使得训练速度大大提升。
多头注意力（Multi-head Attention）：通过多个并行的注意力头，模型可以在不同的子空间中学习输入的不同表示，提高了模型的表达能力。
位置编码（Positional Encoding）：由于 Transformer 中没有像 RNN 那样的顺序信息，位置编码用于为模型提供序列中词的位置。

Transformer 结构的优势在于处理长文本时的高效性和准确性。由于这些特点，Transformer 成为了许多先进 NLP 模型的基础架构。

它们之间的关系：

1. AI 是 NLP 的基础：

AI 是 NLP 的一个基础，因为 NLP 本身是 AI 的一个子领域。NLP 使用 AI 技术来处理自然语言任务。简单来说，NLP 可以看作是 AI 中专门处理语言任务的部分。

2. Transformer 是 NLP 的核心技术之一：

Transformer 直接影响了 NLP 的发展，特别是对于文本生成、翻译、问答等任务。Transformer 是当前很多先进 NLP 模型的基础，尤其是以下几种：

BERT（Bidirectional Encoder Representations from Transformers）：通过双向编码器，BERT 在许多 NLP 任务（如问答系统、情感分析、文本分类）上表现出色。
GPT（Generative Pre-trained Transformer）：一个基于 Transformer 的生成模型，特别擅长自然语言生成，GPT 系列（包括 GPT-3 和 GPT-4）广泛应用于对话系统、自动写作等任务。
T5（Text-to-Text Transfer Transformer）：将所有 NLP 任务（无论是分类、生成还是翻译）统一为文本到文本的问题，具有高度的灵活性。
XLNet、RoBERTa 等其他变种也基于 Transformer，进一步优化了各种 NLP 任务的表现。

3. Transformer 在 AI 中的影响：

Transformer 的出现不仅在 NLP 中取得了突破性的进展，也影响到了其他领域，如计算机视觉和语音处理。尽管 Transformer 最初是为 NLP 任务设计的，但它的结构被成功地应用到图像分类（如 Vision Transformer）和语音识别等任务中。

总结：

AI 是一个广泛的领域，包含许多子领域，NLP 是其中的一个子领域，专注于让机器理解和生成自然语言。
NLP 使用了许多 AI 技术，尤其是深度学习技术，用于理解和处理文本数据。
Transformer 是当前 NLP 技术中的重要突破，它使用自注意力机制，在许多 NLP 任务上表现出了优异的性能。Transformer 的架构成为了许多现代 NLP 模型的基础，并且被广泛应用于文本生成、机器翻译、语义理解等任务。

因此，AI 是一个大范畴，NLP 是专门用于处理语言的子领域，而 Transformer 则是当前 NLP 领域的一个革命性架构，它推动了现代 NLP 技术的飞速发展。

直接使用已存在的开源大模型(Ollama、Hugging face开源社区)

好处：

1. 降低开发成本
- 省去训练成本：开源大模型已预训练，避免了高昂的计算资源投入和复杂的训练流程。
- 快速部署：直接使用现有模型，缩短项目上线时间。
2. 多样性与选择性
- 丰富的模型库：如 Hugging Face 提供了多领域、多任务的模型（如自然语言处理、图像生成）。
- 开源社区支持：可以快速找到适合任务的模型，并通过社区获取支持和改进建议。
3. 灵活的二次开发
- 可定制性强：大多数开源模型支持微调，可针对具体任务进行优化，满足业务需求。
- 开放源码：可以深入了解模型架构和逻辑，便于修改和扩展。
4. 技术社区与生态支持
- 活跃的生态：开源大模型社区通常提供文档、教程和样例，降低使用门槛。
- 共享更新：可以共享社区带来的最新优化成果和工具。
5. 无需从零开始解决复杂问题
- 预训练权重：很多开源模型已在大规模数据集上训练好，具备强大的泛化能力。
- 避免重复劳动：无需重复设计和实现已有的技术方案。

坏处：

1. 模型适配性限制
- 通用性模型的局限：现有开源模型可能不完全适合你的具体业务场景，需要额外的微调或定制。
- 潜在过拟合问题：直接使用预训练模型可能导致对非目标领域数据的错误理解。
2. 数据隐私与安全风险
- 数据暴露：如果需要上传业务数据到外部托管的推理服务（如 Ollama 提供的 API），可能存在隐私泄露的风险。
- 模型的训练数据不可控：开源模型的训练数据可能带有偏见，影响业务应用的公平性或合规性。
3. 技术复杂度的迁移
- 整合与部署难度：将开源模型与现有系统集成时，可能需要克服兼容性问题。
- 推理性能问题：部分开源模型计算资源需求较高，可能导致延迟增加或成本上升。
4. 依赖外部社区
- 稳定性风险：开源项目可能停止维护，或其方向与业务需求不一致。
- 技术锁定：过于依赖某个开源社区，可能导致在迁移或技术选择上受到限制。
5. 法律与版权问题
- 许可证限制：某些开源模型（如采用 AGPL 等许可证）的使用可能对商业项目有附加要求。
- 训练数据的合法性：使用开源模型时，可能间接使用了未经授权的数据。

总结建议：

使用场景建议：

如果时间紧、资源有限且业务需求明确，开源模型是高效的选择。
如果涉及高隐私或行业特定的需求（如医疗、金融），建议评估开源模型的隐私合规性，或考虑本地化部署与二次开发。

优化使用方式：

微调模型：通过迁移学习优化模型表现。
本地化部署：减少数据泄露风险。
许可证评估：确保模型与开源代码的使用符合业务需求与法律规定。

微调大模型

微调大模型是指在预训练模型的基础上，使用特定领域或任务的数据对模型进行进一步训练以提升其性能。

好处：

1. 提高任务性能
- 增强模型针对性：通过微调，模型能更准确地理解和生成特定领域的内容（如医学、法律、金融等领域）。
- 减少泛化误差：微调可以让模型更好地适应目标数据，避免泛用模型带来的无关或错误输出。
2. 高效利用资源
- 节省训练成本：相比从零开始训练，微调仅需较小的计算资源和时间，通常也需要更少的数据。
- 再利用预训练知识：微调保留了模型的通用能力，同时添加领域特定的知识。
3. 灵活性与可控性
- 自定义功能：可以根据业务需求，微调模型以满足特定任务，例如专用的对话生成、分类、信息提取等。
- 适配多种任务：同一个大模型可以被微调成不同任务的专用版本。
4. 数据隐私保护
- 本地化微调：在自己的服务器上微调模型，避免数据外泄，满足隐私保护要求。
5. 改善低资源任务的表现
- 小数据集友好：预训练模型的迁移学习特性使得即使在小规模数据集上，微调也能显著提升性能。

坏处：

1. 数据和资源需求
- 需要高质量数据：微调需要标注精确且代表性的目标领域数据，数据不足或质量低会降低微调效果。
- 计算资源要求：尽管成本低于从零训练，但微调大模型仍需较高的计算资源（如高性能 GPU）。
2. 过拟合风险
- 特定领域适配：微调可能导致模型对特定领域数据的过度优化，从而降低在其他任务上的性能。
- 数据偏差放大：如果微调数据带有偏见，模型可能会继承甚至放大这些偏见。
3. 技术复杂度
- 训练技巧要求高：需要熟悉模型架构、优化算法和超参数调整，否则可能导致微调失败或效果不理想。
- 版本兼容性问题：模型框架或预训练模型的版本更新可能引入兼容性问题，增加维护成本。
4. 限制通用性
- 丧失原始模型的多任务能力：微调后的模型可能对非目标任务表现不佳，丧失预训练模型的广泛适用性。
- 特定场景绑定：微调后的模型可能需要重新微调才能适配新的任务或领域。
5. 法律与版权问题
- 开源协议限制：预训练模型可能附带开源许可证，微调后的模型在商业应用中可能受到使用限制。
- 数据隐私风险：微调时使用的领域数据若涉及敏感信息，可能引发数据隐私问题。

总结建议：

使用场景建议：

微调适用于业务场景明确、对性能要求较高的任务，如定制化聊天机器人、行业特定的信息抽取或分类任务。
如果任务通用性较高，可能更适合直接使用未微调的模型。

优化微调实践：

选择合适的微调方法：
- 全参数微调：适用于深度定制任务。
- 参数高效微调（如 LoRA, Prefix Tuning）：适合资源受限场景。
优化数据：使用高质量且多样化的数据以避免过拟合。
监控和评估：在微调过程中持续监控性能，使用验证集评估模型表现，避免过度训练。
版本管理：记录模型微调的版本和超参数，便于复现和升级。

微调大模型是平衡性能和资源的有效方法，但需结合具体场景与需求权衡利弊。

RAG

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合检索与生成的技术，将外部知识库与生成式模型整合，利用检索到的信息辅助生成回答。这种方法在许多任务中表现出色，但也有其局限性。

好处：

1. 信息准确性提升
- 增强生成内容的可靠性：通过检索外部知识库中的信息，减少生成式模型单独依赖参数生成内容可能带来的不准确性。
- 动态更新知识：知识库内容可以随时更新，无需重新训练模型，从而保证生成内容的时效性。
2. 可解释性更强
- 提供数据来源：生成回答时附带检索到的相关文档或段落，提高模型输出的透明性，便于验证和审查。
- 减少“幻觉”：生成式模型因参数化知识而产生不准确信息的风险降低。
3. 高效利用外部知识库
- 适合大规模知识领域：通过检索，RAG 能访问规模庞大的知识库，而不是将所有知识直接嵌入模型权重中。
- 资源节约：无需对整个知识领域进行训练，降低模型训练时间和计算资源消耗。
4. 灵活性高
- 多任务适应性：通过不同的检索方法和知识库内容，RAG 可适应多种任务（如问答、对话生成、文档摘要）。
- 领域迁移简单：只需替换或更新知识库，无需重新训练生成模型，即可适应新的领域。
5. 更容易扩展和维护
- 独立组件管理：检索模块和生成模块相对独立，便于分开优化、扩展或维护。
- 知识库替换灵活：可结合多种格式的知识库（SQL、向量数据库等），增加系统的扩展性。

坏处：

1. 系统复杂性增加
- 模块依赖：RAG 将检索与生成结合，系统结构复杂，需要确保检索模块与生成模块的高效协作。
- 调试难度高：性能问题可能来自检索模块、生成模块或两者的交互，定位问题更加困难。
2. 对检索模块的依赖
- 检索质量限制：如果检索模块无法找到相关或高质量的信息，生成内容的质量会受到直接影响。
- 知识库依赖性强：知识库的覆盖范围和更新频率决定了 RAG 系统能否应对实时或稀有问题。
3. 性能瓶颈
- 检索耗时：大规模知识库的检索可能增加系统延迟，特别是在实时应用中。
- 生成效率受限：检索到的信息量可能过大或无关紧要，影响生成模型的效率和性能。
4. 数据隐私和安全问题
- 知识库的隐私风险：如果知识库包含敏感或机密信息，需要严格管理访问权限和数据保护机制。
- 外部接口依赖：若检索模块使用外部服务（如网络检索），可能引入隐私泄露或服务中断风险。
5. 模型与检索库的不匹配风险
- 上下文整合困难：生成模型需要处理检索信息与上下文之间的冲突或不一致。
- 过于依赖检索结果：当检索信息不完整或不准确时，生成内容可能产生偏差。
6. 知识库建设成本
- 初期构建复杂：构建高质量、结构化的知识库需要大量的数据收集、清洗和整理工作。
- 维护成本高：知识库需要定期更新，以反映最新的领域知识或数据变化。

总结建议：

适用场景：

需要高准确性和时效性的任务：如法律咨询、医疗问答、技术支持。
动态知识更新：需要频繁更新知识内容，而无需频繁重新训练模型。
需要高可解释性：用户需要了解生成结果的来源和依据。

优化实践：

检索模块优化：使用向量检索、增强排序机制（如结合语义相关性）提高检索效率和相关性。
知识库质量提升：确保知识库内容权威、全面且结构合理。
多轮交互验证：通过用户反馈改进检索和生成模块的协作，减少误生成。
降低延迟：结合缓存机制和高效索引，优化系统响应速度。
隐私与合规：确保知识库中的数据符合隐私保护和合规性要求。

RAG 在平衡生成性能和知识准确性方面优势明显，但需要精心设计与维护以充分发挥其潜力。

私有化大模型 + RAG 文档

1. 微调大模型内容

微调（Fine-tuning）是一种基于预训练模型进行任务定制化的方法。对于 Qwen-2.5，大型模型的微调适合特定领域应用，例如医疗、法律或电商客服。

1.1 微调方法

全参数微调：

修改模型的全部参数，适合高资源环境。
优点：性能最佳。
缺点：资源需求大，耗时长。

LoRA（Low-Rank Adaptation）微调：

冻结大部分模型参数，仅调整新增的低秩矩阵。
优点：高效、资源占用少。
缺点：对泛化能力可能略有影响。

Prefix-tuning：

在输入序列前附加可训练的前缀向量。
优点：轻量化，快速适配特定任务。
缺点：需针对上下文较强的任务设计。

1.2 微调流程

数据准备：

格式：每条数据包含输入（prompt）和输出（response）。
示例：

    #复制代码
     {"prompt": "如何预防感冒？", "response": "保持卫生，增加锻炼，避免长时间暴露在寒冷环境中。"}

微调工具：

使用 HuggingFace 的 transformers 和 peft。

安装必要库：

#复制代码
pip install transformers datasets peft accelerate

代码示例：

全参数微调：

python复制代码from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments
from datasets import load_dataset

# 加载模型和数据
model = AutoModelForCausalLM.from_pretrained("Qwen-2.5")
tokenizer = AutoTokenizer.from_pretrained("Qwen-2.5")
dataset = load_dataset("json", data_files={"train": "train.json", "test": "test.json"})

# 训练参数
training_args = TrainingArguments(
    output_dir="./qwen_finetune",
    per_device_train_batch_size=4,
    gradient_accumulation_steps=8,
    learning_rate=5e-5,
    num_train_epochs=3,
    save_steps=1000,
    save_total_limit=2,
    logging_dir="./logs",
    fp16=True,
)

# Trainer
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=dataset["train"],
    eval_dataset=dataset["test"],
)
trainer.train()

2. Qwen-2.5 资源需求与公式

2.1 并发量资源计算

Qwen-2.5 是一个较大的模型，对 GPU 和内存有较高需求，以下公式可以帮助评估所需资源。

计算公式

显存需求公式：

显存需求 (GB)=16×模型大小 (Billion)+(Batch Size×2)+2×并发数
- 模型大小：Qwen-2.5 为 2.5 Billion。
- Batch Size：推荐为 1-4。
- 并发数：10-50。
CPU 和内存需求：

CPU 核心数=2×并发数

内存 (GB)=16×并发数

示例计算

场景：并发数 20，Batch Size = 2。
显存需求： 16×2.5+(2×2)+2×20=64GB
CPU 核心数： 2×20=40 核
内存需求： 16×20=320GB

2.2 硬件建议

组件	配置推荐
GPU	2x NVIDIA A100 (40GB 显存)
CPU	32 核以上
内存	256 GB - 512 GB
存储	1 TB SSD (知识库和索引存储)

3. 综合工具选型

HuggingFace

用途：模型加载、微调和推理。
优点：生态丰富、社区支持强。

Ollama

用途：本地模型部署，支持轻量化优化。
优点：易用、离线运行，隐私保障。

Dify

用途：集成开发，支持对话式应用。
优点：简单快速构建 AI 应用。

DMeta-embedding-zh

用途：中文嵌入生成，用于高效检索。
优点：中文领域优化，轻量化高效。

4. 性能优化建议

4.1 微调优化

使用 LoRA 或 Prefix-tuning：

显著降低资源需求。

剪枝和量化：

使用 INT8/FP16 量化，减少显存占用。

HuggingFace 示例：

# 加载一个预训练的模型，并应用量化配置来减少模型的内存占用和提高推理速度
from transformers import BitsAndBytesConfig

quant_config = BitsAndBytesConfig(
    #希望以 8 比特整数（int8）格式加载模型权重。这种量化可以显著减少模型的大小和加快推理速度，同时尽量保持模型的准确性。
    load_in_8bit=True,
    # 设置了一个阈值，用来决定哪些权重应该被量化为 int8。具体来说，只有那些绝对值大于等于此阈值的权重会被转换为 int8 格式。这个参数可以帮助保留一些对模型性能至关重要的高精度权重。
    llm_int8_threshold=6.0,
    # 指定了哪些模块不应被量化。如果设为 None，则表示没有特定的模块需要跳过，所有适用的层都会被量化。你可以通过提供一个包含要跳过模块名称的列表来指定哪些模块不进行量化。
    llm_int8_skip_modules=None,
)
# AutoModelForCausalLM 类从预训练模型 "Qwen-2.5" 加载一个因果语言模型（Causal Language Model, CLM）。from_pretrained 方法会自动下载并缓存模型权重和配置文件，如果它们在本地不可用的话。同时，它接收 quantization_config 参数，该参数传递了之前定义的 quant_config，这样在加载模型时就会应用相应的量化配置。

#请注意，AutoModelForCausalLM 是 transformers 库中的一个通用类，它能够根据提供的模型标识符自动识别并加载正确的模型架构。在这个例子中，"Qwen-2.5" 是模型的标识符，代表你想要加载的具体模型版本。
model = AutoModelForCausalLM.from_pretrained("Qwen-2.5", quantization_config=quant_config)

4.2 并发优化

分布式推理：

使用 DeepSpeed 或 TensorParallel。

缓存检索结果：

缓存高频查询的向量化结果和生成响应。

4.3 RAG 流程优化

知识库分片：对于大规模知识库，分区以减少检索延迟。
批量检索：同时查询多条记录，提升吞吐量。

具体案例（偏LLM）

RAG

Ollama\HuggingFace+RAGFlow（开源产品）

Coze，国内称为扣子，是字节跳动推出的一款AI应用开发平台。它允许用户通过简单的操作，快速构建基于AI模型的问答机器人。Coze平台的设计理念是降低技术门槛，让即使没有编程基础的用户也能轻松开发AI应用。用户可以在Coze上创建的机器人，不仅可以解决简单的问答，还能处理包含复杂逻辑的对话。

prompt工程

Spring AI+。通过提示对话完成自动化任务。

扩展

简单回顾一下

AI，也就是人工智能（Artificial Intelligence），是指让机器（尤其是计算机系统）表现出智能的技术。

AGI，也就是通用人工智能（Artificial General Intelligence），能够在广泛的认知任务上表现得与人类一样好，甚至更好。它与狭义的人工智能不同，狭义的人工智能是为特定的任务而设计的，而AGI则更适应通用任务，是一种强人工智能。

大语言模型（Large Language Model, LLM）既是人工神经网络，也是一种以实现通用语言生成和其他自然语言处理任务（例如分类）的能力而闻名的语言模型。

GenAI，也就是生成式人工智能（Generative Artificial Intelligence），也简称为GAI。GenAI能够使用生成式模型，生成文本、图像、视频或其他数据。大语言模型（Large Language Model, LLM）就是一种GenAI。

GPT，也就是Generative Pre-trained Transformer，是一种大语言模型，也是知名的GenAI。

ChatGPT，就是OpenAI在GPT的基础上，开发的文字聊天工具。

AI、AGI、AIGC
AI（人工智能）：AI，就是人工智能，它涵盖了各种技术和领域，目的是让计算机模仿、延伸甚至超越人类智能。想象一下，你的智能手机、智能家居设备，这些都是AI技术的应用。

AIGC（AI生成内容）：接下来是AIGC，即AI Generated Content。这就是利用AI技术生成的内容：

文本生成：可以用于自动生成新闻报道、广告文案、产品描述等。
图像生成：可以用于自动生成图像素材、艺术创作、设计等。
音频生成：可以用于自动生成音乐、电台广播等。
视频生成：可以用于自动生成视频剪辑、电影预告片等。
又称生成式AI，被认为是继专业生产内容（PGC）、用户生产内容（UGC）之后的新型内容创作方式。
互联网内容生产方式经历了PGC——UGC——AIGC的过程。

AGI（通用人工智能）：然后我们来看AGI，即Artificial General Intelligence，中文叫通用人工智能。这可比一般的AI高级多了。AGI的目标是创造一个能像人类一样思考、学习、执行多种任务的系统。想象一下，如果有了AGI，它可能会成为全能的“超级大脑”，能在任何领域都超越人类。听起来是不是有点像科幻电影里的情节？

AGI与AIGC（Artificial Intelligence Generated Content，人工智能生成内容）有显著区别。AIGC指的是利用AI技术，尤其是机器学习和深度学习模型，自动生成内容，如文本、图像、音乐或视频。AIGC通常专注于特定的创作任务，而不具备AGI的广泛智能和通用学习能力。

在谈论AGI时，人工智能和机器学习领域国际上最权威的学者之一DeepLearning.AI创始人吴恩达认为，尽管AGI是一个激动人心的概念，但我们目前对实现真正的AGI还有很长的路要走。他强调，现有的AI技术，尽管在特定任务上表现出色，但仍然缺乏通用性和灵活性。

AIGC、NLP、LLM

从上面可以看出，现在被我们广泛谈起的AI，主要是指的AIGC领域。

AIGC涉及到的领域和技术很广泛，其中很重要的一项技术就是NLP(自然语言处理)，之所以把这3个概念放在一起描述，这两年来，AIGC取得了令人瞩目的增长，有很大因素就在于自然语言处理（NLP），而推动NLP发展到的就是LLM（大型语言模型），也就是我们接下来学习的重点，LLM。

用相对官方的描述，就是说：

NLP(自然语言处理)它是研究如何让计算机读懂人类语言，也就是将人的自然语言转换为计算机可以阅读的指令，NLP是人工智能和语言学领域的分支学科。
而LLM是 NLP 中的一个重要组成部分，主要是用来预测自然语言文本中下一个词或字符的概率分布情况，可以看作是一种对语言规律的学习和抽象。

在NLP中，LLM是一种基本技术，用于处理和理解文本，包括词法分析、句法分析、语义分析等，广泛应用于机器翻译、自动问答系统、信息抽取、文本分类、情感分析等多个领域。而LLM，特别是基于Transformer架构的模型，如GPT-3和T5，通过大规模无监督学习来学习语言规律和上下文信息，然后在微调阶段根据具体任务进行有监督学习和优化，从而能够生成连贯、有意义的文本。这些模型的核心在于预训练和微调，预训练阶段使用掩码语言模型或下一句预测等技术，微调阶段则针对特定任务进行优化。

NLP、GPT、ChatGPT
GPT是NLP领域中的一个重要模型，它是基于Transformer架构构建的预训练语言模型。GPT（Generative Pre-trained Transformer）通过预先训练大量文本数据，学习到语言的基本结构和模式，从而能够理解自然语言文本的意义和语义。

而ChatGPT从名字上就可以看出来，ChatGPT是GPT在对话生成领域的特定应用

posted @ 2024-12-16 15:09 李好秀阅读(84) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 01.大模型起源与发展

· day13-接口和内部类

· AI 学习时代：大语言模型领域的行业术语解析

· 大语言模型（LLM）

· 大模型落地实战指南：从选择到训练，深度解析显卡选型、模型训练技、模型选择巧及AI未来展望—打造AI应用新篇章

阅读排行：
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了
· 上周热点回顾（2.24-3.2）

公告

昵称：李好秀
园龄： 5年8个月
粉丝： 10
关注： 3

+加关注

2025年3月

日

一

二

三

四

五

六

LLM

1. 人工智能（AI）：

2. 自然语言处理（NLP）：

3. Transformer：

Transformer 的核心特点：

它们之间的关系：

1. AI 是 NLP 的基础：

2. Transformer 是 NLP 的核心技术之一：

3. Transformer 在 AI 中的影响：

总结：

直接使用已存在的开源大模型(Ollama、Hugging face开源社区)

好处：

坏处：

总结建议：

微调大模型

好处：

坏处：

总结建议：

RAG

好处：

坏处：

总结建议：

私有化大模型 + RAG 文档

1. 微调大模型内容

1.1 微调方法

1.2 微调流程

2. Qwen-2.5 资源需求与公式

2.1 并发量资源计算

计算公式

示例计算

2.2 硬件建议

3. 综合工具选型

HuggingFace

Ollama

Dify

DMeta-embedding-zh

4. 性能优化建议

4.1 微调优化

4.2 并发优化

4.3 RAG 流程优化

具体案例（偏LLM）

RAG

prompt工程

扩展

简单回顾一下

AIGC、NLP、LLM

公告

常用链接

最新随笔

积分与排名

合集

随笔档案