MarisaMagic

2024年1月17日

摘要： 1. Seq2Seq 模型 1.1 Seq2Seq 简介 \(\text{Seq2Seq}\)（\(\text{Sequence to Sequence}\)）通常由两部分构成：编码器（\(\text{Encoder}\)）和解码器（\(\text{Decoder}\)）。 \(\text{En 阅读全文

posted @ 2024-01-17 02:39 MarisaMagic 阅读(445) 评论(0) 推荐(0)

2024年1月11日

[NLP复习笔记] Transformer

摘要： 1. Transformer 概述 1.1 整体结构 \(\text{Transformer}\) 主要由 \(\text{Encoder}\) 和 \(\text{Decoder}\) 两个部分组成。\(\text{Encoder}\) 部分有 \(N = 6\) 个相同的层，每层包含一个 \( 阅读全文

posted @ 2024-01-11 16:08 MarisaMagic 阅读(354) 评论(0) 推荐(0)

2024年1月7日

[NLP复习笔记] 神经网络及BP算法

摘要： 1. 神经网络 1.1 神经元神经元（Neuron）或节点（Node）是神经网络的基本单元。下图是一个简单的神经元示意图，\(x\) 表示输入（\(\text{Input}\)）， \(x_i\) 表示来自于前面第 \(i\) 个神经元（\(\text{Neuron}\)）的输入，通常会增加阅读全文

posted @ 2024-01-07 17:42 MarisaMagic 阅读(411) 评论(0) 推荐(0)

[NLP复习笔记] RNN、LSTM

摘要： 1. RNN 1.1 RNN 简介循环神经网络（\(\text{Recurrent Neural Network}\)，简称 \(\text{RNN}\)）是一种用于处理序列数据的神经网络。其核心思想是使用循环结构来保持一个内部状态，这个状态理论上可以捕获到目前为止的全部信息流。\(\text{R 阅读全文

posted @ 2024-01-07 03:14 MarisaMagic 阅读(296) 评论(0) 推荐(0)

2024年1月6日

[NLP复习笔记] Word2Vec: 基于负采样的 Skip-gram 及其 SGD 训练

摘要： 1. one-hot 向量我们先了解一下 \(\text{one-hot}\) 向量。\(\text{one-hot}\) 编码是表示分类变量的常见方法，尤其在数据预处理和机器学习的特征工程中。一个 \(\text{one-hot}\) 向量是一个其中只有一个元素是 1，其余为 0 的向量。假设阅读全文

posted @ 2024-01-06 23:44 MarisaMagic 阅读(1462) 评论(0) 推荐(1)

[NLP复习笔记] 单词向量表示、余弦相似度以及TF-IDF

摘要： 1. 单词与向量 1.1 Term-document 矩阵 Term-document 矩阵是信息检索和文本挖掘中常用的一种表示方法，这种矩阵是一个二维表格，用来表示词（term）在文档（document）集合中的分布情况。在这个矩阵中，行通常代表词汇（terms），列代表文档。矩阵中的每一个元素，阅读全文

posted @ 2024-01-06 17:39 MarisaMagic 阅读(495) 评论(0) 推荐(0)

2024年1月5日

[NLP复习笔记] 朴素贝叶斯分类器

摘要： 1. 贝叶斯决策论假设有 \(N\) 中类别标记 \(\gamma = \{c_1, c_2, \dots, c_N\}\)，\(\lambda_{ij}\) 是将一个真实标记为 \(c_{j}\) 分类为 \(c_i\) 所产生的损失。基于后验概率 \(P(c | \mathbf{x})\) 可阅读全文

posted @ 2024-01-05 21:16 MarisaMagic 阅读(308) 评论(0) 推荐(0)

[NLP复习笔记] N-gram 及基本平滑方法

摘要： 1. N-gram 模型 1.1 N-gram 模型介绍 \(\text{N-gram}\) 是一种基于统计语言模型的算法，用于预测文本中的单词，其中 \(\text{N}\) 一般指的是序列中的单词数量。其基本思想是将文本内容进行大小为 \(\text{N}\) 的滑动窗口操作来计算概率。例如：阅读全文

posted @ 2024-01-05 16:05 MarisaMagic 阅读(2407) 评论(0) 推荐(2)

2023年12月16日

[最优化方法笔记] 非线性规划拉格朗日乘子法

摘要： 1. 拉格朗日乘子法拉格朗日乘子法是一种将约束优化问题转化为无约束优化问题的方法。其核心思想就是通过拉格朗日乘子将含有 \(n\) 个变量和 \(m\) 个约束条件的带约束优化问题转换为含有 \(n + m\) 个变量的无约束优化问题。对于如下约束优化问题： \[\begin{ 阅读全文

posted @ 2023-12-16 17:21 MarisaMagic 阅读(1407) 评论(0) 推荐(1)

[最优化方法笔记] 共轭梯度法

摘要： 1. 共轭方向设 \(A \in \mathbb{R}^{n \times n}\) 为对称阵，\(p, q \in \mathbb{R}^{n \times 1}\) 为 n元列向量。如果: \[p^T A q = 0 \]则称 \(p\) 和 \(q\) 关于 \(A\) 共轭。特别地，若阅读全文

posted @ 2023-12-16 03:32 MarisaMagic 阅读(3185) 评论(2) 推荐(3)

公告