上一页 1 2 3 4 5 6 7 ··· 9 下一页
摘要: 一、熵(PRML) 考虑将A地观测的一个随机变量x,编码后传输到B地。 这个随机变量有8种可能的状态,每个状态都是等可能的。为了把x的值传给接收者,需要传输一个3-bits的消息。注意,这个变量的熵由下式给出: ⾮均匀分布⽐均匀分布的熵要⼩。 如果概率分布非均匀,同样使用等长编码,那么并不是最优的。 阅读全文
posted @ 2023-04-15 23:01 LeonYi 阅读(300) 评论(0) 推荐(1) 编辑
摘要: 一、Transformer Transformer最开始用于机器翻译任务,其架构是seq2seq的编码器解码器架构。其核心是自注意力机制: 每个输入都可以看到全局信息,从而缓解RNN的长期依赖问题。 输入: (待学习的)输入词嵌入 + 位置编码(相对位置) 编码器结构: 6层编码器: 一层编码器 = 阅读全文
posted @ 2023-04-15 22:51 LeonYi 阅读(850) 评论(0) 推荐(1) 编辑
摘要: 一、背景 编码是信息处理的基础(重新表示信息)。 普通的编码是等长编码,例如7位的ASCIL编码,对出现频率不同的字符都使用相同的编码长度。但其在传输和存储等情况下编码效率不高。 可使用不等长编码,来压缩编码:高频字符编码长度更短,低频字符编码长度更长。 [例] 将百分制的考试成绩转换成五分制的成绩 阅读全文
posted @ 2023-04-15 22:41 LeonYi 阅读(516) 评论(0) 推荐(0) 编辑
摘要: Expectation Maximization,EM算法是带有隐变量的概率模型参数的极大似然估计(MLE为给定参数,观测数据出现/生成的可能性)。 如下为《统计机器学习》中对应EM算法的笔记。 观测数据Y和隐变量X合称,完全数据 观测数据Y称,不完全数据 E步:(期望步)求Q函数(上一轮参数固定, 阅读全文
posted @ 2023-04-15 21:49 LeonYi 阅读(308) 评论(0) 推荐(0) 编辑
摘要: 一、矩阵的范数 二、矩阵的谱半径 虽然,谱半径小于等于任意矩阵范数。 但是,也必存在一个算子范数,小于等于谱半径+一个小的正数 从线性方程组的迭代法的收敛性到矩阵的幂的收敛。 谱半径小于1,也必存在一个算子范数,小于1; 若矩阵的范数小于1, 当k趋于无穷时,矩阵任意范数的k次幂肯定趋近于0,这就使 阅读全文
posted @ 2023-02-18 22:09 LeonYi 阅读(243) 评论(0) 推荐(2) 编辑
摘要: 一、快排基础 1.1 快排的流程 将数组A进行快速排序的基本步骤-quick_sort(A): 递归基础情况:如果A中的元素个数是1或0,则返回。 选取主元:取A中的任意一个元素v,作为主元(pivot)。 交换策略:将A-{v}即A中剩余元素,划分成两个不相交的集合(多重集)A1和A2, 递归处理 阅读全文
posted @ 2023-02-08 20:19 LeonYi 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 手撕版 最大堆的完全实现, 堆中元素为二元组(num, idx),比较时用数值,赋值或交换时用整个元组。 class Heap: def __init__(self, arr, capacity): # 容量和大小 self.size = len(arr) self.arr = [None] * c 阅读全文
posted @ 2023-02-06 21:35 LeonYi 阅读(87) 评论(0) 推荐(0) 编辑
摘要: 【图算法】图卷积的演变-从谱图卷积到GCN 基础 傅里叶变换 傅里叶级数是对周期为T的确定性信号做展开,而傅里叶变换将周期推广到无穷,能对具有任意长度的信号做展开。 傅里叶级数和傅里叶变换是什么关系? 如下为傅里叶变换公式: \[\hat{f}(t)={\int}f(x){\exp}^{-iwt}dx = {\int}f(x) \left(c 阅读全文
posted @ 2023-02-02 23:23 LeonYi 阅读(276) 评论(0) 推荐(1) 编辑
摘要: 一、堆的基础 1.1 优先队列和堆 优先队列(Priority Queue):特殊的“队列”,取出元素顺序是按元素优先权(关键字)大小,而非元素进入队列的先后顺序。 若采用数组或链表直接实现优先队列,代价高。依靠数组,基于完全二叉树结构实现优先队列,即堆效率更高。一般来说堆代指二叉堆。 优先队列的完 阅读全文
posted @ 2023-02-01 23:51 LeonYi 阅读(484) 评论(0) 推荐(1) 编辑
摘要: 一、背景 将卷积运算推广到不规则域通常表示为邻局聚合(neighborhood aggregation)或消息传递(neighborhood aggregation)模式。 \(\mathbf{x}^{(k-1)}_i \in \mathbb{R}^{1 \times D}\)表示节点\(i\)在第 阅读全文
posted @ 2023-01-18 22:03 LeonYi 阅读(641) 评论(0) 推荐(1) 编辑
上一页 1 2 3 4 5 6 7 ··· 9 下一页