摘要: 一元函数连续性定义的问题: 遇到一道题,问题是:若函数\(f\)在\(x=a\)处连续,则在a的某个去心邻域内,\(f(x)\)连续,是否正确。 这是一个乍一看好像正确的结论。函数在某点连续,则该点附近的函数值都与他相近,这些点连起来就连续了。 但是,这个结论是错误的。 重新回顾函数在某点连续的定义 阅读全文
posted @ 2025-01-06 11:35 continu~ 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 问题: 我们如何构造一个序列,使他的极限为\(\sqrt{2}\)? 让我们从一个根号二的近似 s 开始。 \(s\times\frac{2}{s}=2\) 因此,\(\sqrt2\) 在 s 和 \(\frac{2}{s}\) 之间。 故而,一个更好的近似是他们的算数平均值 new approxi 阅读全文
posted @ 2024-11-29 23:37 continu~ 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 矩阵论学习 线性空间 是什么? 假设 V 是一个非空集合,P 是一个数域。对于任意 x、y、z∈V,如果 V 满足以下条件: 在 V 中定义一个封闭的加法运算: x+y=y+x (x+y)+z=x+(y+z) 存在 0 元素,+0=x 存在负元素,x+(-x)=0 也就是交换律和结合律,有加法单位元 阅读全文
posted @ 2024-11-26 17:51 continu~ 阅读(99) 评论(0) 推荐(0) 编辑
摘要: 矩阵论学习 矩阵的几何意义 如果空间中任意的一个向量,都可以由某几个向量通过线性组合得来。则称这几个向量为这个空间的基。 该空间被称为由基向量张成的向量空间 如何选取基向量? 如果一个向量\(\vec{c}\)可以由\(\vec{a}\)和\(\vec{b}\)经过数乘和相加得到。则\(\vec{c 阅读全文
posted @ 2024-11-25 15:52 continu~ 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 算术平均数 (AM) 算术平均数是最常见的平均数计算方式,适用于大多数情况下的平均值计算。 公式: \(AM = \frac{1}{n} \sum_{i=1}^{n} x_i\) 描述: 所有数值加总后除以数值的数量。 几何平均数 (GM) 几何平均数主要用于计算比率或比例的平均值,特别适用于连续增 阅读全文
posted @ 2024-11-21 23:19 continu~ 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 众所周知,在当前机器学习看待数据的很重要一个方式是概率,例如分类问题是建模一个P(Y=C|X)。 在面对离散变量的时候,例如人名这种离散变量。 假设有问题:给一个名字,判断该人是中国哪里人。(或许在现实生活中,该问题是不合理的,一般情况下无法根据人名判断是哪里人) 假设我们有所有省份的人名。我们可以 阅读全文
posted @ 2024-11-02 20:24 continu~ 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 工作中涉及了EM算法,重新学习一下不清晰的概念。偶然发现了国外的教材,不经感叹国外的教材写的是真的好。掰开揉碎了,一行行的讲公式的意思,讲变量的由来。 反观国内的教材,啥也不说,啪啪啪几行公式列下来,标注几个变量,仿佛生怕多说几个字让你学会了。让人懵逼进来懵逼出去。 该文献的标题是:> > > > 阅读全文
posted @ 2024-10-24 23:30 continu~ 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 困惑度公式: 困惑度的定义如上。 具体里面这个条件概率概率怎么计算呢? 假设我们的生成模型生成了一个 shape为(N,D)的序列。表示N个字,序列长度,序列中,每个token的概率分布维度为D,也就是字典中共有D个字。 由于我们是自回归模型,基于前k个字预测第K+1个字。所以这个N*D序列中的每一 阅读全文
posted @ 2024-10-16 10:02 continu~ 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 工作过程中了解了下声音的产生。久违的体验了科普的快乐。 我们的常识是声音是空气振动产生的。这里来具体探究一下。 我们所处在一个被空气包围的世界中。 如果空气被一个物体(声源)的运动或振动所干扰,则空气密度将会不断变化。当振动物体向外移,将附近的空气分子推开,并挤压在一起,导致密度和压强略有增加,形成 阅读全文
posted @ 2024-10-15 11:45 continu~ 阅读(64) 评论(0) 推荐(0) 编辑
摘要: 为什么需要特征归一化? 消除量纲的影响,加快收敛速率。采用梯度下降的角度来说。特征空间是圆形比椭圆更容易收敛。 采用梯度下降求解的模型,如神经网络,支持向量机等需要特征归一化。树模型一般不需要。 原始特征下,因尺度差异,其损失函数的等高线图可能是椭圆形,梯度方向垂直于等高线,下降会走zigzag路线 阅读全文
posted @ 2024-10-14 14:31 continu~ 阅读(15) 评论(0) 推荐(0) 编辑