Loading

摘要: 简单实现MongoDB的复制集和分片的功能 阅读全文
posted @ 2021-12-22 21:03 Christopher·阳 阅读(334) 评论(3) 推荐(0) 编辑
摘要: 背景 Local Outlier Factor(LOF)是基于密度的经典算法(Breuning et. al. 2000), 文章发表于 SIGMOD 2000, 到目前已经有 3000+ 的引用。 在 LOF 之前的异常检测算法大多是基于统计方法的,或者是借用了一些聚类算法用于异常点的识别(比如 阅读全文
posted @ 2021-12-22 20:43 Christopher·阳 阅读(404) 评论(0) 推荐(0) 编辑
摘要: 主成分分析(Principal components analysis,以下简称PCA)是最常用的降维方法之一,在数据压缩和消除冗余方面具有广泛的应用,本文由浅入深的对其降维原理进行了详细总结。 1. 向量投影和矩阵投影的含义 如下图: 向量a在向量b的投影为: 其中,θ是向量间的夹角 。 向量a在 阅读全文
posted @ 2021-12-21 11:52 Christopher·阳 阅读(274) 评论(0) 推荐(0) 编辑
摘要: Introduce 感知机模型(Perceptron)是一个最简单的有监督的二分类线性模型。他可以从两个方面进行介绍 方面一 问题分析 问题(一维):儿童免票乘车问题(孩子身高低于1.2m可以免票上车) 这转换成数学表达式就是 $x:$身高,$y:\{-1:$免票 ,$1:$购票$\}$ $$ y= 阅读全文
posted @ 2021-12-19 14:00 Christopher·阳 阅读(574) 评论(0) 推荐(0) 编辑
摘要: 先对几个概念和问题做一个解释: 图像为什么要灰度化? 识别物体,最关键的因素是梯度(SIFT/HOG),梯度意味着边缘,这是最本质的部分,而计算梯度,自然就用到灰度图像了,可以把灰度理解为图像的强度。 颜色,易受光照影响,难以提供关键信息,故将图像进行灰度化,同时也可以加快特征提取的速度。 仿射不变 阅读全文
posted @ 2021-12-17 16:32 Christopher·阳 阅读(659) 评论(0) 推荐(1) 编辑
摘要: 范数本质是向量或者矩阵映射到实数域的单值函数。 假设$N(x)=\Vert x \Vert$是定义在$R^n$上的函数,她需要满足以下三个条件: 非负性: \(\Vert x \Vert \ge 0\),当且仅当$x=0$时,\(\Vert x \Vert = 0\) 齐次性:\(\Vert kx 阅读全文
posted @ 2021-12-16 15:53 Christopher·阳 阅读(507) 评论(0) 推荐(1) 编辑
摘要: Tensor的概念 说起张量(tensor)就不得不说他和scalar、vertor、matrix之间的关系了,直接上图: 标量(scalar):只有大小概念,没有方向的概念。通过一个具体的数值就能表达完整。比如:重量、温度、长度、提及、时间、热量等都数据标量。 向量(vector):物理学上也叫矢 阅读全文
posted @ 2021-12-13 16:15 Christopher·阳 阅读(1257) 评论(0) 推荐(1) 编辑
摘要: 交叉验证是一种用于估计机器学习模型性能的统计方法,它是一种评估统计分析结果如何推广到独立数据集的方法。 阅读全文
posted @ 2021-12-12 12:24 Christopher·阳 阅读(1821) 评论(0) 推荐(1) 编辑
摘要: 神经网络绘图工具集合 阅读全文
posted @ 2021-12-12 11:29 Christopher·阳 阅读(99) 评论(0) 推荐(1) 编辑
摘要: 距离(distance,差异程度)、相似度(similarity,相似程度)方法可以看作是以某种的距离函数计算元素间的距离,这些方法作为机器学习的基础概念,广泛应用于如:Kmeans聚类、协同过滤推荐算法、相似度算法、MSE损失函数等等。本文对常用的距离计算方法进行归纳以及解析,分为以下几类展开: 阅读全文
posted @ 2021-12-11 09:34 Christopher·阳 阅读(914) 评论(0) 推荐(1) 编辑