12 2021 档案
摘要:机器学习中的监督学习本质上是给定一系列训练样本$(x_i,y_i)$,尝试学习$x \to y$的映射关系,使得给定一个$x$,即便这个$x$不在训练样本中,也能够得到尽量接近真实$y$的输出$\hat{y}$。而损失函数(Loss Function)则是这个过程中关键的一个组成部分,用来衡量模型的
阅读全文
摘要:机器学习 概率论相关应用部分,从大学课本中走出面向机器学习中概率的要求
阅读全文
摘要:上图是MapReduce的任务处理过程 概述 MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题. MapReduce是分布式运行的,由两个阶段组成:Map和Reduce,Map阶段是一个独立的程序,有很多个节点同时运行,每个节点处理一部分数据。Re
阅读全文
摘要:记录搭建hadoop的过程
阅读全文
摘要:简单实现MongoDB的复制集和分片的功能
阅读全文
摘要:背景 Local Outlier Factor(LOF)是基于密度的经典算法(Breuning et. al. 2000), 文章发表于 SIGMOD 2000, 到目前已经有 3000+ 的引用。 在 LOF 之前的异常检测算法大多是基于统计方法的,或者是借用了一些聚类算法用于异常点的识别(比如
阅读全文
摘要:主成分分析(Principal components analysis,以下简称PCA)是最常用的降维方法之一,在数据压缩和消除冗余方面具有广泛的应用,本文由浅入深的对其降维原理进行了详细总结。 1. 向量投影和矩阵投影的含义 如下图: 向量a在向量b的投影为: 其中,θ是向量间的夹角 。 向量a在
阅读全文
摘要:Introduce 感知机模型(Perceptron)是一个最简单的有监督的二分类线性模型。他可以从两个方面进行介绍 方面一 问题分析 问题(一维):儿童免票乘车问题(孩子身高低于1.2m可以免票上车) 这转换成数学表达式就是 $x:$身高,$y:\{-1:$免票 ,$1:$购票$\}$ $$ y=
阅读全文
摘要:先对几个概念和问题做一个解释: 图像为什么要灰度化? 识别物体,最关键的因素是梯度(SIFT/HOG),梯度意味着边缘,这是最本质的部分,而计算梯度,自然就用到灰度图像了,可以把灰度理解为图像的强度。 颜色,易受光照影响,难以提供关键信息,故将图像进行灰度化,同时也可以加快特征提取的速度。 仿射不变
阅读全文
摘要:范数本质是向量或者矩阵映射到实数域的单值函数。 假设$N(x)=\Vert x \Vert$是定义在$R^n$上的函数,她需要满足以下三个条件: 非负性: \(\Vert x \Vert \ge 0\),当且仅当$x=0$时,\(\Vert x \Vert = 0\) 齐次性:\(\Vert kx
阅读全文
摘要:Tensor的概念 说起张量(tensor)就不得不说他和scalar、vertor、matrix之间的关系了,直接上图: 标量(scalar):只有大小概念,没有方向的概念。通过一个具体的数值就能表达完整。比如:重量、温度、长度、提及、时间、热量等都数据标量。 向量(vector):物理学上也叫矢
阅读全文
摘要:交叉验证是一种用于估计机器学习模型性能的统计方法,它是一种评估统计分析结果如何推广到独立数据集的方法。
阅读全文
摘要:距离(distance,差异程度)、相似度(similarity,相似程度)方法可以看作是以某种的距离函数计算元素间的距离,这些方法作为机器学习的基础概念,广泛应用于如:Kmeans聚类、协同过滤推荐算法、相似度算法、MSE损失函数等等。本文对常用的距离计算方法进行归纳以及解析,分为以下几类展开:
阅读全文
摘要:有关CNN的详细介绍 原理及各部分作用更详细一些
阅读全文
摘要:转载于:https://www.toutiao.com/a6609148733269475848/
阅读全文
摘要:博客日常用于记录学习过程,心得以及一些好的技术帖 欢迎大家留言
阅读全文
摘要:欢迎来到我的友链小屋 展示本站所有友情站点,排列不分先后,均匀打乱算法随机渲染的喔! 友链信息 博客名称: Christopher·阳博客网址: https://www.cnblogs.com/young978/ 博客介绍: 低头不是认输,而是要看清自己的路;抬头不是骄傲,而是要看见自己的天空
阅读全文