摘要:
朴素贝叶斯法可以用来做多分类问题。阅读本篇之前需要先去了解一下贝叶斯公式。 先验概率:事情还没有发生,根据以往的经验来判断事情发生的概率。是“由因求果”的体现,是单独事件概率,如 $P(X),P(Y)$。 后验概率:事情已经发生了,有多种原因,判断事情的发生是由哪一种原因引起的。是“由果求因”,一般 阅读全文
摘要:
所有的循环都可以转成递归,但递归不一定可以写成循环。 先贴一张图整体感受下递归: 通俗来讲:递归就是方法自己调用自己,每次传入的参数不同,每调用一次自己就开一个新的函数栈,在每个 栈空间完成自己的事情后再回到上一层栈空间,这样一来递归就可以分为三类: 1)上一层栈空间会利用下一层栈空间的运行结果:这 阅读全文
摘要:
1. 背景 假设现在有一个非常大的数组 arr,对数组里面的数字需要反复做两个操作: 1)随机的选择一块区间,然后对区间里面的所有数字求和。 2)随机修改数组里面的某一个值,即更新操作。 因为数组是随机存取的,所以更新操作很容易,其时间复杂度是 $O(1)$。 对于求和操作,其时间复杂度取决于区间的 阅读全文
摘要:
$k$ 近邻算法是一个有监督的机器学习算法,也被称为 $k-NN$ 算法,可以解决分类问题,也可以解决回归问题。 该方法的思路是:通过找出一个样本的 $k$ 个最近邻居,将这些邻居的某个(些)属性的平均值赋给该样本,就可以得到该样本对应属性的值。 $kNN$ 是懒惰学习(lazy learning) 阅读全文
摘要:
看本篇博客之前,首先得先去了解一下什么是梯度。梯度下降算法的思想,它将按如下操作达到最低点: 1)明确自己现在所处的位置。 2)找到相对于该位置而言下降最快的方向。 3)沿着第二步找到的方向走一小步,到达一个新的位置,此时的位置肯定比原来低。 4)回到第一步。 5)终止于最低点。 从数学角度来看,多 阅读全文
摘要:
定义:$n$ 维线性空间中维度为 $n - 1$ 的子空间,它可以把线性空间分割为不相交的两部分。 这里的 $n$ 必须大于 $3$,其子空间才能称之为超平面。 更直观得来理解超平面:超平面其实就是平面中的直线、空间中的平面之推广。在三维坐标系里,$XoY$ 平面把三维坐标系”分割”成 两个空间,这 阅读全文
摘要:
学一个模型最重要是要知道这个模型的: 1)适用条件。 2)它能够解决的问题。 3)对应的统计学习方法的三要素,即假设空间,策略和求解算法。 感知机的假设空间 适用条件:感知机是一种线性分类模型,也就是说输入的数据必须是线性可分的。线性可分是说可以用一个线性函数把两类样本分开, 比如二维空间中的直线、 阅读全文
摘要:
1. 关于三角形边的不等式 关于三角形有一个常用的不等式,以下面的三角形为例: $$a + b > c \\a + c > b \\b + c > a$$ 上面的三个不等式很容易理解,两点之间直线段最短,而两边之和相当于折线段,必然会小于直线段的长度。 上面三个不等式进行移项有 $$a > c - 阅读全文
摘要:
统计学习:也称统计机器学习,是计算机基于数据构建概率统计模型,并用模型进行预测与分析的一门学科。 函数:描述客观世界变化规律的数学模型。 数据是统计学习的对象。统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。这些数据具有某种共同的性质, 并且由于具有统计规律性,因此可以 阅读全文
摘要:
Kaggle 上有各种机器学习的项目,有数据,有各种竞赛。用户可以随便参加竞赛,下载数据,然后得到成绩排名,排名在前的人还会得到竞赛奖金, 1. 访问 google 安装 Google Chrome 浏览器,直接百度搜索该软件即可。 然后还需要安装该浏览器的一个插件:谷歌访问助手。通过安装该插件可以 阅读全文