摘要: 1 阅读全文
posted @ 2018-10-29 16:21 李威威 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 快速的数据科学教程: https://www.kaggle.com/learn/overview 阅读全文
posted @ 2018-10-29 15:52 李威威 阅读(471) 评论(0) 推荐(0) 编辑
摘要: 【转载】使用 scikit learn 进行特征选择 Read more: http://bluewhale.cc/2016 11 25/use scikit learn for feature selection.html ixzz5UMdz0779 阅读全文
posted @ 2018-10-29 15:42 李威威 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 理解贝叶斯公式其实就只要掌握:1、条件概率的定义;2、乘法原理 $$ P(c_i|x) = \cfrac{P(x|c_i)P(c_i)}{P(x)} $$ 这里 $x$ 是一个向量,有几个特征,就有几个维度。朴素贝叶斯就假设这些特征独立同分布,即 $$ P(x|c_i) = P(x_1|c_i)P( 阅读全文
posted @ 2018-10-29 15:37 李威威 阅读(3828) 评论(1) 推荐(0) 编辑
摘要: 一级标题已经出现在第 1 行了,因此,不标注“ ”设置一级标题。 参考博客模板 数学公式设置:$a=b+c$ EM算法推导: https://www.cnblogs.com/crackpotisback/p/9855756.html 算法系列教程04 算法相关的基础概念: https://www.c 阅读全文
posted @ 2018-10-29 13:32 李威威 阅读(385) 评论(0) 推荐(0) 编辑
摘要: 评价指标是针对同样的数据,输入不同的算法,或者输入相同的算法但参数不同而给出这个算法或者参数好坏的定量指标。 以下为了方便讲解,都以二分类问题为前提进行介绍,其实多分类问题下这些概念都可以得到推广。 准确率 准确率是最好理解的评价指标,它是一个比值: $$ 准确率 = \cfrac{算法分类正确的数 阅读全文
posted @ 2018-10-29 12:44 李威威 阅读(21337) 评论(0) 推荐(3) 编辑
摘要: PCA 这个名字看起来比较玄乎,其实就是给数据换一个坐标系,然后非常生硬地去掉一些方差很小的坐标轴。 例:三维空间中,有一些数据只分布在一个平面上,我们通过“坐标系旋转变换”,使得数据所在的平面与 $x$,$y$ 平面重合,那么我们就可以用 $x'$,$y'$ 两个维度表达原始数据,并且没有任何损失 阅读全文
posted @ 2018-10-29 11:16 李威威 阅读(2890) 评论(0) 推荐(0) 编辑