上一页 1 2 3 4 5 6 ··· 11 下一页
摘要: 【转载】使用 scikit learn 进行特征选择 Read more: http://bluewhale.cc/2016 11 25/use scikit learn for feature selection.html ixzz5UMdz0779 阅读全文
posted @ 2018-10-29 15:42 李威威 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 理解贝叶斯公式其实就只要掌握:1、条件概率的定义;2、乘法原理 $$ P(c_i|x) = \cfrac{P(x|c_i)P(c_i)}{P(x)} $$ 这里 $x$ 是一个向量,有几个特征,就有几个维度。朴素贝叶斯就假设这些特征独立同分布,即 $$ P(x|c_i) = P(x_1|c_i)P( 阅读全文
posted @ 2018-10-29 15:37 李威威 阅读(3956) 评论(1) 推荐(0) 编辑
摘要: 一级标题已经出现在第 1 行了,因此,不标注“ ”设置一级标题。 参考博客模板 数学公式设置:$a=b+c$ EM算法推导: https://www.cnblogs.com/crackpotisback/p/9855756.html 算法系列教程04 算法相关的基础概念: https://www.c 阅读全文
posted @ 2018-10-29 13:32 李威威 阅读(387) 评论(0) 推荐(0) 编辑
摘要: 评价指标是针对同样的数据,输入不同的算法,或者输入相同的算法但参数不同而给出这个算法或者参数好坏的定量指标。 以下为了方便讲解,都以二分类问题为前提进行介绍,其实多分类问题下这些概念都可以得到推广。 准确率 准确率是最好理解的评价指标,它是一个比值: $$ 准确率 = \cfrac{算法分类正确的数 阅读全文
posted @ 2018-10-29 12:44 李威威 阅读(21559) 评论(0) 推荐(3) 编辑
摘要: PCA 这个名字看起来比较玄乎,其实就是给数据换一个坐标系,然后非常生硬地去掉一些方差很小的坐标轴。 例:三维空间中,有一些数据只分布在一个平面上,我们通过“坐标系旋转变换”,使得数据所在的平面与 $x$,$y$ 平面重合,那么我们就可以用 $x'$,$y'$ 两个维度表达原始数据,并且没有任何损失 阅读全文
posted @ 2018-10-29 11:16 李威威 阅读(2951) 评论(0) 推荐(0) 编辑
摘要: 关键词:间隔最大化、无约束优化问题、有约束优化问题、凸函数、仿射函数、凸二次规划问题、希尔伯特空间、拉格朗日乘子法、拉格朗日对偶函数、KKT 条件 研究思路 支持向量机(support vector machines,SVM)是一种二分类模型。 1、硬间隔最大的线性可分的支持向量机 前提:数据线性可 阅读全文
posted @ 2018-10-08 12:25 李威威 阅读(689) 评论(0) 推荐(1) 编辑
摘要: 官方文档:http://scikit learn.org/stable/modules/generated/sklearn.preprocessing.PolynomialFeatures.html 使用 这个类可以进行特征的构造,构造的方式就是特征与特征相乘(自己与自己,自己与其他人),这种方式叫 阅读全文
posted @ 2018-09-27 21:20 李威威 阅读(38872) 评论(0) 推荐(4) 编辑
摘要: (转载)FM算法 https://zhuanlan.zhihu.com/p/33184179 阅读全文
posted @ 2018-09-27 18:33 李威威 阅读(156) 评论(0) 推荐(0) 编辑
摘要: Kaggle_Titanic生存预测 详细流程吐血梳理 https://blog.csdn.net/Koala_Tree/article/details/78725881 Kaggle中Titanic项目简单入门 https://blog.csdn.net/masbbx123/article/det 阅读全文
posted @ 2018-09-27 16:27 李威威 阅读(161) 评论(0) 推荐(0) 编辑
摘要: https://www.jianshu.com/p/516f009c0875 阅读全文
posted @ 2018-09-27 16:15 李威威 阅读(201) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 11 下一页