摘要: 待整理…… 阅读全文
posted @ 2019-11-06 14:06 小稣 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 待整理…… 阅读全文
posted @ 2019-11-06 09:56 小稣 阅读(80) 评论(0) 推荐(0) 编辑
摘要: 没有监督标签,只有x特征值,没有y,没有办法去预测,没有办法证明你做的对错,这样的数据集,我们能做的是什么呢?就是非监督机器学习。常见的算法就是聚类或者降维。聚类做的是什么?就是挖掘数据集中的规律的存在,通过把相似的数据归类,帮助我们探索数据集里的样本如何划分,比如可以将用户分群,不同的营销策略。聚 阅读全文
posted @ 2019-11-04 11:55 小稣 阅读(281) 评论(0) 推荐(0) 编辑
摘要: 一、类型 1、从样例中学习: 1.符号主义学习:决策树 2.连接主义学习:神经网络 深度学习 (深度学习的第二春原因:数据大了、计算能力强了。) 2、统计学习: 支持向量机(核方法) 二、模型评估与选择 我们希望的是,在新样本上能表现很好的学习器。为了达到这个目的,应该从训练样本中尽可能学出适用于所 阅读全文
posted @ 2019-11-01 13:52 小稣 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 线性模型形式简单,易于建模,但却蕴含着机器学习中一些重要的基本思想,许多功能更为强大的非线性模型可在线性模型的基础上通过引入层级结构或高维映射而得。 一、线性回归 线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,在小数据中运用十分广泛。分析按照自变 阅读全文
posted @ 2019-10-31 11:55 小稣 阅读(716) 评论(0) 推荐(0) 编辑
摘要: 是基本算法,和决策树一样,是树模型中的基础算法,朴素贝叶斯是贝叶斯中的一个算法,是基于统计学的,在文本处理领域应用广泛。 需要先掌握贝叶斯定理: 联合概率(两个事件同时发生的概率) 条件概率(事件A发生的情况下,B的概率)= AB的联合概率/A发生的概率 乘法公式:条件概率变形 联合概率—条件概率— 阅读全文
posted @ 2019-10-30 17:37 小稣 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 思路:算法原理、API调用、调差 sklearn 一般的做法是API里面找到你要调用的方法,然后可以查看方法参数的情况和使用情况。也可以在指南里面找到具体的解释。 sklearn库的算法主要有四类:分类,回归,聚类,降维。 请看:https://blog.csdn.net/u014248127/ar 阅读全文
posted @ 2019-10-30 10:19 小稣 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 简介 机器学习算法其实很古老,作为一个码农经常会不停的敲if, else if, else,其实就已经在用到决策树的思想了。只是你有没有想过,有这么多条件,用哪个条件特征先做if,哪个条件特征后做if比较优呢?怎么准确的定量选择这个标准就是决策树机器学习算法的关键了。 在这个算法中,基本的构造流程, 阅读全文
posted @ 2019-10-29 11:26 小稣 阅读(186) 评论(0) 推荐(0) 编辑
摘要: 利用这个算法,学习一些机器学习中的基本概念。KNN是分类算法。 物以类聚人以群分的思想,KNN是一个没有学习过程的,不算模型,消耗的运算量比较大。 一、算法的数学原理 两点的距离计算,二维是勾股定理,三维和高维是类似的。 二、手写代码实现 三、scikit-learn 算法库实现 https://s 阅读全文
posted @ 2019-10-28 11:38 小稣 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 常用的是有监督学习和无监督学习。有监督学习,就是有目标值的。有正确答案。没有目标标签的,没有正确答案的就是无监督学习,就是聚类。更多是有目标的,离散的数据就是分类,连续的数据就是回归。两分类的问题相对简单。 阅读全文
posted @ 2019-10-28 11:15 小稣 阅读(194) 评论(0) 推荐(0) 编辑