摘要: 分类和决策树(DT)。 决策树是预测建模机器学习的一种重要算法。 决策树模型的表示是二叉树。就是算法和数据结构中的二叉树,没什么特别的。每个节点表示一个单独的输入变量(x)和该变量上的左右孩子(假设变量为数值)。 树的叶节点包含一个输出变量(y),用于进行预测。通过遍历树,直到到达叶节点并输出叶节点 阅读全文
posted @ 2018-05-17 23:02 Skye_Zhao 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯算法。 朴素贝叶斯是一种简单但功能强大的预测建模算法。该模型由两种类型的概率组成,可以直接从训练数据中计算:每个类的概率。每个类给定每个x值的条件概率。一旦计算出概率模型,就可以利用贝叶斯定理对新数据进行预测。 当你的数据是实值时,通常假设高斯分布(钟形曲线),这样你就可以很容易地估计这些 阅读全文
posted @ 2018-05-17 23:00 Skye_Zhao 阅读(193) 评论(0) 推荐(0) 编辑
摘要: K近邻算法。 KNN算法非常简单,非常有效。KNN算法适合样本较少典型性较好的样本集。 KNN的模型表示是整个训练数据集。也可以说是:KNN的特点是完全跟着数据走,没有数学模型可言。 对一个新的数据点进行了预测,通过对K个最类似的实例(邻居)的整个训练集进行搜索,并对这些K实例的输出变量进行汇总。对 阅读全文
posted @ 2018-05-17 22:59 Skye_Zhao 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 学习矢量量化。 k近邻的缺点是你需要维持整个数据集的训练。 学习矢量量化算法(简称LVQ)是一种人工神经网络算法,它允许你选择要挂在多少个训练实例上,并精确地了解这些实例应该是什么样子。 LVQ的表示是一个codebook 向量的集合。这些都是在开始时随机选择的,并根据学习算法的多次迭代对训练数据集 阅读全文
posted @ 2018-05-17 22:57 Skye_Zhao 阅读(384) 评论(0) 推荐(0) 编辑