摘要: 这个监督式学习算法通常被用于分类问题。令人惊奇的是,它同时适用于分类变量和连续因变量。在这个算法中,我们将总体分成两个或更多的同类群。这是根据最重要的属性或者自变量来分成尽可能不同的组别。想要知道更多,可以阅读:简化决策树。 阅读全文
posted @ 2018-05-24 16:02 我不是小鲁班 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 线性回归 线性回归通常用于根据连续变量估计实际数值(房价、呼叫次数、总销售额等)。我们通过拟合最佳直线来建立自变量和因变量的关系。这条最佳直线叫做回归线,并且用 Y= a *X + b 这条线性等式来表示。 在这个等式中: Y:因变量 a:斜率 x:自变量 b :截距 系数 a 和 b 可以通过最小 阅读全文
posted @ 2018-05-24 10:12 我不是小鲁班 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 广义来说,有三种机器学习算法 1、 监督式学习 工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。监督式学习的例子有 阅读全文
posted @ 2018-05-24 09:53 我不是小鲁班 阅读(162) 评论(0) 推荐(0) 编辑