摘要: 过拟合:当某个模型过度的学习训练数据中的细节和噪音,以至于模型在新的数据上表现很差,我们称过拟合发生了,通俗点就是:模型在训练集中测试的准确度远远高于在测试集中的准确度。 过拟合问题通常发生在变量特征过多的时候。这种情况下训练出的方程总是能很好的拟合训练数据,也就是说,我们的代价函数可能非常接近于0 阅读全文
posted @ 2018-11-07 16:53 时间带着假象流淌 阅读(1161) 评论(0) 推荐(0) 编辑
摘要: 机器学习最通俗的解释就是让机器学会决策。对于我们人来说,比如去菜市场里挑选芒果,从一堆芒果中拿出一个,根据果皮颜色、大小、软硬等属性或叫做特征,我们就会知道它甜还是不甜。类似的,机器学习就是把这些属性信息量化后输入计算机模型,从而让机器自动判断一个芒果是甜是酸,这实际上就是一个分类问题。 分类和回归 阅读全文
posted @ 2018-11-07 16:33 时间带着假象流淌 阅读(3518) 评论(0) 推荐(0) 编辑
摘要: 回归分析是一个广泛使用的统计工具,用于建立两个变量之间的关系模型。 这些变量之一称为预测变量,其值通过实验收集。 另一个变量称为响应变量,其值来自预测变量。 在线性回归中,这两个变量通过一个等式相关联,其中这两个变量的指数(幂)是1。数学上,当绘制为图形时,线性关系表示直线。任何变量的指数不等于1的 阅读全文
posted @ 2018-11-07 12:30 时间带着假象流淌 阅读(725) 评论(0) 推荐(0) 编辑