摘要: 过度拟合(overfitting)是指数据模型在训练集里表现非常满意,但是一旦应用到真实业务实践时,效果大打折扣;换成学术化语言描述,就是模型对样本数据拟合非常好,但是对于样本数据外的应用数据,拟合效果非常差。在我们数据分析挖掘业务实践中,就是“模型搭建时表现看上去非常好,但是应用到具体业务实践时, 阅读全文
posted @ 2018-12-08 18:40 孩纸有点硬 阅读(681) 评论(0) 推荐(0) 编辑
摘要: kNN--近邻算法 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。 在机器学习中常用于分类。 数学内容: 欧氏距离公式,矩阵运算,归一化数值 python模块: numpy,operator(用其中的it 阅读全文
posted @ 2018-12-08 17:03 孩纸有点硬 阅读(381) 评论(0) 推荐(0) 编辑