摘要: 防止过拟合的处理方法 过拟合 我们都知道,在进行数据挖掘或者机器学习模 型建立的时候,因为在统计学习中,假设数据满足独立同分布(i.i.d,independently and identically distributed),即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立 阅读全文
posted @ 2017-03-28 22:27 静悟生慧 阅读(530) 评论(0) 推荐(0) 编辑
摘要: 1 梯度法 就是直接对目标函数进行计算,然后判断其是否凸。具体地,就是计算目标函数的一阶导数和二阶导数。然后作出判断。 凸函数的一阶充要条件 等号右边是对函数在x点的一阶近似。这个条件的意义是,对于函数在定义域的任意取值,函数的值都大于或者等于对函数在这点的一阶近似。用图来说明就是: 通过图可以很清 阅读全文
posted @ 2017-03-28 22:20 静悟生慧 阅读(10743) 评论(1) 推荐(1) 编辑
摘要: 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。 本文目录: 1. 欧氏距离 2. 阅读全文
posted @ 2017-03-28 18:55 静悟生慧 阅读(178) 评论(0) 推荐(0) 编辑