摘要: 在实际应用中,一般会选择将数据集划分为训练集(training set)、验证集(validation set)和测试集(testing set)。其中,训练集用于训练模型,验证集用于调参、算法选择等,而测试集则在最后用于模型的整体性能评估。 1. 留出法 (Hold-out) 将数据集D划分为2个 阅读全文
posted @ 2018-11-23 17:33 KHBK 阅读(629) 评论(0) 推荐(0) 编辑
摘要: 机器学习的定义:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E,使其在T中任务获得了性能改善,我们则说关于任务类T和P,该程序对经验E进行了学习(Mitchell, 1997)。 机器学习的研究内容:关于在计算机上从数据中产生模型的算法,即学习算法(learning algo 阅读全文
posted @ 2018-11-23 15:43 KHBK 阅读(478) 评论(0) 推荐(0) 编辑