摘要:
1 子集搜索与评价"> 对于一个学习任务,我们将属性称之为特征。对当前学习任务有用的称为">“相关特征">”,没什么用的称为">“无关特征">”。从特征集合中选择出相关特征子集的过程称为">“特征选择">”。"> 特征选择属于“数据预处理”过程,进行特征选择的两个原因:">(1)减轻维数,与降维动机相似;">(2)去除不相关特征会降低学习任务的难度。"> ... 阅读全文
摘要:
前言 看了好久书了,该总结一下了。如果有理解不到位的地方,欢迎批评。摘要1 个体与集成 集成学习通过结合多个学习器来完成学习任务,他的一般结构是:先产生一组“个体学习器”,再用某种策略结合起来。“个体学习器”通常由现有算法(如决策树算法、BP神经网络算法等)产生。一组“个体学习器”是相同类型的,称其为同质集成(homogeneous),类型不同称其为异质集成。同质集成的个体学习器称... 阅读全文
摘要:
1 k邻*学习"> k邻*(KNN)学习是一种常用的监督学习,懒惰学习的代表。通常在分类任务中使用“投票法”,即选择">k个样本中出现最多的类别标记作为预测结果;回归任务中使用“*均法”。还可基于距离远*加权*均或者加权投票。">2 低维嵌入"> 由于knn在多维的时候会使样本数目达到天文数字,高维度空间会给距离计算带来巨大的麻烦,甚至连内积都不容易。高维出现的样本... 阅读全文