2018年3月6日

摘要: 1 子集搜索与评价"> 对于一个学习任务,我们将属性称之为特征。对当前学习任务有用的称为">“相关特征">”,没什么用的称为">“无关特征">”。从特征集合中选择出相关特征子集的过程称为">“特征选择">”。"> 特征选择属于“数据预处理”过程,进行特征选择的两个原因:">(1)减轻维数,与降维动机相似;">(2)去除不相关特征会降低学习任务的难度。"> ... 阅读全文
posted @ 2018-03-06 20:20 柯尔特 阅读(1506) 评论(0) 推荐(0) 编辑

2018年3月5日

摘要: 前言 看了好久书了,该总结一下了。如果有理解不到位的地方,欢迎批评。摘要1 个体与集成 集成学习通过结合多个学习器来完成学习任务,他的一般结构是:先产生一组“个体学习器”,再用某种策略结合起来。“个体学习器”通常由现有算法(如决策树算法、BP神经网络算法等)产生。一组“个体学习器”是相同类型的,称其为同质集成(homogeneous),类型不同称其为异质集成。同质集成的个体学习器称... 阅读全文
posted @ 2018-03-05 16:03 柯尔特 阅读(1966) 评论(1) 推荐(0) 编辑
摘要: 1 k邻*学习"> k邻*(KNN)学习是一种常用的监督学习,懒惰学习的代表。通常在分类任务中使用“投票法”,即选择">k个样本中出现最多的类别标记作为预测结果;回归任务中使用“*均法”。还可基于距离远*加权*均或者加权投票。">2 低维嵌入"> 由于knn在多维的时候会使样本数目达到天文数字,高维度空间会给距离计算带来巨大的麻烦,甚至连内积都不容易。高维出现的样本... 阅读全文
posted @ 2018-03-05 16:00 柯尔特 阅读(847) 评论(0) 推荐(0) 编辑
摘要: 1 聚类 聚类是无监督学习,聚类试图将样本划分为若干个不想交的子集,每个子集称为簇。常见的无监督学习除了聚类还有密度估计、异常检测等。 聚类既可以寻找数据内在分布结构,也可以作为分类任务的前驱。2 性能度量 聚类性能度量即聚类“有效性指标”(validity index),聚类希望的结果是“簇间相似度低”而 “簇内相似度”高。 聚类的性能度量大致分两类:外部... 阅读全文
posted @ 2018-03-05 15:59 柯尔特 阅读(621) 评论(0) 推荐(0) 编辑

导航