柯尔特

机器学习十一-特征选择与稀疏学习

摘要： 1 子集搜索与评价"> 对于一个学习任务，我们将属性称之为特征。对当前学习任务有用的称为">“相关特征">”，没什么用的称为">“无关特征">”。从特征集合中选择出相关特征子集的过程称为">“特征选择">”。"> 特征选择属于“数据预处理”过程，进行特征选择的两个原因：">（1）减轻维数，与降维动机相似；">（2）去除不相关特征会降低学习任务的难度。"> ... 阅读全文

posted @ 2018-03-06 20:20 柯尔特阅读(1635) 评论(0) 推荐(0)

机器学习（八）——集成学习

摘要：前言看了好久书了，该总结一下了。如果有理解不到位的地方，欢迎批评。摘要1 个体与集成集成学习通过结合多个学习器来完成学习任务，他的一般结构是：先产生一组“个体学习器”，再用某种策略结合起来。“个体学习器”通常由现有算法（如决策树算法、BP神经网络算法等）产生。一组“个体学习器”是相同类型的，称其为同质集成（homogeneous）,类型不同称其为异质集成。同质集成的个体学习器称... 阅读全文

posted @ 2018-03-05 16:03 柯尔特阅读(2086) 评论(1) 推荐(0)

机器学习十-降维与度量学习

摘要： 1 k邻*学习"> k邻*（KNN）学习是一种常用的监督学习，懒惰学习的代表。通常在分类任务中使用“投票法”，即选择">k个样本中出现最多的类别标记作为预测结果；回归任务中使用“*均法”。还可基于距离远*加权*均或者加权投票。">2 低维嵌入"> 由于knn在多维的时候会使样本数目达到天文数字，高维度空间会给距离计算带来巨大的麻烦，甚至连内积都不容易。高维出现的样本... 阅读全文

posted @ 2018-03-05 16:00 柯尔特阅读(937) 评论(0) 推荐(0)

机器学习九-聚类

摘要： 1 聚类聚类是无监督学习，聚类试图将样本划分为若干个不想交的子集，每个子集称为簇。常见的无监督学习除了聚类还有密度估计、异常检测等。聚类既可以寻找数据内在分布结构，也可以作为分类任务的前驱。2 性能度量聚类性能度量即聚类“有效性指标”（validity index），聚类希望的结果是“簇间相似度低”而 “簇内相似度”高。聚类的性能度量大致分两类：外部... 阅读全文

posted @ 2018-03-05 15:59 柯尔特阅读(704) 评论(0) 推荐(0)

导航

公告