摘要: 前言 集成学习是通过构建并结合多个学习器来完成学习任务,主要包含两类,一是 个体学习器间 存在 强依赖关系、必须串行生成得序列化方法,比如提升学习方法、提升树GBDT、xgboost等,主要思想是boosting迭代将弱学习器提升为强学习器;二是个体学习器之间不存在强依赖关系、可同时生成得并行化方法 阅读全文
posted @ 2018-08-03 16:48 我们都是大好青年 阅读(1244) 评论(0) 推荐(0) 编辑
摘要: PCA操作流程 1、去平均值,每一位特征减去均值,(当然,为了避免量纲以及数据量级差异的影响,先标准化是必要的) 2、计算协方差矩阵 3、计算协方差矩阵的特征值与特征向量 4、对特征值从大到小排序 5、保留最大的几个特征向量 6、将数据转换到特征特征向量构建的新空间中 阅读全文
posted @ 2018-08-03 11:47 我们都是大好青年 阅读(173) 评论(0) 推荐(0) 编辑