摘要: REF[24]随机森林是一个很好适用于微阵列数据的分类算法:1.即使大多数的预测变量都是噪音,RF仍然具有优秀的性能,因此不需要对基因进行预选择。2.能够应用于变量数远远大于观测数据量的情况3.能用于两类和多于两个分类问题的情况4.返回变量重要性测量5.不会过拟合6.能处理分类和连续预测器的混合7.... 阅读全文
posted @ 2014-03-07 17:45 黎嫣 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 偏最小二乘法是一种新型的多元统计数据分析方法,它于1983年由伍德(S.Wold)和阿巴诺(C.Albano)等人首提示来的,偏最小二乘法有机的结合起来了,在一个算法下,可以同时实现回归建模(多元线性回归)、数据结构简化(主成分分析)以及两组变量之间的相关性分析(典型相关分析)。这是多元统计数据分析中的一个飞跃。偏最小二乘法在统计应用中的重要性体现在以下几个方面: 偏最小二乘法是一种多因变量对多自变量的回归建模方法。偏最小二乘法可以较好的解决许多以往用普通多元回归无法解决的问题。 偏最小二乘法之所以被称为第二代回归方法,还由于它可以实现多种数据分析方法的综合应用。 主成分回归的主要目的是要提取 阅读全文
posted @ 2014-03-07 16:30 黎嫣 阅读(2629) 评论(0) 推荐(0) 编辑