随笔分类 - 多元统计
摘要:变量选择是在面对高维数据时需要处理的问题,有三类处理的方法,分别是最优子集的搜索、变量的稀疏和压缩、降维和特征重构。 最优子集的搜索L:一类处理方法是从备选的变量集合里面筛选出对于我们的分析目的有更大贡献的子集,常用的方法由最优子集法、BIC\AIC准则选择法、随机森林等。 变量的压缩和稀疏:常用的
阅读全文
摘要:
intro 判别分析是一类监督学习,解决的是在已知标签的训练数据时,训练模型对未知标签的数据进行分类。在统计学习方法中有以下方法可以来做分析。 软分类:logistic回归、随机森林、神经网络等 硬分类:距离判别分析、贝叶斯判别分析、费希尔判别分析、支持向量机、决策树、朴素贝叶斯等 其中关于硬分类问
阅读全文
