彭谨

导航

2016年10月16日 #

主成分分析入门

摘要: 主成份分析: 主成份分析是最经典的基于线性分类的分类系统。这个分类系统的最大特点就是利用线性拟合的思路把分布在多个维度的高维数据投射到几个轴上。如果每个样本只有两个数据变量,这种拟合就是 其中和分别是样本的两个变量,而和则被称为loading,计算出的P值就被称为主成份。实际上,当一个样本只有两个变量的时候,主成份分析本质上就是做一个线性回归。公式本质上就是一条直线。 插入一幅图(主成份坐标旋转图... 阅读全文

posted @ 2016-10-16 09:20 彭谨 阅读(63252) 评论(4) 推荐(3) 编辑

如何对医学大数据进行分类

摘要: 评估预测器预测的工作效率 判断分类器的工作效率需要使用召回率和准确率两个变量。 召回率:Recall,又称"查全率", 准确率:Precision,又称"精度"、"正确率"。 以判断病人是否死亡的分类器为例,可以把分类情况用下表表示: 实际死亡实际未死亡分类为死亡AB分类为未死亡CD表5-2 A:正确分类,命中死亡 B:错误分类,判断为死亡实际未死亡 C:错误分类,判断为未亡实际死亡 D:正确分... 阅读全文

posted @ 2016-10-16 09:18 彭谨 阅读(2871) 评论(0) 推荐(0) 编辑