有前提条件
- 样本量
- 各变量之间必须有相关性(被归纳在一个因子里强相关,因子间弱相关)
因子分析:对定量数据,不对定性数据
特征值大于1
自己设置几个因子
旋转后,就是调整能够解释的项的占比,
选择原则
1.贡献率0.5
2.大于1
3.可解释
- 纠缠不清:根据专业知识判断
- 张冠李戴:大部队与某一项关联,但是其中的一个因素和大部队不同,这时需要把这一个因素剔除掉
共同度:比较低的不要
- 探索因子,就是把它归类
- 计算权重,就是看最后得到所有因子各占的比例,如果需要的因子相加不为1,则需要标准化。
===========================================
对应分析:类别数据之间的关系
手机品牌偏好和收入水平之间的关系
手机品牌偏好确实有差异
收入水平确实有差异
重点:图
高收入与E品牌有关系
离原点越远表示差异性越强
=========================================
X、Y两个矩阵之间的关系,但是比较困难
X做好多个线性组合A,B,C,D
Y做好多个线性组合E,F,G,H
将这两组线性组合相互成对并比较,找到相关性最强的线性组合。
即比较A-E,A-f,A-G,A-H,B-E,B-f,B-G,B-H,C-E,C-f,C-G,C-H,D-E,D-f,D-G,D-H之间的相关性,假如A-E最强,就将它挑选出来。
然后还剩下
X线性组合B,C,D
Y线性组合F,G,H
再以同样方式比较,但是不同的是,选择的线性组合必须与A且与E正交。
假如第二组选择的是B-F,则需要B与A正交,B与E正交,F与A正交,F与E正交,即B与A不相关,B与E不相关,F与A不相关,F与E不相关。
以此类推。
第二组解释第一组没解释的部分
标准化
解释
- 通过线性组合
- 线性组合与单元变量的相关性
=====================================
目的一:消灭信息重叠--PCA
目的二:探讨变量内的联系和结构:FA
PCA:1.尽量多保留信息2.主成分之间不相关
用途:
- 主成分评价:
- 主成分回归,解决共线性问题
小于1个主成分都不用考虑