列联表和crosstab(MATLAB)
二维列联表
二维列联表又称 \(r \times s\) 列联表。
我们从两种角度观察一组数据。第一种将被观察对象分为\(r\)类,比如,被调查群体吸烟和不吸烟的人数。第二种将被观察对象分为\(s\)类,比如,被调查群体中患肺癌和未患肺癌的人数。此时二维列联表是一个矩阵\(X \in \mathbb{N}^{r \times s}\),其中\(x_{ij}\)表示同时属于第一种角度的第\(i\)类,和第二种角度的第\(j\)类的个数。比如,吸烟并患肺癌的人数。
卡方检验
Pearson 卡方检验,判断各变量之间的独立性。TBC
MATLAB中的函数crosstab
输入变量\(a \in \\{ 1, \dots, r \\}^N, b \in \\{1, \dots, s \\}^N\),其中\(N\)是被观察对象的个数。
[
[ \rm{table, chi2, p, labels} ] = \rm{crosstab}(a, b)
]
其中\(\rm{table}\)就是二联表\(X\),其中\(x_{ij} = \sum_{p,q} (a_p == i)*(b_q == j)\)。\(\rm{chi2}\)是卡方检验。
labels是每一类的名称,按照我们上述的描述,第一种角度的第一类叫1,第二类叫2,等等。但也可能第一种角度第一类就叫2,也是可以的
--- 我是仙, 我不是神