列联表和crosstab(MATLAB)

二维列联表

二维列联表又称 \(r \times s\) 列联表。

我们从两种角度观察一组数据。第一种将被观察对象分为\(r\)类,比如,被调查群体吸烟和不吸烟的人数。第二种将被观察对象分为\(s\)类,比如,被调查群体中患肺癌和未患肺癌的人数。此时二维列联表是一个矩阵\(X \in \mathbb{N}^{r \times s}\),其中\(x_{ij}\)表示同时属于第一种角度的第\(i\)类,和第二种角度的第\(j\)类的个数。比如,吸烟并患肺癌的人数。

卡方检验

Pearson 卡方检验,判断各变量之间的独立性。TBC

MATLAB中的函数crosstab

输入变量\(a \in \\{ 1, \dots, r \\}^N, b \in \\{1, \dots, s \\}^N\),其中\(N\)是被观察对象的个数。
[
[ \rm{table, chi2, p, labels} ] = \rm{crosstab}(a, b)
]
其中\(\rm{table}\)就是二联表\(X\),其中\(x_{ij} = \sum_{p,q} (a_p == i)*(b_q == j)\)\(\rm{chi2}\)是卡方检验。

labels是每一类的名称,按照我们上述的描述,第一种角度的第一类叫1,第二类叫2,等等。但也可能第一种角度第一类就叫2,也是可以的

posted @ 2014-12-18 15:09  小雨初晴爱学习  阅读(3104)  评论(0编辑  收藏  举报