Logistic回归中估计系数的标准差、P值等为NAN

仅考虑等方差情形:

估计系数\(\hat{\beta}_j\)的标准误差(即Python输出结果中的std err\(s(\hat{\beta}_j)=\hat{\sigma}\sqrt{c_{jj}}\)

\(\hat{\sigma}^2=\frac{SSE}{n-p}=\frac{总平方和-回归平方和}{n-p}\)

\((X^TX)^{-1}=\{c_{ij}\}_{p\times p}\)\(X_{n\times p}\)\(rk(X)=rk(X^T)=r,r<p\)

此时矩阵\(X\)不是列满秩,根据\(rk(AB)\le min\{rk(A),rk(B)\}\),得到\(rk(X^TX)\le min\{rk(X^T),rk(X)\}=rk(X)=r<p\),而\(X^TX\)\(p\times p\)维度的

因此\(X^TX\)无法求逆,即无法求出\(c_{jj}\),因此输出std err为nan

Python结果中的z、P>|z|、[0.025 0.0975]的计算均与std err有关,因此也相应输出为nan

posted @ 2021-01-06 10:07  penny618  阅读(2448)  评论(0编辑  收藏  举报