t 检验+R语言第九章方差分析+相关性图+主成分分析

用MASS包中的UScrime数据集

一、

1.独立样本的t检验

我们比较的对象是南方和非南方各州，因变量为监禁的概率。一个针对两组的独立样本t检验可以用于检验两个总体的均值相等的假设。

library(MASS)

t.test(Prob~So,data=UScrime)

2 非独立样本的t检验

library(MASS)

sapply(UScrime[c("U1","U2")],function(x)(c(mean=mean(x),sd=sd(x))))

with(UScrime,t.test(U1,U2,paired=TRUE))

3.多于两组的情:使用方差分析（ANOVA）

二、

组间差异的非参数检验:结果变量在本质上就严重偏倚或呈现有序关系

4.两组的比较

若两组数据独立，可以使用Wilcoxon秩和检验（更广为人知的名字是Mann–Whitney U检验）

with(UScrime,by(Prob,So,median))

wilcox.test(Prob~So,data=UScrime)

5.多于两组的比较

如果各组独立，则Kruskal—Wallis检验将是一种实用的方法。

states<-as.data.frame(cbind(state.region,state.x77))

kruskal.test(Illiteracy~state.region,data=states)

第八章回归

1.拟合并解释线性模型

2.检验模型假设

3.模型选择

用一个或多个预测变量（也称自变量或解释变量）来预测响应变量（也称因变量、效标变量或结果变量）的方法。

预测一个人在跑步机上锻炼时预期消耗的卡路里数。

第九章方差分析

方差分析主要通过F检验来进行效果评测，若治疗方案的F检验显著，则说明五个星期后两种疗法的STAI得分均值不同。

单因素方差

library(multcomp)

attach(cholesterol)

table(trt)

aggregate(response,by=list(trt),FUN=mean)

aggregate(response,by=list(trt),FUN=sd)

fit<-aov(response~trt)

summary(fit)

带有置信区间的组均值图形

install.packages("gplots")

library(gplots)

plotmeans(response~trt,xlab="Treatment",ylab="Response",main="Mean Plot\nwith95% CI")

detach(cholesterol)

#多重比较(没做出来)

install.packages("multcomp")

library(multcomp)

par(mar=c(5,4,6,2))

tuk<-glht(fit,linfct=mcp(trt="Tukey"))

plot(cld(tuk,level=0.5),col="lightgrey')

TukeyHSD(fit)

install.packages("carData")

library(car)

qqplot(lm(response~trt,data=cholesterol),simulate=TRUE,main="Q-Q plot",labels=FALSE)

setwd("E:/rdata")

read.csv("土培11.csv")

a<-read.csv("土培11.csv")

head(a)

fit<-aov(根干重~根数,data=a)

summary(fit)

#多元方差分析

单因素多元方差分析

library(MASS)

attach(UScereal)

y<-cbind(calories,fat,sugars)#cbind()函数将三个因变量（卡路里、脂肪和糖）合并成一个矩阵

aggregate(y,by=list(shelf),FUN=mean)#aggregate()函数可获取货架的各个均值，cov()则输出各谷物间的方差和协方差。

cov(y)

fit<-manova(y~shelf) #manova()函数能对组间差异进行多元检验。

summary(fit)

summary.aov(fit)

相关图

option(digits=2)

cor(mtcars)

install.packages("corrgram")

library(corrgram)

corrgram(mtcars,order=TRUE,lower.panel=panel.shade,

upper.panel=panel.pie,text.panel=panel.txt,

main="Correlogram of mtcars intercorrelations")

corrgram(a,order=TRUE,lower.panel=panel.shade,

upper.panel=panel.pie,text.panel=panel.txt,

main="根系指标相关性的相关图 ")

蓝色和从左下指向右上的斜杠表示单元格中的两个变量呈正相关。反过来，红色和从左上指向右下的斜杠。表示变量呈负相关。色彩越深，饱和度越高，说明变量相关性越大。

主成分分析

判断主成分的个数

library(psych)

fa.parallel(Harman23.cor$cov,n.ob=302,fa="pc",n.iter=100,show.legend=FALSE,main="Scree plot parallel analysis")

fa.parallel(a,n.ob=302,fa="pc",n.iter=100,show.legend=FALSE,main="PCA个数")

library(psych)

pc<-principal(a[,-1],nfactors=1)

提取主成分，nfactor设定主成分数

posted @ 2021-11-10 21:03 ^_^Anne 阅读(636) 评论(0) 收藏举报

刷新页面返回顶部

t 检验+R语言第九章方差分析+相关性图+主成分分析

公告