t 检验+R语言第九章方差分析+相关性图+主成分分析

用MASS包中的UScrime数据集

一、

1.独立样本的t检验

我们比较的对象是南方和非南方各州,因变量为监禁的概率。一个针对两组的独立样本t检验可以用于检验两个总体的均值相等的假设。

library(MASS)
t.test(Prob~So,data=UScrime)

2 非独立样本的t检验

library(MASS)
sapply(UScrime[c("U1","U2")],function(x)(c(mean=mean(x),sd=sd(x))))

 with(UScrime,t.test(U1,U2,paired=TRUE))

3.多于两组的情:使用方差分析(ANOVA)

二、

组间差异的非参数检验:结果变量在本质上就严重偏倚或呈现有序关系

4.两组的比较

若两组数据独立,可以使用Wilcoxon秩和检验(更广为人知的名字是Mann–Whitney U检验)
with(UScrime,by(Prob,So,median))
wilcox.test(Prob~So,data=UScrime)

 

 5.多于两组的比较

如果各组独立,则Kruskal—Wallis检验将是一种实用的方法。

states<-as.data.frame(cbind(state.region,state.x77))

kruskal.test(Illiteracy~state.region,data=states)

 

 第八章回归

1.拟合并解释线性模型
2.检验模型假设
3.模型选择

用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量、效标变量或结果变量)的方法。
预测一个人在跑步机上锻炼时预期消耗的卡路里数。
 
第九章方差分析
 
方差分析主要通过F检验来进行效果评测,若治疗方案的F检验显著,则说明五个星期后两种疗法的STAI得分均值不同。

单因素方差

library(multcomp)

attach(cholesterol)

table(trt)

aggregate(response,by=list(trt),FUN=mean)

aggregate(response,by=list(trt),FUN=sd)

fit<-aov(response~trt)

summary(fit)

带有置信区间的组均值图形

 install.packages("gplots")

library(gplots)

plotmeans(response~trt,xlab="Treatment",ylab="Response",main="Mean Plot\nwith95% CI")

detach(cholesterol)

#多重比较(没做出来)

 install.packages("multcomp")

library(multcomp)

par(mar=c(5,4,6,2))

tuk<-glht(fit,linfct=mcp(trt="Tukey"))

plot(cld(tuk,level=0.5),col="lightgrey')

TukeyHSD(fit)

install.packages("carData")

library(car)

qqplot(lm(response~trt,data=cholesterol),simulate=TRUE,main="Q-Q plot",labels=FALSE)

 

setwd("E:/rdata")

read.csv("土培11.csv")

a<-read.csv("土培11.csv")

head(a)

 

 fit<-aov(根干重~根数,data=a)

summary(fit)

 

#多元方差分析
单因素多元方差分析

library(MASS)

attach(UScereal)

y<-cbind(calories,fat,sugars)#cbind()函数将三个因变量(卡路里、脂肪和糖)合并成一个矩阵

aggregate(y,by=list(shelf),FUN=mean)#aggregate()函数可获取货架的各个均值,cov()则输出各谷物间的方差和协方差。

cov(y)

fit<-manova(y~shelf)     #manova()函数能对组间差异进行多元检验。

summary(fit)

summary.aov(fit)

 

 

 相关图

option(digits=2)

cor(mtcars)

install.packages("corrgram")

library(corrgram)

corrgram(mtcars,order=TRUE,lower.panel=panel.shade,

upper.panel=panel.pie,text.panel=panel.txt,

main="Correlogram of mtcars intercorrelations")

 

 

corrgram(a,order=TRUE,lower.panel=panel.shade,

upper.panel=panel.pie,text.panel=panel.txt,

main="根系指标相关性的相关图 ")

 

 

蓝色和从左下指向右上的斜杠表示单元格中的两个变量呈正相关。反过来,红色和从左上指向右下的斜杠。表示变量呈负相关。色彩越深,饱和度越高,说明变量相关性越大。
主成分分析
判断主成分的个数
library(psych)
library(psych)
fa.parallel(Harman23.cor$cov,n.ob=302,fa="pc",n.iter=100,show.legend=FALSE,main="Scree plot parallel analysis")
fa.parallel(a,n.ob=302,fa="pc",n.iter=100,show.legend=FALSE,main="PCA个数")   

 

 

library(psych)
pc<-principal(a[,-1],nfactors=1)
pc
提取主成分,nfactor设定主成分数


 

 

 

posted @   ^_^Anne  阅读(587)  评论(0编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具
点击右上角即可分享
微信分享提示