这是师生共同努力的尝试,迭代进化,每天改进一点点.不经意间完成巨大的跨越. 我们关注数据科学, 我们寻找投资机会 我们研究就业岗位 我们关注资讯,我们更关注思想 世界正在加速飞奔 未来呼啸而来!

统计学术思想R案例网络收集和介绍

统计学术思想R案例网络收集和介绍

作者:樊瑞珍

文章来源:统计建模与R软件

名称:卡方检验

目标描述:卡方检验在R语言中的运用(案例)

卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。

R语言下进行分层卡方检验方法和过程如下:

t.test t检验

wilcox.test wilcox检验

prop.test

binom.test 贝努力试验检验

chisq.test 卡方检验

fish.test fisher精确检验

ks.test 科尔莫哥罗夫-斯米尔诺夫检验

shapiro.test shapio-wilk正态分布检验

pp.test. phillips-perron检验

quada.test quade检验

friedman.test friedman秩和检验

 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

R语言 卡方检验

预览:

3t.test(x,y) 表示对两个变量xy做两样本均数的成组t检验

4t.test(x~group) 表示group为分组变量,x为数值变量,做t检验,此时xy应该在同一个数据集中。

5 t.test(x[group==1],x[group==2]) 表示对group12时的xt检验 方差分析:利用lm()函数

如果一个数据集dd中,x是数值变量,g是分组变量,运行:lm(dd$x~dd$g) ,这样实际是拟合一个线性模型,x为应变量,g为自变量。缺省的输出很少,只有g和截据的系数,采用summary()函数可以输出较多信息。即:summary(lm(dd$x~dd$g)) 这样将会输出常见方差分析所需要输出的全部信息,诸位一试便知。

这里提示了R的一个特性:缺省的输出往往是很少的,其实有很多的结果被保存在背后,需要用语句提取出来的。

秩和检验: wilcox.test()函数和kruskal.test()函数

wilcox.test(x) 表示对x做均数为0的符号秩和检验

kruskal.test(x,g) 表示x为数值变量而g为分组变量,做秩和检验

卡方检验:chisq.test()

对于如下四格表资料:12 5

24 11

首先建立四格表:matrix(c(12,24,5,11),crow=2)->data

说明:data中存储了四格表资料,也就是一个矩阵。c(12,24,5,11)是一个向量,crow=2表示有两行,请注意行列的顺序:即先排数据,再排数据。

然后进行卡方检验:chisq.test(data)

对于四格表卡方,缺省的用Yates连续性校正。如果用:chisq.test(data,correct=FLASE),则不进行Yates校正。如果理论数过小,则输出时会提示卡方检验可能不正确,此时就需要用fisher精确概率法:fisher.test(data)

线性相关

采用cor()函数可以计算两变量的线性相关系数;采用cor.test()函数可以计算相关系数比进行假设检验、提供相关系数可信区间。

例如:c(12,15,13,16,21,22,14)->x

c(25,56,45,15,32,16,45)->y

cor.test(x,y) 即可对xy进行线性相关分析,计算两者的相关系数并进行假设检验。 线性回归:

lm()函数可以拟合一般线性模型。例如:lm(y~x+z) 便是拟合应变量为y,自变量为xz的回归方程。直接使用lm(y~x+z) 只能输出xz的回归系数,用summary(lm(y~x+z)),即外部套上summary函数,可以输出线性回归分析的大部分内容。summary(lm(y~x+z+x*z)) 则是考虑了xz的交互作用了。

R中能够实现各种常用统计分析,这,一般成熟的统计软件都是具有的。

R,作为s+的一个克隆,其实是S语言的一个编程环境。

R中一切都是对象。

R中的功能主要是以函数的形式实现。使用者可以修改(重载)这些函数,也可以开发新的函数。 R有很多package,实现各种功能,可以在R的站点cran中下载安装各种package以扩展功能。

案例:

R软件入门教程---卡方检验

 使用chisq.test方法)

如资料如下:

 A   B

  15   12

  23   12

  24   21

程序如下:

         matrix(c(15,23,24,12,12,21),nc=2)->x  ―――――――建立两维表nc指列数

 

         chisq.test(x,correct=TRUE) ――――――――――――correct表示是否矫正

 结果如下:

          Pearson's Chi-squared test

data:  x

X-squared = 1.3229, df = 2, p-value = 0.5161

 

本篇来源于 www.stathome.cn

 原文链接:http://www.stathome.cn/html/S-plus_R/Rrumen/2009/0604/474.html

posted @ 2017-06-27 20:23  维雪炜梅数据智能工室  阅读(276)  评论(1编辑  收藏  举报