随笔分类 - 统计:R
摘要:简单线性回归 library(ISLR) library(class) library(MASS) fix(Boston) #弹出数据编辑器 names(Boston) #基本句法是 lm (y ~ x , data) ,其中y是响应变量,x是预测变量,data是这两个变量所属的数据集。 lm.fi
阅读全文
摘要:逻辑回归:股票市场数据 library(ISLR) names(Smarket) dim(Smarket) summary(Smarket) pairs(Smarket) #pairs()函数用于返回一个绘图矩阵,由每个 DataFrame 对应的散点图组成。 cor(Smarket[,-9]) #
阅读全文
摘要:主成分分析(parincipal component analysis,PCA) #对 USA ests 数据集进行 PCA, PCA 包肯在基础软件包中。 states=row.names(USArrests) #数据集包含50个州 states #显示50个州的名字 names(USArrest
阅读全文
摘要:袋装法 #装袋法是随机森林在 m=p 时的一种特殊情况。 因此函数 randomForest() 既可以用来做随机森林,也可以执行装袋法。 library(randomForest) set.seed(1) dim(Boston) bag.boston=randomForest(medv~.,dat
阅读全文
摘要:主成分回归(principal components regression, PCR) #使用 p1s 库中的 pcr ()渴数实现主成分回归 (PCR) #install.packages("pls") library(pls) set.seed(2) pcr.fit=pcr(Salary~.,
阅读全文
摘要:子集选择方法:最优子集选择 #Hitters (棒球)数据集实践最优于集选择方法 library(ISLR) fix(Hitters) names(Hitters) dim(Hitters) sum(is.na(Hitters$Salary)) Hitters<-na.omit(Hitters) #
阅读全文
摘要:验证集方法 library(ISLR) set.seed(1) Train<-sample(392,196) #用sample ()函数把观测集分为两半,从原始的 392 个观测中随机地选取一个有 196个观测的子集,作为训练集。 lm.fit<-lm(mpg~horsepower,data=Aut
阅读全文
摘要:泊松回归 当通过一系列连续型和/或类别型预测变量来预测计数型结果变量时,泊松回归是一个非常有用的工具。为阐述泊松回归模型的拟合过程,并探讨一些可能出现的问题,我们将使用robust包中的Breslow癫痫数据(Breslow,1993)。特别地,我们将讨论在治疗初期的八周内,抗癫痫药物对癫痫发病数的
阅读全文
摘要:1 lmPerm 包的置换检验 lmPerm包可做线性模型的置换检验。比如lmp()和aovp()函数即lm()和aov()函数的修改版,能够进行置换检验,而非正态理论检验。lmp()和aovp()函数的参数与lm()和aov()函数类似,只额外添加了perm=参数。perm=选项的可选值有Exac
阅读全文
摘要:1 置换检验 置换方法和参数方法都计算了相同的t统计量。但置换方法并不是将统计量与理论分布进行比较,而是将其与置换观测数据后获得的经验分布进行比较,根据统计量值的极端性判断 是否有足够的理由拒绝零假设。 R目前有一些非常全面而复杂的软件包可以用来做置换检验。两个有用的包:coin和lmPerm包,c
阅读全文
摘要:1 双因素方差分析 1.1 双因素方差分析的实战 dat<-ToothGrowth dat attach(dat) table(dat$supp,dat$dose) aggregate(len,by=list(dat$supp,dat$dose),FUN=mean) #根据投方式(橙汁OJ,维C素V
阅读全文
摘要:1 方差分析 ANOVA 当包含的因子是解释变量时,我们关注的重点通常会从预测转向组别差异的分析,这种分析方法称作方差分析(ANOVA) 2 单因素方差分析 2.1 单因素比较 install.packages("multcomp") library(multcomp) dat<-cholester
阅读全文
摘要:1 异常观测值 states<-as.data.frame(state.x77[,c("Murder", "Population","Illiteracy","Income","Frost")]) fit<-lm(Murder~Population+Illiteracy+Income+Frost,d
阅读全文
摘要:1 OLS回归(最小二乘法回归) 1.1 用lm()拟合回归模型 在R中,拟合线性模型最基本的函数是lm(),格式为:myfit<-lm(formula,data) 1.2 简单线性回归 dat<-women fit<-lm(weight~height,data=dat) summarize(fit
阅读全文
摘要:1 基本统计分析 1.1 描述性统计分析 myvar<-c("mpg","hp","wt") head(mtcars[myvar]) #显示数据框的头部信息 dat<-mtcars[myvar] #查看数据框 1.1.1 方法 (1)简单分析:summary() 结果分析:计算了最值、分位数、均值等
阅读全文