R中的基本函数运算

一、均值

1.均值：mean(X)#计算所有元素的均值，包括矩阵、向量

2.行均值：apply(x,1,mean)

3.行均值：apply(x,2,mean)

注：如果x是数据框，则返回的就是向量

ex:mean(as.data.frame(x))

在做多元数据分析时，多元数据输入最好使用数据框的方式输入

4.在计算中某些数据是异常的，参数trim可以减少输入误差对计算的影响

ex:w.mean<-mean(w,trim=0.1)

0.1表示计算均值前需要去掉异常值的比例

5.有缺失值的时候无法计算均值，加上参数na.rm=TRUE可以计算有缺失值的均值

ex:w.mean<-mean(w.na,na.rm=TRUE);w.mean

6.加权向量

weight.mean(x,w,na.rm=TRUE)

x：数值向量

w:权值

二、顺序统计量

1.顺序排序

sort(x)

2.更广泛的功能

格式：sort(x,partial=NULL,na.last=NA,decreasing=FALSE,method=c("shell","quick"),index.return=FALSE)

partial:部分排序的指标向量

na.last：=NULL:不处理缺失数据；=FALSE缺失数据排在最后面；=TRUE缺失数据排在最前面

method:选择排序的方法。shell排序的复杂度为N的4/3次方，quick是快速排序

index.return:逻辑变量，TRUE为返回排序下标及排序结果，缺省为FASLE

decreasing:为TRUE时排序从大到小

三、中位数

中位数描述的是数据中心位置的数字特征，大体上比中位数或大或小的数据个数占整个数据的一半，对称分布的数据均值与中位数比较接近，偏态分布均值与中位数不同，中位数不受异常值的影响，具有稳健性

median(x，na.rm=TRUE):计算向量x的中位数,可处理有缺失值的数据

四：百分位数

quantile(x,probs=seq(0,1,0,25),na.rm=FASLE,names=TRUE,type=7,...)

probs：分位位置

五：方差、标准差、变异系数

变异系数是刻画数据相对分散性的一种度量记为CV=100*(s/x~)(%),x~为均值

方差：var(x)

标准差：sd(x)

协方差：cov(x)