摘要: 一组数据怎样去评价和量化它的离散度,有很多种方法: 标准差极差 标准差极差 最直接也是最简单的方法,即最大值-最小值(也就是极差)来评价一组数据的离散度。这一方法在日常生活中最为常见,比如比赛中去掉最高最低分就是极差的具体应用。 标准差离均差平方和 标准差离均差平方和 由于误差的不可控性,因此只由两 阅读全文
posted @ 2018-01-08 17:11 quietwalk 阅读(12240) 评论(0) 推荐(1) 编辑
摘要: http://blog.csdn.net/xidiancoder/article/details/71341345 平均值 平均值的概念很简单:所有数据之和除以数据点的个数,以此表示数据集的平均大小;其数学定义为 以下面10个点的CPU使用率数据为例,其平均值为17.2。 1 方差、标准差 方差这一 阅读全文
posted @ 2018-01-08 16:52 quietwalk 阅读(155564) 评论(1) 推荐(1) 编辑
摘要: 下载并安装 “sqldf” 包 library(sqldf) newData <- sqldf("select * from mtcars where carb=1 order by mpg", row.names=TRUE) row.names=TRUE将原始数据框中的行名延续到了新数据框中 阅读全文
posted @ 2018-01-08 16:14 quietwalk 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 1、列选择 (1)下标方式 newData <- leadership 【, c(6:10)】 选择全部行和第6到第10列;将行下标留空表示选择所有行。 (2)列名集合方式 newData <- leadership【c("q1", "q2", "q3", "q4", "q5")】 2、列剔除 (1 阅读全文
posted @ 2018-01-08 16:07 quietwalk 阅读(639) 评论(0) 推荐(0) 编辑
摘要: 1、创建新变量 方式 一:常规方式,用已有变量组合新变量; 方式二:使用 attach()函数,不用再带数据框变量名; 方式三:使用 transform()函数,按需创建变量,并将其保存到数据框中 mydata<- transform(mydata, sum= x1 + x2, mean = (x1 阅读全文
posted @ 2018-01-08 15:49 quietwalk 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 变量分类 : (1)离散型: (a)有序:如病情,表示顺序有关系 ,但不知道相差多少。 ( b)无序:没 顺序关系,如糖尿病分型。 (2)连续型:同时体现顺序和数量。 factor()函数;将向量因子化,抽象成 整数向量。 阅读全文
posted @ 2018-01-08 15:00 quietwalk 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2018-01-08 14:10 quietwalk 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 注释:# 赋值:<- 查看、设定当前工作目录:getwd() setwd() wd:workspace directory【setwd("c:/myproject/project1")】 在独立的目录中保存项目是个好主意。 文本输出:函数 skin("fileName")将输出重定向到文件 中。不加 阅读全文
posted @ 2018-01-08 14:00 quietwalk 阅读(354) 评论(0) 推荐(0) 编辑