2018 年 1月 8 日随笔档案 - quietwalk

2018年1月8日

摘要：一组数据怎样去评价和量化它的离散度，有很多种方法：标准差极差标准差极差最直接也是最简单的方法，即最大值－最小值（也就是极差）来评价一组数据的离散度。这一方法在日常生活中最为常见，比如比赛中去掉最高最低分就是极差的具体应用。标准差离均差平方和标准差离均差平方和由于误差的不可控性，因此只由两阅读全文

posted @ 2018-01-08 17:11 quietwalk 阅读(12240) 评论(0) 推荐(1) 编辑

平均值(Mean)、方差(Variance)、标准差(Standard Deviation) （转）

摘要： http://blog.csdn.net/xidiancoder/article/details/71341345 平均值平均值的概念很简单：所有数据之和除以数据点的个数，以此表示数据集的平均大小；其数学定义为以下面10个点的CPU使用率数据为例，其平均值为17.2。 1 方差、标准差方差这一阅读全文

posted @ 2018-01-08 16:52 quietwalk 阅读(155564) 评论(1) 推荐(1) 编辑

4.3 使用 SQL 语句操作数据框

摘要：下载并安装 “sqldf” 包 library(sqldf) newData <- sqldf("select * from mtcars where carb=1 order by mpg", row.names=TRUE) row.names=TRUE将原始数据框中的行名延续到了新数据框中阅读全文

posted @ 2018-01-08 16:14 quietwalk 阅读(394) 评论(0) 推荐(0) 编辑

4.2 数据框的行、列选择

摘要： 1、列选择（1）下标方式 newData <- leadership 【, c(6:10)】选择全部行和第6到第10列；将行下标留空表示选择所有行。（2）列名集合方式 newData <- leadership【c("q1", "q2", "q3", "q4", "q5")】 2、列剔除（1 阅读全文

posted @ 2018-01-08 16:07 quietwalk 阅读(639) 评论(0) 推荐(0) 编辑

4.1 基本数据管理

摘要： 1、创建新变量方式一：常规方式，用已有变量组合新变量; 方式二：使用 attach()函数，不用再带数据框变量名; 方式三：使用 transform()函数，按需创建变量，并将其保存到数据框中 mydata<- transform(mydata, sum= x1 + x2, mean = (x1 阅读全文

posted @ 2018-01-08 15:49 quietwalk 阅读(254) 评论(0) 推荐(0) 编辑

2.2.5 因子的使用

摘要：变量分类：（1）离散型：（a）有序：如病情，表示顺序有关系，但不知道相差多少。（ b）无序：没顺序关系，如糖尿病分型。（2）连续型：同时体现顺序和数量。 factor()函数；将向量因子化，抽象成整数向量。阅读全文

posted @ 2018-01-08 15:00 quietwalk 阅读(138) 评论(0) 推荐(0) 编辑

R-向量

摘要：阅读全文

posted @ 2018-01-08 14:10 quietwalk 阅读(152) 评论(0) 推荐(0) 编辑

1 R语言介绍

摘要：注释：# 赋值：<- 查看、设定当前工作目录：getwd() setwd() wd：workspace directory【setwd("c:/myproject/project1")】在独立的目录中保存项目是个好主意。文本输出：函数 skin("fileName")将输出重定向到文件中。不加阅读全文

posted @ 2018-01-08 14:00 quietwalk 阅读(354) 评论(0) 推荐(0) 编辑

quietwalk

公告