摘要: 数学类函数 在求有缺失值的子集的最大值时候,需要先用na.re=TRUE去掉缺失值。 求几个特定百分位数 round(x,n) n表示保留的小数点位数 分布类函数 rnorm,密度高的数字,生成概率就高 阅读全文
posted @ 2019-06-05 23:59 我的数据之路 阅读(531) 评论(0) 推荐(0) 编辑
摘要: 取子集方法 x[]:适用于所有r语言 x[[ ]]:适用于list或者data.frame中提取元素 x$:使用元素名做索引,提取list或者data.frame中的某个元素 注意,取出的子集数据类型跟原来的类型一致 x[[ ]],仅可以提取一个对象,返回对象并不和原list、data.frame数 阅读全文
posted @ 2019-06-05 23:58 我的数据之路 阅读(852) 评论(0) 推荐(0) 编辑
摘要: 相比r语言自带软件包,ggplot2有以下特色 图形语法的核心:统计图形是数据向几何对象属性的一个映射。 阅读全文
posted @ 2019-06-05 23:56 我的数据之路 阅读(1769) 评论(0) 推荐(0) 编辑
摘要: 一.数据类型 5种 1.character 字符 2.numeric 数值 3.integer 整数 一般数字的存储会默认为数值类型,如果要强调是整数,需要在变量值后面加上 L。 x <- 5L class(x) 4.complex 复数 1+2i 5.logical 逻辑 TRUE&FALSE c 阅读全文
posted @ 2019-06-05 23:55 我的数据之路 阅读(3437) 评论(0) 推荐(0) 编辑
摘要: 先读懂箱型图的几条线 Q1,Q2,Q3 分别为数据的第一四分位数、中位数、第三四分位数。 Q3+1.5*IQR 是数据向上取值的边界,如果大于这个数,就被定义成轻度异常大的值。 Q1-1.5*IQR 是数据向下取值的边界,如果小于这个数,就被定义成轻度异常小的值。 箱型图实际是概率密度函数的简化版, 阅读全文
posted @ 2019-06-05 18:10 我的数据之路 阅读(4163) 评论(0) 推荐(0) 编辑