摘要: 1、数学函数 对数据做变换是这些函数的一个主要功能。 abs(x) 绝对值 sqrt(x) 平方根 ceiling(x) 不小于x的最小整数 floor(x) 不大于x的最大整数 trunc(x) 向0的方向截取的x中的整数部分 round(x,digits=n) 将x舍入指定位的小数 signif 阅读全文
posted @ 2017-03-14 19:49 yangk 阅读(881) 评论(0) 推荐(0) 编辑
摘要: 聚类分析是一种数据归约技术,旨在揭露一个数据集中观测值的子集。它可以把大量的观测值归约为若干类。最常用的两种聚类方法是层次聚类(hierarchical agglomeration clustering)和划分聚类(partitioning clustering)。在层次聚类中,每一个观测值自成一类 阅读全文
posted @ 2017-02-13 19:15 yangk 阅读(3338) 评论(0) 推荐(0) 编辑
摘要: 1、找出两个向量的交集 2、找出b向量与a向量之间的差异 阅读全文
posted @ 2017-02-10 14:29 yangk 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 一、处理缺失值的步骤 一个完整的处理方法通常包含以下几个步骤: 遗憾的是,往往只有识别缺失数据是清晰明确的步骤。明白数据为何缺失依赖于你对数据生成过程的理解,而决定如何处理缺失值则需要判断那种方法的结果最为可靠和精确。 缺失数据的分类:统计学家通常将数据分为三类。尽管它们都采用概率术语进行描述,但思 阅读全文
posted @ 2017-02-07 19:45 yangk 阅读(4824) 评论(0) 推荐(0) 编辑
摘要: 1、用0替代数据框中的缺失值NA 生成数据框: 替代数据框中的缺失值 2、用0替代变量中的缺失值 阅读全文
posted @ 2017-02-07 14:51 yangk 阅读(58371) 评论(1) 推荐(1) 编辑
摘要: #横向合并ID<-c(1,2,3,4)name<-c("Jim","Tony","Lisa","Tom")score<-c(89,22,78,78)student1<-data.frame(ID,name)student2<-data.frame(ID,score)total_student<-me... 阅读全文
posted @ 2015-09-30 10:10 yangk 阅读(12089) 评论(0) 推荐(0) 编辑
摘要: 1.颜色列表 阅读全文
posted @ 2015-08-27 11:20 yangk 阅读(3253) 评论(0) 推荐(0) 编辑
摘要: 移除图例require(ggplot2)b = qplot(Sepal.Length,Petal.Length,data=iris,geom="point",colour = Species)#有图例b#去除图例b+theme(legend.position="none")#右图 2.图例位置摆放... 阅读全文
posted @ 2015-08-26 23:26 yangk 阅读(25592) 评论(0) 推荐(1) 编辑
摘要: 在Linux下使用vi来查看一些在Windows下创建的文本文件,有时会发现在行尾有一些“^M”。有几种方法可以处理。注意:在Linux下,可以通过ctrl+v,ctrl+m,打出^M字符。而却,以下正则表达中的^M,必须通过这个方式(ctrl+v,ctrl+m)打出来,否则正则表达式匹配不到^M字... 阅读全文
posted @ 2015-08-26 21:57 yangk 阅读(5627) 评论(0) 推荐(1) 编辑
摘要: require(ggplot2)require(Cairo)require(grid)p = ggplot(iris,aes(x = Species,y = Sepal.Length,colour = Species))p+geom_point()a = p+geom_point()b = qplo... 阅读全文
posted @ 2015-08-26 19:43 yangk 阅读(6484) 评论(0) 推荐(0) 编辑