摘要: ggplot2是R语言最为强大的作图软件包,强于其自成一派的数据可视化理念。当熟悉了ggplot2的基本套路后,数据可视化工作将变得非常轻松而有条理。 本文主要对ggplot2的可视化理念及开发套路做一个总体介绍,具体绘图方法(如折线图,柱状图,箱线图等)将在后面的文章中分别进行讲解。 回到顶部 核 阅读全文
posted @ 2017-03-05 16:26 holy_black_cat 阅读(3936) 评论(0) 推荐(1) 编辑
摘要: 在R语言中 paste 是一个很有用的字符串处理函数,可以连接不同类型的变量及常量。 函数paste的一般使用格式为: paste(..., sep = " ", collapse = NULL) 1 1 其中…表示一个或多个R可以被转化为字符型的对象;参数sep表示分隔符,默认为空格;参数coll 阅读全文
posted @ 2017-03-05 14:11 holy_black_cat 阅读(18920) 评论(0) 推荐(0) 编辑
摘要: 摘要:R是数据科学家中最流行的编程语言和环境之一,在Spark中加入对R的支持是社区中较受关注的话题。作为增强Spark对数据科学家群体吸引力的最新举措,最近发布的Spark 1.4版本在现有的Scala/Java/Python API之外增加了R API(SparkR)。SparkR使得熟悉R的用 阅读全文
posted @ 2017-03-05 14:10 holy_black_cat 阅读(213) 评论(0) 推荐(0) 编辑
摘要: Yeah, that’s probably because the head() you’re invoking there is defined for SparkR DataFrames[1] (note how you don’t have to use the SparkR::: namep 阅读全文
posted @ 2017-03-05 14:09 holy_black_cat 阅读(448) 评论(0) 推荐(0) 编辑
摘要: y<-1:4 data1 <-data.frame(x1=c(1,3,5,7), x2=c(2,4,6,8),x3=c(11,12,13,14),x4=c(15,16,17,18)) data2<-cbind(data1[,1:2],y,data1[,3:ncol(data1)]) 阅读全文
posted @ 2017-03-05 14:08 holy_black_cat 阅读(752) 评论(0) 推荐(0) 编辑
摘要: y<-1:4 data1 <-data.frame(x1=c(1,3,5,7), x2=c(2,4,6,8),x3=c(11,12,13,14),x4=c(15,16,17,18)) data2<-cbind(data1[,1:2],y,data1[,3:ncol(data1)]) 阅读全文
posted @ 2017-03-05 14:07 holy_black_cat 阅读(1007) 评论(0) 推荐(0) 编辑
摘要: 目录: 原始图样 如何去除饼图中心的杂点 如何去除饼图旁边的标签 如何去掉左上角多出来的一横线 如何去掉图例的标题,并将图例放到上面 如何对图例的标签加上百分比 如何让饼图的小块按顺时针从大到小的顺序显示 如何去掉白色外框上的数字 如何在图中加百分比 如何生成饼环 (更多内容请见:R、ggplot2 阅读全文
posted @ 2017-03-05 14:05 holy_black_cat 阅读(1694) 评论(0) 推荐(0) 编辑
摘要: 我们说Excel有难度的图表,可以考虑ggplot2是否更方便,本帖的例子就是用ggplot做玫瑰图。 Excel做玫瑰图有一定难度,可以使用雷达图或圆环图来构建,我的博客上曾有多个帖子讨论这个,见 1、已被sohu隐藏 2、已被sohu隐藏 3、圆环图做南丁格尔玫瑰图:http://blog.si 阅读全文
posted @ 2017-03-05 14:04 holy_black_cat 阅读(1802) 评论(0) 推荐(0) 编辑
摘要: 原网址 http://blog.sina.com.cn/s/blog_6bb07f83010152z0.html 在使用R做数据挖掘时,最常用的数据结构莫过于dataframe了,下面列出几种常见的dataframe的操作方法。1.查看数据 2.合并数据(1)data.frame(x,y)x,y是d 阅读全文
posted @ 2017-03-05 14:03 holy_black_cat 阅读(471) 评论(0) 推荐(0) 编辑
摘要: write.table(),是保存数据为文件的函数。 得到的1234.txt,打开是这个样子: "x"是列名,"1","2","3"是行名。不输出列名、行名和代表字符串的双引号——加参数:quote = FALSE,row.names = FALSE, col.names = FALSE。 再次得到 阅读全文
posted @ 2017-03-05 10:36 holy_black_cat 阅读(15377) 评论(0) 推荐(0) 编辑