08 2016 档案

摘要:继续来了解dplyr中的其他有用函数 1、sample() 目的是可以从一个数据框中,随机抽取一些行,然后组成新的数据框。 sample_n(tbl, size, replace = FALSE, weight = NULL, .env = parent.frame()) sample_frac(t 阅读全文
posted @ 2016-08-17 20:38 molearner 阅读(1720) 评论(0) 推荐(0)
摘要:接下来我们继续了解一些dplyr中的常用函数。 1、ranking 以下各个函数可以实现对数据进行不同的排序 row_number(x) ntile(x, n) min_rank(x) dense_rank(x) percent_rank(x) cume_dist(x) 具体的看些例子。 row_n 阅读全文
posted @ 2016-08-13 20:55 molearner 阅读(2669) 评论(0) 推荐(0)
摘要:接下了我们继续了解dplyr中有用的函数 1、if_else() if_else主要用于在数据做判断用 以上结果是对数据框中第3和第4列数据进行判断后显示的。 2、lead()和lag() lead(x, n = 1L, default = NA, order_by = NULL, ...) lag 阅读全文
posted @ 2016-08-11 16:03 molearner 阅读(3220) 评论(0) 推荐(0)
摘要:继上一节常用函数,继续了解其他函数 1、desc() 这个函数和SQL中的排序用法是一样的,表示对数据进行倒序排序。 接下来我们看些例子。 在使用desc后是直接在数据前面加上一个负号,一般情况下配合arrange()函数一起使用,功能强大。 2、distinct() 跟SQL中distinct函数 阅读全文
posted @ 2016-08-10 15:54 molearner 阅读(1245) 评论(0) 推荐(0)
摘要:上面介绍完dplyr中,几个主要的操作函数后,我们再进一步了解dplyr中那些函数可能我们会经常要用到。 这里主要根据dplyr包作者的书籍目录来把它列出来。 1、add_rownames 添加行名称,把数据转换成列。 add_rownames(df, var = "rowname") 下面来看个具 阅读全文
posted @ 2016-08-08 22:59 molearner 阅读(3224) 评论(1) 推荐(0)
摘要:在R中,summary()是一个基础包中的重要统计描述函数,同样的在dplyr中summarise()函数也可以对数据进行统计描述。 不同的是summarise()更加的灵活多变,下面来看下summarise这个函数 summarise(.data, ...) 其灵活性和其他dplyr函数一样,主要 阅读全文
posted @ 2016-08-06 15:03 molearner 阅读(33163) 评论(0) 推荐(0)
摘要:在R中,我们通常需要对数据列进行各种各样的操作,比如选取某一列、重命名某一列等。 dplyr中的select函数子在数据列的操作上也同样表现了它的简洁性,而且各种操作眼花缭乱。 select(.data, ...) 参数主要在于如何添加条件。配合select()进行使用的函数有: starts_wi 阅读全文
posted @ 2016-08-05 15:38 molearner 阅读(39842) 评论(0) 推荐(0)
摘要:在R中,我们在整理数据时,经常需要对数据排序,以便数据增强数据的可读性。 下面我们来看下dplyr中的,arrange函数 arrange(.data, ...) 跟filter()类似,arrange()的参数也很简单,出来data外,余下的是排序条件。 下面来看些具体的例子 按照字母的顺序进行排 阅读全文
posted @ 2016-08-05 11:23 molearner 阅读(18087) 评论(0) 推荐(0)
摘要:在R的使用过程中我们几乎都绕不开Hadley Wickham 开发的几个包,前面说过的ggplot2、reshape2以及即将要讲的dplyr 因为这几个包可以非常轻易的使我们从复杂的数据操作中逃离,操作过程简洁,最重要的是数据结果也异常简洁。 首先我们来了解下第一个函数filter() filte 阅读全文
posted @ 2016-08-04 22:46 molearner 阅读(22255) 评论(0) 推荐(1)
摘要:前面一篇讲了cast,想必已经见识到了reshape2的强大,当然在使用cast时配合上melt这种强大的揉数据能力才能表现的淋漓尽致。 下面我们来看下,melt这个函数以及它的特点。 melt(data, ..., na.rm = FALSE, value.name = "value") 从这里来 阅读全文
posted @ 2016-08-03 22:52 molearner 阅读(11398) 评论(0) 推荐(0)
摘要:我们在做数据分析的时候,对数据进行操作也是一项极其重要的内容,这里我们同样介绍强大包reshape2,其中的几个函数,对数据进行操作cast和melt两个函数绝对少不了。 首先是cast,把长型数据转换成你想要的任何宽型数据, dcast(data, formula, fun.aggregate = 阅读全文
posted @ 2016-08-02 22:33 molearner 阅读(8048) 评论(0) 推荐(0)