摘要: 内容概览 尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要。从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高。R语言提供了很多字符串操作函数,本文仅简要以下几种常用的字符串函数。 字符串分割函数:strsplit( ) 字符串连接函数:paste( 阅读全文
posted @ 2016-03-23 11:00 萱草yy 阅读(12143) 评论(0) 推荐(0) 编辑
摘要: (1) apply apply函数通过对数组,矩阵,或非空维数值的数据框的“边缘”(margin)即行或列运用函数。返回值为向量,数组或列表。 函数形式 apply(X, MARGIN, FUN, ...) 其中,X:数组(矩阵); MARGIN:函数要作用的下标向量,对于矩阵,1表示行,2表示列,1:2表示行和列; FUN:函数名或函数表达式。 ##例 > m appl... 阅读全文
posted @ 2016-03-23 10:59 萱草yy 阅读(504) 评论(0) 推荐(0) 编辑
摘要: 问题: R中提供的例子不太懂,为什么得出的结果是6 5 2 1 7 4 10 8 3 9呢? (ii <- order(x <- c(1,1,3:1,1:4,3), y <- c(9,9:1), z <-c(2,1:9)))##结果为 6 5 2 1 7 4 10 8 3 9 原始数据:x : 1 1 3 2 1 1 ... 阅读全文
posted @ 2016-03-23 10:58 萱草yy 阅读(1165) 评论(0) 推荐(0) 编辑
摘要: 从不同途径得到的数据的组织方式是多种多样的,很多数据都要经过整理才能进行有效的分析,数据整形不仅仅是为了改善数据的外观,也是进行一些统计分析和作图前必要的步骤。数据整形和数据凝练/汇总往往密不可分,这是门学问,是R语言数据处理的内容之一。 AD:51CTO技术沙龙 | 赋予APP不同凡响的交互和体验 阅读全文
posted @ 2016-03-23 10:55 萱草yy 阅读(1547) 评论(0) 推荐(0) 编辑
摘要: ddply()函数位于plyr包,用于对data.frame进行分组统计,与tapply有些类似 准备数据 统计每个api的请求数 统计每个api的各个httpCode的请求数: 下面这个复杂些,根据上面的统计结果a,统计每个api所占比例 这就是说你可以根据需要写自己的统计函数 用ggplot画a 阅读全文
posted @ 2016-03-23 10:54 萱草yy 阅读(12716) 评论(0) 推荐(0) 编辑
摘要: R语言与数据挖掘:公式;数据;方法R语言特征对大小写敏感通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母)。不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字。基本命令要么是表达式(expressions)要么就是 赋值(assignments)。命令可以被 (;)隔开,或者另起一行。基本命令可以通过大括弧({和}) 放在一起构成一个复合表达式(c... 阅读全文
posted @ 2016-03-23 10:25 萱草yy 阅读(134007) 评论(2) 推荐(23) 编辑
摘要: 1.1课题介绍 本课题以阿里巴巴移动电商平台的真实用户-商品行为数据为基础,同时提供移动时代特有的位置信息。您需要通过大数据和算法构建面向移动电子商务的商品推荐模型,挖掘数据背后丰富的内涵,为移动用户在合适的时间、合适的地点精准推荐合适的内容。 在真实的业务场景下,我们往往需要对所有商品的一个子集构 阅读全文
posted @ 2016-03-23 10:08 萱草yy 阅读(7624) 评论(2) 推荐(0) 编辑