摘要: 1、去重distinct 2、抽样 3、返回最高记录top_n 4、筛选 5、select子集 选择以某些字符串开头的列 同样的用法有:ends_with(‘id’),contains(‘date’) 6、arrange排序 7、敲黑板:summarize 阅读全文
posted @ 2017-07-13 16:42 积水成渊数据分析 阅读(550) 评论(0) 推荐(0) 编辑
摘要: 一、数据变换 中心化、标准化原数据: log变换: apply 既能对行操作,又能对列操作,lapply不需要指定行列,默认对列进行操作 age income store_exp1 4.043051 11.70324 6.2712422 4.143135 11.71184 6.1696233 4.0 阅读全文
posted @ 2017-07-13 13:05 积水成渊数据分析 阅读(416) 评论(0) 推荐(0) 编辑