12 2018 档案

摘要:1 shell下批量出去文件名中的空格 执行看现象: 上面的是执行for循环以后看到的; 然而源目录下的文件如下: 这样的话想要cat某个具体文件是拿不到的,所以需要去空格处理: 处理方式有很多:如 mv+sed 、rename方式。本次只做简单有效的方式--rename: rename 's/ / 阅读全文
posted @ 2018-12-25 16:55 云上的听者 阅读(8780) 评论(0) 推荐(0)
摘要:简单介绍 combineByKey()是最通用的对key-value型rdd进行聚集操作的聚集函数(aggregation function)。类似于aggregate(),combineByKey()允许用户返回值的类型与输入不一致。 其定义如下,我们可以根据这个形式来分别定义createComb 阅读全文
posted @ 2018-12-11 17:03 云上的听者 阅读(2642) 评论(0) 推荐(0)