2015年8月5日

基于spark实现表的join操作

摘要: 1. 自连接假设存在如下文件:[root@bluejoe0 ~]# cat categories.csv 1,生活用品,02,数码用品,13,手机,24,华为Mate7,3每一行的格式为:类别ID,类别名称,父类ID现在欲输出每个类别的父类别的名称,类似于SQL的自连接,注意到joi... 阅读全文

posted @ 2015-08-05 23:39 白乔 阅读(471) 评论(0) 推荐(0) 编辑

关于IO的一些数字

摘要: http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en/us/people/jeff/stanford-295-talk.pdf 阅读全文

posted @ 2015-08-05 22:44 白乔 阅读(150) 评论(0) 推荐(0) 编辑

导航