2014年7月20日

hive 学习笔记精简

摘要: 创建表:drop table tcreate table if not exists t (t string) partitioned by (log_date string) row format delimited fields terminated by '\t' lines terminat... 阅读全文

posted @ 2014-07-20 17:48 a_badegg 阅读(268) 评论(0) 推荐(0) 编辑

(转)MapReduce 中的两表 join 几种方案简介

摘要: 1. 概述在传统数据库(如:MYSQL)中,JOIN操作是非常常见且非常耗时的。而在HADOOP中进行JOIN操作,同样常见且耗时,由于Hadoop的独特设计思想,当进行JOIN操作时,有一些特殊的技巧。本文首先介绍了Hadoop上通常的JOIN实现方法,然后给出了几种针对不同输入数据集的优化方法。... 阅读全文

posted @ 2014-07-20 17:47 a_badegg 阅读(197) 评论(0) 推荐(0) 编辑

导航