1.1 管理表(内部表)和外部表

location 默认值由hive.metastore.warehouse.dir指定.

外部表在create table有关键字extenal指定,

udf

2.1 

语法

1.count(a) 和 count(*)的区别

count(a) 统计a字段非null的记录的个数,count(*)统计所有记录的个数.即count不统计null.

2.left semi join 和 join

http://my.oschina.net/leejun2005/blog/188459#OSC_h4_4

文件格式

  1. SerDe作用

Row:Hive中的一行

Line:输出文件中的一行

  1. 默认分隔符

2.1 行内分隔符 Control-A \001

2.2 集合分隔符 Control-B \002

2.3 map key分隔符 Control-C \003

2.4 行分隔符 \n

  1. lazySimpleSerDe

完全没懂

posted on 2015-06-11 15:19  onesteng  阅读(126)  评论(0编辑  收藏  举报