表
1.1 管理表(内部表)和外部表
location 默认值由hive.metastore.warehouse.dir指定.
外部表在create table有关键字extenal指定,
udf
2.1
语法
1.count(a) 和 count(*)的区别
count(a) 统计a字段非null的记录的个数,count(*)统计所有记录的个数.即count不统计null.
2.left semi join 和 join
http://my.oschina.net/leejun2005/blog/188459#OSC_h4_4
文件格式
- SerDe作用
Row:Hive中的一行
Line:输出文件中的一行
- 默认分隔符
2.1 行内分隔符 Control-A \001
2.2 集合分隔符 Control-B \002
2.3 map key分隔符 Control-C \003
2.4 行分隔符 \n
- lazySimpleSerDe
完全没懂