简单,可复制

点点滴滴,尽在文中

  :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

虚拟列

Hive 0.8.0支持两个虚拟列:

 INPUT__FILE__NAME, mapper任务的输出文件名。

 BLOCK__OFFSET__INSIDE__FILE, 当前全局文件的偏移量。对于块压缩文件,就是当前块的文件偏移量,即当前块的第一个字节在文件中的偏移量。

 

简单例子

select INPUT__FILE__NAME, key, BLOCK__OFFSET__INSIDE__FILE from src;

select key, count(INPUT__FILE__NAME) from src group by key order by key;

select * from src where BLOCK__OFFSET__INSIDE__FILE > 12000 order by key;

翻译自 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+VirtualColumns

posted on 2013-01-16 11:02  ggjucheng  阅读(2176)  评论(0编辑  收藏  举报