摘要:
pig cookbook学习Overview近期需要用pig做一些统计,由于没有系统学习,问题出现一些问题,且不容易调试,执行效率也不高。所以打算看一些官方文档,在此做些笔记。pig性能提升指定类型如果在load文件时不指定类型,pig在计算时会指定为double类型,而在很多时候,数据本应是整形等,指定为double类型会增加广计算量。另外,指定类型也会使错误提早暴露出来。--Query 1A = load 'myfile' as (t, u, v);B = foreach A generate t + u;--Query 2A = load 'myfile' 阅读全文