摘要:
测试数据位于:/home/hadoop/luogankun/workspace/sync_data/pigdept和emp表来源自oracle数据库自带的表dept.txt10 ACCOUNTING NEW YORK20 RESEARCH DALLAS30... 阅读全文
2014年8月7日 #
摘要:
测试数据位于:/home/hadoop/luogankun/workspace/sync_data/pigperson.txt中的数据以逗号分隔1,zhangsan,1122,lisi,1133,wangwu,1144,zhaoliu,115score.txt中的数据以制表符分隔1 20... 阅读全文
摘要:
pig概述pig是一个用于并行计算的高级数据流语言和执行框架;类sql、文件处理框架;有一套和sql类似的执行语句,处理的对象是HDFS上文件。Pig的数据处理语言是数据流方式的,一步一步的进行处理;Pig基本数据类型:int、long、float、double、chararry、bytearray... 阅读全文