瞌睡中的葡萄虎

博客园 首页 新随笔 联系 订阅 管理

2014年8月7日 #

摘要: 测试数据位于:/home/hadoop/luogankun/workspace/sync_data/pigdept和emp表来源自oracle数据库自带的表dept.txt10 ACCOUNTING NEW YORK20 RESEARCH DALLAS30... 阅读全文
posted @ 2014-08-07 14:55 瞌睡中的葡萄虎 阅读(438) 评论(0) 推荐(0) 编辑

摘要: 测试数据位于:/home/hadoop/luogankun/workspace/sync_data/pigperson.txt中的数据以逗号分隔1,zhangsan,1122,lisi,1133,wangwu,1144,zhaoliu,115score.txt中的数据以制表符分隔1 20... 阅读全文
posted @ 2014-08-07 14:41 瞌睡中的葡萄虎 阅读(519) 评论(0) 推荐(0) 编辑

摘要: pig概述pig是一个用于并行计算的高级数据流语言和执行框架;类sql、文件处理框架;有一套和sql类似的执行语句,处理的对象是HDFS上文件。Pig的数据处理语言是数据流方式的,一步一步的进行处理;Pig基本数据类型:int、long、float、double、chararry、bytearray... 阅读全文
posted @ 2014-08-07 14:30 瞌睡中的葡萄虎 阅读(691) 评论(0) 推荐(0) 编辑