摘要:
Pig相当于Hadoop的客户端软件,它可以连接到Hadoop,通过Pig Lating这种类似SQL的面向数据流的语言对数据进行处理。 用Pig Lating编写的程序,在Pig中执行。Pig把Pig Lating编写的程序编译成MapReduce作业,上传到集群中执行。 Pig可以看作Pig Lating到MapReduce的映射器。 1、下载Pig,我这里下载的是pig-0.9.2.tar.gz,放到/home/coder/目录下。 2、解压Pig。[coder@h1 ~]$ tar -zxvf pig-0.9.2.tar.gz 3、编辑/etc/profile,在文件最后... 阅读全文
posted @ 2013-04-19 22:16 CN.programmer.Luxh 阅读(513) 评论(0) 推荐(0) 编辑