Pig 安装和使用

pig 0.10.0 的下载地址 http://labs.mop.com/apache-mirror/pig/pig-0.10.0/
下载针对Ubuntu 的安装文件pig-0.10.0.tar.gz ，0.10.0 可以运行在Hadoop 0.20.x 的版本之上，
下载安装pig 的版本要和自己在安装的hadoop版本匹配。
把 pig-0.10.0 文件放到Linux 系统的当前用户下，
解压 pig-0.10.0 文件 tar -vxf pig-0.10.0.tar.gz
配置环境变量 /etc/profile 可以使用vi 也可以使用 sudo gedit
命令： sudo gedit /etc/profile
#set pig
export PIG_HOME=/home/liucheng/pig-0.10.0
同时，要配置到path路径下
使配置文件生效 source /etc/profile
进入pig 的bin 目录下启动pig

命令：./pig 或是 ./pig -x mapreduce

命令：./pig -x local 运行本地模式
这个时间，就可以使用jps 查看已经启动的线程，有两个 grunt 线程
在grunt> 下打出Help 就可以查看 pig 可以使用的命令
在pig 命令下可以直接操作HDFS
以后的pig 命令就会转成 mapreduce 运行。

grunt> stu = LOAD '/user/liucheng/pig/student.txt' AS (name,age);

注： = 的两边有空格。

把HDFS pig 目录下的student.txt 转存为关系stu,默认每行数据是以"\t" 分割。

当调用DUMP stu; 可以查看存储到stu 关系中的数据。

注：当使用quit 退出此次会话时，那么这个关系stu 也会丢失的。

pig 调用脚本文件。

第一步：我们在当前用户的file 目录下创建一个script.pig 文件。内容为

cat pig/student.txt

第二步：查看一下HDFS 上有哪些文件，且pig/student.txt 文件的内容

第三步：调用我们创建的 ~/file/script.pig 角本。pig ~/file/script.pig

分析：系统调用mapreduce 分析处理角本内容，第一个列表所有HDFS 文件，且，把pig/student.txt 内容读出来。

接下来的学习参考：http://www.cnblogs.com/uttu/archive/2013/02/19/2917438.html

posted @ 2013-04-08 17:01 C语言程序阅读(234) 评论(0) 收藏举报

刷新页面返回顶部

木其网络科技专业程序员代写http://www.xmsydw.com
程序员	学历	擅长	经验	网店链接
apenny	硕士	ASP.NET PHP 电子通信设计图像编程网络	5年	进入店铺
zheng_qianqian	本科	C语言 C++面向对象 Java	3年	进入店铺
guoguanl	本科	Java Web项目 JSP Hibernate Struts Mysql	4年	进入店铺

木其网络科技专业程序员代写http://www.xmsydw.com
程序员	学历	擅长	经验	网店链接
apenny	硕士	ASP.NET PHP 电子通信设计图像编程网络	5年	进入店铺
zheng_qianqian	本科	C语言 C++面向对象 Java	3年	进入店铺
guoguanl	本科	Java Web项目 JSP Hibernate Struts Mysql	4年	进入店铺

C语言程序

大学生程序代写
低价源码代写

Pig 安装和使用

pig 调用脚本文件。

公告

C语言程序

大学生程序代写 低价源码代写

Pig 安装和使用

pig 调用 脚本文件。

公告

大学生程序代写
低价源码代写

pig 调用脚本文件。