摘要: 多次搭建,每次都要找新博客,特意搜了个好使的博客,转粘贴过来 一、工具准备 1、ubuntu16.04LTS 2、jdk1.8._111(http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.ht 阅读全文
posted @ 2017-03-01 15:52 寻影4_2 阅读(104) 评论(0) 推荐(0) 编辑
摘要: 1.dir()函数 返回所有查询对象的所有属性和函数列表。 2.python内置数据类型:整型(数字)、字符串、元组、列表、字典和布尔类型 1)整型——int——数字--不可变数据类型 python有5种数字类型,最常见的就是整型int,int python方法很实用。例如:1234、-1234 2 阅读全文
posted @ 2016-12-09 11:03 寻影4_2 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 最近常常会用到一些之前看过却没有实际去实现的小细节,深有感慨(掌握一门技术绝不是看一遍就够了,一遍远远不够,远远不够........), 言归正传,先直接上代码 Attributeresult 运行结果肯定是:存在 这里面Attributeresult类重载了hasCode()方法和equals() 阅读全文
posted @ 2016-04-06 10:40 寻影4_2 阅读(3478) 评论(0) 推荐(0) 编辑
摘要: 自定义UDF,由此可见,pig还是很值得一用的,它也提供插入python代码 阅读全文
posted @ 2016-03-16 09:54 寻影4_2 阅读(230) 评论(0) 推荐(0) 编辑
摘要: 原谅我只是拿这个当笔记来写了,最近写的就这几个常用的 1.基本使用 2.这个是大师姐给我提供的,将两条相连记录合并 pig对于刚刚处理大量数据的人来讲真的方便好多,对于不擅长写代码的孩纸更是容易不少, 讲真,掌握一门语言如java或者python,应该可以帮我们得到任意形式的数据,千万不要仅仅依赖p 阅读全文
posted @ 2016-03-16 09:25 寻影4_2 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 1.自定义key对象,实现WritableComparable接口 2.mapreduce 阅读全文
posted @ 2016-01-21 11:06 寻影4_2 阅读(361) 评论(0) 推荐(0) 编辑
摘要: 1.下载对应版本zeal:https://zealdocs.org/download.html例如,我是ubuntu 对应命令是:$ sudo add-apt-repository ppa:zeal-developers/ppa$ sudo apt-get update$ sudo apt-get ... 阅读全文
posted @ 2015-12-25 09:02 寻影4_2 阅读(456) 评论(0) 推荐(0) 编辑
摘要: 本实例是:用hadoop的mapreduce思想来求解每年中的最高温度和最低温度(假设都是整型的温度数据)1.mapreduce程序package com.zhangdan.count;import java.io.IOException;import java.util.StringTokeniz... 阅读全文
posted @ 2015-12-24 21:25 寻影4_2 阅读(384) 评论(0) 推荐(0) 编辑
摘要: 1.在eclipse中运行,运行前配置(这一步可省略,因为我在开始给了路径)hdfs://192.168.1.104:9000/user/vlab/wcinput/* hdfs://192.168.1.104:9000/user/vlab/wcoutput可以在改运行文件下,右击鼠标,选择 Run ... 阅读全文
posted @ 2015-12-23 15:30 寻影4_2 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 第一步:下载安装包:http://mirrors.cnnic.cn/apache/pig/ (我的hadoop版本是1.2.1,我先下的pig-0.15总是提示不支持,于是我直接删了,重新下载的pig-0.13)第二步:将下载的安装包解压:tar -xvf pig-0.13.0.tar.gz第三步:... 阅读全文
posted @ 2015-09-15 21:48 寻影4_2 阅读(227) 评论(0) 推荐(0) 编辑