摘要: 原文地址:http://blog.csdn.net/zythy/article/details/18326693 我们以气温统计和词频统计为例,讲解以下三种用户自定义函数。 用户自定义函数 什么时候需要用户自定义函数呢?和其它语言一样,当你希望简化程序结构或者需要重用程序代码时,函数就是你不二选择。 阅读全文
posted @ 2016-09-27 18:30 hadoop_dev 阅读(851) 评论(1) 推荐(0) 编辑
摘要: 原地址:http://f.dataguru.cn/thread-233064-1-1.htm 因为理解上的错误,在这里被搞糊涂了。通过做测试,应该算是澄清了,所以写出来。假设有个文件叫test,该文件的内容如下(ip地址和url之间有一个空格):127.0.0.1 dataguru.cn/forum 阅读全文
posted @ 2016-09-27 16:09 hadoop_dev 阅读(441) 评论(0) 推荐(0) 编辑
摘要: 一、pig的运行模式: Pig 有两种运行模式: Local 模式和 MapReduce 模式。当 Pig 在 Local 模式运行的时候, Pig 将只访问本地一台主机;当 Pig 在 MapReduce 模式运行的时候, Pig 将访问一个 Hadoop 集群和 HDFS 的安装位置。这时, P 阅读全文
posted @ 2016-09-27 10:40 hadoop_dev 阅读(2465) 评论(0) 推荐(0) 编辑