摘要: 散仙,在上篇文章中介绍了,如何使用Apache Pig与Lucene集成,还不知道的道友们,可以先看下上篇,熟悉下具体的流程。在与Lucene集成过程中,我们发现最终还要把生成的Lucene索引,拷贝至本地磁盘,才能提供检索服务,这样以来,比较繁琐,而且有以下几个缺点:(一)在生成索引以及最终能提供... 阅读全文
posted @ 2015-03-06 22:02 三劫散仙 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 在文章开始之前,我们还是简单来回顾下Pig的的前尘往事:1,Pig是什么?Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache(一个开源软件的基金组织)的一个项目,由Apache来负责维护,Pig是一个基于 Hadoop的大规模数据分析平台,它提供的SQ... 阅读全文
posted @ 2015-03-06 00:49 三劫散仙 阅读(236) 评论(0) 推荐(0) 编辑