摘要: Pig是一个大规模数据分析平台。Pig的基础结构层包括一个产生MapReduce程序的编译器。在编译器中,大规模并行执行依据存在。Pig的语言包括一个叫Pig Latin的文本语言,此语言有如下特性:1.易于编程。实现简单的和高度并行的数据分析任务非常容易。2.自动优化。任务编码的方式允许系统自动去优化执行过程,从而使用户能够专注于逻辑,而非效率3.可扩展性,用户可以轻松编写自己的函数用于特殊用途的处理。1 安装 1.安装java,配置环境变量2.安装pig,配置环境变量ps:安装一款平台级软件一般都是要配置环境变量用于系统执行时进... 阅读全文
posted @ 2013-07-09 19:15 朗道二级相变 阅读(1623) 评论(0) 推荐(0) 编辑