摘要: 话说任何语言的学习,环境搭建是一个蛋疼的问题,网上google的n多文章,试了一边一边又一边,终于在某个下午搭建好列环境,基于linux系统环境搭建总结如下: 1.主要的参考文章: http://sunng.info/blog/2011/09/beginning-emacs-for-clojure/ 阅读全文
posted @ 2013-02-19 18:29 成金之路 阅读(689) 评论(0) 推荐(1) 编辑
摘要: 本文主要来源于google资料的自我总结,对常用的pig语法即“算法”进行了总结基础概念: relation bag tuple field data 关系(relation) = 包(bag) 一个包是一个元组(tuple)的集合,在pig中用{}扩起来表示一个包 一个元组(tuple)是若干个字段的有序集合(order set),在pig的数据结构中,用()扩起来标识一个元组 一个字段(field)是列数据(data)的标识; 和数据库的对应关系: pig database relation/bag table tuple one record f... 阅读全文
posted @ 2013-02-19 17:31 成金之路 阅读(7273) 评论(0) 推荐(0) 编辑
摘要: 任何一种语言的学习掌握都离不开结构和算法的思想,本文将从结构方面剖析Pig常用操作后的结构,总结了其中的一些容易犯错的地方。 详细语法介绍请参考http://pig.apache.org/docs/r0.8.1/piglatin_ref2.html#Casting+Relations+to+Scalars;个人的总结请参考下一篇pig常用语法总结,教你快速入门——算法篇结构: LOAD 后的数据结构为: A: {col1: int,col2: int,col3: int,col4: double,col5: double} GROUP BY 后的数据结构为: B: {gr... 阅读全文
posted @ 2013-02-19 17:17 成金之路 阅读(1159) 评论(0) 推荐(0) 编辑