摘要: Pig是一种编程语言,它简化了Hadoop常见的工作任务。Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义(如日志文件)。同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换。 Hive在Hadoop中扮演数据仓库的角色。Hive添加数据的结构在HDFS(hive superimposes structure on data in HDFS),并允许使用类似于SQL语法进行数据查询。与Pig一样,Hive的核心功能是可扩展的。 Hive更适合于数据仓库的任务,Hive主要用于静态的结构以及需要经常分析的工作。Hive与SQL相似促使其成.. 阅读全文
posted @ 2014-01-09 14:58 南国生红豆 阅读(169) 评论(0) 推荐(0) 编辑
摘要: hive 加载HDFS的数据时出现错误,FATAL:SemanticException[Error10028]search了一下,跟他一样Hive load from hdfs 出错。我按照他说的做了发现不好用。后来改了把inpath的hdfs路径改为internal ip就好了。我们在亚马逊的ec2上跑的hadoop 阅读全文
posted @ 2014-01-09 14:13 南国生红豆 阅读(175) 评论(0) 推荐(0) 编辑