摘要: impala 是基于hive的大数据实时分析查询引擎,直接使用Hive的元数据库metadata意味着impala元数据都存储在hive的metadstore中并且impala兼容hive的sql解析,实现了hive得sql语义子集,功能还在不断完善中。shell命令impala-shell 命令用... 阅读全文
posted @ 2015-08-19 22:58 农民阿姨 阅读(524) 评论(0) 推荐(0) 编辑
摘要: 1.pom 配置 org.apache.storm storm-core 0.9.3 commons-io commons-io 2.4 阅读全文
posted @ 2015-08-19 07:34 农民阿姨 阅读(190) 评论(0) 推荐(0) 编辑
摘要: Hadoop之Storm命令1.storm核心概念stream--->一列火车tuple--->一节车厢数据--->乘客spout--->始发站bolt--->中间站点bolt--->中间站点bolt--->终点topology(拓扑) 阅读全文
posted @ 2015-08-19 07:33 农民阿姨 阅读(155) 评论(0) 推荐(0) 编辑
摘要: nimbus:主节点,负责分发代码,分配任务(只能有一个)supervisor:从节点,负责执行任务(可以有多个)jdkzookeeper(192.168.1.170/171/172)建议在zookeeper的节点上设置一个crontab定时任务,同步时间:* * * * * /usr/sbin/n... 阅读全文
posted @ 2015-08-19 07:32 农民阿姨 阅读(418) 评论(0) 推荐(0) 编辑