jstorm集群安装及错误

jstorm的官方网站http://www.jstorm.io

JStorm 是一个分布式实时计算引擎。

JStorm 是一个类似Hadoop MapReduce的系统, 用户按照指定的接口实现一个任务,然后将这个任务递交给JStorm系统,JStorm将这个任务跑起来,并且按7 * 24小时运行起来,一旦中间一个Worker 发生意外故障, 调度器立即分配一个新的Worker替换这个失效的Worker。

因此,从应用的角度,JStorm应用是一种遵守某种编程规范的分布式应用。从系统角度, JStorm是一套类似MapReduce的调度系统。 从数据的角度,JStorm是一套基于流水线的消息处理机制。

实时计算现在是大数据领域中最火爆的一个方向,因为人们对数据的要求越来越高,实时性要求也越来越快,传统的Hadoop MapReduce,逐渐满足不了需求,因此在这个领域需求不断。

概述

安装JStorm 分为2个步骤,

  • 安装JStorm 引擎
  • 安装JStorm UI
  • 安装步骤
  • 搭建外部依赖
  • 搭建JStorm集群
    • 检查
    • 安装JStorm
    • 配置$JSTORM_HOME/conf/storm.yaml
    • 部署其他节点时
    • 启动JStorm
    • 安装步骤

      • 下载页面下载relase包
      • 搭建外部依赖
        • 搭建Zookeeper集群
        • 安装Java
      • 安装jstorm
      • 启动JStorm集群

      搭建外部依赖

      搭建Zookeeper集群

      如果公司有现成zookeeper,则直接使用,无须安装。

      本处不细描叙Zookeeper安装步骤

      安装JDK 7

      如果机器上已经安装了jdk7, 则无需再安装jdk7,

      注意: * 如果当前系统是64位系统,则需要下载64位JDK,如果是32为系统,则下载32位JDK * jstorm 2.x 版本开始,要求jdk版本必须等于或高于jdk7

      搭建JStorm集群

      检查

      • 检查机器ip是否正确 执行hostname -i 如果返回“127.0.0.1”, 则机器没有配置正确的ip, 需要设定/etc/hosts或网卡配置, 直到hostname -i返回一个正确的ip

      • 检查 java 版本 执行java -version, 如果找不到java 或java 版本低于7, 则需要设置PATH环境变量或安装jdk7

      安装JStorm

      假设以jstorm-2.1.1.zip为例

      unzip jstorm-2.1.1.zip
      vi ~/.bashrc
      export JSTORM_HOME=/XXXXX/XXXX
      export PATH=$PATH:$JSTORM_HOME/bin
      

      配置$JSTORM_HOME/conf/storm.yaml

      基本配置项:

      • storm.zookeeper.servers: 表示zookeeper 的地址,
      • storm.zookeeper.root: 表示JStorm在zookeeper中的根目录,当多个JStorm共享一个zookeeper时,需要设置该选项,默认即为“/jstorm”
      • nimbus.host: 表示nimbus的地址, 填写ip
      • storm.local.dir: 表示JStorm临时数据存放目录,需要保证JStorm程序对该目录有写权限

      部署其他节点时

      请确保其他节点的‘临时数据存放’目录为空, ‘临时数据存放’ 为$JSTORM_HOME/conf/storm.yaml 中指定storm.local.dir的目录

      启动JStorm

      • 在nimbus 节点上执行 “nohup jstorm nimbus &”, 查看$JSTORM_HOME/logs/nimbus.log检查有无错误
      • 在supervisor节点上执行 “nohup jstorm supervisor &”, 查看$JSTORM_HOME/logs/supervisor.log检查有无错误
posted @ 2019-04-09 13:55  大小狮子  阅读(353)  评论(0编辑  收藏  举报