Mesos提交任务没有被执行

当通过marathon提交了一个任务后,发现一直处于waiting状态;
回到mesos,执行MASTER=$(mesos-resolve `cat /etc/mesos/zk`) &  mesos-execute --master=$MASTER --name="cluster-test" --command="sleep 60"
在mesos管理界面还是hold住了;
后来在agent页面发现agent列表空空如也;这说明mesos-slave没有和mesos-master通气上;这说明mesos-slave没有获取到mesoso-master的路径信息;mesos-master路径信息是放置在zookeeper中,zookeeper信息我已经更新的啊(/etc/mesos/zk);
后来通过service mesos-slave status看了一下,发现有一些异常信息,这些异常之前是在看mesos日志的时候看到的,当时没太在意:
ZOO_ERROR@handle_socket_error_msg@1722: Socket [10.1.108.6:2181] zk retcode=-4, errno=111(Connection refused): server refused to accept the client
发现mesos-slave还是在访问6服务器,说明zk更新没有被slave知道,突然我想到了slave没有重启,我汗,于是重启了一下。
任务不执行有两个点,master本身出问题,第二个点agent(slave)执行问题;从现象来看master已经看到framework,但是没有很可能是agent问题

posted on 2017-10-01 20:08  张叫兽的技术研究院  阅读(784)  评论(0编辑  收藏  举报

导航