曹工改bug:centos下,mongodb开机不能自启动,systemctl、rc.local都试了,还是不行,要不要放弃?

问题背景#

最近装个centos 7.6的环境,其中,基础环境包括,redis、nginx、mongodb、fastdfs、mysql等,其中,自启动使用的是systemctl,其他几个组件,都没啥问题,唯独,这个mongodb,是死活启动不了。

但是,我这里说的,不是启动不了,如果直接在shell里敲:

Copy
systemctl start mongod.service

是没啥问题的,是可以启动的。

mongod.service大致如下,各文件夹的权限也已经仔细检查过,应该是没毛病:

Copy
[Unit] Description=High-performance, schema-free document-oriented database After=network.target Documentation=https://docs.mongodb.org/manual [Service] User=mongod Group=mongod Environment="OPTIONS=-f /etc/mongod.conf" ExecStart=/usr/bin/mongod $OPTIONS ExecStartPre=/usr/bin/mkdir -p /var/run/mongodb ExecStartPre=/usr/bin/chown mongod:mongod /var/run/mongodb ExecStartPre=/usr/bin/chmod 0755 /var/run/mongodb PermissionsStartOnly=true PIDFile=/var/run/mongodb/mongod.pid Type=forking # file size LimitFSIZE=infinity # cpu time LimitCPU=infinity # virtual memory size LimitAS=infinity # open files LimitNOFILE=64000 # processes/threads LimitNPROC=64000 # locked memory LimitMEMLOCK=infinity # total threads (user+kernel) TasksMax=infinity TasksAccounting=false # Recommended limits for for mongod as specified in # http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings [Install] WantedBy=multi-user.target

后边换成了rc.local方式:

Copy
/etc/rc.d/rc.local #!/bin/bash /usr/bin/mongod --fork -f /etc/mongod.conf &

但是,依然不行。

这两天,同事也在断断续续在弄,大家手里有其他事,这块暂时放下了。

转机:strace命令#

我一般浏览器开的tab比较多,有个几天前的tab,是关于strace的,我当时主要是想:找一个命令,可以监控某个进程的网络请求。

本来可以用tcpdump,但是,这个不是针对某个进程的,只能通过端口过滤,一般情况下,用端口过滤也足够了,但是,总是觉得不爽。

然后找到了这个链接:

https://askubuntu.com/questions/11709/how-can-i-capture-network-traffic-of-a-single-process

里面提到了strace可以做到。试了下,确实完美解决了我的问题。

比如说,我可以attach到某个进程,然后调用进程的某个接口,让该进程调用某个微服务,然后看看我们能不能抓到:

(看不清可在单独tab查看,这个是java应用,向注册中心eureka发送的心跳,可以发现,完美抓到了)

strace的使用#

可参考我的这篇简单介绍:

Linux下,如何监控某个进程到底向哪个地址发起了网络调用

大家也可以直接在服务器上直接执行以下shell,查看帮助文档:

Copy
yum install strace man strace

其主要支持两种方式,一种是直接使用strace来包装某个命令,使用strace来启动该命令;另一种,就是上面说的,attach到某个已经在运行中的进程。

然后,我想到,既然strace可以监控系统调用,那么,监控下mongodb吧,这里可以用strace来包装命令,我试着把命令换成了如下的样子:

Copy
strace -tt -s 10000 -o mongo.txt /usr/bin/mongod --fork -f /etc/mongod.conf

这块命令,分两块看。

Copy
strace -tt -s 10000 -o mongo.txt

这部分是strace的参数,

-tt 打印时间

-s 设置字符串的长度,否则具体内容显示不出来

-o 将结果输出到文件

另外部分,就是mongo的命令了:

Copy
/usr/bin/mongod --fork /etc/mongod.conf

比较正常情况下,和异常情况下的strace输出日志#

在同事建议下,我们先直接在shell中执行了以下命令:

Copy
strace -tt -s 10000 -o mongo.txt /usr/bin/mongod --fork -f /etc/mongod.conf

然后,得到了mongo.txt。这个是正常的文件。

然后,我们reboot了服务器,然后不清楚文件生成到哪里了,直接find查找了一把,然后找到后,把这两个文件,都存到了pc上,用beyond compare进行对比。

下面是对比结果:

建议大图查看。

可以发现,有问题的文件里,在打开以下文件时,报了错,提示没有权限:

Copy
/sys/fs/cgroup/memory/memory.limit_in_bytes EACCES (Permission denied)

然后,我们只是知道了,有这个现象,但不知道为啥,然后就开始了一顿漫无边际的面向搜索引擎找问题。找了半天,没啥收获。

后边我们就决定再去看看官网,看看官网有没有说,怎么才是正统的服务自启动方式(已经快放弃了。。。)

柳暗花明#

结果在官网的如下链接:

https://docs.mongodb.com/manual/tutorial/install-mongodb-on-red-hat/#install-mongodb-community-edition

看到如下一段话,说SELinux,默认不让mongo访问/sys/fs/cgroup:

然后我一看,这个目录有点熟悉啊,上面报没有权限的文件,不就这个目录下吗?

Copy
/sys/fs/cgroup/memory/memory.limit_in_bytes EACCES (Permission denied)

知道原因就好说了,原来是SELinux,我们这边比较暴力,直接把这个关闭了。

关闭方式:https://www.cnblogs.com/activiti/p/7552677.html

总结#

在华为的时候,组里的大佬们有一句话:办法总比困难多。

那时感觉,这也太鸡汤了。。。

我现在也有这个感觉,每次在快要放弃时,问题结果被解决了,有点意思。

另外一个感悟:方法比结果重要




posted @   三国梦回  阅读(847)  评论(0编辑  收藏  举报
编辑推荐:
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
· 使用C#创建一个MCP客户端
历史上的今天:
2019-06-16 了不得,我可能发现了Jar 包冲突的秘密
点击右上角即可分享
微信分享提示
CONTENTS