数据库有惊无险风波记录--大页内存的配置和根分区扩容
最近经常看这样的小电影,每天要看好几次,昨天晚上发现看不了了,就把存小电影的云主机重启了一下,之后就发现启动不了,有点捉急,赶紧在群里求助,乐哥及时回复,按照指导看了一下/var/log/messages:
https://blog.csdn.net/cuigelasi/article/details/78476917
messages里大量的这样的消息,乐哥一看就断定是因为数据库之类的产生内存碎片太多的问题,搜了一下,确实是这样,见上文链接。这台服务器2月份上线以来一直没有重启过,而且随着云主机的增加,负荷越来越重,特别是有一个极重负荷的数据库云主机,后来内存负荷接近100%,网络接收3台示波器的波形数据,流量一直维持在40MB/S一直工作:
之后按照乐哥的指导,需要配置成大页内存模式:
https://blog.csdn.net/liyu123__/article/details/83539348
给上面的链接,不是要按链接里的指导来配置大页内存,只是给您看看上面的指导是不是有点复杂?实际上Zstack里的过程很简单,只需要在web ui下点点鼠标就好了,我只是单台物理机,比集群简单,下面的步骤是单台物理机的步骤:
1、所有的云主机先关机;
2、所有的物理机调整为维护模式;
3、之后按下图里红框的两条设置好,记得保留内存至少16G哦:
4、还有如果想云主机性能更好,按下面的设置成host-passthrough:
之后重启物理机,web ui里启用物理机就好了。
昨晚在家按上面的步骤做好重启后打算先刷牙,刷完牙回来看服务器竟然还ping不通,突然好捉急,如果崩了,这几个月就白干了,赶紧到实验室现场看,后面的过程贴个图吧:
能从聊天过程中看出俺心情的跌宕起伏不?后来服务器顺利启动,最后数据库那个云主机以及其他的都启动成功了。回到家困得不得了,倒头就睡,早晨爬起来继续看数据库云主机,发现数据库服务以及web服务都没有启动起来,后来发现/根分区的容量只剩下20k左右,赶紧给云盘从10G扩容到20G并给根分区的lvm扩容,之后重启云主机,数据库又活了,又可以继续看小电影了
https://www.cnblogs.com/yujianadu/p/10560272.html
您能看到这里真是太难为您了,我搞这种又臭又长的文本来也不是为了您看得爽的,主要是自己做个过程记录,感谢Zstack的乐哥,以及后台的大神们,跟进到我最终解决他们才放心。出现这样的风波可不是因为Zstack的原因,主要是自己愣头青什么都不懂跑进不熟悉的领域,对数据库这类大吞吐量的内存,磁盘以及网络消耗的应用,对于大页内存解决之类的都是第一次听说。并且最后云主机的根分区竟然没剩余容量了导致数据浏览不正常才有了这次风波和解决。
大页内存的使用在Zstack下配置的真舒服,实验室另一台4CPU的服务器,已经跑了半年多没重启了,什么时候也这样大页内存的弄一下,省的内存碎片的问题再出现。对于系统运维,我掉的坑也许您也曾掉过,如果没掉过就注意些吧。