Docker(虚拟机的)宿主机意外断电导致容器实例无法启动 故障复盘及解决方案
rgqancy:
[root@server-crm proc]# grep aufs /proc/filesystems
[root@server-crm proc]# grep autofs /proc/filesystems
nodev autofs
rgqancy:aufs与autofs是一回事吗?
RJ:不一样
rgqancy:centos6.9,内核已经升级到
[root@server-crm proc]# uname -a
Linux server-crm 4.4.172-1.el6.elrepo.x86_64 #1 SMP Sat Jan 26 11:32:22 EST 2019 x86_64 x86_64 x86_64 GNU/Linux
rgqancy:服务器意外停电,devicemapper的一些实例启动不了,想升级存储驱动到aufs或者overlay2,有相关操作经验的吗?
RJ:其他存储也会有这个问题
RJ:断电丢失数据避免不了的
RJ:上UPS才能保平安
RJ:底层事ext4?
rgqancy:是的
RJ:调下mount参数,开write barrier
http://os.51cto.com/art/201103/250836.htm
RJ:也没啥好方法
rgqancy:我看到网上的文章,说devicemapper不稳定,并且在Twitter上被吐槽。同事的前公司用的Ubuntu上生产上跑Docker,用的AUFS,Window10+Hyper-V上用的overlay2,导致我就以为其他驱动更稳定没这个问题呢。
rgqancy:那就只能把存储的一些数据放在物理机的硬盘上,总不至于断电时全丢就得了。上UPS这个方案,我们的团队不适用。
rgqancy:@RJ 我不太懂linux底层,一个java码农。
RJ:要么上btrfs定期snapshot,不过一般运维都不敢上,没啥经验
rgqancy:@RJ btrfs,我就更不懂了。
bing搜索:docker aufs 断电
https://yq.aliyun.com/articles/475363
一种可以尝试的方案。
UPS
解决方案:
1.上UPS。
成本:高
运维:?
2.上 高速缓冲存储器电池备份管理IC
成本:低。
运维:要进行软件配置。
write barrier || 上btrfs定期snapshot
http://os.51cto.com/art/201103/250836.htm
RC7M控制器存储器备份电池的更换_厉害了我的思的博客-CSDN博客
https://blog.csdn.net/qq_27139123/article/details/90266773
支持狮子电池备份模块所需的 RAID 控制器固件更新英特尔® RAID 控制器
https://www.intel.cn/content/www/cn/zh/support/articles/000007987/server-products.html
DS2731 高速缓冲存储器电池备份管理IC - Maxim Integrated
https://www.maximintegrated.com/cn/products/power/supervisors-voltage-monitors-sequencers/DS2731.html
MAX16016 低功耗微处理器监控电路,具有电池备份电路和片选控制 - Maxim Integrated
https://www.maximintegrated.com/cn/products/power/supervisors-voltage-monitors-sequencers/MAX16016.html
电池备份IC - Maxim Integrated
https://www.maximintegrated.com/cn/products/power/supervisors-voltage-monitors-sequencers/battery-backup-ics.html
配置方式:
Write barrier - Wikipedia
https://en.wikipedia.org/wiki/Write_barrier
R大在在介绍CMS时提到了write barrier写屏蔽的概念,是来干什么的? - 知乎
https://www.zhihu.com/question/42879518
(zz)Why Memory Barrier - 做个不善的人 - 博客园
http://www.cnblogs.com/whyandinside/archive/2012/11/07/2759014.html