随笔分类 - 混沌工程
故障实验注入
摘要:1、什么是MAA MAA即最高可用性架构(Maximum Availability Architecture ) Oracle最高可用性架构(MAA)为Oracle数据库提供了架构、配置和生命周期最佳实践 参考之前的文章: 1、 Oracle最高可用性架构(MAA)|青铜级(BRONZE) http
阅读全文
摘要:设计一个高可用的数据库系统,首先需要明确的就是RPO和RTO 关于RPO RPO是业务连续性中的一个常用术语,称为恢复点目标。 在数据库系统中,它描述的是数据库在一次故障停机恢复后可能丢失的数据量。 在数据库系统架构设计中,这是需要优先考虑的,假定数据库每天会做1次全量数据备份,那么在最坏情况下,用
阅读全文
摘要:1.1. 故障场景 状态变化类故障包括机器重启、掉电、意外关机、kernel panic、应用意外停止、进程被杀,进程hang死,时间漂移等。 1.2. 演练目标 是否能监控发现 应用是否支持故障自动恢复&资源转移,是否有对应的预案 故障恢复的时长 1.3. 模拟手段 1.3.1. 机器重启 直接在
阅读全文
摘要:简要介绍 Pacemaker是 Linux环境中使用最为广泛的开源集群资源管理器。 pacemaker集群架构 一个pacemaker集群通常包括以下部分(Pacemaker stack) Resources: These are the reason for the cluster’s being
阅读全文
摘要:本文主要记录使用ChaosBlade工具开展网络类故障注入 来源:文档https://chaosblade-io.gitbook.io/chaosblade-help-zh-cn/blade blade create network delay 网络延迟实验场景 介绍可以指定网卡、本地端口、远程端口
阅读全文
摘要:资源耗尽类故障主要参考如下: 磁盘满 方法1: 找到对应的分区,dd一个大文件 dd if=/dev/zero of=/home/cli/diskfull.drill bs=1G count=10 #写10G 方法2: 阿里chaosblade(推荐) ./blade create disk fil
阅读全文
摘要:ChaosBlade 是阿里巴巴开源的一款遵循混沌工程原理和混沌实验模型的实验注入工具,帮助企业提升分布式系统的容错能力,并且在企业上云或往云原生系统迁移过程中业务连续性保障。 地址:https://github.com/chaosblade-io/chaosblade 文档:https://cha
阅读全文