随笔分类 - 故障分享
发生故障时的处理问题思路及流程
摘要:虚拟机创建失败 用户创建一台虚拟机,虚拟机使用4个网络平面,所以虚拟机选择了4个不同平面的网络,创建虚拟机一直在孵化的过程中,最后创建虚拟机失败。 失败后返回的报错日志 Build of instance 51c0b7c5-2d37-43d7-b1c6-491789ccfab6 aborted: F
阅读全文
摘要:cinder service状态错误 日常巡检发现cinder service state出现down,提示丢失数据库连接错误,导致了cinder服务状态更新或者创建卷报错。 问题发现 $ openstack volume service list + + + + + + + | Binary |
阅读全文
摘要:创建虚拟机失败 问题发现 客户按照往常一样提创建资源需求给我,但这次需要的虚拟机的数量比较多,所以我先找比较空闲资源的物理机,找到较空闲资源物理机后,我这次虚拟机创建通过指定物理机来进行创建,但发现创建失败了。 环境信息 openstack 版本: train 部署方式:kolla-ansible
阅读全文
摘要:描述: 记录一次重大事故:根据IaaS资源业务要求,需要增加某些功能,所以要修改部署代码。修改后重推部署代码,检查发现没有什么异常。 但是一段时间后就收到用户的报障反馈,接连一个电话、2个电话、3个电话。。。。慌了。。。。 业务故障表现,如下图 处理流程 首先查看ceph集群状态正常,排除ceph集
阅读全文
