OpenStack虚拟机状态

OpenStack创建一个虚拟机，涉及到三种状态，vm_state，task_state和power_state。

先总结几点：

电源状态(power_state)：是hypervisor的状态，从计算节点”由下而上“加载。
虚拟机状态(vm_state)：反应基于API调用的一种稳定状态，符合用户体验，从上而下的API实现。
任务状态(task_state)：代表API调用过程的过渡状态。
只要数据库可用，就可以强删虚拟机。（”hard“ delete of VM）
电源状态和虚拟机状态会彼此冲突，需具体情况具体分析。

Power_state

Power_state是我们调用虚拟机中驱动获得的一个状态，事实上hypervisor的状态才是权威的。数据库中power_state只是之前状态的一个快照，

会被周期性更新，并且在有任务改变了power_state后要更新数据库。

1、怎样更新？

通常是”自下而上“，由计算节点产生，重写数据库。这个更新过程可能引起和vm_state的一致性冲突，如下。

2、power_state命名惯例

取决于ibvirt返回的状态。

废弃的状态：

BLOCKED，本质上应该是RUNNING;

SHUTOFF，现在是SHUTDOWN；

FAILED，现在是NOSTATE。

vm_state

vm_sate描述虚拟机当前稳定状态，而非过渡状态。如果没有running_tasks，虚拟机就应该是用户期待的状态，比如active。ACTIVE是一个vm_state，因为它代表虚拟机正常运行；而SUSPENDING是一个过渡状态，代表n秒后虚拟机将被挂起，所以应该属于task_state。

1、vm_stae怎样更新

vm_state仅在任务结束后更新，即当一个任务成功结束并且设置task_state状态为None。

当有API调用时，vm_state永远不能改变。如果任务失败，并且合适的清理后（比如live迁移失败，任务回滚，虚拟机在源节点正常运行），虚拟机状态不变。如果任务失败并且不能回滚，vm_state状态被置为ERROR。

2、vm_state命名惯例：使用一个形容词

3、vm_state和power_state关系？

二者不是一一映射，代表的侧重点不同，不能通过推理从一个得到另一个，所以都是需要的。

比如，当你去修复一个虚拟机，虚拟机从一个rescue镜像启动，此时power_state状态为RUNNING，但是vm_state状态只能是RESCUED。单单靠power_state是不能确定vm_state是ACTIVE还是RESCUED。

4、power_state和vm_state状态不一致，如何修正？

首先，有正在运行的任务时，vm_state和power_state极有可能不同，因为vm_state代表一个稳定状态，在任务运行期间，状态是过度状态，vm_state本来就是过期的。

当没有任务运行时，power_state和vm_state应该保持一致，除非出错或者失败，这种情况，要具体分析。

a、如果power_state=SHUTOFF，但是vm_state=ACTIVE，极有可能是虚拟机内部shotdown命令出错，所以power_state正确。一个粗暴但等价的方法，手动调用一个内部方法stop()API，虚拟机应该被修正为STOPPED。

b、如果power_state=BLOCKED，vm_state=HARD_DELETED，代表用户已经要求删除虚拟机但是过程失败了。所以尝试再次删除。

c、如果power_state=BLOCKED，vm_state=PAUSED，代表可能是pause()方法调用前出了不可预料的问题。此时修正方法就看怎样对用户最友好了，maybe设置vm_state为ERROR。

到此，会发现 _sync_power_states （同步电源状态）不鸟正在执行的任务，可能导致奇怪的错误。
5、如何从vm_state中获得和EC2等价的状态？

ec2状态包含稳定状态和过渡状态。所以需要同时根据task_state和vm_state来推断ec2状态。

vm_state如下：

INITIALIZED：虚拟机仅仅在数据库创建（应该是说表结构建好了），但是还没开始创建。（状态是BUILDING）
ACTIVE:虚拟机正在运行，使用特定的镜像。
RESCUED：虚拟机正在运行，但使用rescue镜像。
PAUSED：虚拟机暂停，使用特定镜像。依然占用计算和内存资源。
SUSPENDED：虚拟机挂起，使用的是特定的镜像，但是不占用计算和内存资源。
STOPPED：虚拟机停止，但是镜像依然在磁盘上。
SOFT_DELETED:虚拟机不再计算节点运行了，但是磁盘镜像依然保存，可以恢复。
HARD_DELETED:从配额和计费角度看，虚拟机不存在了。最终虚拟机和磁盘被销毁。
RESIZED：虚拟机在源节点停止，在目标节点运行。虚拟机镜像在源节点和目标节点都有，但是参数不同。用于需要确认resize(调整参数)或者恢复虚拟机。（废弃的的task_state RESIZE_VERIFY和vm_state RESIZED功能一样。）
ERROR：发生了无法恢复的错误，唯一的可执行的操作就是删除虚拟机。

vm_state中废弃的状态REBUILDING，MIGRATING，RESIZING都放在了task_state中。而SHUTOFF不用了，因为这个状态很费解，应该根据shutdown_terminate标记被划分到STOPPED或者DELETED。

task_state

task_state代表过渡状态，和一个computeAPI紧密相关，表明虚拟机当前执行哪个任务。处于vm_state的虚拟机是不会有task_state，只有正在运行的进程有task_state。

1、特定任务：force_delete(或者hard delete)

虚拟机什么时候都能成功删除。用户删除虚拟机可以释放配额里更多资源，不再被收费。不幸的是，可能出现这种情况，一个前置任务卡住了所以task_state永远不能到None，或者虚拟驱动在销毁虚拟机时卡住了，再或者计算节点因为网络/硬件的原因不可用而无法执行销毁虚拟机操作。所以，不应该等到force_delete() 任务获得计算节点然后更新虚拟机状态为HARD_DELETED。而应该是说，vm_state立马更新而不去检查计算节点。换句话说，force_delete() 任务是一个纯粹的数据库操作。一些善后工作（真正的清除工作）随后进行，也不需要power_state和vm_state之间的一致性操作，因为它们会被定期触发。

2、如何更新？

task_state被设置当确认它是虚拟机上唯一执行的任务时。要做到原子更新，任务开始会生成一个独一无二的task_id(uuid格式)和虚拟机id关联。如果虚拟机已经有一个VM id，说明已经有别的任务在运行。在任务执行过程中，task_id通过RequestContext数据格式传播。在任务执行中途如果要更新ask_state，必须确认虚拟机的task_id匹配当前执行任务的id，否则新任务抢占当前任务（目前只有force_delete）。当任务成，task_state置为None，同时task_id置为None。

因为hard delete是唯一一个可以抢占其他任务的任务，我们没必要立即设置task_id，但是需要检查vm_state以确认它不是HARD_DELETE而不是去检查task_id是否匹配。

3、真的要分开vm_state和task_state吗？

从技术上讲,虚拟机状态(稳定)和任务状态(过渡)没有交集，可以组合使用。分开最大的好处就是状态转换图简单得多——只要考虑vm_state之间的DFA。如果需要增加一个新task_state,状态转换图保持不变。

4、命名变化

最好用动词+”ing“来描述task_state，且这个动词是compute API方法。任务执行期间，task_state不变。要表述任务的进展,应该使用一个单独的领域,而不是简化状态机。

None:没有正在执行的任务
BUDILDING
IMAGE_SNAPSHOTTING
IMAGE_BACKINGUP
UPDATING_PASSWORD
PAUSING
UNPAUSING
SUSPENDING
RESUMING
DELETING
STOPPING
STARTING
RESCUING
UNRESCUING
REBOOTING
REBUILDING
POWERING_ON
POWERING_OFF
RESIZING
RESIZE_REVERTING
RESIZE_CONFIRMING
SCHEDULING
BLOCK_DEVICE_MAPPING
NETWORKING
SPAWNING
RESIZE_PREP
RESIZE_MIGRATING
RESIZE_MIGRATED
RESIZE_FINISH

废弃的状态：
RESIZE_VERIFY不是一个过渡状态，而是稳定状态。变成了vm_state中的新状态RESIZED。

参考：

https://wiki.openstack.org/wiki/VMState

http://docs.openstack.org/developer/nova/devref/vmstates.html#preconditions-for-commands

../_images/PowerStates2.png ../_images/PowerStates1.png

$digraph states { node [fontsize=10 fontname="Monospace"] /* states */ building [label="BUILDING"] active [label="ACTIVE"] paused [label="PAUSED"] suspended [label="SUSPENDED"] stopped [label="STOPPED"] rescued [label="RESCUED"] resized [label="RESIZED"] soft_deleted [label="SOFT_DELETED"] deleted [label="DELETED"] error [label="ERROR"] shelved [label="SHELVED"] shelved_offloaded [label="SHELVED_OFFLOADED"] /* apis */ create [shape="rectangle"] create -> active create -> error building -> create delete [shape="rectangle"] delete -> deleted building -> delete paused -> delete suspended -> delete stopped -> delete rescued -> delete soft_deleted -> delete error -> delete soft_delete [shape="rectangle"] soft_delete -> soft_deleted soft_delete -> error active -> soft_delete stopped -> soft_delete restore [shape="rectangle"] restore -> active restore -> error soft_deleted -> restore pause [shape="rectangle"] pause -> paused pause -> error active -> pause unpause [shape="rectangle"] unpause -> active unpause -> error paused -> unpause suspend [shape="rectangle"] suspend -> suspended suspend -> error active -> suspend resume [shape="rectangle"] resume -> active resume -> error suspended -> resume start [shape="rectangle"] start -> active start -> error stopped -> start stop [shape="rectangle"] stop -> stopped stop -> error active -> stop error -> stop rescue [shape="rectangle"] rescue -> rescued rescue -> error active -> rescue stopped -> rescue error -> rescue unrescue [shape="rectangle"] unrescue -> active rescued -> unrescue resize [shape="rectangle"] resize -> resized resize -> error active -> resize stopped -> resize confirm_resize [shape="rectangle"] confirm_resize -> active confirm_resize -> error resized -> confirm_resize confirm_resize [shape="rectangle"] revert_resize -> active revert_resize -> error resized -> revert_resize snapshot [shape="rectangle"] snapshot -> active snapshot -> stopped snapshot -> error active -> snapshot stopped -> snapshot backup [shape="rectangle"] backup -> active backup -> stopped backup -> error active -> backup stopped -> backup rebuild [shape="rectangle"] rebuild -> active rebuild -> error active -> rebuild stopped -> rebuild set_admin_password [shape="rectangle"] set_admin_password -> active set_admin_password -> error active -> set_admin_password reboot [shape="rectangle"] reboot -> active reboot -> error active -> reboot stopped -> reboot paused -> reboot suspended -> reboot error -> reboot live_migrate [shape="rectangle"] live_migrate -> active live_migrate -> error active -> live_migrate shelve [shape="rectangle"] shelve -> shelved shelve -> shelved_offloaded shelve -> error active -> shelve stopped -> shelve paused -> shelve suspended -> shelve shelve_offload [shape="rectangle"] shelve_offload -> shelved_offloaded shelve_offload -> error shelved -> shelve_offload unshelve [shape="rectangle"] unshelve -> active unshelve -> error shelved -> unshelve shelved_offloaded -> unshelve }$

posted @ 2015-01-14 17:00 starof 阅读(15119) 评论(0) 收藏举报

刷新页面返回顶部

starof

我是你的骄傲吗？

OpenStack虚拟机状态

Power_state

vm_state

task_state

公告