基于集群的高可用性技术初探
摘要:
由于集群的保障对象,即服务程序和应用程序在功能和结构上千差万别,集群软件系统的提供商很难了解应用软件的内部结构和功能,所以集群一般都是采用通用的容错方式对待应用软件,对于资源检测和故障转移只能采用与软件功能没有相关性的方法。也就是说集群只能从系统层上对应用软件状态进行检测,只有在发现应用软件出现异常中止和进程结束时才对应用程序进行故障转移,而对于业务软件在应用层上的错误并不予关注,但应用层上的错误往往会导致错误的结果却并不会导致程序的异常中止,这样一来集群就无法做到故障转移了。实际上,集群停掉错误节点并在备用服务上重新启动业务软件的时候并没有考虑到对业务软件的错误现场的捕获和业务状态的恢复,这对于关键业务系统来说当然是不行的。 阅读全文
posted @ 2006-11-05 20:58 肥猫 阅读(858) 评论(0) 推荐(0) 编辑