Zstack迁移实战记录1
https://blog.csdn.net/weixin_43767046/article/details/113748775
这段时间除了那个重度烤机测试(上面链接),还在做另一件事,想再做一个服务器备份,容我慢慢道来。
合肥光源束测在线使用服务器还是从永良师弟搞起的,我以前都是一台台工控机搭系统,每个子系统一台工控机,轻量的一个工控机跑两三个系统。重大维修改造时,师弟那时候博后吧,使用centos+kvm跑虚拟机,每个虚拟机跑起各系统的IOC。新生代就是不一样,我那时候觉得这个东西太高端了,用着蛮好的,但是掌握它我就只好躲了。还好那时候服务器管理,搭建维护等都是永良自己搞,我也乐的清闲不需要去操心系统后台运行的事。后来红外项目,那时候他已经是组长了,也是他亲自操刀用服务器把束测的服务建起来,并前期做了大量工作,包括后台的IOC和前台的OPI。可是好像18还是19?真糊涂了,他要去兰州,他维护的这些我只好接手,那时候压力山大,想万一他走了,服务器崩了怎么办?服务器一点都不熟悉,几天我都搞不定恢复系统。所以在他走之前,几乎是手把手的指导下,我又在另一台服务器上做了所有在线系统的备份。并且前两年每个开机季轮番跑,一直很稳定。
这几年每年运行费都可以买服务器了,手头上就有机器可以线下摸,现在慢慢摸得越来越熟,而且我想我比师弟那时候走得更远了。再做备份,我就交给别人练练手吧,去年让天雨师弟再做一个,他不愿用Zstack,要用vmware做,还算给力,把备份做好,去年下半年vmware备份的服务器跑了半年系统稳定运行。又是一个放假季,服务器系统备份无止境,而且最早的两台运行了也近10年了,该下岗了,所以又想用Zstack备份。放假前把服务器装好放到现场的机柜里,想着假期时娃们睡了夜里慢慢搞。雷雷师弟后来确定回归束测,终于可以抓他干活了,正好让他来做。可是他维护集群的身手,不忍心让他做这些体力活,想着Zstack的迁移功能是不是可以批量搞,自己试了多次,实在搞不定,只好找Zstack的大神们帮忙。武汉的@Ericbili兄弟2月6号开始干,因为大光源时间早,是centos6+kvm,版本太老,Zstack也是新生代,对于跨代碾压前辈的产品真没必要迁就太老的版本,不支持迁移是正常的。永良师弟建的红外项目的服务器也跑了好几年了,现在也开始供光了,必须尽快做备份系统了,可惜一直没预算买那边的服务器,想着正好让@Ericbili兄弟试试迁移那边的centos7+kvm的虚拟机,一下子把他推进坑里陷了好几天,还喊来上海的乐哥一起干,那个服务器我当时随便找了个百兆的交换机接外网,每次传个镜像都要命,两位兄弟白天黑夜又熬夜一直折腾到今天,其中蹚坑过坎周折不断,很多现象都莫名其妙,最后两位兄弟终于找出原因,比较狗血,直接上截图吧:
所有这些波折和莫名其妙都是因为这个原因,如果不是zstack大神帮忙检视,我根本发现不了,估计这个假期都要耗在折腾系统上,而且是白花功夫,这两天就去按雷雷说的去试试看。
回看两位兄弟的history命令记录,每个shell几百上千条的命令,回看前段时间杰杰站长帮忙解决的被挖矿入侵经历,每个云主机的解决也是几百上千条的命令,虽然我很多命令都看不懂,也看的惊心动魄,大神们被我拉来干苦力,于心不忍,后来杰杰说还有两个云主机也发现问题的时候,干脆就让他帮我把云主机删掉了事,大不了我再重新建,也总好过这样费心费力。
最后总结,莫名其妙写了这么长,主要是感念两位兄弟这几天确实太辛苦,俺无钱给付总要有个记录留下,趁热打铁赶紧写一篇,要不然过后经过都忘了,更想起杰杰前段时间的辛苦。
无问题的另一个盘做主储存后,centos7+kvm,Zstack终于迁移成功了,这下心里有底了,不过更老版本的备份还是要一个个导入后手动调试。后面还要再试试vmware那个坑,不过正好试试Zstack的纳管,到时候少不了还要辛苦两位兄弟,到时候再出2吧。