设为首页收藏本站language 语言切换
查看: 988|回复: 0
收起左侧

vSphere 5.0之HA的虚拟机重启机制

[复制链接]
发表于 2014-3-19 18:20:00 | 显示全部楼层 |阅读模式
在vSphere 5.0里,针对HA的虚拟机重启机制中以下几个部分发生了变化:
重启优先级有所调整
重启重试机制有所调整
隔离响应和检测方式有所调整
接下来,就针对这几个更改的部分一个个描述,首先看看重启优先级的调整:
针对重启优先级的调整方面如下:
虚拟机的Agent
FT Secondary虚拟机
虚拟机可以被配置高、中、低优先级
那么,什么是虚拟机的Agent?比如,类似Edge或vShield之类的用于安全防护的服务;
FT Secondary虚拟机的意思应该是说如果重启虚拟机失败,则HA一样会启动其它的虚拟机;
重启重试机制
针对4.1的重启重试机制在之前我有讲到过,它缺省包含6个重启等级:也就是1次初始化重启和由das.maxvmrestartcount控制的5次重试次数。在5.0里,这一点发生了变化,最大的重启次数变成了5次,虽然看起来变化不太大,但其实这个变化是比较重要的。变化后的时间安排如下:
T0 - 初始化重启
T2m - 第一次重启尝试
T6m - 第二次重启尝试
T14m - 第三次重启尝试
T30m - 第四次重启尝试
一共就这5次。其中的"m"的意思是代表在多少分钟后重新尝试重启动作。因此,时间上T0和T2之间的时间间隔会是2分钟+10秒这么多,其中的10秒是故障检测时间间隔。
隔离响应和检测方式
vSphere 5.0的HA里,针对隔离响应反映和隔离检测校验机制有很大变化。当然,整个vSphere 5.0的HA部分虽然代码重写了,但是,从街面上看,是看不到太多变化的(可操控GUI的地方不多)。下面就简单来说说为什么有那么大的变化,首先,HA启用了das.failuredetectiontime这个参数,在4.x以前,这个参数被用于做隔离响应故障检测时间间隔设定的,虽然在4.x以前它看起来很有价值,不过,在Datastore Heartbeating出线之后,它已经可以被丢弃了。弃用的理由很简单:现在已经能够实现在网络保持畅通的情况下,隔离响应检测到主机隔离之前就可以实现对VMs的重启,也就是说:当我们升级主机时,不用再考虑将主机退出HA cluster啦,直接干活就行,因为,有Datastore Heartbeating支持。
下面是一个隔离Slave主机的时间间隔:
T0 - 隔离Slave主机
T10s - Slave进入“备选状态”
T25s - Slave认为自己成为了新的Master,然后Slave会ping隔离响应地址
T30s - Slave声明自己被隔离,然后触发隔离响应机制
隔离Master主机的时间间隔:
T0 - 隔离Master主机,同时ping隔离响应地址
T5s - Master声明自己被隔离,然后触发隔离响应机制
完成之后,Master确认被隔离,它上面的VM就会在Slave主机上重启;
从上面的时间表可以很明显的看出,我们的HA隔离响应时间更短暂了。
您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2025-2-3 11:07 , Processed in 0.054195 second(s), 12 queries , Redis On.  

  Powered by Discuz!

  © 2001-2025 HH010.COM

快速回复 返回顶部 返回列表