设为首页收藏本站language 语言切换
查看: 1952|回复: 14
收起左侧

关于ESX故障的处理办法

[复制链接]
发表于 2014-3-26 16:09:58 | 显示全部楼层 |阅读模式
关于ESX的故障,应该说并不少见。
当ESX故障,该ESX无法通过VC管理,但其IP地址可以ping通,而其上运行vm可以正常运行。这样的情况下,当我需要重启ESX时,我有如下问题,请教各位:
1、VM如何确保持续运行?按我的理解,当时该ESX无法被管理,其中运行VM也无法被管理,所以是没有办法做手工HA迁移的。
2、当ESX手动启动后,VM的状态如何?
2.1 如何确保VM可以迁移。
2.2 当VM无法迁移时,ESX启动完成后,如何确保宕机的VM可以自动回复。
内容如上,欢迎各位提供建议。
发表于 2014-3-26 16:10:56 | 显示全部楼层
本帖最后由 TiGi 于 10-31-2011 18:06 编辑
1、ESXi如果无法和vCenter联系时,上面的虚拟机可能还是处于正常运行;所以最好还是在虚拟机上留一个管理途径(例如远程桌面、SSH等)。
2、ESXi手动重启后,那些虚拟机好像会处于“突然关机”状态,具体需要实践尝试一下。
2.1 似乎无法迁移了;
2.2 内存内的数据,丢失了就是丢失了。
我遇到过vCenter和ESXi无法联系的情况(ping ESXi主机还是通的,ESXi ping DNS/网关/vCenter也还可以),后来我是在通过重启ESXi上的管理代理解决问题的。
沙发 2014-3-26 16:10:56 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-3-26 16:11:35 | 显示全部楼层
看楼主描述的环境应该是个配置齐全的HA环境,service console始终能ping通HA是不会起作用的,我觉得可以断开这台故障ESX的service console连接迫使HA启动迁移VM。
不会ESX上就一块网卡吧?
板凳 2014-3-26 16:11:35 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-3-26 16:12:12 | 显示全部楼层
你提的这几个问题我觉得可以用以下方法回答你:
1、切到SSH,Service mgmt-vmware restart;Service vmware-vpxa restart;
2、永久性解决这些问题建议升级ESX到最新版本,4.0版本会有较多这样的问题。
3、也可以考虑重新部署成ESXI版本。
地板 2014-3-26 16:12:12 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2011-1-11 08:55:48 | 显示全部楼层

感谢你的帮助。
1、VM的管理途径肯定是有的,这也是正常情况下我在虚拟化下对vm管理的正常途径。在当时的情况下,VM是正常的,毋庸置疑。只是,如果我对ESX操作,例如重启OS,那么肯定会导致VM宕机。这一点是急需处理的。
2.1 2.2 当时的VM处于关机状态,如何将其自动开机,这是一个大的问题。
你所提到的重启管理代理,我后来才知道,命令行是:service mgmt-vmware restart。
5# 2011-1-11 08:55:48 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2011-1-11 08:56:48 | 显示全部楼层

网卡是有teaming的。这一点肯定没有问题。
不过你所提到的方法倒也还真不错,拔网线?
6# 2011-1-11 08:56:48 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2011-1-11 08:56:44 | 显示全部楼层

感谢你的答复。
1、在ESX本地Console上,当我F2输入账号和密码后,回车不生效,无法进去管理界面。并且,之前我嫌VC上有”打开SSH“的类似警告别扭就没开SSH。于是,命令行最终还是没进去。
2、我的ESX确实是5.0的。
3、我的ESX是5.0的,确实是ESXi,可能我的描述有点失误,概念还停留在vSphere 4的那一代上。
7# 2011-1-11 08:56:44 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2011-1-11 08:57:40 | 显示全部楼层
感谢各位的大力支持!
自我总结一下对我提到问题的解决办法。
1、HA确实无法迁移。可以尝试通过拔掉该ESX的Management Network网线主动告诉HA切换。
2.1 2.2 仍旧没有解决。
欢迎各位继续各抒己见!
8# 2011-1-11 08:57:40 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2011-1-11 09:02:33 | 显示全部楼层
感谢各位的大力支持!
自我总结一下对我提到问题的解决办法。
1、HA确实无法迁移。可以尝试通过拔掉该ESX的Management Network网线主动告诉HA切换。
2.1 2.2 仍旧没有解决办法,只能手工来弄。
9# 2011-1-11 09:02:33 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2011-1-11 09:03:08 | 显示全部楼层

配置里面不是有与系统一起启动和停止虚拟机的吗?
10# 2011-1-11 09:03:08 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2011-1-11 09:07:16 | 显示全部楼层

您的说法很对。确切的说,是在Cluster的HA配置中,确认当主机出现问题时的策略。可以选择“保持打开电源”、“关闭电源”,以及“关机”。
但是,为了确保VM的可用性,我在这一项还是选择默认的“保持打开电源”,这样VM还可以正常运行。虚拟机的配置也是保持群集设置不变。
如您所述,不知有什么更好的办法?
11# 2011-1-11 09:07:16 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2011-2-11 22:38:22 | 显示全部楼层

正解, 重启ESXi上的管理代理
12# 2011-2-11 22:38:22 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2011-3-11 15:58:41 | 显示全部楼层

呵呵。这个早就知道了。
13# 2011-3-11 15:58:41 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2011-1-11 08:55:00 | 显示全部楼层
如果你要做到任何一个主机上的特定VM垮了之后,应用完全不受影响,只有FT以及集群技术了。
内存里面的咚咚,一旦“断电”/“清除”谁都没有办法恢复的。
14# 2011-1-11 08:55:00 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2011-4-11 11:10:48 | 显示全部楼层

或者我的问题可以修改成这样:
ESXi的可用性并非我考虑的重点,我的重点在于要确保VM的可用性。
当ESXi发生我所述问题时,虽然VM还是可用,但要恢复功能会导致VM宕机。那么,在此种情况下,我该如何修改vCenter的配置或者该怎样做,才能在确保VM的可用性的同时恢复虚拟化环境的功能。
15# 2011-4-11 11:10:48 回复 收起回复
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2025-2-3 16:01 , Processed in 0.067256 second(s), 13 queries , Redis On.  

  Powered by Discuz!

  © 2001-2025 HH010.COM

快速回复 返回顶部 返回列表