设为首页收藏本站language 语言切换
查看: 3866|回复: 8
收起左侧

vcenter连不上esxi问题,重启后恢复,请教大家。

[复制链接]
发表于 2012-8-10 16:44:01 | 显示全部楼层 |阅读模式
本帖最后由 hbqyzf 于 10-8-2012 16:53 编辑
硬件环境:
存储:Dell PS6100, iSCSI协议,硬盘配置300G*12,RAID50
存储交换机:Dell 6224,24个千兆口,8个口连接存储(2个控制器:一主一备各接4个口),每台服务器各连接2个口
服务器(2台):Dell 620, CPU E5-2630*2, RAM 8*24G, SD 2G*2, iDARC
业务交换机:Cisco 2960, 24个百兆口,每台服务器各连接2个口,2个存储管理口,2个iDARC口和广域网接口
系统:
Exsi 5.0 build 623860
vCenter 5.0 build 623373 (运行在esxi1主机上的vm)
两台服务器跑在群集模式下,运行了HA、DRS等
网络:
esxi网络规划,两台配置一样:
物理网卡(vmnic)       虚拟交换机(vSwitch)     端口组(Port Groups)                 
vmnic0                      vSwitch0                                VM
vmnic1                      vSwitch0                                VM
vmnic2                      vSwitch1                                Management + VMkernel(ISCSI) + vMotion
vmnic3                      vSwitch1                                Management + VMkernel(ISCSI) + vMotion
esxi主机IP地址如下:
Esxi1  管理地址 172.16.10.1,vmnic2 172.16.10.21 vmnic3 172.16.10.22 设置了MPIO
Esxi2  管理地址  172.16.10.2, vmnic2 172.16.10.22  vmnic3 172.16.10.32 设置了MPIO
Eql地址
GroupIP 172.16.10.10
4块网卡IP 172.16.10.11 --- 172.16.10.14
Dell 交换 IP 172.16.10.254
问题描述如下:
生产环境与8月28日开始运行,一直没有问题。
9月18日下午4点进行了硬件升级,依次使用vmotion进行平滑迁移。
9月20日凌晨6点20分左右,其中一台主机esxi2 vcenter连不上管理口地址,虚拟机对外正常工作。
9月22日晚上20点左右通过iDARC,修改了管理口地址的绑定,结果虚拟机出现僵死状态和存储失去联系。之后重起了服务器,重起之后之前失去联系的服务器又能回到vCenter的管理中来,目前为止未再次出现问题。
9月20日故障之后的网络状况如附件。
目前网络均可以ping通、esxi2主机运行正常。
排查:
Esxi2 系统中有一台vm每天6点20执行计划任务对一个2G的文件执行备份,这时vc中有告警如下:
设备 naa.64ed2ad549ca2e7a2203c5ff375b242d 性能降
低。I/O 滞后时间已从平均值 3170 微秒增加到 67861
微秒。
警告
2012/9/28 6:26:45
172.16.10.2

此问题咨询过dell eql技术,收集了eql、esxi日志给dell,没有发现问题,排查了配置错误引起的问题。
联想起vc连不上esxi2主机,在正好在这个时间点,有点像网卡数据流量大了,网卡不工作或dell的存储交换机堵塞了。因为esxi2主机重启后,故障就消除了。具体原因未知。
不知大家有无遇到这样的问题,谢谢。
发表于 2012-9-10 06:52:57 | 显示全部楼层
EQL,建议用MEM解决MPIO问题。
沙发 2012-9-10 06:52:57 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2012-9-10 10:07:41 | 显示全部楼层
感谢楼上的回复。
用MEM解决MPIO问题,不是很明白,能说清楚些吗 谢谢。
板凳 2012-9-10 10:07:41 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2012-9-10 10:08:11 | 显示全部楼层
lz后来有没有解决问题,我也有类似的情况。出问题的时候是一个虚拟交换失去响应,导致下面的vm网卡都不通。重启解决问题。硬件是dellR720,系统是esxi5.0update1,dell定制的。
地板 2012-9-10 10:08:11 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2012-9-10 10:08:48 | 显示全部楼层
我也出现过类似的情况,机器是DELL R910和联想的R680 G7
5# 2012-9-10 10:08:48 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2012-9-10 10:09:47 | 显示全部楼层
所以监测虚拟环境下流量变化情况还是非常有必要的
6# 2012-9-10 10:09:47 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2012-9-10 10:10:21 | 显示全部楼层

不好意思,后来没有看到这个帖子。
MEM,是EQL专门的用于ESXi/ESX环境的MPIO组建。
7# 2012-9-10 10:10:21 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2012-9-10 10:07:00 | 显示全部楼层
今天才来回复,不好意思。
回TiGi ,MEM早之前设置过了。
出现故障到现在,我做了以下两个操作,目前没有重启过。
1、升级esxi 5.0 update1 到 esxi 5.1 ;
2、将业务交换机 cisco2960 百兆交换机升级到 2960S 千兆交换机。
之前的故障还真找不到原因,估计跟这两个操作有关。不知道大家有没有遇到相同的问题的。
8# 2012-9-10 10:07:00 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2012-3-12 14:05:33 | 显示全部楼层

强烈怀疑你的瓶颈在那个百兆交换机上。
9# 2012-3-12 14:05:33 回复 收起回复
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2025-3-6 21:57 , Processed in 0.059815 second(s), 22 queries , Redis On.  

  Powered by Discuz!

  © 2001-2025 HH010.COM

快速回复 返回顶部 返回列表