- 积分
- 9
- 鸿鹄币
- 个
- 好评度
- 点
- 精华
- 最后登录
- 1970-1-1
- 阅读权限
- 10
- 听众
- 收听
网络小学徒

|
本帖最后由 hbqyzf 于 10-8-2012 16:53 编辑
硬件环境:
存储:Dell PS6100, iSCSI协议,硬盘配置300G*12,RAID50
存储交换机:Dell 6224,24个千兆口,8个口连接存储(2个控制器:一主一备各接4个口),每台服务器各连接2个口
服务器(2台):Dell 620, CPU E5-2630*2, RAM 8*24G, SD 2G*2, iDARC
业务交换机:Cisco 2960, 24个百兆口,每台服务器各连接2个口,2个存储管理口,2个iDARC口和广域网接口
系统:
Exsi 5.0 build 623860
vCenter 5.0 build 623373 (运行在esxi1主机上的vm)
两台服务器跑在群集模式下,运行了HA、DRS等
网络:
esxi网络规划,两台配置一样:
物理网卡(vmnic) 虚拟交换机(vSwitch) 端口组(Port Groups)
vmnic0 vSwitch0 VM
vmnic1 vSwitch0 VM
vmnic2 vSwitch1 Management + VMkernel(ISCSI) + vMotion
vmnic3 vSwitch1 Management + VMkernel(ISCSI) + vMotion
esxi主机IP地址如下:
Esxi1 管理地址 172.16.10.1,vmnic2 172.16.10.21 vmnic3 172.16.10.22 设置了MPIO
Esxi2 管理地址 172.16.10.2, vmnic2 172.16.10.22 vmnic3 172.16.10.32 设置了MPIO
Eql地址
GroupIP 172.16.10.10
4块网卡IP 172.16.10.11 --- 172.16.10.14
Dell 交换 IP 172.16.10.254
问题描述如下:
生产环境与8月28日开始运行,一直没有问题。
9月18日下午4点进行了硬件升级,依次使用vmotion进行平滑迁移。
9月20日凌晨6点20分左右,其中一台主机esxi2 vcenter连不上管理口地址,虚拟机对外正常工作。
9月22日晚上20点左右通过iDARC,修改了管理口地址的绑定,结果虚拟机出现僵死状态和存储失去联系。之后重起了服务器,重起之后之前失去联系的服务器又能回到vCenter的管理中来,目前为止未再次出现问题。
9月20日故障之后的网络状况如附件。
目前网络均可以ping通、esxi2主机运行正常。
排查:
Esxi2 系统中有一台vm每天6点20执行计划任务对一个2G的文件执行备份,这时vc中有告警如下:
设备 naa.64ed2ad549ca2e7a2203c5ff375b242d 性能降
低。I/O 滞后时间已从平均值 3170 微秒增加到 67861
微秒。
警告
2012/9/28 6:26:45
172.16.10.2
此问题咨询过dell eql技术,收集了eql、esxi日志给dell,没有发现问题,排查了配置错误引起的问题。
联想起vc连不上esxi2主机,在正好在这个时间点,有点像网卡数据流量大了,网卡不工作或dell的存储交换机堵塞了。因为esxi2主机重启后,故障就消除了。具体原因未知。
不知大家有无遇到这样的问题,谢谢。
|
|