设为首页收藏本站language 语言切换
查看: 2693|回复: 25
收起左侧

存储故障导致HOST不可用

[复制链接]
发表于 2014-4-10 16:48:52 | 显示全部楼层 |阅读模式
存储扩展柜控制器损坏,导致所有VM不可用,这不奇怪
奇怪的是,导致HOST不能正常工作。各位有见过的吗?
打电话给vmware的工程师,工程师说开启HA功能,存储损坏可能导致HOST工作不正常
 楼主| 发表于 2014-4-10 16:49:50 | 显示全部楼层
很怪异,出故障的时候,有的VM正常,有的VM无法访问和PING通
而且没有规律,比如,同一主机上的VM,有的正常,有的不正常
同一LUN上的VM,有的正常,有的不正常
我现在在想,是否VC或VC的数据库也放在这个存储上~
沙发 2014-4-10 16:49:50 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:50:35 | 显示全部楼层
关注ing......。
板凳 2014-4-10 16:50:35 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:51:12 | 显示全部楼层
你这个错误很正常,lun本来就是打散分布在不同磁盘上的,同一个LUN上的主机有的有错误,有的没错误,那可能是有的磁盘是好的,有的是不好的,如果磁盘都正常,而控制器挂了,可能是校验出错。
地板 2014-4-10 16:51:12 回复 收起回复
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-10 16:52:07 | 显示全部楼层
故障解除,回来和大家说一下,也算有头有尾
1)IDC工程师首先将HOST强行重启,故障依旧
2)IDC工程师发现他们存储的扩展机柜控制器发生故障,但是按照一般逻辑,就算存储坏了,也不应该影响    HOST工作。但是故障就是VC无法与HOST通讯,电话VMware,对方工程师说,在开启HA的情况下,存储损坏可能出现这种状况。没办法,只有等IDC把存储休好了再说。
3)IDC工程师把存储弄好了,然后重新连接HOST,打散,再建立HA,DRS。
4)各个VM也都正常了
5)发现Linux服务器里面的所有文件与文件夹属性全部变为只读,无法修改,创建,删除文件。WINDOWS的无此现象。
6)后仔细进行确认,发现存储出故障时通电的Linux VM,都出现此故障。但没开机的VM和WINDOWS的VM则无此现象
7)重启所有Linux服务器,故障解除。
一切OK
最纳闷的就是,为什么存储故障,会导致VC与HOST无法连接,像第一章图里那样
按照想像,就算存储怎么坏掉,都不应该影响HOST的,最多应该是VM起不来。
个人猜想是否IDC的VC或VC的数据库也在损坏的存储中,所以导致这种不正常情况。
6)
5# 2014-4-10 16:52:07 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:52:54 | 显示全部楼层
这个确实很奇怪,一般都是vm会出问题哈
6# 2014-4-10 16:52:54 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:53:44 | 显示全部楼层
VC就算坏掉了,也不影响HOST的正常使用啊。
7# 2014-4-10 16:53:44 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:54:37 | 显示全部楼层
同样关注......
8# 2014-4-10 16:54:37 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:55:24 | 显示全部楼层
太正常了,MD3200i在我的环境下就会造成host不可用,datastore频繁丢失造成的。
9# 2014-4-10 16:55:24 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:56:00 | 显示全部楼层
本帖最后由 TiGi 于 6-26-2012 08:21 编辑
求教一下:
不太了解LZ那里到底是怎样的存储和扩展盘柜。
如果是类似MD3000i、MD3200i这样的盘柜,如果通过扩展口进行扩展,因为扩展口在控制器上,那控制器故障的时候,是不是会导致扩展盘柜出现类似的故障?
也就是说两个控制器连接扩展盘柜,但是实际上主盘柜和控制盘柜间是不是还是存在单点故障隐患?
10# 2014-4-10 16:56:00 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:56:54 | 显示全部楼层

我的MD3200i上没有接扩展盘柜。
11# 2014-4-10 16:56:54 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:57:40 | 显示全部楼层

我的MD3000i上也没有接。呵呵。
12# 2014-4-10 16:57:40 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:58:18 | 显示全部楼层

只要有丢包 linux文件系统就会锁定文件系统变成readonly 重新获取一次存储就正常了。
windows下没有这样的机制所以不会出readonly的问题。
13# 2014-4-10 16:58:18 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:59:02 | 显示全部楼层

受教了!!!
14# 2014-4-10 16:59:02 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2014-4-10 16:59:50 | 显示全部楼层
整个平台内,是不是只有这么一个存储?
个人猜想:
1、HA的某些信息会放置在共享存储上 —— 因此,vCenter 不可用的时候,HA仍旧有效;
2、假设vCenter也在存储上,也由此处于故障中,而存储上的HA配置又不可读取;
3、HA的从属关系不明确以及无法选举,致使主机异常。
15# 2014-4-10 16:59:50 回复 收起回复
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2025-5-10 05:39 , Processed in 0.077985 second(s), 23 queries , Redis On.  

  Powered by Discuz!

  © 2001-2025 HH010.COM

快速回复 返回顶部 返回列表