问题描述
IBM主机在对接华为存储,在存储侧配置主机启动器时,在存储侧无法正常发现启动器。如果在存储侧手动创建了启动器,则启动器状态显示为离线。主机侧执行扫描HBA卡操作也无法恢复,如下图:
AIX主机HBA卡扫描方法:cfgmgr –v
处理过程
1、 排查主机、交换机、存储对应端口运行指示灯是否显示正常。如果显示不正常则排查对应端口、光模块等是否存在异常,故障排除后在主机侧重新扫描HBA设备。 2、 排查交换机ZONE配置是否正确,如果配置不正确,故障排除后在主机侧重新扫描HBA设备。常用命令如下: 博科交换机ZONE查看命令:cfgshow 思科交换机ZONE(已激活)查看命令: show zone activate 3、 排查主机侧HBA卡是否存在异常,如端口是否存在大量误码、是否能正常收发数据。
使用命令fcstat fcsX(X使用具体端口ID替代)对应HBA卡端口信息,如下:
1)如果存在大量误码,则观察一段时间误码增长情况,如果继续增长则更换对应端口光模块等来进行故障排除。
2)如果Input/Output Bytes都为0,则说明此端口可能无法正常收发数据,请排除主机端口到交换机端口的光纤、光模块是否存在异常,排查主机和交换机端口运行指示灯是否显示正常。否则建议协调主机侧工程师协助分析。 4、 AIX特殊机制导致存储设备第一次对接AIX应用服务器不正常
1) 运行lscfg -vpl fcsx命令(x此处代表HBA卡的编号)查看FC HBA卡的WWPN号,如下:
2) 确认该端口为与存储相连端口,并且当前主机无其他业务使用该端口的前提下,运行rmdev -dl fcsX -R命令(X此处代表为0或1)删除与存储设备连接的HBA卡设备。 3) 删除HBA卡设备后,运行lsdev -Cc adapter|grep fcs查看HBA卡设备信息,确认HBA卡设备已经删除成功。 4) 运行cfgmgr命令重新扫描HBA卡设备。运行lsdev -Cc adapter|grep fcs查看与存储设备连接的HBA卡已经重新显示。
5) 重新检查主机是否与存储已正常建立连接。
5、 同口问题导致无法正常建立连接。 1) 分析存储日志,查看主机与存储端口报文交互流程是否与以下描述类似,由于不同接口卡日志不一致,此处不对日志进行说明。 原因:在主机与存储建立FC2连接后,主机没有及时主动向阵列发送建立FC4连接的请求,因此阵列端口主动向对方端口发送PRLI要求建立FC4的连接,但由于主机没有目标器属性,因此被主机拒绝。阵列发出要求建立FC4连接的请求被拒绝后,阵列端口发送LOGO要求断开连接,因此与主机的连接建立失败。 2) 在developer模式使用命令修改存储端口模式,如下。
命令:change port fc port_id=PORT ID role=tgt
使用命令查看对应端口是否修改成功,如下:
命令: show port general physical_type=FC
3) 重启主机,观察连接是否恢复。
根因
该问题属于存储与主机、交换机的连通性问题,需要对主机、交换机、存储逐步排查才能确认问题根因,排查方法见处理过程。
解决方案
解决方案见处理过程。
|