Re: Проблема с пропаданием путей


Главная Форумы POWER Systems AIX/Hardware Проблема с пропаданием путей Re: Проблема с пропаданием путей

#17759

Anton Bukhman
Участник

Да, 5735 — Dual port.
На каждом VIOS создано по 2 виртуальных FC адаптера для каждого lpar.(На сколько я понимаю их может быть сколько угодно).
Пути пропадают примерно так :
root@aix1lpar4 $ lspath
Enabled hdisk0 vscsi0
Enabled hdisk1 vscsi1
Enabled hdisk2 fscsi0
Enabled hdisk3 fscsi0
Enabled hdisk4 fscsi0
Enabled hdisk5 fscsi0
Enabled hdisk6 fscsi0
Enabled hdisk2 fscsi0
Enabled hdisk3 fscsi0
Enabled hdisk4 fscsi0
Enabled hdisk5 fscsi0
Enabled hdisk6 fscsi0
Failed hdisk2 fscsi1
Failed hdisk3 fscsi1
Failed hdisk4 fscsi1
Failed hdisk5 fscsi1
Failed hdisk6 fscsi1
Failed hdisk2 fscsi1
Failed hdisk3 fscsi1
Failed hdisk4 fscsi1
Failed hdisk5 fscsi1
Failed hdisk6 fscsi1
Failed hdisk2 fscsi3
Failed hdisk3 fscsi3
Failed hdisk4 fscsi3
Failed hdisk5 fscsi3
Failed hdisk6 fscsi3
Failed hdisk2 fscsi3
Failed hdisk3 fscsi3
Failed hdisk4 fscsi3
Failed hdisk5 fscsi3
Failed hdisk6 fscsi3
Enabled hdisk2 fscsi2
Enabled hdisk3 fscsi2
Enabled hdisk4 fscsi2
Enabled hdisk5 fscsi2
Enabled hdisk6 fscsi2
Enabled hdisk2 fscsi2
Enabled hdisk3 fscsi2
Enabled hdisk4 fscsi2
Enabled hdisk5 fscsi2
Enabled hdisk6 fscsi2

Пропадают по разному. Иногда только по одному адаптеру, иногда по трём.
при этом в errpt появляются сообщения типа :

DE3B8540 0206092213 P H hdisk11 PATH HAS FAILED

5A7598C3 0204153913 I O fscsi2 Additional FC SCSI Protocol Driver Infor

4B436A3D 0204153913 T H fscsi2 LINK ERROR

DCB47997 0204153713 T H hdisk12 DISK OPERATION ERROR

D712FEAE 0202175413 T S fcs1 LINK_DEAD events reported by the VIOS

A6F5AE7C 0206093413 I H hdisk13 PATH HAS RECOVERED

На коммутаторах (Cisco MDS 9513) они настроены через NPIV. Т.е. физически занято по 2 порта на каждом коммутаторе :

fc3/38 20 0x780063 c0:50:76:02:b2:73:00:00 c0:50:76:02:b2:73:00:00
[aix1lpar1_fc0]
fc3/38 20 0x780065 c0:50:76:02:b2:73:00:14 c0:50:76:02:b2:73:00:14
[aix1lpar2_fc0]
fc3/38 20 0x780068 10:00:00:00:c9:e8:d8:31 20:00:00:00:c9:e8:d8:31
[p750_vio1_fc1]
fc3/38 20 0x780069 c0:50:76:02:b2:73:00:1c c0:50:76:02:b2:73:00:1c
[aix1lpar5_fc0]
fc3/38 20 0x78006a c0:50:76:02:b2:73:00:04 c0:50:76:02:b2:73:00:04
[aix1lpar3_fc0]
fc3/38 20 0x78006b c0:50:76:02:b2:73:00:18 c0:50:76:02:b2:73:00:18
[aix1lpar4_fc0]
fc3/40 20 0x78005f 10:00:00:00:c9:cc:37:dc 20:00:00:00:c9:cc:37:dc
[p750_vio1_fc0]
fc3/40 20 0x78006d c0:50:76:02:b2:73:00:2a c0:50:76:02:b2:73:00:2a
[aix1lpar1_fc1]
fc3/40 20 0x78006e c0:50:76:02:b2:73:00:2c c0:50:76:02:b2:73:00:2c
[aix1lpar2_fc1]
fc3/40 20 0x78006f c0:50:76:02:b2:73:00:2e c0:50:76:02:b2:73:00:2e
[aix1lpar3_fc1]
fc3/40 20 0x780070 c0:50:76:02:b2:73:00:30 c0:50:76:02:b2:73:00:30
[aix1lpar4_fc1]
fc3/40 20 0x780071 c0:50:76:02:b2:73:00:32 c0:50:76:02:b2:73:00:32
[aix1lpar5_fc1]

В логах никаких ошибок нет.
Зоны созданы под каждый lpar.
Если смотреть show zoneset active vsan x то показывает что всё wwn’ы залогинены.
Зона выглядит примерно так :
zone name z_aix1lpar1 vsan 20
* fcid 0x780063 [device-alias aix1lpar1_fc0]
* fcid 0x780053 [device-alias fas5_1_0c]
* fcid 0x780054 [device-alias fas5_2_0c]
* fcid 0x78006d [device-alias aix1lpar1_fc1]

Массивы администрирую не я, но storage-admin говорит, что с его стороны всё нормально.
К этому массиву подключено много других серверов(В том числе другие AIX’ы и Solaris, Linux, Windows и пр.).

А массив да, двухголовый.