Re: HACMP и странное выключение ноды при FC failover

Главная Форумы High Availability PowerHA (HACMP) HACMP и странное выключение ноды при FC failover Re: HACMP и странное выключение ноды при FC failover

#17550
terminus
Участник

hb hdisk доступен через несколько путей.

[code]
node01

# lspv
hdisk3 00f6cb768553xxxx rootvg active
hdisk1 00f6cb767220yyyy HB-vm01-vm02-VG concurrent
hdisk2 00f6cb76ff19zzzz oracle-u01-VG concurrent

# pcmpath query device 1

DEV#: 1 DEVICE NAME: hdisk1 TYPE: 2145 ALGORITHM: Load Balance
SERIAL: xxxxx76802848117C000000000000005
==========================================================================
Path# Adapter/Path Name State Mode Select Errors
0* fscsi0/path0 OPEN NORMAL 49 0
1 fscsi0/path1 OPEN NORMAL 170454 1
2* fscsi1/path2 OPEN NORMAL 63 0
3 fscsi1/path3 OPEN NORMAL 169403 3

# lspath -l hdisk1
Enabled hdisk1 fscsi0
Enabled hdisk1 fscsi0
Enabled hdisk1 fscsi1
Enabled hdisk1 fscsi1

node02

# lspv
hdisk3 00f6cb777653xxxx rootvg active
hdisk1 00f6cb767220yyyy HB-vm01-vm02-VG concurrent
hdisk2 00f6cb76ff19zzzz oracle-u01-VG concurrent

# pcmpath query device 1

DEV#: 1 DEVICE NAME: hdisk1 TYPE: 2145 ALGORITHM: Load Balance
SERIAL: xxxxx76802848117C000000000000005
==========================================================================
Path# Adapter/Path Name State Mode Select Errors
0* fscsi0/path0 OPEN NORMAL 14 0
1 fscsi0/path1 OPEN NORMAL 79935 0
2* fscsi1/path2 OPEN NORMAL 21 0
3 fscsi1/path3 OPEN NORMAL 79888 1

# lspath -l hdisk1
Enabled hdisk1 fscsi0
Enabled hdisk1 fscsi0
Enabled hdisk1 fscsi1
Enabled hdisk1 fscsi1

[/code]

как-нибудь потом попытаюсь сделать failover еще раз (не могу сейчас эксперементировать на продукции)

Что интересно – когда мы только-только ввели дублированный FC, мы проверяли как HACMP будет обрабатывать ситуацию failover FC и во время тестов все происходило без проблем. А в этот раз, получается, наложилась недоступность как FC так и Ethernet…

вот параметры hb диска:
[code]# lsattr -El hdisk1
PCM PCM/friend/sddpcm PCM True
PR_key_value none Reserve Key True
algorithm load_balance Algorithm True
clr_q no Device CLEARS its Queue on error True
dist_err_pcnt 0 Distributed Error Percentage True
dist_tw_width 50 Distributed Error Sample Time True
flashcpy_tgtvol no Flashcopy Target Lun False
hcheck_interval 60 Health Check Interval True
hcheck_mode nonactive Health Check Mode True
location Location Label True
lun_id 0x1000000000000 Logical Unit Number ID False
lun_reset_spt yes Support SCSI LUN reset True
max_coalesce 0x40000 Maximum COALESCE size True
max_transfer 0x40000 Maximum TRANSFER Size True
node_name 0x5005076802xxxxxx FC Node Name False
pvid xxxxxx767220f6ee0000000000000000 Physical volume identifier False
q_err yes Use QERR bit True
q_type simple Queuing TYPE True
qfull_dly 2 delay in seconds for SCSI TASK SET FULL True
queue_depth 20 Queue DEPTH True
recoverDEDpath no Recover DED Failed Path True
reserve_policy no_reserve Reserve Policy True
retry_timeout 120 Retry Timeout True
rw_timeout 60 READ/WRITE time out value True
scbsy_dly 20 delay in seconds for SCSI BUSY True
scsi_id 0x10200 SCSI ID False
start_timeout 180 START unit time out value True
timeout_policy fail_path Timeout Policy True
unique_id yyyyyy005076802848117C00000000000000504214503IBMfcp Device Unique Identification False
ww_name 0x5005076802yyyyyy FC World Wide Name False
[/code]