проблема с HACMP

Главная Форумы POWER Systems AIX/Hardware проблема с HACMP

В этой теме 9 ответов, 4 участника, последнее обновление  _KIRill 9 года/лет, 9 мес. назад.

  • Автор
    Сообщения
  • #1319

    Sergey
    Участник

    Добрый день.
    Возникла следующая проблема с кластером HACMP (2 ноды):
    при синхронизации кластера с одной ноды все проходит на ура. С другой не получается. Ругается на отсутствие интерфейса, хотя ifconfig пользовать умеем – интерфейс есть, да и пинги ходят. clstat на обеих нодах показывает, что интерфейс есть и UP. Ковыряния в логах навели на такую аномалию: в логах snmp на той ноде, на которую ругается кластер, стоит ругань:
    [code]
    daemon:notice snmpd[151968]: NOTICE: interface pointers changed. re-initializing interfaces
    daemon:err|error snmpd[151968]: EXCEPTIONS: ifTableAttach: Failed to read the share memory id. Error 0
    [/code]
    и причем это постоянно.

    В какую сторону копать?

    Ругань на galabase1 при синхронизации:
    [code]
    ERROR: Interface galabase2_en2_b (192.168.136.1) is not configured in AIX on node: galabase2
    Please check to ensure the interface is properly defined to AIX. If the
    interface is not defined to AIX then add the interface by running
    ‘smitty chinet’ and change network interface: en2 to the above IP definition.
    [/code]

    Это ifconfig на galabase2:
    [code]
    # ifconfig en2
    en2: flags=1e080863,c0
    inet 192.168.136.1 netmask 0xfffffc00 broadcast 192.168.139.255
    tcp_sendspace 131072 tcp_recvspace 65536 rfc1323 0
    [/code]

    А это пинг с galabase1 на galabase2:
    [code]
    # ping galabase2_en2_b
    PING galabase2_en2_b: (192.168.136.1): 56 data bytes
    64 bytes from 192.168.136.1: icmp_seq ttl=255 time ms
    64 bytes from 192.168.136.1: icmp_seq=1 ttl=255 time ms
    [/code]

  • #1320

    а какая версия AIX и HACMP?

  • #1322

    Sergey
    Участник

    AIX 5.3
    HACMP 5.4

  • #1354

    Sergey
    Участник

    неужели ни у кого нет никаких мыслей?
    /var/hacmp/adm/cluster.log
    daemon:notice snmpd[180444]: NOTICE: interface pointers changed. re-initializing interfaces
    ifTableAttach: Failed to read the share memory id. Error 0

    /var/tmp/snmpd.log
    NOTICE: interface pointers changed. re-initializing interfaces
    EXCEPTIONS: open_device called for ent0 doing a 5
    EXCEPTIONS: ask_device called for ent0 doing a 1
    EXCEPTIONS: add interface 1: ent0 0x0 with mask 0x1 alias en0
    EXCEPTIONS: open_device called for ent1 doing a 5
    EXCEPTIONS: ask_device called for ent1 doing a 1
    EXCEPTIONS: add interface 2: ent1 0x0 with mask 0x2 alias en1
    EXCEPTIONS: open_device called for ent2 doing a 5
    EXCEPTIONS: ask_device called for ent2 doing a 1
    EXCEPTIONS: add interface 3: ent2 0x0 with mask 0x4 alias en2
    EXCEPTIONS: open_device called for ent3 doing a 5
    EXCEPTIONS: ask_device called for ent3 doing a 1
    EXCEPTIONS: add interface 4: ent3 0x0 with mask 0x8 alias en3
    DEBUG: add interface 1: en0 0x58a1f000 with mask 0x1
    DEBUG: add interface 2: en1 0x58a1f230 with mask 0x2
    DEBUG: add interface 3: en2 0x58a1f460 with mask 0x4
    DEBUG: add interface 4: en3 0x58a1f690 with mask 0x8
    DEBUG: add interface 5: lo0 0x2f77a00 with mask 0x10
    EXCEPTIONS: ifTableAttach: Failed to read the share memory id. Error 0
    DEBUG: sent trap (coldStart) to 127.0.0.1

    если выносим из кластерной конфигурации интерфейсы en2&en3
    с последующим rmdev для них, то все становится ок
    но хотелось бы задействовать все 4 интерфейса а не два, причем как уже писали такая ругань только на одной ноде, на второй все гуд.

  • #1360

    Дмитрий
    Участник

    IP-адреса на интерфейсах должны быть поставлены через меню smit chinet, при этом обязательно указана маска. Все интерфейсы должны быть указаны в файле /etc/hosts.

    Скорее всего, ошибка где-то здесь.

    Если кластер ещё не в работе, я бы удадил кластер (smit hacmp-> extended->topology->cluster->remove hacmp definition), удалил все интерфейсы (rmdev -dl enX), заново их определил (cfgmgr), поставил ip (smit chinet), hostname (тоже smit), /etc/hosts, и всё проверил.
    После этого создаём заново кластер.

    Как правило, это помогает. А конкретную ошибку можно дооолго искать.

  • #1385

    Sergey
    Участник

    Да нет, уже в работе, вариант все положить и снова поднять, ну это если только в новогоднюю ночь 🙂

    давайте отойдем от кластера, потому проблема в нем я так понимаю только в том, что на одной ноде криво работает SNMP, что если с другой ноды проводить синхронизацию (она что, инфу по интерфейсам дергает у соседа по SNMP?), она ругается, что отсутствуют интерфейсы, которые должны быть, но если на той, где как я предполагаю неполадки в SNMP остановить службу SNMPD, то кластер начинает дышать ровно и синхронизация проходит в обе стороны на ура, только clstrmgrES ругается, что не может подключиться к SNMP. Так что собсветнно вопрос по SNMPD что ему не хватает, для нормальной работы?

    snmpd.log

    11/08/08 12:51:41 NOTICE: interface pointers changed. re-initializing interfaces
    11/08/08 12:51:42 EXCEPTIONS: ifTableAttach: Failed to read the share memory id. Error 0

    на второй ноде, snmpd так не ругается, но конфиги один в один

  • #1405

    Sergey
    Участник

    Проблемку решили таким способом, на одной ноде перешли от snmpdv1 на snmpdv3
    вроде все работает и полночная верификация прошла без ошибок, теперь вопрос
    подводные камни могут быть в этой смене версии snmpd?

  • #1414

    Дмитрий
    Участник

    А на второй ноде – snmpdv1 остался?
    Кластер должен работать.
    На старых версиях была какая-та проблема с версиями snmpd, но отражалось это только на clinfo/clstat.

  • #1446

    Sergey
    Участник

    Да, на второй ноде остался snmpdv1, тоже тогда стоит перевести?

  • #1450

    _KIRill
    Хранитель

    Стоит. В противном случае последствия непредсказуемы.

    ---As If, But Not---

Для ответа в этой теме необходимо авторизоваться.