что это за событие в hacmp.out


Главная Форумы POWER Systems AIX/Hardware что это за событие в hacmp.out

В этой теме 2 ответа, 3 участника, последнее обновление  Ihar 8 года/лет, 3 мес. назад.

  • Автор
    Сообщения
  • #4414

    Arthur
    Участник

    вот мой кусок лог файла:
    Jul 23 09:44:27 EVENT START: server_restart node1 17 AKK_AS
    Jul 23 09:45:29 EVENT FAILED: 1: server_restart node1 17 AKK_AS 1
    Jul 23 09:45:29 EVENT START: event_error 1 TE_SERVER_RESTART
    Jul 23 09:45:30 EVENT COMPLETED: event_error 1 TE_SERVER_RESTART 0
    Jul 23 09:47:27 EVENT START: config_too_long 180 TE_SERVER_RESTART
    :config_too_long[+69] EVENT=TE_SERVER_RESTART

    как я вижу, упал AS и скрипт рестарта AS не отработал…
    после этого запустилось какоето recovery событие event_error с опциями TE_SERVER_RESTART
    кластер после этого ушел в UNSTABLE

    есть ли шанс вернуть его из этого состояния ?
    в логах куча:
    WARNING: Cluster ksip_ha has been running recovery program ‘TE_SERVER_RESTART’ for 5760 seconds. Please check cluster status.

    WARNING: Cluster ksip_ha has been running recovery program ‘TE_SERVER_RESTART’ for 6720 seconds. Please check cluster status.

    WARNING: Cluster ksip_ha has been running recovery program ‘TE_SERVER_RESTART’ for 7680 seconds. Please check cluster status.

    WARNING: Cluster ksip_ha has been running recovery program ‘TE_SERVER_RESTART’ for 8640 seconds. Please check cluster status.

    WARNING: Cluster ksip_ha has been running recovery program ‘TE_SERVER_RESTART’ for 9600 seconds. Please check cluster status.

    WARNING: Cluster ksip_ha has been running recovery program ‘TE_SERVER_RESTART’ for 11520 seconds. Please check cluster status.

    заранее спасибо!
    я новичек в этом деле 🙂

    PS:
    причем, вот что интересно событие рестарта завалилось(стопстарт не сработал) и сам APP продолжает работать ..и в Cluster Status … он как UP

    но кластер в UNSTABLE

  • #4419

    kir
    Хранитель

    У меня тоже что-то похожее было с самовосстановлением.
    Но до этого в логе было сообщение, что есть проблемы с NFS.
    Имеет смысл искать ошибки выше в логе.

  • #4441

    Ihar
    Участник

    clruncmd hostname
    У нас на старых версиях, когда забудешь размонтировать FS, которая не в ресурсе,
    уходила в рековери, ругалась примерно так-же.
    помогало.

Для ответа в этой теме необходимо авторизоваться.