HACMP – реакция на ребут


Главная Форумы POWER Systems AIX/Hardware HACMP – реакция на ребут

В этой теме 8 ответов, 5 участников, последнее обновление  nitalex 8 года/лет, 1 месяц назад.

Aliexpress INT
  • Автор
    Сообщения
  • #4305
    Aliexpress INT

    Стандартный 2-х узловый кластер. Версии AIX 5.3 TL9, PawerHA 5.5. При гашении одного сервера ресурсная группа нормально переезжает на вторую ноду, а при ребуте по команде shutdown -Fr нет перехода: ждет пока опять не загрузиться первая нода и стартует там. Политика стартапа – Online On First Available Node. Параметр Settling Time для RG – 10 sec. Для HACMP 5.4 в похожей конфигурации отрабатывает нормально. Подскажите, плиз, где может быть грабля?

  • #4307

    Андрей
    Участник

    Вывод cldump или cltopinfo можно увидеть??

  • #4310

    OlegV
    Участник

    # ./cltopinfo
    Cluster Name: oradb_cluster
    Cluster Connection Authentication Mode: Standard
    Cluster Message Authentication Mode: None
    Cluster Message Encryption: None
    Use Persistent Labels for Communication: No
    There are 2 node(s) and 6 network(s) defined

    NODE p520prod:
    Network net_diskhb_01
    Network net_diskhb_02
    p520prod_hdisk4_01 /dev/hdisk4
    Network net_ether_01
    service_ip 10.1.1.25
    p520prod 10.1.1.20
    Network net_ether_02
    p520stnd_hb2 10.0.5.6
    Network net_ether_03
    p520stnd_hb1 10.0.0.6
    Network net_rs232_01
    p520prod_tty0_01 /dev/tty0

    NODE p520stnd:
    Network net_diskhb_01
    Network net_diskhb_02
    p520stnd_hdisk4_01 /dev/hdisk4
    Network net_ether_01
    service_ip 10.1.1.25
    p520stnd 10.1.1.21
    Network net_ether_02
    p520prod_hb2 10.0.5.5
    Network net_ether_03
    p520prod_hb1 10.0.0.5
    Network net_rs232_01
    p520stnd_tty0_01 /dev/tty0

    Resource Group oradb_group
    Startup Policy Online On First Available Node
    Fallover Policy Fallover To Next Priority Node In The List
    Fallback Policy Never Fallback
    Participating Nodes p520prod p520stnd
    Service IP Label service_ip

    Total Heartbeats Missed: 0
    Cluster Topology Start Time: 07/10/2009 14:48:21

    PS Эта та же проблема и из одного и того же места

  • #4312

    Дмитрий
    Участник

    При shutdown происходит останов в режиме “graceful WITHOUT takeover” (в старой терминологии, в новой не помню).
    Это означает, что всё так и должно быть – без перехода ресурсных групп на другой узел.

  • #4335

    nitalex
    Участник

    А если Вы все же хотите, чтобы при shutdown -Fr происходил, то достаточно просто
    слегка подредактировать файлик /usr/es/sbin/cluster/etc/rc.shutdown,
    закомментировав указанные ниже строки

    ###############################################################################
    # A “fast shutdown” (“-F”) and/or reboot (“-r”) is specified. We run a
    # forced down so that the local node runs a force down and the remote
    # nodes run a graceful (which will allow the remote nodes to cleanly
    # unmount the NFS or take appropriate action on the XD resource groups.)
    # The resource groups will be in the OFFLINE state. When the node restarts
    # the resource groups will be started back from the offline state.
    ###############################################################################
    #elif [[ $fast == true ]] ; then
    # clstop -f -y -s -N -S

    #elif [[ $reboot == true ]] ; then
    # clstop -f -y -s -N -S

  • #4353

    Дмитрий
    Участник

    Ага. Классно. Только кто тогда будет кластерные сервисы останавливать?

    Надо вписать строчки clstop в режиме takeover.
    Кстати, есть ещё файл /etc/rc.shutdown, можно туда вписать.

  • #4358

    nitalex
    Участник

    Если внимательно посмотреть на файл /usr/es/sbin/cluster/etc/rc.shutdown,
    то можно заметить, что при комментировании указанных выше строк отработает
    конструкция
    else
    clstop -gr -y -s -N -S
    fi

    ###############################################################################
    # We’re doing a shutdown because of an EPOW condition
    ###############################################################################
    if [[ $EPOW_SHUTDOWN == true ]] ; then
    ###########################################################################
    # We attempt to do a ‘graceful with takeover’ shutdown, so that the
    # resource groups get taken over when this node fails. Note that this
    # is in no sense guaranteed to complete before the node dies, but at
    # least the other cluster nodes should perform takeover.
    ###########################################################################
    clstop -gr -y -s -N -S

    ###############################################################################
    # A “fast shutdown” (“-F”) and/or reboot (“-r”) is specified. We run a
    # forced down so that the local node runs a force down and the remote
    # nodes run a graceful (which will allow the remote nodes to cleanly
    # unmount the NFS or take appropriate action on the XD resource groups.)
    # The resource groups will be in the OFFLINE state. When the node restarts
    # the resource groups will be started back from the offline state.
    ###############################################################################
    #elif [[ $fast == true ]] ; then
    # clstop -f -y -s -N -S

    #elif [[ $reboot == true ]] ; then
    # clstop -f -y -s -N -S

    ###############################################################################
    # Every other shutdown is mapped to a graceful with takeover
    ###############################################################################
    else
    clstop -gr -y -s -N -S
    fi

  • #4367

    Дмитрий
    Участник

    сорри.
    Я обычно /etc/rc.shutdown делаю.

  • #4369

    nitalex
    Участник

    Как обычно, linux’ах/unix’ах каждый идет своим путем 🙂
    Хотя с точки зрения идеологии – Ваш вариант с /etc/rc.shutdown
    конечно более правильный, чем прямая корректировка сист. скриптов

Для ответа в этой теме необходимо авторизоваться.