Настраиваемый мониторинг экземпляра Oracle в HACMP


Главная Форумы POWER Systems AIX/Hardware Настраиваемый мониторинг экземпляра Oracle в HACMP

В этой теме 3 ответа, 2 участника, последнее обновление  _KIRill 8 года/лет, 3 мес. назад.

  • Автор
    Сообщения
  • #4665

    Ljus
    Участник

    Интересует поведение в контексте того,
    что вот к примеру у сервера кончается виртуальная память.
    fork — не работает.
    Те процессы что уже есть неживы-немертвы.
    По логике, через N-ое количество минут HACMP должен запустить скрипт мониторинга
    приложения, а тот должен вернуть не ноль, после чего будут предприняты, к примеру, безуспешные
    попытки рестартовать базу, а затем переезд ресурсной группы на другую ноду.
    В виду этого — вопрос к знатакам HACMP и AIX.
    Для того, чтобы код возврата скрипта мониторинга был отличен от 0-ля нужно,
    чтобы он вообще хоть как-то выполнился.
    А каков будет код возврата, при невозможности запуска скрипта в виду исчерпания памяти ?
    Даже если он и будет и отличен от нуля то как HACMP об этом в принципе узнает,
    если echo $? — тоже ведь не пашет. :blink:
    Как себя ведёт HACMP если ОС угадила в такое состояние?

    PS: Кто как с этим борится ?
    WLM ?
    /etc/security/limits ?

  • #4667

    _KIRill
    Хранитель

    По идее, как только clstrmgrES обнаружит невозможность запуска своего «дочернего» процесса (неважно, мониторинг это или что-то другое), то он должен записать в журнал информацию о том, что нехватка памяти… невозможно fork выполнить.. И о том, что он некоректно завершает свою работу. После этого должен запуститься sysdumpstart. Узел завержит работу с созданием системного дампа. Всё…. Ресурсы должны переехать.
    Как бороться? Paging увеличить — это в первую очередь. У вас он на сколько занят? lsps -s покажите.
    Виртуальную память настроить.
    #vmo -p -o minperm%=10
    #vmo -p -o maxperm%=90
    #vmo -p -o maxclient%=90
    #vmo -p -o lru_file_repage=0
    Это ОРИЕНТИРОВОЧНЫЕ значения. Всё зависит от того какие приложения у вас работают.

    ---As If, But Not---

  • #4673

    Ljus
    Участник

    Пэйджинг кончается только в моменты пиковых загрузок, а они достаточно редки.
    Так сейчас

    lsps -a
    Page Space Physical Volume Volume Group Size %Used Active Auto Type
    paging01 hdisk51 dbsrv2_pg2vg 8192MB 1 yes yes lv
    paging00 hdisk23 dbsrv2_pg1vg 8192MB 1 yes yes lv
    hd6 hdisk1 rootvg 8192MB 1 yes yes lv

    lsps -s
    Total Paging Space Percent Used
    24576MB 1%

    И вот так — львиную долю рабочего времени.

    Настраиваемый мониторинг в HACMP отсутствовует. Столкнулся с ситуацией,
    когда на сервер, даже через hmc, неговоря от ssh/telnet/rsh зайти нельзя , но clstat запускаемый на другой ноде, показывает, что
    с ресурсными группами на проблемной ноде всё в порядке и нечего не разъезжается…
    minperm%=5, а все остальные параметры теже, что Вы рекомендовали…
    Специалист порекомендовал ещё page_steal_method=1 выставить…

    PS: И всёже, наличие скрипта настраиваемого мониторинга,
    делающего хотябы:

    select * from dual;

    уберегло бы отца русской демократии от игнора HACMP проблемы
    с виртуальной памятью на ноде?

  • #4858

    _KIRill
    Хранитель

    Ljus писал(а):

    Пэйджинг кончается только в моменты пиковых загрузок, а они достаточно редки.

    🙂 SAP?
    Неважно насколько редки пиковые нагрузки. Paging должен быть в достаточном количестве.

    ---As If, But Not---

Для ответа в этой теме необходимо авторизоваться.