Настраиваемый мониторинг экземпляра Oracle в HACMP

Главная Форумы POWER Systems AIX/Hardware Настраиваемый мониторинг экземпляра Oracle в HACMP

Просмотр 3 веток ответов
  • Автор
    Сообщения
    • #4665
      Ljus
      Участник

      Интересует поведение в контексте того,
      что вот к примеру у сервера кончается виртуальная память.
      fork – не работает.
      Те процессы что уже есть неживы-немертвы.
      По логике, через N-ое количество минут HACMP должен запустить скрипт мониторинга
      приложения, а тот должен вернуть не ноль, после чего будут предприняты, к примеру, безуспешные
      попытки рестартовать базу, а затем переезд ресурсной группы на другую ноду.
      В виду этого – вопрос к знатакам HACMP и AIX.
      Для того, чтобы код возврата скрипта мониторинга был отличен от 0-ля нужно,
      чтобы он вообще хоть как-то выполнился.
      А каков будет код возврата, при невозможности запуска скрипта в виду исчерпания памяти ?
      Даже если он и будет и отличен от нуля то как HACMP об этом в принципе узнает,
      если echo $? – тоже ведь не пашет. :blink:
      Как себя ведёт HACMP если ОС угадила в такое состояние?

      PS: Кто как с этим борится ?
      WLM ?
      /etc/security/limits ?

    • #4667
      _KIRill
      Хранитель

      По идее, как только clstrmgrES обнаружит невозможность запуска своего “дочернего” процесса (неважно, мониторинг это или что-то другое), то он должен записать в журнал информацию о том, что нехватка памяти… невозможно fork выполнить.. И о том, что он некоректно завершает свою работу. После этого должен запуститься sysdumpstart. Узел завержит работу с созданием системного дампа. Всё…. Ресурсы должны переехать.
      Как бороться? Paging увеличить – это в первую очередь. У вас он на сколько занят? lsps -s покажите.
      Виртуальную память настроить.
      #vmo -p -o minperm%=10
      #vmo -p -o maxperm%=90
      #vmo -p -o maxclient%=90
      #vmo -p -o lru_file_repage=0
      Это ОРИЕНТИРОВОЧНЫЕ значения. Всё зависит от того какие приложения у вас работают.

      ---As If, But Not---

    • #4673
      Ljus
      Участник

      Пэйджинг кончается только в моменты пиковых загрузок, а они достаточно редки.
      Так сейчас

      lsps -a
      Page Space Physical Volume Volume Group Size %Used Active Auto Type
      paging01 hdisk51 dbsrv2_pg2vg 8192MB 1 yes yes lv
      paging00 hdisk23 dbsrv2_pg1vg 8192MB 1 yes yes lv
      hd6 hdisk1 rootvg 8192MB 1 yes yes lv

      lsps -s
      Total Paging Space Percent Used
      24576MB 1%

      И вот так – львиную долю рабочего времени.

      Настраиваемый мониторинг в HACMP отсутствовует. Столкнулся с ситуацией,
      когда на сервер, даже через hmc, неговоря от ssh/telnet/rsh зайти нельзя , но clstat запускаемый на другой ноде, показывает, что
      с ресурсными группами на проблемной ноде всё в порядке и нечего не разъезжается…
      minperm%=5, а все остальные параметры теже, что Вы рекомендовали…
      Специалист порекомендовал ещё page_steal_method=1 выставить…

      PS: И всёже, наличие скрипта настраиваемого мониторинга,
      делающего хотябы:

      select * from dual;

      уберегло бы отца русской демократии от игнора HACMP проблемы
      с виртуальной памятью на ноде?

    • #4858
      _KIRill
      Хранитель

      Ljus писал(а):

      Пэйджинг кончается только в моменты пиковых загрузок, а они достаточно редки.

      🙂 SAP?
      Неважно насколько редки пиковые нагрузки. Paging должен быть в достаточном количестве.

      ---As If, But Not---

Просмотр 3 веток ответов
  • Для ответа в этой теме необходимо авторизоваться.