Мониторинг производительности всего сервера с использованием не

Главная Форумы POWER Systems Виртуализация POWER Мониторинг производительности всего сервера с использованием не

Просмотр 14 веток ответов
  • Автор
    Сообщения
    • #13065
      Alexander
      Участник

      Подскажите, как и какими средствами можно мониторить загрузку всех процессоров на железке, если на ней несколько разделов и используется Shared CPU pool ? Такой же вопрос относительно памяти, как узнать сколько реально отъедается памяти всеми разделами из общего пула физической памяти?

    • #13066
      Oldnick
      Участник

      Подскажите, как и какими средствами можно мониторить загрузку всех процессоров на железке, если на ней несколько разделов и используется Shared CPU pool ? Такой же вопрос относительно памяти, как узнать сколько реально отъедается памяти всеми разделами из общего пула физической памяти?

      мониторить можно только ресурсы отдельно взятого раздела средствами OS раздела. Память для раздела выделяется столько сколько указано в параметре раздела (предпочитаемая память). Использование памяти на разделе мониторится средствами операционки данного раздела. На сколько мне известно нельзя мониторить ресурсы которыми управляет Супервизор. Эта часть закрыта от пользователя.

    • #13075
      andrewk
      Участник

      у Вас AIX? разрешить в /etc/inetd.conf xmquery и topas -C

    • #13077
      Sever
      Участник

      Пишем сами.
      Каждый раздел собирает нужную информацию и складывает ее у себя в конкретном месте.
      “главный” раздел опрашивает все разделы и забирает эту информацию, он же и является точкой отображения текущего состояния.

    • #13082
      Alexander
      Участник

      Это какое то некрасивое решение. Тем более, опросив все разделы, получится некая цифра, а вот какой это процент в реальности от общего пула процессоров сложно понять будет.

    • #13083
      Sever
      Участник

      Такой механизм позволяет реально мониторить состояние не только партиций одного сервера, а всех партиций всех систем. Обобщенные цифры не нужны. Нужно отображение информации о параметрах работы всех систем по отдельности, но в одном месте. Причем, это нетолько информация о загрузке процессора, но и любая другая информация о критических параметрах систем. Это позволяет мгновенно увидеть возникшую проблему и принять соответствующие действия для ее устранения.

    • #13084
      Sever
      Участник

      Касательно шаренного пула процессорв…

      Это IBMовский миф, что процессоры шаренного пула используются всеми партициями в конкурентном режиме. В реальности, при достаточном числе активных ядер, гипервизор делит общий пул процессоров обычно так, что бы партиции работали на невидимых подпулах, т.е. система разводит нагрузку работы партиций по разным ядрам. Размер этих подпулов соответствует стартовым параметрам партиций в части процессорной мощности. Партиция может в пиках задействовать “чужие” ядра, но при любом удобном случае мгновенно возвращает активность на “свои родные”. В соответствии с подпулами формируется и разбивка выделения оперативной памяти. Система выделяет ту память партиции, которая находится на той же ноде, что и подпул процессоров. Все соответствия между подпулами процессоров и областями памяти оптимизированы на момент полного рестарта сервера. Все дальнейшие DLPAR процессоров и памяти выводят систему из этого равновесного состояния.

      Это я к тому, что загрузка шаренного пула процессоров – фиктивное понятие.

    • #13112
      Дмитрий
      Участник

      Подскажите, как и какими средствами можно мониторить загрузку всех процессоров на железке, если на ней несколько разделов и используется Shared CPU pool ?

      Есть такое! Только не помню, что и как 😉
      1) LPARMon.
      Раньше был здесь: http://www.alphaworks.ibm.com/tech/lparmon
      Сейчас его там нет. Возможно, перенесли (?)

      2) Freeware-тулза к HMC с Web-интерфейсом. Реально работает, но только с общим Shared Pool. Про Dedicated CPU показывает 0, загрузка памяти – просто показывает, сколько выдано LPARам.
      Точное название посмотрю – напишу.

      3) Свойства LPAR “allow performance information collection” плюс ключики lparstat – сможете увидеть загружку всего пула.

      4) Самописные мега-скрипты, работающие на каждом LPAR, с консолидацией данных в одном месте и оценкой загрузки по придуманным Вами алгоритмам. Наиболее замороченный вариант, но кастомизация полная.

    • #13113
      Alexander
      Участник

      По п.2 я нашел lpar2rrd tool. Это оно?

    • #13115
      Дмитрий
      Участник

      Бинго!
      Да, это оно. 🙂

    • #13119
      pre
      Участник

      вообще-то пункт 2 это lslparutil
      [spoiler][code]hscroot@hmc ]:-> lslparutil
      Usage: lslparutil -r hmc | lpar | pool | procpool | mempool | sys | all | config
      [-m ]
      [-d ]
      [-h ]
      [–minutes ]
      [–startyear ]
      [–startmonth ]
      [–startday ]
      [–starthour ]
      [–startminute ]
      [–endyear ]
      [–endmonth ]
      [–endday ]
      [–endhour ]
      [–endminute ]
      [-n ]
      [-s ]
      [–filter “”]
      [-F []]
      [–header]
      [–help]

      Lists utilization data collected for a managed system.

      -r – the type of system resources for which events
      are to be listed:
      hmc – management console
      lpar – partition
      pool – physical processor pool
      procpool – shared processor pool
      mempool – shared memory pool
      sys – managed system
      all – management console, partition,
      physical processor pool, shared
      processor pool, shared memory pool,
      and managed system
      config – configuration settings
      -m – the managed system’s name
      -d – list events for this number of previous days
      -h – list events for this number of previous hours
      –minutes – list events for this number of previous
      minutes
      –startyear – list events starting with this year
      –startmonth – list events starting with this month
      (January = 1, December = 12)
      –startday – list events starting with this day
      –starthour – list events starting with this hour
      (midnight = 0, 11pm = 23)
      –startminute – list events starting with this minute
      –endyear – list events ending with this year
      –endmonth – list events ending with this month
      (January = 1, December = 12)
      –endday – list events ending with this day
      –endhour – list events ending with this hour
      (midnight = 0, 11pm = 23)
      –endminute – list events ending with this minute
      -n – the maximum number of events to be listed
      -s – the sample events to be listed:
      h – hourly
      d – daily
      m – monthly
      s – snapshot
      –filter “” – filters the events to be listed.
      The syntax is:
      “filter_name1=value,filter_name2=value,…”
      or
      “”filter_name1=value1,value2,…”,…”
      Valid filter names are:
      event_types, lpar_ids, lpar_names, pools,
      pool_names
      -F [] – delimiter separated list of the names of the
      attributes to be listed for each event.
      If no attribute names are specified, then all
      attributes will be listed.
      –header – prints a header of attribute names when -F is
      also specified
      –help – prints this help[/code][/spoiler]со всеми вытекающими ограничениями

      ну а пункт 4 без самописных скриптов идёт как опция к IBM i

    • #13177
      Дмитрий
      Участник

      по п.2: lpar2rrd – это графическая приблуда.

      Есть такие люди, которым подай “красивую картинку”, а циферки разные – это для технарей дремучих 😉

    • #15646
      Yurich
      Участник

      Настроил мониторинг lpar2rrd.
      Полет 2 суток – нормальный. Оказалось очень удобно.
      Ну и статейка попалась.

    • #15647
      Sever
      Участник

      Забавно иметь такой инструмент, видеть полную картину ресурсов – их загруженность максимум на 10-20 процентов и упорно с каждым годом наращивать мощности систем под САП до неоправданных размеров…
      Видать торговля идет очень хорошо…. Системы проапгрейдили уже до 795ых

    • #15648
      uxTuaHgp
      Участник

      Ну это у кого как.
      На то он и шаред пул процессоров ведь.

      А от железки ведь требуется не средняя загруженность, а способность справляться с пиковыми (сезонными/предпраздничными/вконцемесячными) нагрузками.

      На одной из прежних работ за 2 недели до НГ происходил скачок активности клиентов и соответственно скачок потребления ресурсов такой, что огого раз в 15 от обычного.
      И что в такой ситуации делать?
      Предприятие закрывать?
      Тут бы как раз CuOD помог с временной активацией ресурсов, но с СХД опять же что делать?
      Приходится держать мощности прозапас.

Просмотр 14 веток ответов
  • Для ответа в этой теме необходимо авторизоваться.