Карта ресурсов партиции?


Главная Форумы POWER Systems Виртуализация POWER Карта ресурсов партиции?

В этой теме 19 ответов, 5 участников, последнее обновление  andrewk 5 года/лет, 6 мес. назад.

  • Автор
    Сообщения
  • #14778

    Sever
    Участник

    Подскажите, как в AIX определить/посмотреть на каких нодах и сколько ресурсов памяти и процессоров выделено партиции в текущий момент гипервизором?

  • #14779

    Andriy
    Участник

    из AIX — lparstat’ом

  • #14780

    Sever
    Участник

    из AIX — lparstat’ом

    не вижу ничего похожего в lparstat, можно примеры?

  • #14781

    Andriy
    Участник

    а что вы там видите?

    [code]
    System configuration: type=Shared mode=Uncapped smt=4 lcpu=8 mem=8192MB psize=8 ent=1.50

    %user %sys %wait %idle physc %entc lbusy app vcsw phint
    —— —— —— —— —— —— —— — —— ——
    46.4 1.5 0.1 52.1 1.08 71.7 13.7 5.77 689 12
    50.8 2.0 0.3 46.8 1.16 77.2 16.5 5.67 1169 16

    [/code]
    вот мы кушаем ~71-77 процентов от entitled capacity CPU
    ключик -m — дает статистику по памяти
    в общем — man lparstat
    или вам что-то другое надо и я не так понял?

  • #14782

    Sever
    Участник

    Нужны абсолютные номера логических процессоров, на которых «бегает» партиция + номер ноды с которой/которых выделено ваши восемь гигов.

  • #14783

    Sergey S
    Участник

    Попробуйте из под AIX topas -LC

  • #14784

    andrewk
    Участник
  • #14785

    Sever
    Участник

    Похоже это то, что надо. Спасибо за ссылку.
    На машинах смесь из IBM I и Aix. По своей ОС понимание полное в части ресурсов, по AIX понимания используемых ресурсов нет.

  • #14787

    Sever
    Участник

    К сожалению, lssrad не дает информации по номерам нод и номерам процессоров в абсолютных значениях сервера целиком. На выходе только информация относительно домашней ноды и наличие явных «неаффинити» ресурсов при их наличии.

    Пример с двух партиций на одной системе:

    [code]# lssrad -av
    REF1 SRAD MEM CPU
    0
    0 19599.31 0-3[/code]

    [code]# lssrad -av
    REF1 SRAD MEM CPU
    0
    0 15615.31 0-3
    1
    1 3984.00
    2 11952.00[/code]

    Понять на каких нодах выделена память или какие хардверные номера процессоров невозможно.

  • #14790

    andrewk
    Участник

    физически номера процессоров, насколько я понимаю, вообще никак не увидеть — они не передаются в LPAR гипервизором.
    Я разговаривал с одним из разработчиков в прошлом году — специалистом по подобным проблемам производительности на Hi-End’е, обсуждали в том числе и SRAD’ы, и размещение LPAR’ов на нодах, я попросил, чтобы сделали возможность «залочить» LPAR на одной из нод — но не знаю, будут ли они этим заниматься. Сейчас получается, что LPAR, стартовавший первым, размещается по возможности в пределах одной ноды. Второй LPAR, если ему не хватает ресурсов уже в первой ноде, размещается на второй ноде. Если хватает — то он будет размещен на остатке в первой ноде. Если у меня достаточно динамическая инфраструктура и LPAR регулярно стартуют-останавливаются или переезжают с сервера на сервер, то рано или поздно какой-нибудь супер-пупер-важный LPAR оказывается разбросанным между нодами.

  • #14791

    Sever
    Участник

    С первым тезисом не соглашусь. Номера процессоров передаются, просто надо найти эти заветные места. В IBM i я такое место нашел. Так же можно посмотреть карту ресурсов в хардверной терминологии, пример:

    Две партиции работающие на 3 и 5 виртуальных процессорах соответственно (12lp и 20lp в терминах AIX для SMT4). Обеими задействовано 2 ноды — 4я и 5я. Объем памяти представлен на нодах и отражается в 4кбайтных страницах:

    [code]Node statistics from node group 00, hardware group ID 01

    Node # ! 0 ! 1 !
    ==========================================
    Hardware node ID ! 4 ! 5 !
    # of Logical procs ! 12 ! 0 !
    # currently folded ! 0 ! 0 !
    # committed folded ! 0 ! 0 !
    # main store pages ! 0285F0A2 ! 00121A30 !
    Target weight ! 1000 ! 0000 !
    Transition weight ! 1000 ! 0000 !
    Current weight ! 1000 ! 0000 !

    Node statistics from node group 00, hardware group ID 01

    Node # ! 0 ! 1 !
    ==========================================
    Hardware node ID ! 4 ! 5 !
    # of Logical procs ! 12 ! 8 !
    # currently folded ! 0 ! 0 !
    # committed folded ! 0 ! 0 !
    # main store pages ! 009C7BD5 ! 009CA68C !
    Target weight ! 099A ! 0666 !
    Transition weight ! 099A ! 0666 !
    Current weight ! 0C80 ! 0380 !
    [/code]

    Рабочие ядра у обеих партиций постоянно меняются и выдаются в диапазоне [13 14 15 16 17 18] (определяется через API). Два последних ядра у второй партиции всегда 19 и 20. Чипы — шестиядерные.

    Аналогичные средства должны быть и в AIX, видно далеко закопаны.

    С остальным соглашусь.

  • #14792

    andrewk
    Участник

    IBM pHype — самая страшная тайна IBM’а 🙂 Я покопался в документации на AIX kernel services, поискал недокументированные функции в хидерах, почитал libperfstat, и посмотрел, что может сказать kdb по поводу процессоров — никакой новой информации я там, честно говоря, не увидел. Возможно, что и существует какой-нибудь hcall, говорящий, на каких физических процессорах крутится сейчас LPAR, но он в таком случае в AIX судя по всему нигде не используется и никак не документирован. Мне его найти не удалось.

  • #14793

    Oldnick
    Участник

    выходит, что в самой закрытой операционке в мире есть эта информация и ее можно посмотреть:)
    парадокс…
    я имею ввиду i5/OS, конечно.

  • #14794

    andrewk
    Участник

    рано радуетесь. ночь работе не помеха 🙂 Развлекаясь вчера вечером с /dev/nvram, нашел там следующие поля в IPLCB:

    union { /* */
    uint p_id; /* unique processor identifier */
    struct { /* */
    ushort p_nodeid; /* Physical NUMA Node id */
    ushort p_cpuid; /* Physical CPU id */
    } s0; /* */
    } u0; /* */

    но я не уверен, хранится ли там нужная информация — мне вчера не удалось достать эту структуру из /dev/nvram. ioctl() отрабатывает, но IPLCB возвращается пустой 🙁

  • #14795

    andrewk
    Участник

    содержимое структуры можно посмотреть проще, без всякого кода на Си, но у меня там все равно одни нули в этих полях 🙁

    echo iplcb | kdb

  • #14796

    andrewk
    Участник

    Информация из OpenFirmware в выводе той же команды:

    ================================================================
    /cpus
    ibm,phandle
    FFFFFFF8 […………….]
    name
    63707573 00 [cpus…………]
    #address-cells
    00000001 […………….]
    #size-cells
    00000000 […………….]
    ibm,drc-indexes
    00000002 10000000 10000004 […………….]
    ibm,drc-types
    00000002 43505500 43505500 [….CPU.CPU…..]
    ibm,drc-names
    00000002 43505520 31004350 55203500 [….CPU 1.CPU 5.]
    ibm,drc-power-domains
    00000002 FFFFFFFF FFFFFFFF […………….]
    smp-enabled
    IBM,AIX-phandle
    020AF6F0 […………….]

  • #14797

    Sever
    Участник

    ibm,drc-indexes
    00000002 10000000 10000004

    Выделенное может быть номерами первых в четверках LP для SMT4 в терминологии гипервизора. У него всегда нумерация идет с нуля.

    ibm,drc-names
    00000002 43505520 31004350 55203500 [….CPU 1.CPU 5.]

    Это может быть текст на уровне ОС, нумерация в ОС на единицу больше.

    Смущает, что номера маленькие. Что это за машина и сколько на ней реально доступных процессоров? Больше смахивает на нехардверные номера…

  • #14798

    andrewk
    Участник

    это был 1й стартовавший VIOS на 9117-MMB (32w P7). Отсюда могут быть и такие маленькие номера. Машина пока пустая, поэтому ничего другого оттуда пока достать тоже не смогу 🙁
    номера, действительно, могут быть номерами логических процессоров — там 2 виртуальных процессора, SMT4 включен.

  • #14799

    Sever
    Участник

    Можно добавить в VIOS один виртуальный процессор и повторить вызов.

  • #14801

    andrewk
    Участник

    увы, какие-то еще странные проблемы с RMC 🙁 DLPAR не работает, надо разбираться.
    Но! После стопа и старта партиции с теми же ресурсами (0.2 CPU, 2 vCPU) картинка изменилась:

    /cpus
    ibm,phandle
    FFFFFFF8 […………….]
    name
    63707573 00 [cpus…………]
    #address-cells
    00000001 […………….]
    #size-cells
    00000000 […………….]
    ibm,drc-indexes
    00000008 10000000 10000004 10000008 […………….]
    1000000C 10000010 10000014 10000018 […………….]
    1000001C […………….]
    ibm,drc-types
    00000008 43505500 43505500 43505500 [….CPU.CPU.CPU.]
    43505500 43505500 43505500 43505500 [CPU.CPU.CPU.CPU.]
    43505500 [CPU………….]
    ibm,drc-names
    00000008 43505520 31004350 55203500 [….CPU 1.CPU 5.]
    43505520 39004350 55203133 00435055 [CPU 9.CPU 13.CPU]
    20313700 43505520 32310043 50552032 [ 17.CPU 21.CPU 2]
    35004350 55203239 00 [5.CPU 29……..]
    ibm,drc-power-domains
    00000008 FFFFFFFF FFFFFFFF FFFFFFFF […………….]
    FFFFFFFF FFFFFFFF FFFFFFFF FFFFFFFF […………….]
    FFFFFFFF […………….]
    smp-enabled
    IBM,AIX-phandle
    020AF600 […………….]

Для ответа в этой теме необходимо авторизоваться.