Of NUMA on POWER7 in IBM i

Главная Форумы IBM i (OS/400) Of NUMA on POWER7 in IBM i

Просмотр 17 веток ответов
  • Автор
    Сообщения
    • #6892
      Sever
      Участник

      Of NUMA on POWER7 in IBM i

      A lot has been written on multi-core computing, when all it really is is just a more dense
      packaging of more processor cores onto fewer chips. For example, IBM’s PowerPC POWER7
      chip supports eight cores per chip as compared to POWER6’s two. That is a lot of compute
      power on a single chip. What this paper is all about is what happens when the compute capacity
      of such a single chip POWER7 is not enough, requiring a larger system to be built from multiple
      of such chips. Such a system takes on the characteristics of a computer architecture called
      NUMA (Non-Uniform Memory Access), a concept that you can use to further drive up the
      performance capacity of such a system.

      Полный PDF на эту тему

      What’s This Multi-Core Computing Really?

      As a conclusion, with POWER7’s multi-core chips, more compute capacity is being provided via
      more processor cores, as well as advanced processor core and cache design. But that does not
      mean that the world of computing has changed today in some revolutionary way. Yes,
      POWER7 processor frequencies are less than that provided by POWER6 processors, but that it
      only one part of what provides for both capacity and single-threaded performance. Performance
      and the potential for very considerable improvements in system capacity is being provided by
      POWER7, but largely only if you really want it
      .

    • #6893
      Oldnick
      Участник

      кстати, в конфигураторе уже появились Power7 машины. можно конфигурить…

    • #6894
      Sever
      Участник

      А попробуй – всем будет интересно…

      Нужна спецификация заказа на
      780я турбированая, с максимальным объемом ОП, из неё должно выходить 8 петель 12x, в каждой петле 2 5796, в каждом 5796 по два 572F, на каждом 572F на двух портах должно висеть по одному EXP12S. Экспы забиты под завязку дисками 140 гигов. Все ядра лицензируются под i, P50, энтерпрайз. На стойках не экономить – минимум 8 штук.
      Скока “это будет в граммах” ?

    • #6895
      Oldnick
      Участник

      в конфигураторе нет понятия “петля”, тем не менее попробуем. 🙂

    • #6896
      Oldnick
      Участник

      скока ядер, процов?
      скока дисков?

    • #6897
      Sever
      Участник

      oldnick1971 писал(а):

      скока ядер, процов?
      скока дисков?

      64 ядра
      дисков 64 раза по 12 – 140гиговые SAS
      5796 – 16 штук
      572F – 32
      EXP12S – 64

    • #6898
      Oldnick
      Участник

      по поводу памяти
      доступна следующая память: 0/32, 0/64 и 0/128GB слоты. всего 64 слота. Если поставить 64 слота 0/128GB получим 2TB ОЗУ, если 64 слота 0/64GB, получим 1TB ОЗУ.
      однако, слоты 0/128GB будут доступны только в ноябре 2010.

      какие стойки, 2метровые?

    • #6899
      Sever
      Участник

      ОЗУ – 2Тб
      Стойки 2метра,
      в каждой слой 5796 – 4U + 8экспов по 2U = 20U
      остальное – резерв

      Если в большую стойку влезает 40U, то их число можно уполовинить.

    • #6900
      Oldnick
      Участник

      42 юнита влезает.
      если забить всем этим железом, остается 2 свободных стойки из 8.
      конфигурации делал очень тупо, просто чтобы оценить масштаб и цену.
      очень черновая конфига получилась на 9882 килограмм.
      без софта, без тюнинга железа, без конфигураций реков.

    • #6901
      Sever
      Участник

      Конфигуратор врет безбожно.
      Если в стойке 42, то 4 раза по 40U это четыре стойки.

    • #6902
      Oldnick
      Участник

      начиная с Power конфигуратор вообще стойки не конфигурит автоматом. надо вручную.

    • #6903
      Oldnick
      Участник

      по идее надо еще софт включить. он не дешевый. просто тогда цена будет более менее точной.
      с точностью до сотен килограмм

      окно сообщений было такое:

    • #6904
      Sever
      Участник

      Посмотрел – конфигуратор тупо напихал три стойки экспами, а в 4ю к двум экспам добавил 6 слоев 5796. Посчитал, что это предел или по весу или по электричеству и два оставшихся слоя отправил в пятую. Никакой балансировки. Сам сервер в шестой.
      Если правильно все собрать, то получится красивый ряд из 5ти стоек. Сервер и по две дисковые стойки по обе стороны от него.
      Спасибо!

    • #6905
      Oldnick
      Участник

      конфигуратор почти ничего не думает. просто пихает и все.
      там можно вручную распихать, на на это надо кучу времени и геморрой. толку в результате будет мало. суть не в этом, главное чтобы конфига была валидная. на заводе сами распихают, как им покажется правильным 🙂
      можно попробовать убрать 2-3 стойки, посмотреть, что получится.

    • #6906
      Sever
      Участник

      Ну до завода далеко 😉
      Зато ясен порядок цены в сумме и цены на отдельные элементы.
      Есть неясность с ядрами – для турбированного режима на 64 ядрах должно быть 64 активных ядра и 64 в нап моде. То бишь должно быть 128 ядер и только половина из них активна.

      4982 3.86 GHz / 4.14 GHz TurboCore Proc Card, 4
      0/16 Core POWER7, 16 DDR3 Memory Slots

      Этого добра IMHO должно быть больше.
      Какой максимум конфигуратор может поставить для 780ой по этой позиции?

    • #6907
      Oldnick
      Участник

      этой позиции максимум 4 штуки может быть.
      есть там еще 9982 код.

      я сделал все по максимум в части процов. и лицензий для OS.

    • #6908
      Sever
      Участник

      из первой доки в этом посте:

      So, eight physical cores and cache per chip are available, but if only four were needed, these four
      could be allowed to run at a slightly higher frequency and to perceive some additional cache.
      For these four cores, the higher frequency and cache often translate into better performance over
      what they are capable of without it. This is not to say that the performance capacity of these
      faster four cores is the same as what is available from an 8-core chip. But, instead, because you
      are only using four per chip, the super-nominal frequency and additional cache is available to
      provide better performance than what is available with a 4-core chip alone.

      То бишь для 780ой машины с 64ю ядрами нужно “занапить” 32 ядра для перехода в режим TurboCore. Все бы ничего, но динамически это сделать нельзя – нужно машину перегрузить. Получается, что турбокор для этой машины это “морковка для осла”. Этот режим будет эффективен только для 32 ядерных конфигураций.

    • #6909
      Oldnick
      Участник

      Processor cores: Up to 64, POWER7 @ 3.8 GHz or Up to 32 POWER7 @ 4.1 GHz

      то есть, турборежим актуален только для 32 cores POWER7 @ 4.1 GHz ?

Просмотр 17 веток ответов
  • Для ответа в этой теме необходимо авторизоваться.