Очередной “убийца” Power 10


Неделю-две назад (6 июня 2016г.) Intel выпустил линейку процессоров Broadwell-EX. EX – это для старших моделей серверов (4-8 сокетов). В документации эти процы имеют нумерацию типа E7-8800/4800 v4 (где вместо ноликов конкретные цифры модификаций процессора).

Как водится, вышла куча маркетинговых лозунгов про то, что он в разы лучше, чем … чем все остальное вместе взятое и POWER8 в особенности.
—Всё ниженаписанное – это личное мнение автора 🙂 —

Давайте посмотрим на некоторые из этих лозунгов, а заодно и на то, что на самом деле представляет собой новейшее изделие Intel. Смотреть будем на топовый вариант проца, его зовут E7-8890 v4, а сравнивать будем с предыдущим топовым E7-8890 v3. Вот что показывает сравнивалка на официальном сайте Интела: (See attached file: v4 vs v3.pdf).

Внимательно смотрим что изменилось.

  • Техпроцесс – было 22нм, стало 14нм. Такое изменение позволило бы разместить на том же кристалле примерно в 2 раза больше транзисторов (часть площади занята проводниками, поэтому не в 2.5, а только в 2), и можно было бы ожидать удвоения количества ядер, но этого не произошло.
  • Ядра – было 18, стало 24. Последние лет пять Интел идет именно по пути увеличения количества ядер не особо отвлекаясь на то, чтобы сделать их получше. Отметим, что ядер стало на 33% больше.
  • Кэш. Кажется, что он стал больше (было 45МБ, стало 60МБ), однако на самом деле объем кэша на ядро как был так и остался 2.5МБ. Т.е. ядра, похоже, вообще не трогали. Что “не очень-то”. С другой стороны кэша на ядро не стало меньше (а бывало и так), что позволяет надеяться, что ядро не стало слабее. Посмотрим…
  • Память. Стало 3ТБ на сокет. Это много. Хотя сама память осталась медленной (по сравнению с младшими процами семейства v4 – те поддерживают DDR4 2400) и 4-го кэша по прежнему нет (и непонятно будет ли он вообще когда-нибудь).
  • Частота стала ниже, что очевидно, поскольку дальше греться процу уже некуда. Ядер-то стало больше, а термопакет не увеличился, вот и приходится снижать частоту. Немного помогает новый техпроцесс (у 14нм утечки немного меньше, чем у 22нм), но не спасает.
    Кстати, этот фактор – термопакет – очень часто упускают из вида. Теоретически Интел мог бы поднять TDP ватт до 200 (кто не знает – у POWER-а сейчас 190-260Вт, у Интела – 165Вт), но это означало бы, что ВСЕ производители серверов на базе х86 будут вынуждены менять конструктив (чтобы справиться с возросшими требованиями по охлаждению), а они этого не хотят. И по сути запрещают Интелу поднимать термопакет. Это я к тому, что у Интела сильно связаны руки его же экосистемой. А у нас – нет.

Посмотрим, что не изменилось.

  • Шины QPI (и количество и скорость). Т.е. можно ожидать, что все проблемы масштабирования сохранились.
  • Пропускная полоса памяти. Т.е. на каждое ядро теперь приходится меньше пропускной способности памяти и мы можем ожидать небольшого снижения производительности ядра.
  • Ввод-вывод. Ни скорость, ни количество линий, ни кратность PCI. Ничего. Т.е. все рассуждения про “новые возможности” в области аналитики и биг-даты не имеют под собой почвы. Вообще ни какой.
  • Цена. Она точно такая же как и была. Посмотрите на нее, очень многие не знают сколько стоит Интел. Все “знают”, что он “очень дешевый и очень производительный”. При этом при сравнении характеристик (например, с нашим POWER8) всегда берут цифры от топовых процов, а цену от самого дешевого азиата (в котором совсем другие процы). Особенно типично обсуждение в сегменте младших (2-х сокетных) моделей серверов, где будет взят лозунг типа “производительность как у POWER-а или даже лучше, а стоит всего десятку! (тысяч долларов)”. Интел говорит (официально, на своем сайте), что один процессор стоит более семи тысяч долларов. Один. Без корпуса, без памяти, без адаптеров, без мазерборда, без всего остального. И даже без гарантии. И без прибыли производителя сервера и продавца…

А теперь давайте посмотрим на обещалки Интела касательно новых процессоров. Вот они: (See attached file: xeon-e7-8800-4800-v4-product-families-brief.pdf)

Понятно, что показывать они будут страницу номер 2. А мы не поленимся почитать самое интересное – то, что в самом конце самыми мелкими буковками. Итак:

  • Java. Почему-то нам обещают всего +19%, а не как минимум +33% (ведь ядер-то стало на треть больше!) как можно было ожидать. Т.е. ядро стало слабее говорит Интел. Что ж, придется ему поверить…
  • SPECint_rate_base. И здесь +26% вместо хотя бы +33%. Смотрим мелкие буковки: в старом сервере был 1ТБ памяти, а в новом 512ГБ. Очень грамотный ход. Ведь да-а-а-алеко не все знают, что чем больше памяти в Интел-сервере, тем медленней она работает. Если бы сравнивали по честному, то не получили даже +26%. В любом случае Интел официально сообщает, что ядро v4 слабее ядра v3.
  • Warehouse OLTP и Brokerage OLTP. Здесь целых +27% (хотя и по-прежнему не +33%, чтобы остаться хотя бы на том же уровне, что и предыдущее поколение). Мы даже не будем читать, что написано мелкими буквами (а написано, что для v4 использовалось в 4 раза больше памяти)
  • MP LINPACK. Это самое интересное, поскольку нам обещают аж 39% прироста. Т.е. на данной задаче ядро v4 выглядит лучше, чем ядро v3. Но в том-то и дело, что только выглядит. Кто-нибудь знает что это такое? Что это за бенчмарка? Это решение системы линейных уравнений, то, на чем построено очень много вычислительных задач. Но ведь никто не использует топовые процессоры для инженерных и научных расчетов! Да, не использует. Зато здесь можно показать впечатляющий результат. А теперь внимательно почитаем написанное мелкими буквами в сноске. И что же мы видим? А видим мы, что код бенчмарки был специально оптимизирован. Правда здорово? И главное реалистично. Написано, что v3 тестировался на вполне современной ОС RHEL 7, а для v4 специально нашли старую версию – RHEL 6.4. Написано, что для достижения этого “достижения” был уменьшен рабочий набор данных с 220тыс. элементов до 120 тысяч (почти в 2 раза). В итоге, если все вышеописанное жульничество вам кажется реализуемым и практичным, то можно рассчитывать, что ядро v4 будет на 4% (четыре) быстрее ядра v3. Но только на плавающей точке и на очень маленьких задачах. Потому как памяти использовалось в этом тесте очень мало (а у Интела чем ее меньше, тем она быстрее).
  • При этом есть общее свойство всех Интеловских заявлений: они базируются на неких “внутренних тестах”, подробности которых отсутствуют. Даже SPECint-ы берутся не официальные, а свои собственные. Кстати, не все SPECint-ы одинаково полезны, что заслуживает отдельного внимания.  
  • Интересно отметить, что Интел всегда ссылается на SPECint_rate_base, а не на SPECint_rate (и надо отдать ему должное –  вполне преуспел в промывании мозгов многим, очень многим, заказчикам). Приставочка “base” по сути означает запрет компилятору использовать все возможности конкретной тестируемой архитектуры. Поскольку исходно SPEC-овские тесты сочинялись для Интела, то они уже оптимизированы под архитектуру х86. И мы видим (в тех же SPEC-овских отчетах), что включение оптимизации практически ничего для Интел процессоров не дает. Например, мы получим 3550 единиц с оптимизацией, вместо 3680 единиц без оптимизации (для топового 4-х сокетного 8890v4). А вот для POWER-а включение просто разрешив компилятору использовать оптимизацию мы получаем (на примере S824) вместо 1280 единиц аж 1750! Т.е. прирост может составить 30%-37% (в зависимости от модели и модификации процессора). Ничего не делая. Просто не мешая системе работать. Именно эти процентики Интел и зажуливает у всех остальных навязывая использование “заточенной” под него версии бенчмарки.
  • ИТОГО. Если мы поверим заявлениям Интела, то в среднем можно ожидать +26% с проца при увеличении числа ядер на 33%. Т.е. Интел официально заявляет, что ядро v4 слабее ядра v3 больше чем на 5%. Т.е. для заказчика, который использует крупные системы (а все они используют лицензируемый софт) серверы на базе v4 стали еще хуже. Хуже даже, чем v3. Не говоря уж про POWER-ы.Если совсем коротко – ничего не произошло. Вообще ничего. Кроме маркетингового шума, конечно. И, скорее всего, очередного захода азиатских производителей к нашим заказчикам…

PS1. Вся информация взята из открытых и официальных источников. Т.е. это не секретное послание, можно использовать по мере необходимости и целесообразности. Там, где присутствует мое субъективное мнение (т.е. отсутсвуют цифры) – можете не принимать во внимание.
PS2. Как обычно буду благодарен за любые комментарии.

Автор: Алексей Перевозчиков.

Файлы:

v4 vs v3 xeon-e7-8800-4800-v4-product-families-brief


Оставьте комментарий

10 мыслей про “Очередной “убийца” Power

  • Картинка профиля ustas33
    ustas33

    Заказчику глубоко певать на ваши тех процессы, частоты и прочие тех характеристики.
    Ему интересно с какой скоростью у него SAP или Oracle молотит, и сколько это стоит.
    Сейчас проще арендовать CRM/ERP в облаке, чем покупать себе холодильник с Power 8.
    Когда считают инфраструктуру под облако никто на нишевые решения на Power не смотрит.
    x86 всегда можно продать, VMware там, KVM, Oracle, это другой вопрос.

    • Картинка профиля _KIRill
      _KIRill От автора

      ustas33, тут главное не надо путать тёплое с мягким. Если у вас малое предприятие, то выгоднее cloud. Если инфраструктура большая, и вы захотите вынести её в облако, то у вас будет ТАКОЙ OPEX (ОПЕКС), что вас CFO задушит собственными руками. Я уже не говорю про защиту данных и пр…

        • Картинка профиля Илья
          Илья

          Возьмём, к примеру, новомодную штуку SAP HANA. Вопрос: могу ли я использовать существующее железо для установки HANA? В случае с x86 – скорее всего нет. Ибо, SAP официально поддерживает только определённую комбинацию процессоров/памяти/ и прочего железа на этой платформе. Много вопросов с производительностью и надёжностью x86 как платформы. Думаю что надо на эту тему отдельную статью написать 🙂

            • Картинка профиля Илья
              Илья

              О да… Если кратко, то история выглядит следующим образом:
              1)Power. Работаем несколько лет. Пора расширяться….
              2)… “Экономим бабло” – x86 (не буду упоминать вендора)
              3) бл%;:?:%; на%;:*?: мы решили экономить?
              4)Power8…

              Конечно же, учитывая что это “ИНТЕРНЕТ”, вы можете мне не верить, но это ваше право….

              • Картинка профиля roman
                roman

                Можно поподробнее про п.3. С какими конкретно проблемами Вы столкнулись?

              • Картинка профиля Илья
                Илья

                Подробнее про пп3? А смысл? Как известно “каждая несчастная семья несчастна по своему” 🙂
                Но могу, буквально, в двух словах: надёжность и производительность (вернее устоёчивость к большим нагрузкам).