Netapp RAID-DP vs RAID-10

Главная Форумы Storage SAN, Disk & Tape Netapp RAID-DP vs RAID-10

Просмотр 14 веток ответов
  • Автор
    Сообщения
    • #19179
      Pavel Alexei
      Участник

      Сразу оговорюсь, я не сталкивался с netapp устройствами. Так, пролистал пару лет назад redbook-и по n-series.
      Все время считал что “их” RAID-DP это аналог RAID-6 со всеми вытекающими write penalty проблемами. Понятно, что они как-то выкручиваются. Вчера просмотрел несколько статей на тему, все дружно пишут что я глубоко неправ, и у RAID-DP производительность не хуже чем у RAID10 и write penalty там тоже 2. Честно, пытался понять, как это может быть, но вот не доходит. Чудес не бывает. Ну пишется не каждый блок отдельно, а сохраняется в кэше полный страйп пока он заполнится. Но кэш то не резиновый. Ну пишется в “пустые” места, так чтоб не приходилось каждый раз пересчитывать контрольные суммы при записи, но большие “пустые” дырки когда-то заканчиваются.
      Может кто-то сталкивался и видел как реально этот RAID-DP работает в отличии от RAID-10? Понятно, что при достаточном кол-ве кэша, большом кол-ве дисков и относительно небольшом процентом соотношении write/read разницы между RAID5 и RAID6 не будет, тем более что последний давно аппаратный. Ну будет чуть хужее RAID-10.
      Но в реальных условиях чаще всего проблемы с производительностью возникают из-за нехватки шпинделей. Пишут сейчас иногда так, что хочется поотрывать руки писакам. Не напасешся дисков чтоб вытянуть системы. Но если реально нехватает шпинделей, то кэш сильно не поможет.
      Так ли это, что RAID-DP реально не хуже RAID-10? кто-то реально сравнивал IOPS на аналогичных системах?

    • #19180
      Oleg
      Участник

      в аспекте производительности в SPC-1 RAID-DP не показал никаких чудес vs. RAID10 конкурентов
      поэтому в NetApp давно и традиционно сравнивают свои системы с PAM/PAMII/Flash Cache с конкурентами исключительно на “голых” HDD
      а их техническая документация не в свободном доступе
      как только приближается переполнение NVRAM (диски не успевают принимать данные) RAID DP начинает работать вполне “традиционно”

    • #19182
      Pavel Alexei
      Участник

      в аспекте производительности в SPC-1 RAID-DP не показал никаких чудес vs. RAID10 конкурентов

      Сам факт что на Double Parity можно обойтись 2 write penalty и получить такую же производительность как на RAID-10, да еще и объем “выжать” больше, это уже кажется чудом. А я как-то давно перестал в них верить.

      как только приближается переполнение NVRAM (диски не успевают принимать данные) RAID DP начинает работать вполне “традиционно”

      И как в этом случае считать кол-во необходимого кэш? Обычно IBM рекомендует 0.1% от общего диского пространсва, тогда типа можно ожидать 50% cache hits. Меньше уже как получится, а больше нет смысла. У netapp получается цифра должна быть существенно больше.

      А традиционно работать это как? как RAID-4? 5? 6?

    • #19183
      uxTuaHgp
      Участник

      Чисто теоретически можно всю запись выполнять на свободные хвосты и последовательно, а потом переписывать таблицу размещения блоков.
      Фрагментированность устранять фоновой дефрагментацией в периоды низкой нагрузки.

    • #19184
      Сергей
      Участник

      Чисто теоретически можно всю запись выполнять на свободные хвосты и последовательно, а потом переписывать таблицу размещения блоков.
      Фрагментированность устранять фоновой дефрагментацией в периоды низкой нагрузки.

      BTW именно так оно и присходит. 😉

    • #19185
      Pavel Alexei
      Участник

      Получается что есть некое место, таблица, которое дико используется и которое желательно держать всю в памяти. И всегда надо иметь в запасе память на хотя бы один фулл страйп.
      Так кэши не напасешся.

    • #19186
      uxTuaHgp
      Участник

      Фул страйп ну 8МБ, ну может даже 128МБ – ерунда.
      Кэш ведь работает в режиме ФИФО, если грязных блоков становится слишком много – очередь на фронте начинает придерживаться, подрастает время обслуживания, но ситуация, когда кэша недостаточно для формирования полного страйпа в принципе не должна допускаться.

    • #19187
      uxTuaHgp
      Участник

      А таблица размещения блоков всегда в кэше, который:
      1. на батареях
      2. может резервироваться например SSD на кэш контроллере.

    • #19193
      Pavel Alexei
      Участник

      Так где же собака зарылась 🙂 ?
      Имеем решение, которое
      – при таком-же кол-ве дисков, показывает производительность не хуже RAID-10,
      – с большим эфективным дисковым пространством (насколько я смог понять ~60% в отличии от 50% в случае RAID-10)
      – с фукционалом как блочного сториджа, так и NAS, причем не внешними “нашлепками” а родным софтом
      – с богатым набором фичей
      и при этом все остальные конкуренты еще живы? 🙂
      Ну как минимум наверное, что дорого, интересно насколько. n-series помниться было дорого, и что-то из entry level сравнивался по цене с V7000 unified. “Родные” цены такого же маштаба что и n-series? Или “там” оно дешевле.

      У нас Netapp тут давно себя не показывал. Были какие-то попытки, но не очень успешные. Сейчас они стали агрессивнее, и мне просто интересно с чем имею дело. К сожалению пощупать не удалось. Всяким reference из COMP я не очень доверяю, я технарь и меня интересуют технические аспекты. Когда клиенты (а это чаще всего свои же знакомые, друзья) начинают рассказывать взахлеб все что им навешали манагеры партнера Netapp, сказать особо не знаю что. А красивые сказки рассказывать это манагеры умеют, только вот помалкивают про свякие “нюансы”.
      Вот и интересно послушать, что народ думает.

    • #19198
      uxTuaHgp
      Участник

      Мое мнение:
      если у клиента приложение генерирующее постоянно запредельные нагрузки, то в таком случае экономить на объемах глупо.
      Если же график загрузки рваный или вообще никакой, то хаускипер вполне будет успевать дефрагментировать свободные фрагменты, чтобы RAID-DP продолжал радовать клиента и производительностью и экономичностью.

      Нужно железо подбирать понимая, как оно будет себя вести и трезво оценивая риски, деля пополам заявления маркетологов и продажников.
      Ну то есть да, чудес таки не бывает.
      А эффектные фокусы всегда таят что-то за ширмой.

    • #19250
      yota
      Участник

      Господа, а по моему вы просто не совсем поняли как работает “RAID” в NetAPP. Он не ждет сборки полного страйпа, в случае WAFL нет такой необходимости. Там же основная фишка, данные никогда не перезаписываются, новые пишутся всегда в свободное место (ну или поверх самых старых данных), нет необходимости пересчитывать четность, соотв-но нет пенальти традиционных 5-х или 6-х рейдов. Ну особых чудес конечно тоже ждать не стоит, есть свои особенности.

    • #19252
      uxTuaHgp
      Участник

      Мы поняли про свободное место.
      А когда массив забит на 95%?

    • #19253
      Pavel Alexei
      Участник

      тут мнения разняться. Когда я пытался понять что к чему, нарвался на эту статью.
      Тут есть мнение конкурентов, типа что после 60% занятости наступает “жопа”, но автор демонстрирует что netapp нашел решение и для этого случая
      http://storagewithoutborders.com/2010/07/19/data-storage-for-vdi-part-5-raid-dp-wafl-the-ultimate-write-accelerator/
      Насколько я понял, для того, чтоб писать полные страпы, netapp готов перечитать уже заполненные данные, чтоб потом все вкупе записать.
      Честно говоря ситуация с netapp мне напоминает спор сisco или не-cisco (это я про сетевые дела:-) ). Есть аплогеты cisco (если честно то я себя тоже к таковым причисляют), и все остальные. Почему такая полярность, не знаю. Но вот те кто “за” cisco останавливает только одно: цена :-), да и то не всегда.

    • #19254
      uxTuaHgp
      Участник

      вообще, даже если убрать из пенальти необходимость считывания контрольной суммы, то куда деваться от записи двух контрольных сумм при любой записи хоть на свободное место, хоть на занятое?

    • #19255
      Pavel Alexei
      Участник

      А никуда не деваться. Их всегда пишут. Вот в них проблемы и нет. Если писать только полный страйп, то нет необходимости считывать то что было ДО этого там, для пересчета контрольных сумм.
      1 write IO RAID-5 = 4 IO : 2 read IO + 2 write IO.
      1 write IO RAID-6 = 6 IO : 3 read IO + 3 write IO.
      Если же писать полный страйп, то считывать что было ДО этого не надо. Контрольные суммы пересчиваются заново из новых блоков страйпа.
      Кстати, аналогичную ситуацию можно “поймать”, когда RAID-5 будет более производительный чем RAID-10. Если у нас диски используются для backup, куда только пишется и большими объемами, то лучше брать RAID-5 или RAID-6, чем RAID-10. Как бы это не выглядело странно. Например если у нас RAID-5 из 7+1P с блоком в 32K, то полный страйп это 224K. Если теперь записать блоками по 224K, то 7 IO на диск приведет к 8 IO, считывать что было ДО не надо. НО писать надо блоками пропорционально размеру полного страйпа. Если бы это был RAID-10, то запись 223K на array из 7+7 привело бы к 14 IO.
      Что-то впомнилось про token-ring. Он всегда оставал от ethernet по скоростям, но там всегда была гарантированная доставка и гарантированная скорость.

      BTW, интересно как себя будет вести RAID-DP есть диск помрет, пока данные восстановятся в HS.

Просмотр 14 веток ответов
  • Для ответа в этой теме необходимо авторизоваться.