DS4700 Write cache Enabled but internally suspended

Главная Форумы Storage SAN, Disk & Tape DS4700 Write cache Enabled but internally suspended

Просмотр 25 веток ответов
  • Автор
    Сообщения
    • #16479
      uxTuaHgp
      Участник

      СХД зелененькая, просто в определенный момент обнаружили падение производительности и случайно обнаружили, что на всех томах кэш на запись Suspended.

      Поддержка ничего вразумительного кроме поменять Enclosure ID, подуть в трубу и протереть стекло предложить не может.

      Никто не сталкивался с таким?

    • #16480
      Сергей
      Участник

      есть множество глюков в прошивке, которые приводят к такому результату. эти глюки то исправляются, то возвращаются обратно.

      так что поддержка права, надо попинать по колесам (выключить-ребутнуть-включить). после этого с вероятностью 90% все вернется на место.
      ну и обновляцца, традиционно.

    • #16481
      uxTuaHgp
      Участник

      Да, второй уровень рекомендовал перегрузить контроллер, а лучше два последовательно.

    • #16484
      Pavel Alexei
      Участник

      У меня дважды было такое: один раз на DS4800, другой на DS5100. Оба раза проявилось после полного выключения.
      В случае DS5100 смогли выкрутиться без перезагрузки, полностью отключили и потом врубили на месте cache на всех томах по очереди из GUI. Потом нашел что можно было из CLI гопом на все сделать.
      В случае DS4800 только повторный полный ребут помог, но там были и проблемы с одним из контролеров при первом запуске, поднялся только после того, как “пнули” его ногой.

    • #16488
      Oleg
      Участник

      СХД зелененькая, просто в определенный момент обнаружили падение производительности и случайно обнаружили, что на всех томах кэш на запись Suspended.

      была точно такая же беда на DS3400
      последовательный рестарт контроллеров не помог
      а вот powerdown-цикл полечил – при включении системы кеш на запись выключился из-за неполностью заряженной батареи (запись в логе)
      батарея быстро зарядилась – кеш по-человечески включился (тоже по логам видно было)
      LSI-и разные а проблемы у них одинаковые :laugh:

    • #16527
      uxTuaHgp
      Участник

      Спасибо всем откликнувшимся.
      Перезагрузка контроллеров помогла.

    • #16553
      Alex
      Участник

      Очень. Очень жаль, что в посте так и не проявились люди, которые год назад мне с пеной у рта доказывали, что LSI-ное говно – это прекрасные, хорошо себя зарекомендовавшие массивы, а я – урод криворукий. И всё то в этих массивах лепо и хорошо, и прошивки то давно выверены и стабильны. Жаль, жаль, что от этих людей нет комментариев.

    • #16556
      uxTuaHgp
      Участник

      Да нормальные массивы за свои деньги.

    • #16557
      Alex
      Участник

      Нет. У нас есть 4500, 4700, 5100.

      Жизнь более-менее начинается только с 5k. Со всем, что младше, багов наелись по самое не балуйся.

      Нет, если кто-то может себе позволить перегружать массивы по любому чиху – я за них рад. Но не надо считать это нормальным поведением. Это не нормально. И вопрос к таким чувакам простой – а чего ж вы JBOD не взяли, если вам доступность по барабану? Сэкономили б пару концов.

      Отдельной пикантной строкой идёт то, что как-то DS4500 нам кувыркнул IBM-ер, пришедший его чинить (и, разумеется, делавший всё в соответствии с _ПРОЦЕДУРОЙ_).

    • #16558
      roman
      Участник

      Да нормальные массивы за свои деньги.

      Полностью соглашусь. Мы используем DS4700. За несколько лет их использования ни одной внеплановой перезагрузки. IMHO нормальные массивы за свои деньги

    • #16560
      andrewk
      Участник

      стокгольмский синдром 😀

    • #16568
      Andriy
      Участник

      Очень. Очень жаль, что в посте так и не проявились люди, которые год назад мне с пеной у рта доказывали, что LSI-ное говно – это прекрасные, хорошо себя зарекомендовавшие массивы, а я – урод криворукий. И всё то в этих массивах лепо и хорошо, и прошивки то давно выверены и стабильны. Жаль, жаль, что от этих людей нет комментариев.

      сколько батхерта…

      LSI – действительно, не самые замечательные массивы. но уж никак не говно. при правильном обслуживании – вполне себе работают, стабильно. плюс – их ремонтабельность в полевых условиях очень даже высокая.

    • #16574
      Alex
      Участник

      вполне себе работают

      Баттхерт – слово для школоты, нормальные люди называют это опытом. Опыт показывает, что индусы, пишущие прошивки, не в силах организовать нормальное тестирование самостоятельно и перекладывают это на плечи кастомеров.

      А как эти массивы замечательно работают, можно посмотреть поиском на аикспортале. Да и эта тема вроде бы намекает, в том числе комментарии вида “у меня тоже это было и починиться удалось только полной перезагрузкой”. Я уже писал, если ваш бизнес допускает такие простои по любому поводу, – возможно, стоило изрядно сэкономить?

      Про ремонтабельность в полевых условиях рекомендую рассказать IBM-еру, кувыркнувшему нам массив.

    • #16575
      Andriy
      Участник

      [quote]вполне себе работают

      Баттхерт – слово для школоты, нормальные люди называют это опытом.
      [/quote]
      продолжая логическую цепочку, школота – слово для луркое..в, нормальные люди называют это “молодежью” или “школьниками” 🙂

      А как эти массивы замечательно работают, можно посмотреть поиском на аикспортале. Да и эта тема вроде бы намекает, в том числе комментарии вида “у меня тоже это было и починиться удалось только полной перезагрузкой”. Я уже писал, если ваш бизнес допускает такие простои по любому поводу, – возможно, стоило изрядно сэкономить?

      видите-ли, если ваш бизнес требует определенного уровня доступности, то DS-кам там вообще не место. правда-правда. есть “более другие” массивы. лучше.

      Про ремонтабельность в полевых условиях рекомендую рассказать IBM-еру, кувыркнувшему нам массив.

      ну пригласите его ко мне на курс IBM System Storage DS5000 Advanced. я ему расскажу 😉
      откуда такая вера в магические скиллы филд-инженеров вендоров? такие же люди. я, как вы догадываетесь, говорю на основании собственного опыта.

      еще раз, если вы мой посыл не уловили, я не утверждаю, что DS Series – отличные стораджи. я, всего-лишь, говорю, что при правильной эксплуатации эти железяки справляются со своими задачами без особых проблем. другой вопрос, что на правильную эксплуатацию затрачивается больше телодвижений, чем на тех же Hitachi AMS, к примеру. но это уже второй вопрос.

    • #16576
      roman
      Участник

      Уважаемый asddsa, вы сейчас смешали воедино железяки и опыт людей, их обслуживающих. А это разные вещи. Если один сервисник вам кувыркнул DS-ку, это не значит, что она плохая, возможно, проблема в сервиснике

    • #16577
      Alex
      Участник

      продолжая логическую цепочку

      Давайте свернём тему площадного остроумия? Или уж полностью отдадимся чаду угара и кутежа. Одно что-нибудь из двух.

      Разумеется меня задел “баттхёрт”, я этого не скрываю. Потому что я то этих устриц наелся и говно называю говном, а не розой, исключительно на основании накопившихся фактов.

      видите-ли, если ваш бизнес требует определенного уровня доступности, то DS-кам там вообще не место. правда-правда. есть “более другие” массивы. лучше.

      Так у меня и есть другие. Разные массивы для разных уровней. Только вот DS даже на entry level не тянет с таким подходом “выключи всё и включи и, возможно, магически починится”.

      ну пригласите его ко мне на курс IBM System Storage DS5000 Advanced. я ему расскажу

      “Кто может – делает, Кто не может – учит”. Может вы сами внутри ибэмэ как-нибудь разберётесь, без привлечения кастомеров?

      что при правильной эксплуатации эти железяки справляются

      Да нет никакой “правильной эксплуатации”. Мы с вами в разные форумы смотрим, что ли? Вот же, первое сообщение темы: “работало. перестало работать”. Чего, очередную чёрную свечу из жира девственницы перед массивом забыли поставить на ночь?

      И повторю – весь негатив относится к 4500/4700. 5100 пока ведут себя более-менее. Но карма у них изрядно подпорчена предыдущим семейством.

    • #16578
      Alex
      Участник

      Роман, я вас не понял. Оценивать железку в отрыве от производства – это по части маркетологов, обычно, ну и прочих теоретиков в вакууме, которые слепо верят всему, что вендор пишет в книжках и радуются как дети, когда на лабораторном стенде активируют фичу А, а она (сюрприз!) работает!

    • #16579
      Andriy
      Участник

      “Кто может – делает, Кто не может – учит”. Может вы сами внутри ибэмэ как-нибудь разберётесь, без привлечения кастомеров?

      спасибо за комплимент, да. а мы – это кто? и почему “мы” должны разбираться “внутри ибэмэ”?

      Да нет никакой “правильной эксплуатации”. Мы с вами в разные форумы смотрим, что ли? Вот же, первое сообщение темы: “работало. перестало работать”. Чего, очередную чёрную свечу из жира девственницы перед массивом забыли поставить на ночь?

      черная свеча из жира девственницы – это из оккультизма. вы ж тут к инженерному мышлению призываете?
      форум мы смотрим один. я, к примеру, вижу проблему, без описания workaround. может там прошивка древняя?
      у меня этих 4700-х порядка 30 штук на поддержке. работают себе и не жужжат. количество проблем, возникших именно по вине железяки (прошивки), не такое смертельное и ужасное, как вы тут пытаетесь представить

    • #16580
      roman
      Участник

      никто и не собирается оценивать их в отрыве от производства. Просто есть такая поговорка: “техника в руках колхозника – груда металлолома”. Я никого не хочу обидеть этим высказыванием. Но иногда опыт сервисников действительно вызывает сожаление 🙁 А также негатив со стороны кастомеров 😉

    • #16581
      Alex
      Участник

      почему “мы” должны разбираться “внутри ибэмэ”?

      А это я слишком прямо, видимо, воспринял фразу “пригласите его ко мне на курс”.

      я, к примеру, вижу проблему, без описания workaround. может там прошивка древняя?

      Вот это меня всегда умиляло в первой линии саппорта любого вендора. Ошибка от этого перестаёт быть ошибкой, что ли? А кто застрахует от нового индусского кода в самой свежей прошивке? Что уж там говорить, нормальные полевые инженеры обычно в курсе, какая прошивка является стабильной для железки на данный момент и, вопреки рекомендациям первой линии, обычно советуют, на чём сидеть.

      Тридцать 4700-ых – это весомо, признаю, но я не в курсе ваших паттернов нагрузки. У нас массивы используются в хвост и в гриву, реконфигурации часты, инсталляций вида “настроили и работает без изменений 10 лет” – практически нет. Возможно это основная причина того, что на младших DS-ках мы собрали массу ошибок, найденных впоследствии ибэмэ (и не найденных, подозреваю).

    • #16582
      uxTuaHgp
      Участник

      “выключи всё и включи и, возможно, магически починится”.

      Мне кажется дело не в железке, а в прошивке.
      У нас 4700 на 6.22 работала без подобных вывихов много лет, а вот после модернизации и обновления случилось.

    • #16583
      andrewk
      Участник

      никто и не собирается оценивать их в отрыве от производства. Просто есть такая поговорка: “техника в руках колхозника – груда металлолома”. Я никого не хочу обидеть этим высказыванием. Но иногда опыт сервисников действительно вызывает сожаление 🙁 А также негатив со стороны кастомеров 😉

      Роман, Вы не находите, что когда опыт сервисников вызывает сожаление, то надо что-то менять в консерватории? А также то, что негатив кастомеров редко бывает на пустом месте – он обычно обусловлен либо проблемами железа, либо тем самым опытом сервисников, который вызывает сожаление? Во всех случаях виновата только одна компания – IBM.

      Бывает еще случай недостатка квалификации у кастомера, но это явно не он. Среди постоянных посетителей этого сайта неквалифицированных админов вроде нет. По крайней мере ни asddsa, ни Александра, у которого возникла эта проблема, я бы не отнес к дилетантам.

    • #16584
      Alex
      Участник

      Мне кажется дело не в железке, а в прошивке.

      Так и я про это. Индийское (или кто там им пишет) программирование. Но поскольку массив в отрыве от прошивки всего лишь груда железа – я не люблю эту серию целиком, без деления своей нелюбви на части.

    • #16585
      uxTuaHgp
      Участник

      По идее все правы.

      И по большому счету эта проблема на совести корпорации IBM.

      И мне, как потребителю не интересно какое подразделение накосячило.

      Если новая прошивка, которую мне рекомендовал инженер поддержки, как не самую новую, но как самую стабильную из поддерживаемых, то у меня возникают справедливые претензии ко всей компании IBM.

      Однако от продукции IBM мы все равно не откажемся – и это тоже ясно :laugh:

    • #16586
      Andriy
      Участник

      А это я слишком прямо, видимо, воспринял фразу “пригласите его ко мне на курс”.

      можно вести курс в IBM, но там не работать 🙂

      Вот это меня всегда умиляло в первой линии саппорта любого вендора. Ошибка от этого перестаёт быть ошибкой, что ли? А кто застрахует от нового индусского кода в самой свежей прошивке? Что уж там говорить, нормальные полевые инженеры обычно в курсе, какая прошивка является стабильной для железки на данный момент и, вопреки рекомендациям первой линии, обычно советуют, на чём сидеть.

      речь не о бездумном обновлении. любое обновление прошивок должно обкатываться на тестовой системе и обновление накатывается если в чейнджлоге ЯВНО указано – устраняется или не устраняется имеющаяся проблема. речь о том, что человек может сидеть на глюкавой прошивке 🙂

      Тридцать 4700-ых – это весомо, признаю, но я не в курсе ваших паттернов нагрузки. У нас массивы используются в хвост и в гриву, реконфигурации часты, инсталляций вида “настроили и работает без изменений 10 лет” – практически нет. Возможно это основная причина того, что на младших DS-ках мы собрали массу ошибок, найденных впоследствии ибэмэ (и не найденных, подозреваю).

      паттерны нагрузки – от OTLP до файлопомоек. ибо это не у меня, а у кастомеров, которых я имею счастье обслуживать.

      кстати, по-поводу индусского кода. с переходом Engenio подразделения под крыло NetApp, у меня начали теплиться смутные надежды, что там таки наведут порядок… эх…

    • #16896
      Andriy
      Участник

      подброшу еще веселухи:

      обновляем DS3950 до версии 07.83.22.0
      в процессе происходит сбой обновления контроллера B. контроллер уходит в оффлайн. А – обновился корректно.
      вытаскиваем, вставляем B на место. ноль эмоций, ACS не проходит, “эмуляция замены” не прокатила. переводим его с VxWorks консоли в онлайн – пишет много разных букаф, затем опять в оффлайн. опять в онлайн, смотрим на буквы – видно, что пытается что-то делать с новым DACStore (формат поменялся в 7.83, да) – несколько раз бутается, затем в оффлайн. опять взводим в онлайн с консоли (на Storage Manager ноль эмоций) – завелось 🙂
      самое печальное – непонятно, в итоге, какие манипуляции привели к положительному результату и почему не взвелось с первого раза.

      короче все, что привнес нетапп, это

      [code]
      -> moduleList
      ==============================================
      Title: Disk Array Controller
      Copyright 2008-2012 NetApp, Inc. All Rights Reserved.

      Name: RC
      Version: 07.83.22.00
      Date: 06/28/2012
      Time: 17:03:22 CDT
      Models: 4980 4981 4985 4988
      Manager: devmgr.v1083api14.Manager
      ==============================================
      [/code]

Просмотр 25 веток ответов
  • Для ответа в этой теме необходимо авторизоваться.