DS4700 Write cache Enabled but internally suspended


Главная Форумы Storage SAN, Disk & Tape DS4700 Write cache Enabled but internally suspended

В этой теме 25 ответов, 8 участников, последнее обновление  Andriy 5 года/лет, 2 мес. назад.

  • Автор
    Сообщения
  • #16479

    uxTuaHgp
    Участник

    СХД зелененькая, просто в определенный момент обнаружили падение производительности и случайно обнаружили, что на всех томах кэш на запись Suspended.

    Поддержка ничего вразумительного кроме поменять Enclosure ID, подуть в трубу и протереть стекло предложить не может.

    Никто не сталкивался с таким?

  • #16480

    Сергей
    Участник

    есть множество глюков в прошивке, которые приводят к такому результату. эти глюки то исправляются, то возвращаются обратно.

    так что поддержка права, надо попинать по колесам (выключить-ребутнуть-включить). после этого с вероятностью 90% все вернется на место.
    ну и обновляцца, традиционно.

  • #16481

    uxTuaHgp
    Участник

    Да, второй уровень рекомендовал перегрузить контроллер, а лучше два последовательно.

  • #16484

    Pavel Alexei
    Участник

    У меня дважды было такое: один раз на DS4800, другой на DS5100. Оба раза проявилось после полного выключения.
    В случае DS5100 смогли выкрутиться без перезагрузки, полностью отключили и потом врубили на месте cache на всех томах по очереди из GUI. Потом нашел что можно было из CLI гопом на все сделать.
    В случае DS4800 только повторный полный ребут помог, но там были и проблемы с одним из контролеров при первом запуске, поднялся только после того, как «пнули» его ногой.

  • #16488

    Oleg
    Участник

    СХД зелененькая, просто в определенный момент обнаружили падение производительности и случайно обнаружили, что на всех томах кэш на запись Suspended.

    была точно такая же беда на DS3400
    последовательный рестарт контроллеров не помог
    а вот powerdown-цикл полечил — при включении системы кеш на запись выключился из-за неполностью заряженной батареи (запись в логе)
    батарея быстро зарядилась — кеш по-человечески включился (тоже по логам видно было)
    LSI-и разные а проблемы у них одинаковые :laugh:

  • #16527

    uxTuaHgp
    Участник

    Спасибо всем откликнувшимся.
    Перезагрузка контроллеров помогла.

  • #16553

    Alex
    Участник

    Очень. Очень жаль, что в посте так и не проявились люди, которые год назад мне с пеной у рта доказывали, что LSI-ное говно — это прекрасные, хорошо себя зарекомендовавшие массивы, а я — урод криворукий. И всё то в этих массивах лепо и хорошо, и прошивки то давно выверены и стабильны. Жаль, жаль, что от этих людей нет комментариев.

  • #16556

    uxTuaHgp
    Участник

    Да нормальные массивы за свои деньги.

  • #16557

    Alex
    Участник

    Нет. У нас есть 4500, 4700, 5100.

    Жизнь более-менее начинается только с 5k. Со всем, что младше, багов наелись по самое не балуйся.

    Нет, если кто-то может себе позволить перегружать массивы по любому чиху — я за них рад. Но не надо считать это нормальным поведением. Это не нормально. И вопрос к таким чувакам простой — а чего ж вы JBOD не взяли, если вам доступность по барабану? Сэкономили б пару концов.

    Отдельной пикантной строкой идёт то, что как-то DS4500 нам кувыркнул IBM-ер, пришедший его чинить (и, разумеется, делавший всё в соответствии с _ПРОЦЕДУРОЙ_).

  • #16558

    roman
    Участник

    Да нормальные массивы за свои деньги.

    Полностью соглашусь. Мы используем DS4700. За несколько лет их использования ни одной внеплановой перезагрузки. IMHO нормальные массивы за свои деньги

  • #16560

    andrewk
    Участник

    стокгольмский синдром 😀

  • #16568

    Andriy
    Участник

    Очень. Очень жаль, что в посте так и не проявились люди, которые год назад мне с пеной у рта доказывали, что LSI-ное говно — это прекрасные, хорошо себя зарекомендовавшие массивы, а я — урод криворукий. И всё то в этих массивах лепо и хорошо, и прошивки то давно выверены и стабильны. Жаль, жаль, что от этих людей нет комментариев.

    сколько батхерта…

    LSI — действительно, не самые замечательные массивы. но уж никак не говно. при правильном обслуживании — вполне себе работают, стабильно. плюс — их ремонтабельность в полевых условиях очень даже высокая.

  • #16574

    Alex
    Участник

    вполне себе работают

    Баттхерт — слово для школоты, нормальные люди называют это опытом. Опыт показывает, что индусы, пишущие прошивки, не в силах организовать нормальное тестирование самостоятельно и перекладывают это на плечи кастомеров.

    А как эти массивы замечательно работают, можно посмотреть поиском на аикспортале. Да и эта тема вроде бы намекает, в том числе комментарии вида «у меня тоже это было и починиться удалось только полной перезагрузкой». Я уже писал, если ваш бизнес допускает такие простои по любому поводу, — возможно, стоило изрядно сэкономить?

    Про ремонтабельность в полевых условиях рекомендую рассказать IBM-еру, кувыркнувшему нам массив.

  • #16575

    Andriy
    Участник

    [quote]вполне себе работают

    Баттхерт — слово для школоты, нормальные люди называют это опытом.
    [/quote]
    продолжая логическую цепочку, школота — слово для луркое..в, нормальные люди называют это «молодежью» или «школьниками» 🙂

    А как эти массивы замечательно работают, можно посмотреть поиском на аикспортале. Да и эта тема вроде бы намекает, в том числе комментарии вида «у меня тоже это было и починиться удалось только полной перезагрузкой». Я уже писал, если ваш бизнес допускает такие простои по любому поводу, — возможно, стоило изрядно сэкономить?

    видите-ли, если ваш бизнес требует определенного уровня доступности, то DS-кам там вообще не место. правда-правда. есть «более другие» массивы. лучше.

    Про ремонтабельность в полевых условиях рекомендую рассказать IBM-еру, кувыркнувшему нам массив.

    ну пригласите его ко мне на курс IBM System Storage DS5000 Advanced. я ему расскажу 😉
    откуда такая вера в магические скиллы филд-инженеров вендоров? такие же люди. я, как вы догадываетесь, говорю на основании собственного опыта.

    еще раз, если вы мой посыл не уловили, я не утверждаю, что DS Series — отличные стораджи. я, всего-лишь, говорю, что при правильной эксплуатации эти железяки справляются со своими задачами без особых проблем. другой вопрос, что на правильную эксплуатацию затрачивается больше телодвижений, чем на тех же Hitachi AMS, к примеру. но это уже второй вопрос.

  • #16576

    roman
    Участник

    Уважаемый asddsa, вы сейчас смешали воедино железяки и опыт людей, их обслуживающих. А это разные вещи. Если один сервисник вам кувыркнул DS-ку, это не значит, что она плохая, возможно, проблема в сервиснике

  • #16577

    Alex
    Участник

    продолжая логическую цепочку

    Давайте свернём тему площадного остроумия? Или уж полностью отдадимся чаду угара и кутежа. Одно что-нибудь из двух.

    Разумеется меня задел «баттхёрт», я этого не скрываю. Потому что я то этих устриц наелся и говно называю говном, а не розой, исключительно на основании накопившихся фактов.

    видите-ли, если ваш бизнес требует определенного уровня доступности, то DS-кам там вообще не место. правда-правда. есть «более другие» массивы. лучше.

    Так у меня и есть другие. Разные массивы для разных уровней. Только вот DS даже на entry level не тянет с таким подходом «выключи всё и включи и, возможно, магически починится».

    ну пригласите его ко мне на курс IBM System Storage DS5000 Advanced. я ему расскажу

    «Кто может — делает, Кто не может — учит». Может вы сами внутри ибэмэ как-нибудь разберётесь, без привлечения кастомеров?

    что при правильной эксплуатации эти железяки справляются

    Да нет никакой «правильной эксплуатации». Мы с вами в разные форумы смотрим, что ли? Вот же, первое сообщение темы: «работало. перестало работать». Чего, очередную чёрную свечу из жира девственницы перед массивом забыли поставить на ночь?

    И повторю — весь негатив относится к 4500/4700. 5100 пока ведут себя более-менее. Но карма у них изрядно подпорчена предыдущим семейством.

  • #16578

    Alex
    Участник

    Роман, я вас не понял. Оценивать железку в отрыве от производства — это по части маркетологов, обычно, ну и прочих теоретиков в вакууме, которые слепо верят всему, что вендор пишет в книжках и радуются как дети, когда на лабораторном стенде активируют фичу А, а она (сюрприз!) работает!

  • #16579

    Andriy
    Участник

    «Кто может — делает, Кто не может — учит». Может вы сами внутри ибэмэ как-нибудь разберётесь, без привлечения кастомеров?

    спасибо за комплимент, да. а мы — это кто? и почему «мы» должны разбираться «внутри ибэмэ»?

    Да нет никакой «правильной эксплуатации». Мы с вами в разные форумы смотрим, что ли? Вот же, первое сообщение темы: «работало. перестало работать». Чего, очередную чёрную свечу из жира девственницы перед массивом забыли поставить на ночь?

    черная свеча из жира девственницы — это из оккультизма. вы ж тут к инженерному мышлению призываете?
    форум мы смотрим один. я, к примеру, вижу проблему, без описания workaround. может там прошивка древняя?
    у меня этих 4700-х порядка 30 штук на поддержке. работают себе и не жужжат. количество проблем, возникших именно по вине железяки (прошивки), не такое смертельное и ужасное, как вы тут пытаетесь представить

  • #16580

    roman
    Участник

    никто и не собирается оценивать их в отрыве от производства. Просто есть такая поговорка: «техника в руках колхозника — груда металлолома». Я никого не хочу обидеть этим высказыванием. Но иногда опыт сервисников действительно вызывает сожаление 🙁 А также негатив со стороны кастомеров 😉

  • #16581

    Alex
    Участник

    почему «мы» должны разбираться «внутри ибэмэ»?

    А это я слишком прямо, видимо, воспринял фразу «пригласите его ко мне на курс».

    я, к примеру, вижу проблему, без описания workaround. может там прошивка древняя?

    Вот это меня всегда умиляло в первой линии саппорта любого вендора. Ошибка от этого перестаёт быть ошибкой, что ли? А кто застрахует от нового индусского кода в самой свежей прошивке? Что уж там говорить, нормальные полевые инженеры обычно в курсе, какая прошивка является стабильной для железки на данный момент и, вопреки рекомендациям первой линии, обычно советуют, на чём сидеть.

    Тридцать 4700-ых — это весомо, признаю, но я не в курсе ваших паттернов нагрузки. У нас массивы используются в хвост и в гриву, реконфигурации часты, инсталляций вида «настроили и работает без изменений 10 лет» — практически нет. Возможно это основная причина того, что на младших DS-ках мы собрали массу ошибок, найденных впоследствии ибэмэ (и не найденных, подозреваю).

  • #16582

    uxTuaHgp
    Участник

    «выключи всё и включи и, возможно, магически починится».

    Мне кажется дело не в железке, а в прошивке.
    У нас 4700 на 6.22 работала без подобных вывихов много лет, а вот после модернизации и обновления случилось.

  • #16583

    andrewk
    Участник

    никто и не собирается оценивать их в отрыве от производства. Просто есть такая поговорка: «техника в руках колхозника — груда металлолома». Я никого не хочу обидеть этим высказыванием. Но иногда опыт сервисников действительно вызывает сожаление 🙁 А также негатив со стороны кастомеров 😉

    Роман, Вы не находите, что когда опыт сервисников вызывает сожаление, то надо что-то менять в консерватории? А также то, что негатив кастомеров редко бывает на пустом месте — он обычно обусловлен либо проблемами железа, либо тем самым опытом сервисников, который вызывает сожаление? Во всех случаях виновата только одна компания — IBM.

    Бывает еще случай недостатка квалификации у кастомера, но это явно не он. Среди постоянных посетителей этого сайта неквалифицированных админов вроде нет. По крайней мере ни asddsa, ни Александра, у которого возникла эта проблема, я бы не отнес к дилетантам.

  • #16584

    Alex
    Участник

    Мне кажется дело не в железке, а в прошивке.

    Так и я про это. Индийское (или кто там им пишет) программирование. Но поскольку массив в отрыве от прошивки всего лишь груда железа — я не люблю эту серию целиком, без деления своей нелюбви на части.

  • #16585

    uxTuaHgp
    Участник

    По идее все правы.

    И по большому счету эта проблема на совести корпорации IBM.

    И мне, как потребителю не интересно какое подразделение накосячило.

    Если новая прошивка, которую мне рекомендовал инженер поддержки, как не самую новую, но как самую стабильную из поддерживаемых, то у меня возникают справедливые претензии ко всей компании IBM.

    Однако от продукции IBM мы все равно не откажемся — и это тоже ясно :laugh:

  • #16586

    Andriy
    Участник

    А это я слишком прямо, видимо, воспринял фразу «пригласите его ко мне на курс».

    можно вести курс в IBM, но там не работать 🙂

    Вот это меня всегда умиляло в первой линии саппорта любого вендора. Ошибка от этого перестаёт быть ошибкой, что ли? А кто застрахует от нового индусского кода в самой свежей прошивке? Что уж там говорить, нормальные полевые инженеры обычно в курсе, какая прошивка является стабильной для железки на данный момент и, вопреки рекомендациям первой линии, обычно советуют, на чём сидеть.

    речь не о бездумном обновлении. любое обновление прошивок должно обкатываться на тестовой системе и обновление накатывается если в чейнджлоге ЯВНО указано — устраняется или не устраняется имеющаяся проблема. речь о том, что человек может сидеть на глюкавой прошивке 🙂

    Тридцать 4700-ых — это весомо, признаю, но я не в курсе ваших паттернов нагрузки. У нас массивы используются в хвост и в гриву, реконфигурации часты, инсталляций вида «настроили и работает без изменений 10 лет» — практически нет. Возможно это основная причина того, что на младших DS-ках мы собрали массу ошибок, найденных впоследствии ибэмэ (и не найденных, подозреваю).

    паттерны нагрузки — от OTLP до файлопомоек. ибо это не у меня, а у кастомеров, которых я имею счастье обслуживать.

    кстати, по-поводу индусского кода. с переходом Engenio подразделения под крыло NetApp, у меня начали теплиться смутные надежды, что там таки наведут порядок… эх…

  • #16896

    Andriy
    Участник

    подброшу еще веселухи:

    обновляем DS3950 до версии 07.83.22.0
    в процессе происходит сбой обновления контроллера B. контроллер уходит в оффлайн. А — обновился корректно.
    вытаскиваем, вставляем B на место. ноль эмоций, ACS не проходит, «эмуляция замены» не прокатила. переводим его с VxWorks консоли в онлайн — пишет много разных букаф, затем опять в оффлайн. опять в онлайн, смотрим на буквы — видно, что пытается что-то делать с новым DACStore (формат поменялся в 7.83, да) — несколько раз бутается, затем в оффлайн. опять взводим в онлайн с консоли (на Storage Manager ноль эмоций) — завелось 🙂
    самое печальное — непонятно, в итоге, какие манипуляции привели к положительному результату и почему не взвелось с первого раза.

    короче все, что привнес нетапп, это

    [code]
    -> moduleList
    ==============================================
    Title: Disk Array Controller
    Copyright 2008-2012 NetApp, Inc. All Rights Reserved.

    Name: RC
    Version: 07.83.22.00
    Date: 06/28/2012
    Time: 17:03:22 CDT
    Models: 4980 4981 4985 4988
    Manager: devmgr.v1083api14.Manager
    ==============================================
    [/code]

Для ответа в этой теме необходимо авторизоваться.