Горячая замена cache battery

Главная Форумы IBM i (OS/400) Горячая замена cache battery

Просмотр 16 веток ответов
  • Автор
    Сообщения
    • #11752
      pre
      Участник

      Меняли батарейку кеша в 571F адаптере согласно процедуре – через concurrent maintenance. Перезапуск кеша был произведен, все статусы какие надо.
      В течении последующего часа выяснилась неприятная вещь:
      батчевые (да и не только) процессы отрабатывают за гораздо большее время (в разы). В такой ситуации EOD рискует не уложится в разумные рамки.
      IBM сервис также не в силах прояснить причины.
      Performance Advisor из 5722PT1 намекает на Disk service time exceeded guideline, причем начинается это с момента останова кеша и не думает пропадать после перезапуска.

      Переключаю на зеркало и делаю LPAR-у IPL.
      Всё опять работает как и раньше.
      Кто-нибудь сталкивался с подобным?

    • #11755
      Oldnick
      Участник

      на всякий случай спрашиваю. после замены батарейки статус у дисков не был “Degradate”?
      что значит “переключаю” на зеркало? raid-5 быстро переключили на зеркало на ходу? 🙂
      контроллер обслуживает сколько дисков, какая там защита, сколько сетов?
      уровни PTFs не сильно древние?
      какой был промежуток между “стопом” кэша и “стартом”?
      случайно не запомнили какая дата была указана на “новой” батарейке?

      p.s.
      мы это делали много раз. ничего подобного не было.

    • #11756
      Sever
      Участник

      Похоже на то, что кэш у вас “не запустился” при замене.
      Деградация в момент замены и некоторое время после – естественный эффект.

      Если она длилась долго, то это только по причине “не запуска” кэширования. При перезагрузке система его запустила автоматически.

      Меняли батарейку кеша в 571F адаптере согласно процедуре – через concurrent maintenance. Перезапуск кеша был произведен, все статусы какие надо.
      Хотелось бы подробностей… Каковы были пошаговые действия?

    • #11762
      pre
      Участник

      IBM ответил, там всё валят на естественный процесс зарядки новой батарейки.

      Depending on the charge level of the new battery the length of time required to fully charge the replacement battery may be several hours. No errors are logged during this normal charging process unless the charge time exceeds the length of time required by the specific adapter to fully charge a dead battery. The disk status will indicate the drives attached to the affected adapter are operational while the battery is charging. If hardware errors are logged, or if the disk status is degraded, use the new errors to resolve the problem. Once the cache battery has been fully charged the write cache will be enabled and system performance will return to normal.

      Performance Degraded статус у дисков был после удаления старой батарейки, так и должно быть. После установки новой батарейки и запуска кеша статус всех дисков показывался как нормальный, хотя кеш не работал, что негативно сказывалось на быстродействии.
      Никаких тебе статусов “Pending”, всё хорошо и точка.

      Переключаю на зеркало – это не про диски было, это про резервную машину.

      Добавлено:
      Для 571F время полного заряда 5,25 часов.
      И только после могут начать появляться сообщения SRCXXXX8008, что что-то не так.
      Вот такая вот горячая замена.

    • #11763
      Oldnick
      Участник

      неправда. новая батарейка должна быть заряжена. литиевые батарейки поставляют в заряженном состоянии, особенно те, которые имеют P/N :). другое дело что она могла быть не совсем новая и просто села….

    • #11764
      pre
      Участник

      Ну конкретно эта батарейка поставлялась в комплекте с IBM-овским инженером в рамках сервиса.

    • #11765
      Sever
      Участник

      IBM ответил, там всё валят на естественный процесс зарядки новой батарейки.
      [b]Добавлено:[/b]
      Для 571F время полного заряда 5,25 часов.
      И только после могут начать появляться сообщения SRCXXXX8008, что что-то не так.
      Вот такая вот горячая замена.

      Литиевые батареи для 571F (поставляемые сервисом IBM) имеют дату производства, разница с которой составляет не больше месяца-двух от даты поставки заказчику. Дата эта нанесена на саму батарею. Нам приходят именно с такими датами. Новые батареи под замену не могут прийти в разряженном состоянии.
      SRCXXXX8008 в PAL при заменен батареи появляется только в момент выключения кэша. К уровню заряда батареи он никакого отношения не имеет.

      Из вашего поста непонятно…
      – Кто менял батарею (вы сами или сервис) ?
      – Где вы взяли батарею для замены?

      Претензии и вопросы к сервису IBM могут быть только в том случае, если все это делалось с ведома сервиса и его руками.

      UPD не заметил пред.поста. Если все делалось инженером IBM, то можете требовать сатисфакции 🙂

    • #11766
      pre
      Участник

      На машину есть договор о сервисе напрямую с местным IBM-ом.
      Замену вел IBM-инженер. Саму батарею я не держал, поэтому какие там даты не скажу.

      Переписка с IBM, которой я тут поделился, потому и возможна, что все делалось их руками.
      Приведённая информация и собственно батарея тоже от IBM.

      According to information which I can see are 571F, 575B and all SAS adapters should charge within 5.25 hours. If it takes longer than this to charge battery SRCXXXX8008 will log.

      Насколько всё адекватно – судите сами.

      Претензий нет – проблему-то на тот момент удалось оперативно решить.
      Удивляет то, что изначально IBM-освкий сервис предлагал осуществлять замену вообще днём, утверждая что процедура горячей замены абсолютно безобидная.

    • #11767
      Sever
      Участник

      Требуйте замену батареи повторно.
      Есть подозрение, что вам поставили БУшную. При замене сможете проверить дату её производства. Такую батарею нужно заменить на новую, даже если сейчас все работает нормально.

    • #11768
      Oldnick
      Участник

      возможно поставили не бу-шную, новую, которая пролежала на складе (возможно даже у локального IBM 1-3 года). такая батарея будет разряжена и негодна для дальнейшей эксплуатации в течение 3 лет.
      саморазряд у таких батарей – 8-10% в месяц.

    • #11769
      Sever
      Участник

      За поставку такой батареи можно и нужно учинить скандал.

    • #11782
      pre
      Участник

      новая батарейка должна быть заряжена. литиевые батарейки поставляют в заряженном состоянии

      Если это не best practice, а конкретное условие, то оно должно быть где-то отражено. Не подскажете, где именно? Искал в Hardware Information Center и пдфниках по теме.
      То же про разницу даты производства и поставки – существуют ли опубликованные или же внутренние IBM-овские правила на этот счет?

    • #11785
      Oldnick
      Участник

      литиевая батарея должна быть заряжена. это стандартные приреквизиты для литиевых батарей. их хранят заряженными, иначе батарея выйлет из строя. любые литиевые батареи идут заряжеными.
      соответственно, если она разряжена, тогда она долго хранилась после последней зарядки.
      долго – это более 8-9 месяцев. поэтому, узнав какая дата указана на батареи, можно сделать определенные выводы. 2-4 месяца – батарея новая со склада, 4-8 месяцев – батарея новая, но долго лежала…. более 10 месяцев – возможно б/у, в любом случае если более 6-8 месяцев – значит батарая села. Надо пыпаться заряжать и использовать на свой страх и риск, либо требовать поставки новой батареи.

    • #11957
      pre
      Участник

      В общем, сам отвечу на свои же вопросы:
      Представления о том, что горячая замена батареек вообще, и в production часы в частности, устарели по мере перехода на LiIon батарейки. Батарейки поставляются и хранятся в полуразряженном состоянии. Будте бдительны!
      IBM предупреждает,
      Информация, похоже, очень свежая.

    • #11958
      Sever
      Участник

      2Pre: 50% зарядка аккумулятора достаточное условие для работы кэша дискового контроллера. “Не читайте советских газет”. У нас под нагрузкой полторы сотни таких карт с батарейками. Меняли много раз и ни разу никаких проблем не фиксировали.

      Если хотите быть бдительными, то всегда проверяйте дату на поступившем к вам для замены аккумуляторе. Если есть малейшее подозрение, что батарейка “протухла”, то сразу требуйте замену.

    • #11961
      pre
      Участник

      50% зарядка аккумулятора достаточное условие для работы кэша дискового контроллера … Меняли много раз и ни разу никаких проблем не фиксировали.

      Once the battery is fully changed, the write cache overruns found in a Component Report will go to zero and performance will return to normal.

      Да элементарно проверяется же кто из Вас прав – сделайте PRTCPTRPT по короткому промежутку времени до и сразу после старта кэша, если присутствующие на странице Disk Activity значения %Write Cache Overruns пожожи, то нет оснований ставить под сомнение информацию от IBM.

    • #11962
      Sever
      Участник

      Дык нет никакого спора, так как нет предмета обсуждения – каких либо логов.
      В пустую месим воду в ступе.
      Кэш “не работал” – это очевидный факт. Возможные причины были названы ранее.
      Документ а от IBM это отмазка от ответственности.

      ЗЫ Согласен, что %Write Cache Overruns явно указывает на то, работает ли кеш. 100% значение указывает на то, что кэш неактивен. Если значение в десятки процентов, то кеш просто паникует и не справляется с нагрузкой…

Просмотр 16 веток ответов
  • Для ответа в этой теме необходимо авторизоваться.