Синхронизация 2-х SP на p570 при FW Upgrade


Главная Форумы POWER Systems AIX/Hardware Синхронизация 2-х SP на p570 при FW Upgrade

В этой теме 19 ответов, 3 участника, последнее обновление  nickalias 5 года/лет, 5 мес. назад.

  • Автор
    Сообщения
  • #15866

    nickalias
    Участник

    Всем привет!
    При поднятия FW c EM310 на EM320 p570(Type 9117-MMA) на этапе синхронизации primary и secondary SP процесс зависает с кодом B1818902 и висит так долго (всю ночь), что приходится отрубать обе секции сервера выдергиванием кабелей питания. причем FW primary SP становится EM320, а FW secondary SP остается EM310.
    Что можете посоветовать в такой ситуации, и есть ли возможность принудительной синхронизации primary и secondary SP не в режиме FW Upgrade?

  • #15870

    Oldnick
    Участник

    там был где-то пункт синхронизации в меню Advanced…

  • #15871

    nickalias
    Участник

    Где именно? В ASM?

  • #15872

    Oldnick
    Участник

    hmc/update/update to current/Advanced Features

  • #15875

    nickalias
    Участник

    При попытке принудительно запустить процедуру синхронизации через HMC, HMC не дает выполнить это действие-загашена опция «Synchronize Redundant Components»(см.Рис1 файла во вложении).
    При попытке показать Display Fix Level Information (см.Рис2 файла во вложении)выдается сообщение с ошибкой HMC E302F82D
    Рекомендации по устранению этой ошибки:

    Explanation
    An error occurred while attempting to read the header of the common marker firmware update file from flash memory to the hard drive.
    Problem determination
    This error code will be posted under either of the following set of conditions:
    · After a service processor failover, the HMC attempted to read the P1 marker LID from the new primary service processor. If the P1 marker LID on the previously-primary service processor had not been synchronized with the P1 marker LID on the now-primary service processor before the failover, this error code will be posted. It indicates that the P1 marker LID file was not found on the now-primary service processor.

    This error is not critical; it only effect the HMC’s ability to determine whether or not deferred firmware updates have been applied.
    · The files needed to create the P1 marker LID are not available because the HMC is in the process of writing one of them to the service processor. This can happen when a P-side restore runs because a «Do not accept» choice was selected on the advanced features panels. Currently, the HMC will issue an «lslic» command during problem analysis by Inventory Scout scripts. If the P-side common marker LID file is being written to at the time that Inventory Scout script issues the «lslic» command, the E302F82D will be posted.
    Action: Install the latest HMC code package, then install the latest system firmware.

    HMC у нас v.7.3.5 SP3 т.е. вполне актуальная.
    ВОПРОС НЕ В ТЕМУ:
    А ЧТО,ЕСЛИ ОТКЛЮЧИТЬ И ВЫТАЩИТЬ primary SP, то можно будет FW Upgrade(ить) secondary SP (который по логике, оставшись один, должен стать primary), а ПОТОМ primary вернуть на свое место, powerOFF-PowerON?

    Attachments:
  • #15876

    Sever
    Участник

    Покажите, что на выходе у следующих команд :

    lssysconn -r all
    lssyscfg -r sys -F name,ipaddr,state
    lslic -m 9117-MMA*102FBB0
    lshmc -V

  • #15877

    nickalias
    Участник

    hscroot@hmc-01:~> lssysconn -r all

    resource_type=sys,type_model_serial_num=9117-MMA*102FBB0,sp=primary,sp_phys_loc=U789D.001.DQDZFBL-P1-C11,ipaddr=10.0.0.246,alt_ipaddr=unavailable,state=Connected

    resource_type=sys,type_model_serial_num=9117-MMA*102FBB0,sp=secondary,sp_phys_loc=U789D.001.DQDZDLZ-P1-C11,ipaddr=10.0.0.244,alt_ipaddr=unavailable,state=Connected

    resource_type=sys,type_model_serial_num=9117-MMA*102FBC0,sp=primary,sp_phys_loc=U789D.001.DQDZFMB-P1-C11,ipaddr=10.0.0.245,alt_ipaddr=unavailable,state=Connected

    resource_type=sys,type_model_serial_num=9117-MMA*102FBC0,sp=secondary,sp_phys_loc=U789D.001.DQDZDLT-P1-C11,ipaddr=10.0.0.243,alt_ipaddr=unavailable,state=Connected

    hscroot@hmc-01:~> lssyscfg -r sys -F name,ipaddr,state

    Server-9117-MMA-SN102FBB0,10.0.0.246,Operating

    Server-9117-MMA-SN102FBC0,10.0.0.245,Operating

    hscroot@hmc-01:~> lslic -m 9117-MMA*102FBB0

    lic_type=Managed System,management_status=Enabled,disabled_reason=,activated_level=101,installed_level=101,accepted_level=101,ecnumber=01EM320,mtms=9117-MMA*102FBB0,deferred_level=None,platform_ipl_level=101,curr_level_primary=101,curr_ecnumber_primary=01EM320,curr_power_on_side_primary=perm,pend_power_on_side_primary=perm,temp_level_primary=132,temp_ecnumber_primary=01EM340,perm_level_primary=101,perm_ecnumber_primary=01EM320,update_control_primary=HMC,curr_level_secondary=unavailable,curr_ecnumber_secondary=unavailable,curr_power_on_side_secondary=unavailable,pend_power_on_side_secondary=unavailable,temp_level_secondary=unavailable,temp_ecnumber_secondary=unavailable,perm_level_secondary=unavailable,perm_ecnumber_secondary=unavailable,update_control_secondary=unavailable

    hscroot@hmc-01:~> lslic -m 9117-MMA*102FBC0

    lic_type=Managed System,management_status=Enabled,disabled_reason=,activated_level=101,installed_level=101,accepted_level=48,ecnumber=01EM320,mtms=9117-MMA*102FBC0,deferred_level=None,platform_ipl_level=101,curr_level_primary=101,curr_ecnumber_primary=01EM320,curr_power_on_side_primary=temp,pend_power_on_side_primary=temp,temp_level_primary=101,temp_ecnumber_primary=01EM320,perm_level_primary=48,perm_ecnumber_primary=01EM310,update_control_primary=HMC,curr_level_secondary=48,curr_ecnumber_secondary=01EM310,curr_power_on_side_secondary=temp,pend_power_on_side_secondary=temp,temp_level_secondary=48,temp_ecnumber_secondary=01EM310,perm_level_secondary=48,perm_ecnumber_secondary=01EM310,update_control_secondary=HMC

    hscroot@hmc-01:~> lshmc -V

    «version= Version: 7

    Release: 3.5.0

    Service Pack: 3

    HMC Build level 20101011.1

    «,»base_version=V7R3.5.0

    «

  • #15878

    Sever
    Участник

    По машине BBO…

    На примари SP — в perm области 320я прошивка, в temp 340я, загрузочной является perm. Secondary вообще не определяется. Патовая ситуация.

    Рекомендация.
    В первую очередь необходимо синхронизировать все уровни прошивок на одном релизе. Нужно выключить паритиции, выключить сервер BB0 до состояния логического POWER OFF. Выполните снос 340ой методом копирования PERM в TEMP. Выполнить синхронизацию со вторым сервисным процессором.
    По результатам всего перечисленного можно будет строить дальнейшие планы.

  • #15880

    nickalias
    Участник

    При попытке переписи PERM в TERM ошибка:

    Critical Error — Server-9117-MMA-SN102FBB0
    The operation failed due to an internal code failure.
    E302F82D is the error code.
    This error was reported to your service provider.
    Contact your next level of support for further assistance.
    (см. Рис2. в файле во вложении предыдущаего письма)

    Кстати, на secondary PS можно входить по ASMI, хотя он в output команды в статусе unavailable
    ВОПРОС О ПЕРЕПИХИВАНИИ PS ОСТАЕТСЯ ОТКРЫТЫМ?

  • #15881

    Sever
    Участник

    Вы сервер выключили?

  • #15883

    nickalias
    Участник

    Разумеется, он был в PowerOff

  • #15884

    Sever
    Участник

    ок.
    Пара вопросов:

    1. Какой релиз прошивки высвечивается на втором сервисном процессоре при входе в ASMI?
    2. Каким образом у вас на BB0 машине получилось, что в TEMP зоне 340ая, а в PERM 320ая? Вы пытались даунгрейдить 340ю на 320?

  • #15885

    nickalias
    Участник

    ок.
    Пара вопросов:

    1. Какой релиз прошивки высвечивается на втором сервисном процессоре при входе в ASMI?

    На primary 320, на secondary 310.

    2. Каким образом у вас на BB0 машине получилось, что в TEMP зоне 340ая, а в PERM 320ая? Вы пытались даунгрейдить 340ю на 320?

    Нет, решили попытаться на pimary апгрейдить до 340 и посмотреть, как на это отреагирует secondary со своим 310

  • #15886

    Sever
    Участник

    Попробуйте изменить зону загрузки на TEMP и сделайте рестарт с 340ой.

  • #15889

    nickalias
    Участник

    Пробовали — вылетаем на ту же ошибку.

  • #15890

    Sever
    Участник

    Обратитесь в сервис

  • #15891

    nickalias
    Участник

    Логично!

  • #15895

    nickalias
    Участник

    И последний вопрос. У нас отсутствует подключение 2-х CEC через SPCN-порты(system power control network).
    Это может служить причиной того, что синхронизация не идет?
    Наверняка, нет.

  • #15896

    Sever
    Участник

    Наверняка, в этом и была исходная причина ваших проблем.
    http://www-03.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/TD104287
    Найдите пару кабелей и соедините. Два кабеля, так как у вас два сервера.

  • #15902

    nickalias
    Участник

    OK! Как только получим результат, сообщу незамедлительно.

Для ответа в этой теме необходимо авторизоваться.