LPAR is rebooting when Console is opened


Главная Форумы POWER Systems Виртуализация POWER LPAR is rebooting when Console is opened

В этой теме 3 ответа, 2 участника, последнее обновление Картинка профиля Дмитрий Дмитрий 1 год, 2 мес. назад.

Aliexpress INT
  • Автор
    Сообщения
  • #38424
    Картинка профиля Pavel Alexei
    Pavel Alexei
    Участник
    Aliexpress INT

    Всем привет
    Случилась странность, которую не могу понять и не могу повторить. В конторе куча Power 750 с LPAR c RHEL 6. Меняем массово конфигурацию sshd (security) и после этого перегружаем sshd, все через скрипты. Раз на сотый service sshd restart перерубает и текуют сесию и выбрасывает после stop, не доезжая до start. Ничего страшного, подключаешся через HMC и перегружаесь sshd.
    НО! Уже 4 раз при подключнии к такому LPAR через HMC происходит «чудо», linux перегружается. На первые 2 думали что просто так совпало. Тут по 7 нянек на дитя, по 2 HMC на сервера, может кто полез с другого HMC и перегрузил. Не стали тогда разбираться. Но сейчас это уже было при мне. Отвалились на 2 Linux sshd. Заходим в HMC (Web), выбираем LPAR, выбраем Open terminal Windows и «оп-паа» перезагруз. Медленно фигеем и делаем на вротом и получаем вторую такую же картину. Причем до reboot вылетает что-то про неправильный пароль на su.
    Подключаемся с тем же LPAR после перезагрузки, проблем нет. Я думал как-то связано с тем, что sshd отвалился (уже просто идей нет), нет, все нормально. Или может ssh не поднялся по той же причине, почему и странность произошла.
    Я не спрашиваю, почему, но хоть может кто скажет куда рыть и как повторить такое же? 🙂
    Я уже думаю, а не подключился ли кто ДО этого и оставил на консоле «reboot now», а мы после подключения нарвались. Конечно смешно, но просто идей нет никаких.

  • #38427
    Картинка профиля Дмитрий
    Дмитрий
    Участник

    В AIX такого (тьфу-тьфу-тьфу) не встречал. А openssh он везде openssh. Чудеса.

  • #38430
    Картинка профиля Pavel Alexei
    Pavel Alexei
    Участник

    Я вспомнил про 8-ую няньку — Nessus (Tenable) scanner, который периодически все сервера «трусит». Может он в позю зю RHEL ставит.
    Кстати, забыл сказать, перезагрузка не хард, а аккуратная с shutdown и reboot операционки.

  • #38435
    Картинка профиля Дмитрий
    Дмитрий
    Участник

    А что, если запустить трассировку, ps и т.п. И частоту syncd увеличить или online отправлять данные по сети.

    Это может помочь отследить, какой процесс запустил shutdown.

    Вот это
    >Причем до reboot вылетает что-то про неправильный пароль на su.
    тоже за то, что перезагрузку выполняет слишком «умный» сервис какого-нибудь мониторинга, вроде кластерного, который, обнаружив сетевой сбой (ssh?) пытается исправить ситуацию, перезагрузив узел.
    По отдалённой аналогии с Oracle RAC или PowerHA.

Для ответа в этой теме необходимо авторизоваться.