LPAR is rebooting when Console is opened

Главная Форумы POWER Systems Виртуализация POWER LPAR is rebooting when Console is opened

Просмотр 3 веток ответов
  • Автор
    Сообщения
    • #38424
      Pavel Alexei
      Участник

      Всем привет
      Случилась странность, которую не могу понять и не могу повторить. В конторе куча Power 750 с LPAR c RHEL 6. Меняем массово конфигурацию sshd (security) и после этого перегружаем sshd, все через скрипты. Раз на сотый service sshd restart перерубает и текуют сесию и выбрасывает после stop, не доезжая до start. Ничего страшного, подключаешся через HMC и перегружаесь sshd.
      НО! Уже 4 раз при подключнии к такому LPAR через HMC происходит “чудо”, linux перегружается. На первые 2 думали что просто так совпало. Тут по 7 нянек на дитя, по 2 HMC на сервера, может кто полез с другого HMC и перегрузил. Не стали тогда разбираться. Но сейчас это уже было при мне. Отвалились на 2 Linux sshd. Заходим в HMC (Web), выбираем LPAR, выбраем Open terminal Windows и “оп-паа” перезагруз. Медленно фигеем и делаем на вротом и получаем вторую такую же картину. Причем до reboot вылетает что-то про неправильный пароль на su.
      Подключаемся с тем же LPAR после перезагрузки, проблем нет. Я думал как-то связано с тем, что sshd отвалился (уже просто идей нет), нет, все нормально. Или может ssh не поднялся по той же причине, почему и странность произошла.
      Я не спрашиваю, почему, но хоть может кто скажет куда рыть и как повторить такое же? 🙂
      Я уже думаю, а не подключился ли кто ДО этого и оставил на консоле “reboot now”, а мы после подключения нарвались. Конечно смешно, но просто идей нет никаких.

    • #38427
      Дмитрий
      Участник

      В AIX такого (тьфу-тьфу-тьфу) не встречал. А openssh он везде openssh. Чудеса.

    • #38430
      Pavel Alexei
      Участник

      Я вспомнил про 8-ую няньку – Nessus (Tenable) scanner, который периодически все сервера “трусит”. Может он в позю зю RHEL ставит.
      Кстати, забыл сказать, перезагрузка не хард, а аккуратная с shutdown и reboot операционки.

    • #38435
      Дмитрий
      Участник

      А что, если запустить трассировку, ps и т.п. И частоту syncd увеличить или online отправлять данные по сети.

      Это может помочь отследить, какой процесс запустил shutdown.

      Вот это
      >Причем до reboot вылетает что-то про неправильный пароль на su.
      тоже за то, что перезагрузку выполняет слишком “умный” сервис какого-нибудь мониторинга, вроде кластерного, который, обнаружив сетевой сбой (ssh?) пытается исправить ситуацию, перезагрузив узел.
      По отдалённой аналогии с Oracle RAC или PowerHA.

Просмотр 3 веток ответов
  • Для ответа в этой теме необходимо авторизоваться.