ITstory: Потеря кворума в Proxmox

Proxmox - достаточно гибкая система виртуализации. С его помощью можно построить как многонодовые кластеры с High Availability, так и запустить пару виртуалок на отдельном серваке. В моем случае используется 2 сервера с общим хранилищем бекапов на nfs.
Не буду вдаваться в теорию настройки (можно почитать в wiki), упомяну только, что для управления кластером необходим непрерывный доступ к общему хранилищу, даже если оно используется раз в несколько дней. Однако бывают ситуации, когда этот самый доступ неожиданно пропадает. Сетевое оборудование, например, заглючило, или nfs понадобилось перезагрузить.И вот тогда начинаются проблемы. Нет, с виртуалками все нормально - работают, доступны, настраиваются. А вот с бекапом, миграцией, созданием и удалением все не так радужно. Дело в том, что ноды кластера теряют кворум.
При входе в веб интерфейс Proxmox это заметно по состоянию нод:

Та, на которую залогинились, зеленая, вторая - красная.
При попытке выполнить задание получаем результат:

Упс... Что делать?
Пробуем дергать сервисы:
/etc/init.d/cman restart - не помогает
/etc/init.d/rgmanager restart - мимо
/etc/init.d/pve-manager restart - не то
/etc/init.d/pve-cluster restart - 8(
/etc/init.d/pve-daemon restart - все, демоны кончились.

Да что такое! Я ведь помню, что реанимировал кластер в прошлый раз именно таким образом. Собственно, я не помню последовательность перезапуска, поэтому и начал писать заметку на память.
Лезу в историю команд, выявлять закономерность. Ага, в прошлый раз были cman, rgmanager и pve-cluster, а сейчас pve-manager еще затесался. Делаю как раньше - кворум!

Судя по выводу в консоль при выполнении команд, к нашей проблеме имеют отношение только cman и pve-cluster, остальное можно не дергать. Так это или нет - проверю в следующий раз.

2 комментария:

Unknown29 мая 2013 г. в 22:36
UPD:
К нашей проблеме имеют отношение cman, pve-cluster и pvedarmon. Дергать нужно именно в таком порядке, без перезапуска pvedarmon кворум у меня через пару минут опять пропадал.
ОтветитьУдалить
Ответы
ыыы31 января 2016 г. в 20:34
А если кворум есть, но из гуи вторая нода не работает, и на вебморду второй ноды нет доступа?
Только когда в кластере, уводишь - работает.
Такое ощущение, что дело в сети, что то работает, что то нет.
http://joxi.ru/4vAWZ04UV0Op2W.jpg

pvelocalhost приходится вешать на внешний ip-адрес, если на внутреннем висит - нода красная..
ОтветитьУдалить
Ответы

Добавить комментарий

среда, 29 мая 2013 г.

Потеря кворума в Proxmox

2 комментария:

среда, 29 мая 2013 г.