Почему Red Hat Cluster Suite перестала работать?

Я тестировал Cluster Suite на CentOS 6.4 и работал нормально, но сегодня я заметил [ 8 августа, когда этот вопрос был первоначально задан ], что ему не нравится configuration, которая ранее работала. Я попытался воссоздать конфигурацию с нуля с помощью CCS, но это дало ошибки проверки.


Отредактировано 21 августа:

Я полностью переустановил ящик из CentOS 6.4 x86_64 минимальной установки, добавив следующие пакеты и их зависимости:

yum install bind-utils dhcp dos2unix man man-pages man-pages-overrides nano nmap ntp rsync tcpdump unix2dos vim-enhanced wget 

а также

 yum install rgmanager ccs 

Сработали следующие команды:

 ccs -h ha-01 --createcluster test-ha ccs -h ha-01 --addnode ha-01 ccs -h ha-01 --addnode ha-02 ccs -h ha-01 --addresource ip address=10.1.1.3 monitor_link=1 ccs -h ha-01 --addresource ip address=10.1.1.4 monitor_link=1 ccs -h ha-01 --addresource ip address=10.110.0.3 monitor_link=1 ccs -h ha-01 --addresource ip address=10.110.8.3 monitor_link=1 ccs -h ha-01 --addservice routing-a autostart=1 recovery=restart ccs -h ha-01 --addservice routing-b autostart=1 recovery=restart ccs -h ha-01 --addsubservice routing-a ip ref=10.1.1.3 ccs -h ha-01 --addsubservice routing-a ip ref=10.110.0.3 ccs -h ha-01 --addsubservice routing-b ip ref=10.1.1.4 ccs -h ha-01 --addsubservice routing-b ip ref=10.110.8.3 

и привел к следующей конфигурации:

 <?xml version="1.0"?> <cluster config_version="13" name="test-ha"> <fence_daemon/> <clusternodes> <clusternode name="ha-01" nodeid="1"/> <clusternode name="ha-02" nodeid="2"/> </clusternodes> <cman/> <fencedevices/> <rm> <failoverdomains/> <resources> <ip address="10.1.1.3" monitor_link="1"/> <ip address="10.1.1.4" monitor_link="1"/> <ip address="10.110.0.3" monitor_link="1"/> <ip address="10.110.8.3" monitor_link="1"/> </resources> <service autostart="1" name="routing-a" recovery="restart"> <ip ref="10.1.1.3"/> <ip ref="10.110.0.3"/> </service> <service autostart="1" name="routing-b" recovery="restart"> <ip ref="10.1.1.4"/> <ip ref="10.110.8.3"/> </service> </rm> </cluster> <? xml version = "1.0"?> <?xml version="1.0"?> <cluster config_version="13" name="test-ha"> <fence_daemon/> <clusternodes> <clusternode name="ha-01" nodeid="1"/> <clusternode name="ha-02" nodeid="2"/> </clusternodes> <cman/> <fencedevices/> <rm> <failoverdomains/> <resources> <ip address="10.1.1.3" monitor_link="1"/> <ip address="10.1.1.4" monitor_link="1"/> <ip address="10.110.0.3" monitor_link="1"/> <ip address="10.110.8.3" monitor_link="1"/> </resources> <service autostart="1" name="routing-a" recovery="restart"> <ip ref="10.1.1.3"/> <ip ref="10.110.0.3"/> </service> <service autostart="1" name="routing-b" recovery="restart"> <ip ref="10.1.1.4"/> <ip ref="10.110.8.3"/> </service> </rm> </cluster> 

Однако, если я использую ccs_config_validate или пытаюсь запустить службу cman , он терпит неудачу:

 Relax-NG validity error : Extra element rm in interleave tempfile:10: element rm: Relax-NG validity error : Element cluster failed to validate content Configuration fails to validate 

Что происходит? Это работало!

Я думаю, что вам не хватает переадресованных доменов, если вы хотите определить службу в кластере redhat, сначала вам нужно определить failoverdomain, вы можете использовать failoverdomain для многих служб или по одному для службы.

Если вам нужна дополнительная информация об отказоустойчивом домене «man clurgmgrd»,

Отказоустойчивый домен – это упорядоченное подмножество членов, к которым может быть привязана служба. Следующие

представляет собой list семантики, определяющей parameters того, как различные parameters конфигурации влияют на поведение отказоустойчивого домена:

Это только начало работать снова, после того, как больше танцует yum update . Я сравнил старый и новый /var/lib/cluster/cluster.rng и, удивление, удивление, есть разница. В одном из систем, которые не работали, не было никаких определений для элемента <ip> .

Текущая инкарнация системы была установлена ​​с того же минимального CD, и у меня есть пошаговая процедура команд для вырезания и вставки, которые работали несколько раз, пока я ее разрабатывал, а затем провалился почти два месяца, теперь начинается работая снова. Я построил коробку примерно полдюжины раз, поэтому я думаю, что это не процедура.

Вероятно, скользят части Red Hat, но я не уверен, как узнать, какие изменения были проверены в этом fileе за последние два месяца.

Давайте будем гением компьютера.