PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Heartbeat schaltet nicht zurück



Ronny69
15.09.03, 17:43
Hallo zusammen,

seit einiger Zeit beschäftige ich mich mit Linux-HA um einen Cluster zu bauen bzw. zu testen. Auf der Basis von Heartbeat habe ich folgende Konfiguration zusammengestellt:

2 Pentium PC´s 400 MHz / 733MHz, beide 128 MB RAM, SuSE Prof. 8.2, Kern. 2.4.20
je 1 NIC 10MBit/s für die Backgroundverbindung von Heartbeat über CrossLink,
je 1 NIC 100MBits/s für die Verbindung zum Client (Verbunden über Office Hub),
1 serielle Verbindung für die Backgroundverbindung von Heartbeat über CrossLink

Die Konfiguration der ha.cf, der authkeys und der haresources habe ich nach dem GettingStartet Guide der HA-Projektseite erstellt. Nun zu meiner Frage.

Ich teste die Verbindung zum Cluster, indem ich von Node A das Netzwerkkabel aus dem Hub entferne und ein Endlospig auf Node A von einem Client aus laufen lasse. Nach 5 Sekunden erhält Node B die IP Adresse von Node A und das Ping läuft ordnungsgemäß weiter. So weit, so gut. Nach 2 Minuten verbinde ich Node A wieder mit dem Hub. Vom Client aus lande ich aber weiterhin auf Node B (zB. mit Telnet).

Node B schaltet also nicht auf Node A zurück. Erst wenn ich auf Node A die heartbeat services neu starte funktioniert das Szenario wie gewollt.

Muß das so sein oder habe ich irgendwo einen Fehler im Detail? Im Folgenden sind die Konfigurationsdaten der drei Heartbeat Configfiles aufgelistet.

Es wäre super, wenn mir jemand einen Tipp geben könnte, an welcher Stelle sich der Fehler eingeschlichen hat.

ha.cf:

debugfile /var/log/ha-debug
logfile /var/log/ha-log
logfacility local0
keepalive 1
deadtime 3
warntime 2
initdead 10
nice_failback on
serial /dev/ttyS0
baud 19200
udpport 694
bcast eth0 # Linux
node linuxha1
node linuxha2
ping 192.168.85.1 192.168.85.2
respawn hacluster /usr/lib/heartbeat/ipfail

haresources:

linuxha1 192.168.85.1 httpd

authkeys:

auth 1
1 crc


Gruß Ronny69

anquijix
04.02.04, 09:34
Original geschrieben von Ronny69

nice_failback on


ich glaube, es liegt daran, weil du des auf on hast und nicht auf off. in der beispiel ha.cf steht bei diesem parameter folgender text, dem du sicherlich auch schon über den weg gelaufen bist:



# nice_failback: determines whether a resource will
# automatically fail back to its "primary" node, or remain
# on whatever node is serving it until that node fails.
#
# The default is "off", which means that it WILL fail
# back to the node which is declared as primary in haresources
#
# "on" means that resources only move to new nodes when
# the nodes they are served on die. This is deemed as a
# "nice" behavior (unless you want to do active-active).


es sei denn, ich verstand da etwas falsch