PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : heartbeat,xen,drbd unter opensuse 11.1



Hotze
19.01.10, 10:41
Hallo zusammen,

ich habe auf 2 Servern heartbeat, xen & drbd soweit konfiguriert, dass ich mittels heartbeat meine domU starten, stoppen und live migrieren kann. Soweit läuft alles fein.

Wenn jedoch bspw. meine domU auf nodeA läuft und ich nodeA manuell vom Netz nehme, übernimmt nodeB nicht automatisch. Im Gegenteil, nodeB fährt sich erstmal runter. Hänge ich dann nodeA wieder ans Netz, fährt sich nodeA runter. Ist irgendwie das Gegenteil von Hochverfügbarkeit.

Wie bekomme ich es hin, dass nodeB die domU automatisch übernimmt, oder zumindest neu startet? Als Stonith-Agenten nutze ich external/riloe.

Als System läuft openSuse 11.1, xen 3.3.1, drbd 8.2.7 & heartbeat 3.0.0

Danke im Voraus!

HBtux
19.01.10, 15:22
Vielleicht lieferst Du mal noch ein paar Infos bzw. beschreibst mal genauer, wie die beiden Server zusammen hängen......
Hauptadresse der beiden Server, Cluster-Adresse.....

Die Config der HA-Recource wäre auch nicht schlecht.

Hotze
20.01.10, 12:28
Hallo,

ha.cf:


crm yes
node sedna2 kallisto2
use_logd on
logfacility local0

udpport 696
udp eth0

ucast eth0 <IP1>
ucast eth0 <IP2>
ping <IP-Liste>

auto_failback on

traditional_compression off
compression bz2
coredumps true

autojoin none

keepalive 5
warntime 30
deadtime 60
deadping 60
initdead 120


Config:


primitive st-riloe_kallisto stonith:external/riloe \
params hostlist="kallisto2 sedna2" \
ilo_hostname="ilo_kallisto" \
ilo_user="Administrator" \
ilo_password="asdf" \
ilo_can_reset="1" \
ilo_protocol="2.0" \
ilo_powerdown_method="button" \
op monitor interval="1h" timeout="1m" \
meta target-role="Started"


primitive st-riloe_sedna stonith:external/riloe \
params hostlist="kallisto2 sedna2" \
ilo_hostname="ilo_sedna" \
ilo_user="Administrator" \
ilo_password="asdf" \
ilo_can_reset="1" \
ilo_protocol="2.0" \
ilo_powerdown_method="button" \
op monitor interval="1h" timeout="1m" \
meta target-role="Started"

clone fencing-kallisto st-riloe_kallisto
clone fencing-sedna st-riloe_sedna

property no-quorum-policy="ignore" \
start-failure-is-fatal="false" \
stonith-action="reboot"

primitive test ocf:heartbeat:Xen \
params xmfile="/etc/xen/vm/test" allow-migrate="true" resource-stickiness="0"\
op monitor interval="10s" \
op start interval="0s" timeout="30s" \
op stop interval="0s" timeout="300s" \
target-role="Started"


Da beide Server an unterschiedlichen Standorten stehen, kann ich sie nur über das normale LAN kommunizieren lassen (also kein serielles Kabel, etc. möglich). Beides sind HP Server mit ilo-Interface.

Was brauchst Du noch an Infos? Ein Clusteradresse habe ich (noch) nicht im Angebot. Klingt komisch, aber brauche ich sie denn?

ciao,
Hotze

HBtux
20.01.10, 23:19
Könntest Du mal die Log-Files ha.debug der beiden Nodes posten....
Vielleicht die verschiedenen Zustände
- beide verbunden - nodeA abgehängt - nodeA wieder angesteckt - nodeB abgehängt....

Was steht den in der Zeile "ping <IP-Liste>"?
Welche IP-Adressen im Netz überwachst Du zusätzlich?
Nur die beiden Nodes gegenseitig oder noch eine zentrale IP-Adresse z.B. das Gateway des entfernen Netzwerkes?

Ich kenne in Heartbeat im Zusammenhang mit einer Cluster IP-Adresse.
Mit dem Xen weiß ich nicht so recht.....

Ich bin mir nicht ganz sicher, ob es mit einem der folgenden Punkte zusammenhängt...

Als Stonith-Agenten nutze ich external/riloe
Diesbezüglich habe ich folgenden Hinweis.....
http://lists.linux-ha.org/pipermail/linux-ha/2007-August/027300.html

oder ob es was mit dem CRM zu tun hat...
http://www.drbd.org/users-guide/s-xen-heartbeat.html

Für Xen gibt es auch einen speziellen Agenten Namens "Xen"....

Vielleicht hilft das ein stückchen weiter....
http://www.pro-linux.de/NB3/artikel/2/1143/1,projekt-virtueller-hochverfuegbarer-linux-server-teil-5.html