PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : allgemeines zu ha-cluster



theWireless
24.08.04, 10:06
hab hier mal bissi im Forum gestöbert (mir war langweilig) und stieß dabei auf einige Freds zum Thema HA-Cluster mittels DBRD und Heartbeat. Ich habe mir dazu auch das Linuxmagazin 07/04 durchgelesen, wo ja ein großer Bericht steht.
Eines ist mir jedoch nicht ganz klar:
In dem Artikel ham sie eine extra Leitung mit einer 2. NIC im Sys zum Syncen der Daten und zur Überwachung genommen. Was ist nun aber, wenn z.B. eine dieser Karten ausfallen würde, der Rest aber in Takt wäre? Dann würde der 2. Knoten (also der Secondary-Server) ja annehmen, dass der 1. Knoten tot wäre (was er ja aber nicht ist) und ebenfalls an springen, was dann ja zu nem IP-Konflikt käme, oder nicht? Oder habe ich hier irgendwo nen Denkfehler? Was für Auswirkungen hätte ein solches Szenario?

Dewitt
24.08.04, 21:19
In dem Artikel ham sie eine extra Leitung mit einer 2. NIC im Sys zum Syncen der Daten und zur Überwachung genommen. Was ist nun aber, wenn z.B. eine dieser Karten ausfallen würde, der Rest aber in Takt wäre? Dann würde der 2. Knoten (also der Secondary-Server) ja annehmen, dass der 1. Knoten tot wäre (was er ja aber nicht ist) und ebenfalls an springen, was dann ja zu nem IP-Konflikt käme, oder nicht? Oder habe ich hier irgendwo nen Denkfehler? Was für Auswirkungen hätte ein solches Szenario?

Hi.

Ja. Wir haben hier auch einen Loadbalancer, der "eigentlich" über ein Serielles Kabel und ein Ethernet Kabel verbunden sein sollten. Aber da wir kein sooo langes Serielles Kabel haben, sind die beiden loadbalancer nur über Ethernet verbunden.

Nun hatten wir hier im Netzwerk irgendwelche Traffic Probleme und node1 (active) war für node2 (standby) nicht mehr erreichbar. Also wechselte node2 into the active mode. Darum hatten wir IP Konflikte und Netzwerk war so gut wie tot. :-/

Darum immer eine failback connection für die Heartbeat Verbindung einplanen. :)

Gruss,
Dennis

bla!zilla
25.08.04, 08:46
Wobei HA-Cluster normalerweise versuchen, beim Ausfall der Heartbeatleitung, die anderen Nodes im Cluster für das Public-Interface zu erreichen. Wenn das nicht klappt, wird halt über das Quorum geschaut wer gerade aktiv, welche Nodes noch da sind oder welche Nodes evtl. ihren Shutdown dort vermerkt haben. Das sind alle Rückfallebenen die verhindern sollen, dass es zu einer sog. Split-Brain Situation kommt.