← Back to team overview

sslug-teknik team mailing list archive

Re: Linux HA og failover

 

Hej Kim,

mange tak for dit svar. Desværre er der ikke installeret noget crm tool på
mine noder. Det fik mig dog til at søge lidt efter det med quorum og
majority rules.

Jeg fandt ud af at når man bygger sin /etc/cluster/cluster.conf fil med
kommandoen: ccs_tool create -2 mitcluster
sørger den automatisk for at indsætte en linie:
<cman expected_votes="1" two_node="1"/>
som gør at den burde kunne håndtere at der kun er "halvdelen" af noderne
tilbage. Det viste sig at mit problem er fencing.

Jeg havde ikke nogen form for fencing konfigureret og når clusteret ikke
kan sikre sig at den fejlede node ikke længere kan tilgå fælles resourcer,
så vil det ikke flytte resourcen.

Der findes flere forskellige fence agents, men de kræver aller en eller
anden form for speciel hardware og jeg har ikke kunne finde en agent som
jeg synes var brugbar.

Jeg har derfor lavet min egen fencing agent som egentlig bare er et
bash-script der returnere uden fejl. Når jeg konfigurere mit cluster til at
bruge denne fence agent kan jeg få failover til at fungere. Dette er dog
ikke optimalt da der så kan opstå "split brain" problemer.

Jeg har vedhæftet min cluster.conf fil.

Hvis der er nogen der kan komme med nogle forslag til hvordan jeg får
konfigureret fencing "rigtigt", hører jeg det gerne.

Med venlig hilsen
Jimmy Dansbo

On Tue, Feb 7, 2012 at 11:18 AM, Kim Jørgensen <getsniped@xxxxxxxxx> wrote:

> Hej.
>
> Jeg har ikke prikket til denne specifikke opsætning,
> men jeg har rodet en god del med corosync/heartbeat som den er baseret på.
>
> Der løb jeg ind i samme slags problem.
> Grunden til problemet opstod er at corosync virker ved at maskinerne
> stemmer om hvem der er off/online.
> Og når der kun er to maskiner og den ene forsvinder er der ikke nogen
> til at stemme med, og slet ikke at opnå et flertal, så den kan ikke
> skifte.
>
> For at tvinge den til at skifte alligevel deaktiverede jeg at den
> skulle opnå flertal. Siden har det virker fint.
> Jeg deaktivere den via kommandoen: crm configure property
> no-quorum-policy=ignore
>
> --
>  -Kim-
>
>
> 2012/1/31 Jimmy Dansbo <jimmy.dansbo@xxxxxxxxx>:
> > Hej,
> >
> > jeg har fulgt denne guide
> >
> http://olex.openlogic.com/wazi/2011/ensure-high-availability-with-centos-6-clustering/for
> > at sætte et HA cluster op på Centos 6.2
> >
> > Jeg har nu et cluster med 2 noder og en virtuel IP som kan flyttes
> imellem
> > noderne med clusvcadm tool'et.
> > Mit problem er at der ikke automatisk sker en failover af IP servicen
> hvis
> > den aktive node "forsvinder" (bliver powered off).
> >
> > Så vidt jeg kan se, skal jeg lave noget med failoverdomains, men efter at
> > have prøvet mig lidt frem står jeg stadig med samme problem.
> > Er der nogen der kan hjælpe med et eksempel på en cluster.conf der
> fungerer?
> >
> > På forhånd tak
> > Mvh.
> > Jimmy
>
>
>
> --
> Venlig hilsen
>  -Kim Jørgensen-
>
>
>


-- 
Just smile and wave, boys. Smile and wave.

http://dansbo.dk/smileandwave.mp3
http://space.dyndns.dk/smileandwave.mp3

Follow ups

References