← Back to team overview

sslug-teknik team mailing list archive

Re: Servernedbrud

 

On Thu, 14 Jul 2005 20:47:03 +0200
Ivar wrote:

> 
> Jeg prøvede at sende den en signal 9 (med top) men processen lever videre.
> Nu begynder jeg så at blive stædig:-) jeg troede at sende signal 9 ville få
> kernen til at kvæle processen, sådan hårdt og brutalt, og uden at spørge
> processen om den vil være med til det eller ej?
> Hvorfor kan den så leve videre efter at have fået sådan en?

Et signal er en bit i kernens procestabel, så hvis processen hænger
af en anden grund og ikke skal have CPU-tid, så dør den heller ikke
af en kill -9.

Det er faktisk et alvorligt problem, du kommer ind på, men altså,
til en anden tråd.

Et eksempel på en der "lever videre" efter kill -KILL er

Et program P (mysqldump eller copy eller tar - whatever) ønsker
at læse fil XXX som ligger på et NFS mounted filtræ.

Kernen har mounted NFS systemet uden option soft eller intr 

hard           If an NFS file operation has a major timeout then report
               "server not responding"  on  the  console  and  continue
               retrying indefinitely.  This is the default.

Når det er tilfældet vil program P ikke køre overhovedet mens
kernen prøver (uendeligt mange gange) at få fat i den døde
server. Grunden til denne måde at mounte NFS træer er at man så
bedre kan få gennemløbet alle transaktioner, så hvis man fx.
kører et kritisk job, og server YYY går ned, så venter hele
P bare pænt indtil Operatør Donald får sat server YYY op igen.

Kom nu ikke og sig at det er hjernedødt, dette system; det
***kan*** somme tider være en fordel hvis fx. transaktionerne er
ens løn og XXX indeholder nogle overtimer som helst ikke skal gå
tabt.


:-)

-- 
donald_j_axel donax snabela get2net.dk -- http://d-axel.dk/


References