On Tue, 29 Apr 2008 10:36:06 +0200, Jon Bendtsen wrote:
<snip>
Hvis jeg laver mange rsh'er (efter hinanden - kun een samtidig), så
bliver der efter noget tid (klient-side)
'poll: protocol failure in circuit setup'
men der er ikke nogen ændring i, hvordan strace viser det på
server-siden.
Måske problemet er på client siden?
Det tror jeg ikke.
Min test-kommando er til stadighed
time for i in `seq 1 600`; do echo $i ; rsh n004 true ; done
Hvis jeg eksekverer fra een node (n001) mod n004 (server),
så sker der fejl efter ca 500 kald (på 40 sek). Dette er
nogenlunde reproducerbart, selvom jeg det præcise tal
varierer en smule.
Hvis jeg kører samtidigt fra 2 klienter (n001+n002) op
mod n004, så sker der fejl efter ca 250 kald fra *hver*
klient (sammenlagt ca 500), men nu på ca 22 sek.
Hvis jeg kører samtidigt fra 3 klienter, så sker der fejl
efter ca 170 kald fra hver klient (sammenlagt igen ca 500),
men nu på ca 12 sek.
For mig ligner det helt sikkert et server-side problem.