sslug-teknik team mailing list archive
-
sslug-teknik team
-
Mailing list archive
-
Message #93254
Gigabit Nightmare
Jeg købte nye maskiner og de kom med gigabit netværk, så jeg valgte at
opgraderer til en gigabit switch, med jumbo frame support.
Jeg tror det hele har intil flere fejl, for jeg kan ikke rigtigt finde
hoved og hale i det og historien bliver noget rodet når jeg skal forsøge
at beskrive det.
Det virker bare ikke så godt. Der er forbindelse igennem, flood pings
kan klare en vær pakke størrelse og test op til 100K pakker uden fejl.
Serveren køre NFS og Samba og et stykke tid virkede det meste meget
godt, det virkede som om de hurtigere server diske var i stand til at
leverer data hurtigere end de diske der var i maskinerne lokalt, men
måske det var opstarts held, for med tiden gik pusten ligesom af netværket.
Den nye server var noget underlig fra starten af, den havde en del pakke
tab, men kun i en periode efter en genstart. Derefter forsvant pakke
tabet. Den kørte i ca 190 dage uden genstart, hvor det virkede som om
tingende fungerede. (Pga. fejlen skiftede jeg ikke helt over fra den
gamle server, men fortsatte med at havde begge kørende, hvis jeg nu fik
et "clue" og skulle skifte hardware i den nye server)
Jeg købte også et Intel 1000/Pro GT kort for at opdatere gammelt udstyr
og installerede det i maskinen, men jeg kunne ikke få det til at virke.
Det nægtede at lave en forbindelse til switchen, så jeg fik aldrig noget
link og måtte til sidst opgive at få det til at virke.
Til sidst efter jeg stadigvæk ikke var kommet nogen steder med mit syge
netværk smed jeg et old gammelt 3com 10 Mbit netværks kort i serveren og
havde pludselig en ekstrem synlig hastigheds forbedring når jeg gik på
nettet der bruger en squid cache på maskinen. NFS/Samba mistede
hastighed. Jeg smed så et 100 Mbit kort i maskinen, NFS/Samba er
hurtigere, men ikke den hastighed der var med 1 Gb, men jeg har en ret
mærkbar hastigheds forbedring af web adgang.
Da jeg ikke kunne finde noget jeg kunne sætte finger på for at sige, det
her er helt galt, så investerede jeg i fire diske for at eksperimentere
med raid0 af dem for at opnå den hastighed jeg syndes jeg manglede. Jeg
smed dem i en Linux Workstation og satte Samba op på den for at checke
hastigheden, men samba er stadigvæk sådan lidt halv syg. Nogen gange
virker det rigtigt godt, men så er der andre tidspunkter hvor der er et
eller andet galt. Så som at gå på en Windows boks og pakke en Linux
kerne source tree, og når maskinen skal skrive den nye fil på serveren,
så dør den med Windows - Forsinket skrivning mislykkedes.Når jeg checker
filen har den skrevet det meste af den, sådan lidt random hvornår den
stopper.
Windows kan godt være noget syg når den læser fra net drev, nogen gange
går det meget langsom, så alting ligesom hænger og der ikke sker noget.
Stadigvæk ingen fejl jeg kan se noget sted.
Jeg fik endelig et dumt lille netværks test program, der virker med
mange platforme, når jeg køre det på Linux maskiner så går det vist fint
nok, men den er helt gal med Windows, her er TCP noget sløv og jeg
mister op til 100% af pakkerne når jeg tester UDP. Ingen pakker bliver
mistet ved ICMP (ping).
Efter jeg har checket alting 117 gange opdager jeg at 3com datablad på
switchen taler om 1000Base-TX *ikke* 1000Base-T, som jeg har verificeret
netkortendene til at være. Når jeg checker forskelige sælger af
produktet i Danmark skriver de alle sammen det er en 1000Base-T switch,
så jeg er ikke sikker på jeg har nogen forklaring endnu. Er det en fejl
fra 3com's side, eller de Danske sælger har taget fejl? Giver det nogen
mening at netværket er sygt, men stadigvæk virker med 1 Gb, hvis det er
en TX switch og T kort?
Ikke at forglemme, hvis jeg pumper Jumbo Frames ud, så dør netværk
forbindelsen på den gamle server, som om jeg ikke havde nok problemer,
så alting køre uden jumbo frames. Jeg har siden lært at Jumbo er noget
rod og jeg ved faktisk ikke om nogen af 1 Gb kortene og switchen rent
faktisk kan sende med jumbo frames, men det dræbte den gamle servers
netværk forbindelse når de var aktive, så noget må det jo virke. (De
andre maskiner snakkede sammen.)
Linux til Linux NFS - Dårlig performance, men det fejler ikke.
(Formentlig fordi NFS ikke kan fejle).
Linux til Windows Samba - Dårlig performance og fejl, men jeg har smidt
rundt med 10 GB filer uden fejl også.
Både med 1 Gb og 100 Mb.
Squid Cache, ekstremt meget hurtigerer med lavere hastighed på netkort.
Vi snakker 30 sekunder om at vise en side, mod 1 sekund.
3com GigaBit 8 port Switch.
Intel PRO/1000 GT
nVidia Corporation MCP55 Ethernet (rev a2) (Server)
nVidia Corporation MCP55 Ethernet (rev a2) (En anden maskine, uden
problemer, men den snakker også dårligt når den er samba server)
Nvidia nForce Networking Controller aka Vitesse VSC8201 Gigabit Phy
Wireshark check af netværks trafik. Jeg har en hulens masse TCP checksum
fejl, men regner med det er checksum offloading, det undrer mig bare at
det ikke er 100% fejl, men mere sådan 50%, da jeg ikke kan se at
pakkerne bliver sent mere end en gang, så må det væld være checksum
offloading.
Med checksum offloading i TCP, så kan netværket jo være helt tosset uden
at jeg kan se det og da jeg bruger en switch er der ingen mugligheder
for at se trafik fra andre maskiner.
På et tidspunkt mens resten kørte meget godt forsvant netkortet i
Windows maskinen, men da bundkortet har to skiftede jeg over til det
andet, men da jeg kiggede på det igen og prøvede det første kort virkede
det igen. Så det er ærligt talt ved at være lidt for tosset.
Jeg har nu bestilt et andet bundkort til serveren og en anden switch,
som jeg har checket og genchecket og checket igen er en 1000Base-T
switch, men jeg har også sat hele netværket til at køre 100Mbit Full
Duplex og netværket er stadigvæk sygt.
Hvad er den her gamle joke med blink lys. Nu virker den, nu virker den
ikke, Nu virker den, etc.
Jeg er ikke hardware specialist, men jeg har arbejdet med IT siden jeg
var 9 år gammel, da min far byggede vores første EDB maskine omkring
1980, og fra starten af PC'eren (81) købte han en IBM PC, så har det
meste af mit liv været EDB, både som hobby og arbejds liv, men selv med
mine omkring 15 år med Linux er jeg ærligt talt sat til vægs af de
problemer jeg har her.
Jeg håber der er nogen der ved et eller andet der kan få alt det her til
at give mening. For det der skulle havde været mit bedste Linux år med
masser af hjemme legetøj er blevet et kæmpe mareridt. Til tider
overvejer jeg at smide det hele i skralde spanden.
Follow ups