← Back to team overview

sslug-teknik team mailing list archive

Problem med harddisk - dma/crc fejl

 

På min hjemmeserver brokker den ene lagerdisk sig med følgende klagesang
(fra /var/log/kernel/warnings):

Apr 14 17:21:34 clinton kernel: hdg: dma_intr: status=0x51 { DriveReady
SeekComplete Error }
Apr 14 17:21:34 clinton kernel: hdg: dma_intr: error=0x84 { DriveStatusError
BadCRC }

-og disse to linjer gentages mange gange ved meget IO til disken. F.eks.
kommer de ca. 60-100 gange i løbet af <5 min. hvis jeg kører reiserfsck på
diskens ene partition. Når fejlene bliver for mange sætter kernen diskens
hastighed ned (og slår DMA fra) og så overfører den ca. 2-3 MB/s - hvilket
er uacceptabelt.

Maskinen er som følger:
Abit BE6-2 bundkort m. Pentium3 650 MHz og 256 MB PC133
2 x 15 GB IDE systemdiske i Raid 1 (sw raid) (master på IDE0+1)
Lager:
1 Promise ATA66 PCI kort m. 60 GB IBM 60GXP og 120 GB WD Caviar som hhv.
master og slave på IDE2 og Seagate 120 GB 7200.7 som master på IDE3.
Mandrake 9.2 m. standard kerne 2.4.22-28mdk.

Disken som volder problemer er Seagaten.

Jeg har prøvet at:
-sætte den på bundkortets Highpoint HPT366 controller
-slå Highpoint controlleren fra i BIOS
-sætte disken på et Promise ATA66 PCI kort
-sætte den på som eneste disk udover systemdiskene
-sætte den som master
-og som slave (begge via Cable Select)
-skifte 80-leder IDE kablerne ud med nye
-kontrollere disken med Seagates Seatools (melder alt OK)
-sætte disken til ATA66 (UDMA4) med Seagates UATA100 værktøj
-sætte disken/driveren til ATA66 med hdparm -d1 -X68

Og i alle tilfælde bliver problemet ved med at være der.

Der er absolut ingen bøvl med WD disken, som er samme størrelse, sidder på
samme controller(e), samme partitionering (en stor), samme filsystem
(Reiser FS).

Ind imellem crasher maskinen - ofte om natten ifm. kørslen af "makewhatis"
scriptet, som vist også genererer en masse disk-IO og jeg gætter
naturligvis på at det er fordi denne disk driller kernen tilpas meget. Dog
står der ingenting i logfilerne
(/var/log/messages, /var/log/syslog, /var/log/kernel/*).

Har i nogen forslag, evt. til hvad jeg kan gøre af debugging? Jeg kan se i
dmesg-bufferen når den brokker sig, og så kører jeg smartctl en gang i
døgnet for at holde øje med SMART-logfilerne, men ellers ved jeg ikke hvad
jeg skal gøre...

Jeg har naturligvis også googlet, og fundet flere med samme symptomer som
mine, men de er ofte løst med nye kabler el. en ombyttet disk - men
Seagates diagnosticeringsværktøj påstår at min disk er 100% OK.

Alle ideer er velkomne. :)
---
Mvh
Kenneth


Follow ups