sslug-teknik team mailing list archive
-
sslug-teknik team
-
Mailing list archive
-
Message #65488
raid problemer igen...
Hej sslug'ere
Jeg har nu igennem nogen tid levet med at 2 af mine 4 raid arrays kører i
degraded mode.
Sagen er, at jeg har 3 raid 5 arrays og et raid 0 array.
Jeg har 3 ide diske hver på 80 GB
Diskene sidder fysisk som hda, hde og hdg
raid 0 array'et bruger kun hde og hdg
Det raid 5 array som virker rigtigt kører (ligesom de 2 degradede) på alle
2 diske.
Jeg er ret sikker på at der ikke er fysiske fejl på de partitioner (hhv
hda6 og hda8) som bruges af de 2 degradede raid 5 arrays,
så jeg har prøvet at raidhotadde dem flere gange. Det går godt (omend det
tager lang tid) hver gang, men næste gang jeg booter
så kommer der en fejl om at partitionen er "unavailable" og den kører igen
de samme 2 arrays i degraded mode.
Så konstaterede jeg i går vha mdadm, at superblokken på både hda6 og hda8
sagde noget andet end på hhv hde6, hde8 og hdg6 og hdg8.
hde6 og hdg6's superblokke meldte ens informationer om array'et, det samme
gælder for hde8 og hdg8.
Så tænkte jeg at jeg nok bare skulle skrive failed-disk us for hda
partitionerne, boote og køre raidhotadd igen. Dette har før virket.
Jeg checkede superblokkene med mdadm og konstaterede at hda's superblok nu
var magen til hde og hdg's superblokke. (prøvede kun med
det ene raid pga tidsforbruget.)
Men næste boot gik som før, md: melder at hda8 (for eksempel) er
"unavailable" og fortsætter i degraded mode.
Jeg har googlet en del på forskellige søgeord taget fra /var/log/messages
og fundet mange rapporter om lignende fejl.
Men enten mener de, at fejlen skyldes scsi devices som ikke nødvendigvis
har samme device nummer for hver boot og kunne give ældre
versioner af raid-tools problemer eller også fandt jeg bare ud af at der
også var andre som havde haft problemet.
Min raid howto foreslår at jeg bruger failed-disk og kører mkraid --force
for at synkronisere superblokkene, men forfatteren skriver at
det er ensbetydende med destruktion af alle data hvis rækkefølgen af
devices i array'et ikke stemmer.
Så den løsning er jeg lidt nervøs ved.
Jeg kører mandrake 9.1 med standard kernen.
Det hele har virket før, men jeg har ifbm. opgradering fra mdk 8.2 til 9.1
rodet en del rundt inden jeg (næsten) fik det hele til at køre igen.
Er der nogen der kan hjælpe mig ?
Herunder har jeg indlagt min raidtab og relevante passager fra min
/var/log/messages :
raidtab:
raiddev /dev/md0
raid-level 5
chunk-size 64k
persistent-superblock 1
nr-raid-disks 3
device /dev/hdg6
raid-disk 1
device /dev/hde6
raid-disk 2
device /dev/hda6
raid-disk 0
raiddev /dev/md1
raid-level 5
chunk-size 64k
persistent-superblock 1
nr-raid-disks 3
device /dev/hdg8
raid-disk 0
device /dev/hde8
raid-disk 2
device /dev/hda8
failed-disk 1
raiddev /dev/md2
raid-level 5
chunk-size 64k
persistent-superblock 1
nr-raid-disks 3
device /dev/hda9
raid-disk 0
device /dev/hde9
raid-disk 1
device /dev/hdg9
raid-disk 2
raiddev /dev/md3
raid-level 0
chunk-size 64k
persistent-superblock 1
nr-raid-disks 2
device /dev/hde10
raid-disk 0
device /dev/hdg10
raid-disk 1
/var/log/messages :
Jul 22 09:17:48 videocrunch kernel: md: md0: sync done.
Jul 22 09:17:48 videocrunch kernel: RAID5 conf printout:
Jul 22 09:17:48 videocrunch kernel: --- rd:3 wd:2 fd:1
Jul 22 09:17:48 videocrunch kernel: disk 0, s:0, o:1, n:0 rd:0 us:1
dev:ide/host2/bus0/target0/lun0/part6
Jul 22 09:17:48 videocrunch kernel: disk 1, s:0, o:1, n:1 rd:1 us:1
dev:ide/host3/bus0/target0/lun0/part6
Jul 22 09:17:48 videocrunch kernel: disk 2, s:0, o:0, n:2 rd:2 us:1
dev:[dev 00:00]
Jul 22 09:17:48 videocrunch kernel: RAID5 conf printout:
Jul 22 09:17:48 videocrunch kernel: --- rd:3 wd:3 fd:0
Jul 22 09:17:48 videocrunch kernel: disk 0, s:0, o:1, n:0 rd:0 us:1
dev:ide/host2/bus0/target0/lun0/part6
Jul 22 09:17:48 videocrunch kernel: disk 1, s:0, o:1, n:1 rd:1 us:1
dev:ide/host3/bus0/target0/lun0/part6
Jul 22 09:17:48 videocrunch kernel: disk 2, s:0, o:1, n:2 rd:2 us:1
dev:ide/host0/bus0/target0/lun0/part6
Jul 22 09:17:48 videocrunch kernel: md: updating md0 RAID superblock on
device
Jul 22 09:17:48 videocrunch kernel: md: ide/host0/bus0/target0/lun0/part6
[events: 00000083]<6>(write) ide/host0/bus0/target0/lun0/part6's sb offset:
3068288
Jul 22 09:17:48 videocrunch kernel: md: ide/host2/bus0/target0/lun0/part6
[events: 00000083]<6>(write) ide/host2/bus0/target0/lun0/part6's sb offset:
3068224
Jul 22 09:17:48 videocrunch kernel: md: ide/host3/bus0/target0/lun0/part6
[events: 00000083]<6>(write) ide/host3/bus0/target0/lun0/part6's sb offset:
3068224
Jul 22 09:17:48 videocrunch kernel: md1: no spare disk to reconstruct
array! -- continuing in degraded mode
Jul 22 09:33:38 videocrunch syslogd 1.4.1: restart.
Jul 22 09:33:38 videocrunch kernel: klogd 1.4.1, log source = /proc/kmsg
started.
Jul 22 09:33:38 videocrunch kernel: Inspecting
/boot/System.map-2.4.21-0.13mdk
Jul 22 09:33:38 videocrunch partmon: Checking if partitions have enough
free diskspace:
Jul 22 09:33:38 videocrunch kernel: Loaded 19673 symbols from
/boot/System.map-2.4.21-0.13mdk.
Jul 22 09:33:38 videocrunch kernel: Symbols match kernel version 2.4.21.
Jul 22 09:33:38 videocrunch kernel: Loaded 463 symbols from 22 modules.
Jul 22 09:33:38 videocrunch kernel: ]
Jul 22 09:33:38 videocrunch kernel: [events: 0000002d]
Jul 22 09:33:38 videocrunch kernel: md: autorun ...
Jul 22 09:33:38 videocrunch kernel: md: considering
ide/host3/bus0/target0/lun0/part8 ...
Jul 22 09:33:38 videocrunch kernel: md: adding
ide/host3/bus0/target0/lun0/part8 ...
Jul 22 09:33:38 videocrunch kernel: md: adding
ide/host2/bus0/target0/lun0/part8 ...
Jul 22 09:33:38 videocrunch kernel: md: created md1
Jul 22 09:33:38 videocrunch kernel: md:
bind<ide/host2/bus0/target0/lun0/part8,1>
Jul 22 09:33:38 videocrunch kernel: md:
bind<ide/host3/bus0/target0/lun0/part8,2>
Jul 22 09:33:38 videocrunch kernel: md: running:
<ide/host3/bus0/target0/lun0/part8><ide/host2/bus0/target0/lun0/part8>
Jul 22 09:33:38 videocrunch kernel: md: ide/host3/bus0/target0/lun0/part8's
event counter: 0000002d
Jul 22 09:33:38 videocrunch kernel: md: ide/host2/bus0/target0/lun0/part8's
event counter: 0000002d
Jul 22 09:33:38 videocrunch kernel: kmod: failed to exec /sbin/modprobe -s
-k md-personality-4, errno = 2
Jul 22 09:33:38 videocrunch kernel: md: personality 4 is not loaded!
Jul 22 09:33:38 videocrunch kernel: md :do_md_run() returned -22
Jul 22 09:33:38 videocrunch kernel: md: md1 stopped.
Jul 22 09:33:38 videocrunch kernel: md:
unbind<ide/host3/bus0/target0/lun0/part8,1>
Jul 22 09:33:38 videocrunch kernel: md:
export_rdev(ide/host3/bus0/target0/lun0/part8)
Jul 22 09:33:38 videocrunch kernel: md:
unbind<ide/host2/bus0/target0/lun0/part8,0>
Jul 22 09:33:38 videocrunch kernel: md:
export_rdev(ide/host2/bus0/target0/lun0/part8)
Jul 22 09:33:38 videocrunch kernel: md: considering
ide/host3/bus0/target0/lun0/part6 ...
Jul 22 09:33:38 videocrunch kernel: md: adding
ide/host3/bus0/target0/lun0/part6 ...
Jul 22 09:33:38 videocrunch kernel: md: adding
ide/host2/bus0/target0/lun0/part6 ...
Jul 22 09:33:38 videocrunch kernel: md: created md0
Jul 22 09:33:38 videocrunch kernel: md:
bind<ide/host2/bus0/target0/lun0/part6,1>
Jul 22 09:33:38 videocrunch partmon: ^[[65G[^[[1;32m
Jul 22 09:33:38 videocrunch partmon:
Jul 22 09:33:38 videocrunch kernel: md:
bind<ide/host3/bus0/target0/lun0/part6,2>
Jul 22 09:33:38 videocrunch kernel: md: running:
<ide/host3/bus0/target0/lun0/part6><ide/host2/bus0/target0/lun0/part6>
Jul 22 09:33:38 videocrunch kernel: md: ide/host3/bus0/target0/lun0/part6's
event counter: 00000084
Jul 22 09:33:38 videocrunch kernel: md: ide/host2/bus0/target0/lun0/part6's
event counter: 00000084
Jul 22 09:33:38 videocrunch kernel: md0: former device
ide/host0/bus0/target0/lun0/part6 is unavailable, removing from array!
Jul 22 09:33:38 videocrunch kernel: kmod: failed to exec /sbin/modprobe -s
-k md-personality-4, errno = 2
Jul 22 09:33:38 videocrunch kernel: md: personality 4 is not loaded!
Jul 22 09:33:38 videocrunch kernel: md :do_md_run() returned -22
Jul 22 09:33:38 videocrunch kernel: md: md0 stopped.
Jul 22 09:33:38 videocrunch kernel: md:
unbind<ide/host3/bus0/target0/lun0/part6,1>
Jul 22 09:33:38 videocrunch kernel: md:
export_rdev(ide/host3/bus0/target0/lun0/part6)
Jul 22 09:33:38 videocrunch kernel: md:
unbind<ide/host2/bus0/target0/lun0/part6,0>
Jul 22 09:33:38 videocrunch kernel: md:
export_rdev(ide/host2/bus0/target0/lun0/part6)
Jul 22 09:33:38 videocrunch kernel: md: ... autorun DONE.
Mvh
Lars Olesen
B,Sc,E,E
DSP SW designer
Bang & Olufsen
Peter Bangs Vej 15
DK-7600 Struer
Denmark
Phone (+45) 96 84 4359
Fax (+45) 96 84 44 01
e-mail: lol@xxxxxxxxxxxxxxx