PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Raid5 Controller streikt und lässt sich nicht mehr einbinden



Carcass
10.06.05, 00:19
hallo
hab heute irgendwie mist gebaut, hab mit der raid-konfigurationssoftware ein bissel rumgespielt und dabei scheinbar irgend etwas falsch gemacht, weil mein raid-controller (Promise FastTrak SX4000 im RAID 5 modus mit 4 platten) nach neustart nicht mehr gemountet werden kann, weil die partitionstabelle nicht mehr gelesen werden kann.
ich glaub ich bin ausversehen auf "Migrate Array" gekommen, aber hab sofort abgebrochen, danach hat sich der server mehr oder weniger aufgehangen, nix ging mehr, dann hab ich eben neugestartet...

wenn ich das kernelmodul für den controller lade kommt:


SCSI subsystem driver Revision: 1.00
Promise FastTrak SX4000 Linux Driver Version 1.01.00.58 (8.Sep.2004)
FastTrak: Installed FastTrak SX4000 Local DIMM - 128MB..
scsi0 : FastTrak SX4000
FastTrak| 1|4131|Error|Array 1, Status Offline
FastTrak| 2|4131|Error|Array 1, Status Offline
Vendor: Model: ! À¤pÁ Rev:
Type: Direct-Access ANSI SCSI revision: 00
Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
sda : READ CAPACITY failed.
sda : status = 0, message = 00, host = 4, driver = 25
sda : sense not available.
sda : block size assumed to be 512 bytes, disk size 1GB.
sda:SCSI disk error : host 0 channel 0 id 0 lun 0 return code = 25040000
I/O error: dev 08:00, sector 0
SCSI disk error : host 0 channel 0 id 0 lun 0 return code = 25040000
I/O error: dev 08:00, sector 2
SCSI disk error : host 0 channel 0 id 0 lun 0 return code = 25040000
I/O error: dev 08:00, sector 4
SCSI disk error : host 0 channel 0 id 0 lun 0 return code = 25040000
I/O error: dev 08:00, sector 6
SCSI disk error : host 0 channel 0 id 0 lun 0 return code = 25040000
I/O error: dev 08:00, sector 0
SCSI disk error : host 0 channel 0 id 0 lun 0 return code = 25040000
I/O error: dev 08:00, sector 2
SCSI disk error : host 0 channel 0 id 0 lun 0 return code = 25040000
I/O error: dev 08:00, sector 4
SCSI disk error : host 0 channel 0 id 0 lun 0 return code = 25040000
I/O error: dev 08:00, sector 6
unable to read partition table


oh man, ich weiss nicht mehr weiter! mit der beiliegenden software "sxcslapp" sehe ich aber noch die konfiguration und den zustand des array's, aber bei status steht "Offline".
ich bring das ding jedenfalls nimmer zum laufen... das lief jetzt schon seit fast 2 jahren, ohne daran einmal rum zu fummeln.
bitte bitte kann mir jemand helfen, es kann doch nicht sein, dass über 400 GB unwiederbringlich verloren sind? :-(

danke schonmal im vorraus

gruss, phil

Carcass
10.06.05, 16:35
update: hab von nem sachkundigen kumpel gehört, dass "migrate array" dazu dient, ein raid system in einen cluster einzubinden und demnach die partitionstabelle umschreibt... und damit scheint der controller schon begonnen zu haben, als ich abgebrochen bzw. neugestartet habe.
nun gehe ich jedenfalls davon aus, dass die partitionstabelle kaputt ist.
wie gehe ich nun vor um diese zu rekonstruieren oder eine neue zu schreiben??
funktioniert es, wenn ich die definition des array's auflöse und gleich wieder die gleiche aufsetze, damit der controller mit hilfe der redudanten daten eine neue partitionstabelle schreibt??

Carcass
12.06.05, 22:22
*schieb*
hat denn wirklich keiner ne ahnung, was man in diesem fall machen könnte??
ich bin wirklich ratlos im moment...
also einen mechanischen oder elektrischen schaden der platten und des controllers schließe ich aus, aber die partitionstabelle könnte kaputt sein, nur wie gehe ich dann vor, wenn jedes rescue-programm a'la testdisk oder (g)parted zum absturz des systems führt, wenn auf das raid-device zugegriffen wird?
bitte bitte gibt mir doch jemand nen tipp :(

Carcass
14.06.05, 16:42
PROBLEM GELÖST!
hab den wagemutigen schritt gewagt und die raid-definition gelöscht und identisch neu-erstellt, nachm hochfahren war alles beim alten...
naja, das dateisystem hat scheinbar doch ein bissel was abbekommen, da ich ab und zu fehlermeldungen bekomme, das nen fehler im dateisystem aufgetreten ist:


Jun 14 17:46:30 server kernel: is_tree_node: node level 2442 does not match to the expected one 1
Jun 14 17:46:30 server kernel: vs-5150: search_by_key: invalid format found in block 720648. Fsck?
Jun 14 17:46:30 server kernel: vs-13070: reiserfs_read_inode2: i/o failure occurred trying to find stat data of [1333 85304 0x0 SD]
Jun 14 17:46:30 server kernel: is_tree_node: node level 58861 does not match to the expected one 1
Jun 14 17:46:30 server kernel: vs-5150: search_by_key: invalid format found in block 30044. Fsck?
Jun 14 17:46:30 server kernel: vs-13070: reiserfs_read_inode2: i/o failure occurred trying to find stat data of [1333 82545 0x0 SD]


naja, werd ich schon noch hinkriegen ...

*juchuuuu*