21.10.06, 20:06

Hab da ein kleines Problem... Mein Linuxrechner hat heute plötzlich angefangen leicht zu "hängen". Das hängen wurde innerhalb von Sekunden schlimmer und schlimmer bis das System nach etwa 10 sekunden ganz eingefroren war. Da ich sowas nur von Windows kenne und nicht von Linux, dachte ich sofort an einen Hardwarefehler. Also Rechner neu gestartet und siehe da, eine Fehlermeldung von Grub , nämlich Error 17. Laut dem Net bedeutet das folgendes:

cannot mount selected partition, this error is returned if the partition requested exist, but the filesystem cannot be recognized by GRUB.

Was ist da passiert? Warum auf einmal? Die Platte ist jedenfalls nciht kaputt und die Partition da. Schreibe gerade von Knoppix aus. Knoppix brauchte zwar 3 min um die Platte zu mounten, aber die Daten sind alle da...

Bitte um Rat...

21.10.06, 20:36
Das Problem hatte ich auch mal. Bei mir hieß damals die Diagnose: Festplatte kaputt.
Vielleicht helfen dir ja folgende Themen weiter:

Bei mir war es damals übrigens genauso: Zuerst wurde das System immer langsamer und stockender, bis es irgendwann komplett eingefroren ist.

Ich wünsche dir viel Glück.

21.10.06, 21:06
danke für die links (war bissle suchfaul muss ich zugeben :rolleyes: )...
Das lustige ist: Ich bin wieder in meinem system drin!
Einfach mal Rechner neu gestarte und jetzt geht es wieder :ugly:
Ist meine Platte langsam am abschmieren? Als ich in knoppix drin war, wollte Knoppix die Platte nicht beim ersten mal mounten, es gab eine Fehlermeldung.
Erst beim dritten Anlauf hats geklappt. Kann es ein Wackelkontakt sein?
Weiss aus eigene Erfahrung wie mysteriös Wackelkontakte sein können :eek:

21.10.06, 21:08
Digedag1 zustimmend: Sichere Deine Daten schnellstmöglich. Mit dd_rescue z.B., das bei Knoppix und Konsorten verfügbar ist.

Danach sind fsck, testdisk, smartctl und das Prüftool des HD-Herstellers Dein Freund.


21.10.06, 22:07
Ok, hab jetzt direkt aus meinem "wieder funktionierenden" System meine Daten und Configs gesichert. Bei dem Kopiervorgang (ca. 8 gb) ist mir jedoch was aufgefallen...
Die Transferrate schwankte stark zwischen 8mb/s und lange Phasen von nur 100-200 kb/s , auch bei großen Dateien >500mb. Kann mich nicht erinnern früher sowas gehabt zu haben. Das könnte doch ein Anzeichen sein, dass bestimmte Bereiche nicht gut gelesen werden können und die Fehlerkorrektur fleißig am arbeiten ist, oder?

21.10.06, 22:17
Siehe oben. Habe in der Aufzählung der Prüftools leider "badblocks" vergessen, sry.

Laß die gesamte Prüfarmada einfach mal auf die Platte los und beobachte. Trauen würde ich ihr aber so oder so nicht mehr...


22.10.06, 13:19
sorry, der thread ist jetzt so ziemlich in Richtung Hardware mutiert...
Mit badlocks habe ich ein einziges mal ein paar fehlerhafte Blöcke gefunden, nach weiteren Durchläufen jedoch nicht mehr.

Es gibt jedoch einige Fehler:

Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 628 occurred at disk power-on lifetime: 10780 hours (449 days + 4 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
40 59 08 f1 ef 66 eb Error: UNC at LBA = 0x0b66eff1 = 191295473

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
20 00 08 f1 ef 66 eb 08 00:14:14.336 READ SECTOR(S)
20 00 08 f1 ef 62 eb 08 00:14:14.320 READ SECTOR(S)
20 00 08 f1 ef 5e eb 08 00:14:14.320 READ SECTOR(S)
20 00 08 f1 ef 5a eb 08 00:14:14.304 READ SECTOR(S)
20 00 08 f1 ef 56 eb 08 00:14:13.376 READ SECTOR(S)

Error 627 occurred at disk power-on lifetime: 10780 hours (449 days + 4 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
40 59 08 f1 ef 56 eb Error: UNC at LBA = 0x0b56eff1 = 190246897

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
20 00 08 f1 ef 56 eb 08 00:14:13.376 READ SECTOR(S)
20 00 08 79 f0 52 eb 08 00:14:13.376 READ SECTOR(S)
20 00 08 71 f0 52 eb 08 00:14:13.376 READ SECTOR(S)
20 00 01 71 f0 52 eb 08 00:14:13.376 READ SECTOR(S)
20 00 01 01 f0 52 eb 08 00:14:13.376 READ SECTOR(S)

Error 626 occurred at disk power-on lifetime: 10780 hours (449 days + 4 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
40 59 08 f1 ef 4a ee Error: UNC at LBA = 0x0e4aeff1 = 239792113

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
20 00 08 f1 ef 4a ee 08 00:13:08.752 READ SECTOR(S)
20 00 08 f1 ef 4a ee 08 00:13:06.592 READ SECTOR(S)
20 00 08 f1 ef 46 ee 08 00:13:06.592 READ SECTOR(S)
20 00 08 f1 ef 42 ee 08 00:13:06.576 READ SECTOR(S)
20 00 08 f1 ef 3e ee 08 00:13:06.576 READ SECTOR(S)

Error 625 occurred at disk power-on lifetime: 10780 hours (449 days + 4 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
01 59 08 f1 ef 4a ee Error: AMNF at LBA = 0x0e4aeff1 = 239792113

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
20 00 08 f1 ef 4a ee 08 00:13:06.592 READ SECTOR(S)
20 00 08 f1 ef 46 ee 08 00:13:06.592 READ SECTOR(S)
20 00 08 f1 ef 42 ee 08 00:13:06.576 READ SECTOR(S)
20 00 08 f1 ef 3e ee 08 00:13:06.576 READ SECTOR(S)
20 00 08 f1 ef 3a ee 08 00:13:00.032 READ SECTOR(S)

Error 624 occurred at disk power-on lifetime: 10780 hours (449 days + 4 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
01 59 08 f1 ef 3a ee Error: AMNF at LBA = 0x0e3aeff1 = 238743537

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
20 00 08 f1 ef 3a ee 08 00:12:57.872 READ SECTOR(S)
20 00 08 f1 ef 36 ee 08 00:12:57.872 READ SECTOR(S)
20 00 08 f1 ef 32 ee 08 00:12:57.856 READ SECTOR(S)
20 00 08 f1 ef 2e ee 08 00:12:57.856 READ SECTOR(S)
20 00 08 f1 ef 2a ee 08 00:12:56.864 READ SECTOR(S)

Auch das hier macht mir Sorgen:

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Aborted by host 70% 10786 -
# 2 Extended offline Completed: read failure 10% 10785 190280251
# 3 Short offline Completed without error 00% 10784 -

Vor allem jedoch sticht ein Attribut ins Auge:

199 UDMA_CRC_Error_Count 0x0008 188 001 000 Old_age Offline - 380

klingt nach einem Kommunikationsfehler :confused:

Habe am gleichen Kabel eine andere viel ältere Platte mit schon kaputtem Lager hängen, diese jedoch hat nahezu Jungfräuliche Werte. Das einzige das da wieder hervorsticht ist das UDMA_CRC_ERROR_Count Attribut:

199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age Always - 138

Das klingt für mich immer mehr nach einem schlechten DMA Controller oder Kabel.
Warum jedoch ist meien zweite Festplatte im perfekten Zustand?