PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Speicherfehler bei fast allem



sirride
06.12.05, 15:05
hi
Seit neustem funktionieren bei meinen Debian (Kernel 2.4.27-1-386) X-tools nicht mehr.
Dies sind unter anderem:
sendmail
df
tar
smbmount
Diese bringen Speicherzugriffsfehler.
Der Syslog bringt meldet danach:

----
Dec 6 15:56:20 www kernel: printing eip:
Dec 6 15:56:20 www kernel: 58c01082
Dec 6 15:56:20 www kernel: Oops: 0002
Dec 6 15:56:20 www kernel: CPU: 0
Dec 6 15:56:20 www kernel: EIP: 0010:[<58c01082>] Not tainted
Dec 6 15:56:20 www kernel: EFLAGS: 00010293
Dec 6 15:56:20 www kernel: eax: 0000010c ebx: c223a000 ecx: 00000000 edx: 00000011
Dec 6 15:56:20 www kernel: esi: bffff3f0 edi: 4014c880 ebp: bffff3d8 esp: c223bfc0
Dec 6 15:56:20 www kernel: ds: 0018 es: 0018 ss: 0018
Dec 6 15:56:20 www kernel: Process df (pid: 2021, stackpage=c223b000)
Dec 6 15:56:20 www kernel: Stack: c0108267 08052318 00000054 bffff3f0 bffff3f0 4014c880 bffff3d8 ffffffda
Dec 6 15:56:20 www kernel: 0000002b 0000002b 0000010c 400e65c4 00000023 00000246 bffff380 0000002b
Dec 6 15:56:20 www kernel: Call Trace: [tracesys+31/35]
Dec 6 15:56:20 www kernel:
Dec 6 15:56:20 www kernel: Code: Bad EIP value.
Dec 6 16:01:33 www kernel: <1>Unable to handle kernel NULL pointer dereference at virtual address 0000010c
Dec 6 16:01:33 www kernel: printing eip:
Dec 6 16:01:33 www kernel: 58c01082
Dec 6 16:01:33 www kernel: Oops: 0002
Dec 6 16:01:33 www kernel: CPU: 0
Dec 6 16:01:33 www kernel: EIP: 0010:[<58c01082>] Not tainted
Dec 6 16:01:33 www kernel: EFLAGS: 00010293
Dec 6 16:01:33 www kernel: eax: 0000010c ebx: c206a000 ecx: 00000054 edx: 00000018
Dec 6 16:01:33 www kernel: esi: bffff400 edi: 4014c880 ebp: bffff3e8 esp: c206bfc0
Dec 6 16:01:33 www kernel: ds: 0018 es: 0018 ss: 0018
Dec 6 16:01:33 www kernel: Process df (pid: 2050, stackpage=c206b000)
Dec 6 16:01:33 www kernel: Stack: c01081fb 08052318 00000054 bffff400 bffff400 4014c880 bffff3e8 0000010c
Dec 6 16:01:33 www kernel: 0000002b 0000002b 0000010c 400e65c4 00000023 00000246 bffff390 0000002b
Dec 6 16:01:33 www kernel: Call Trace: [system_call+51/56]
Dec 6 16:01:33 www kernel:
Dec 6 16:01:33 www kernel: Code: Bad EIP value.

Was kann ich tun? Ich habe weder neue libs noch neue irgendwas installiert.
Apt-Get geht auch nicht mehr (da tar nicht funktioniert)

comrad
06.12.05, 15:31
Ich schätze mal, dein RAM is hin.

sirride
06.12.05, 15:36
Wieso?
Apache, MySql, Bind laufen tadellos
Auch wenn ich Mysql und Apache stoppe (und somit wieder reihenweise RAM freischaufle) hab ich diese Meldungen

Sidolin
06.12.05, 16:00
Na dann lass doch mal memtest86 laufen...

TPol
21.01.06, 17:36
Affen*******e, sein RAM ist nicht hin.

Hab nämlich seit heute Mittag daselbe Problem. aMule startet nicht wegen "Speicherzugriffsfehler", da kommt nicht nehr an Fehlermeldung zurück:

tpol@linux:~> amule
Speicherzugriffsfehler
Azureus nicht weil die JAVA VM abraucht wegen:


tpol@linux:~/azureus> ./azureus
Starting Azureus...
Loading Azureus:
/opt/jdk1.5.0_06/bin/java -Xms16m -Xmx128m -cp "/home/tpol/azureus/Azureus2.jar:/home/tpol/azureus/swt.jar" -Djava.library.path="/home/tpol/azureus" -Dazureus.install.path="/home/tpol/azureus" org.gudy.azureus2.ui.swt.Main ''
#"An unexpected error has been detected by HotSpot Virtual Machine:
#
# SIGSEGV (0xb) at pc=0x471262e7, pid=402, tid=1075275456
#
# Java VM: Java HotSpot(TM) Client VM (1.5.0_06-b05 mixed mode, sharing)
# Problematic frame:
# C [libfontconfig.so.1+0x132e7] FcFreeTypeCharIndex+0x17
#
# An error report file with more information is saved as hs_err_pid402.log
#
# If you would like to submit a bug report, please visit:
# http://java.sun.com/webapps/bugreport/crash.jsp"

Und Thunderbird gibt mir in der console folgendes zurück:

./run-mozilla.sh: line 131: 357 Speicherzugriffsfehler "$prog" ${1+"$@"}


ALLES Sachen die ich seit dem ich mit Linux unterwegs bin dauernd und immer im Einsatz hab und hatte. Der Rest vom System (Opera, YaST, OpenOffice) und was ich sonst noch so nutze, XMMS, amaroK, laufen tadellos...

Wo ist nun der Zusammenhang zwischen aMule, Azureus und Thunderbird? (jeweils neuste stabile NICHT Beta-Version)

Ich hab heute diverese Font-Pakete und Tools dazu installiert, wills nicht ausschliessen, aber ich denke mal die werden nicht die Ursache dafür sein.

Sidolin
21.01.06, 17:45
Da muss ich mich jetzt leider auch anschliessen, so Probleme hab ich leider auch. Tribal Trouble, amarok usw., grad eben hat sogar rm nur noch Segfaults produziert. (btw. nochmal danke Pieth :)) Leider ists sehr wahrscheinlich ein Hardwareproblem, da ich das auch unter windows, das ich mal testweise draufhatte hatte. Und nachdem ich die rm binary ausgetauscht hatte gings auch wieder ohne Segfault.
Der Ram ist nicht kaputt und ich hab auch sonst keine Ahnung, was falsch sein könnte...

Irgendwer Ideen?

Stephanw
21.01.06, 20:55
Also ich hab bisher auch nur die Erfahrung gemacht, das ein Hardwarefehler vorlag, wenn der Kernel sogar ein Prozessorregisterabbild ausspuckt.

Vor kurzem erst war ein SATA-Stecker kaputt und das System lief total unzuverlässig, aber unter Windows traten natürlich auch ne Menge Fehlfunktionen auf.

In deinem Fall würde ich erstmal n "format c:" machen und dann mal sehen. Wenn die Fehler immer noch auftreten weisste ja worans liegt...

Gruß Stephan

PS: Warum rennt bei dir son alter Kernel?

TPol
22.01.06, 05:04
Danke fürs Gespräch...

sirride hat sich längst dünne gemacht oder sonst wie aus dem Staub gemacht... ich bin GERNE Luft, igrnorier mich ruhig... ;)

P.S.: Wenn ich Aufmerksamkeit erhaschen wollte hätte ich nen neuen Thread aufgemacht und nicht grossartig die SuFu missbraucht... ;)

Stephanw
22.01.06, 11:52
@TPol:

Was ist denn mit dir los? Du schreibst, was bei dir auf einmal nicht mehr funktioniert. Was sollen wir dazu sagen? Hat das irgendwas mit srrides Problem zu tun?

Vielleicht wäre es angebracht einen Lösungsvorschlag zu geben anstatt hier son Müll zu schreiben.

alterpinguin
22.01.06, 12:33
solange noch ein Internetbrowser (firefox?) funktioniert, bitte einmal die Suche bei google.de Bereich groups ausprobieren und dann mit den gefundenen Hinweisen vergleichen. Da gibt es Hinweise die reichen vom Kernel bis hin zur Hardware und auch deutliche Hinweise, daß es ein Fehler sein kann, der nur bei bestimmten Belastungen auftritt. Solange nicht überprüft wird, was tatsächlich noch funktionert, solange ist aber alles reine Spekulation und die Aussage ging bis Gestern ist solange wirklich nichtssagend, solange zwischen Gestern und Heute keine Unterschiede festgestellt werden können (Unterschiede, was hat sich geändert?). Denn dann bleibt nur der ganz normale Alterungsprozess der Hardware übrig!
-
somit bleibt: zuerst Testen was überhaupt noch funktioniert - und die Ergebnisse mit alten Tests vergleichen. Gibt es KEINE Vergleichswerte, dann eben den Rechner auf -Herz und Nieren- testen. D.h. aber auch mit einer anderen Software als der gerade installierten - dazu gibt es dann verschiedene Live-CDs angefangen bei Knoppix bis zu .... - was das Herz begehrt.

TPol
22.01.06, 18:30
unbelievable

Alle Programme lassen sich aus der Console mit dem Benutzer "root" starten...

Es liegt daran dass "irgendwas" installiert wurde worauf der "user" anscheinend keinen zugriff hat... Meine mich zu entsinnen dass allen drei Programmen gemeinsam ist dass sie auf GTK aufgesetzt sind oder so...
Aber wieso funktioniert denn der OPERA 8.51, der ja auch auf GTK aufsetzt?

ThorstenHirsch
22.01.06, 18:38
Ist das die statisch gelinkte Version von Opera? Dann kommt ein eigenes gtk mit.

Speicherzugriffsfehler kann leider so ziemlich alles sein. Angefangen mit CPU/RAM/Motherboard hinüber bis hin zu nem Update einer lib ohne passendes Update der daran gelinkten Programme und auch unterschiedliche gcc/glibc-Versionen beim Kompilieren der verschiedenen Pakete kommen in Frage.

Stephanw
23.01.06, 09:40
Hi,

also das die Hardware betroffen ist, kann natürlich bei einem solcher Fehler der Fall sein. Was aber in genau diesem Fall dagegen spricht, ist, das der Fehler nicht überall auftritt. Ein Hardwaredefekt ist daher eher unwahrscheinlich.

Dass das Problem z.B. bei einer lib liegt, ist schon eher wahrscheinlich. Ich hatte deshalb ja geschrieben, das ich persönlich bei einem solchen Problem ein "format c:" machen würde.

Vielleicht wäre es aber interessant, ob man vielleicht eine gemeinsame Stelle finden kann, wo alle Programme den sigsegv verursachen.

Ich würde mal ein "strace -o log <Programmname>" probieren und dann die "log" untersuchen, um herauszufinden, an welcher Stelle das jeweilige Programm abnippelt. In TPol´s Fall wäre natürlich besonders interessant, die jeweilige Stelle, wo das Programm abbricht zu untersuchen, wenn man es als root startet.

Gruß Stephan

fuffy
23.01.06, 09:57
Hi!


Aber wieso funktioniert denn der OPERA 8.51, der ja auch auf GTK aufsetzt?
Opera verwendet Qt.

Gruß
fuffy

TPol
23.01.06, 11:20
@fuffy:
Achso, wieder dazugelernt.

@Stephanw:

10245 pts/2 Sl+ 214:41 amule
.
.
14408 pts/6 Sl+ 1:28 ./thunderbird-bin


Die beiden Programme laufen schon fast wieder einen ganzen Tag, wohlgemerkt als "root" in der Console gestartet. Als "user" (tpol) starten die erst garnicht. Azureus lässt sich als "root" auch starten und läuft durch...
Im Attachement hab ich mal den "strace -o log ./azureus" ausgeführt als "user" eingehangen.
Anbei noch den errorlog von der VM.

Ergänzung wegen Thunderbird:
(siehe Anhang)

TPol
29.01.06, 12:58
Nach dem letzten DICKEN Update bei Gnome unter SuSE 10. Der hat sich gestern bei mir, obwohl immer aktuell gehalten, satte 900MB an Updates besaugt bei mir, dass waren fast ausschliesslich GNOME Sachen....

Ehem ja, wollt nur bescheid geben dass wieder alles ordentlich in Ordnung funktioniert und die Progs wieder als "user" genutzt und gestartet werden können.