PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Linux crasht dauernd



Takeshi
12.12.03, 02:22
Habe momentan ein SEHR instabiles Linux auf meinem Rechner. Da ich nicht weiss, wo ich den Fehler suchen muss, versuche ich mal alle Details zu beschreiben, die ich so weiss:
Mainboard: K7VTA3 (VIA)
512 MB RAM
250 GB Maxtor Festplatte (neu gekauft, nachdem ich das Problem schon mal hatte und dachte, dass es evtl. an ner defekten Platte hängen könnte)
60 GB Intel Festplatte
NVIDIA GeForce MX440 Grafikkarte
SuSE 9.0

So, jedesmal, wenn ich das Betriebssystem installiere, läuft alles. Dann geht es an die Routine-Installationen (Grafikkarten-Treiber, Installation von email-Clients). Irgendwann - mal bei der Installation von "MPLAYER", letztes Mal war es bei der Installation der "libdvdcss", kommt bei jeder Eingabe in dem Terminal der Fehlerhinweis "Speicherzugriffsfehler". Da ist im Prinzip alles schon gelaufen. Ich kann keine Programme mehr aufrufen, und runterfahren geht auch nicht mehr ganz, denn es steht da:
"skipped services in runlevel 6: reboot". Dann kommt beim Neustart der Fehler, den ich schon bei dem letzten Thread beschrieben habe:

http://www.linuxforen.de/forums/showthread.php?threadid=109600


hier nochmal kurz die Zusammenfassung der Fehlermeldungen:
Failed services in runlevel 5: alsalound postfix noscd hwscan
INIT: ID "1" respawning too fast: disabled for minutes
INIT: ID "2" respawning too fast: disabled for minutes
INIT: ID "3" respawning too fast: disabled for minutes
INIT: ID "4" respawning too fast: disabled for minutes
INIT: ID "5" respawning too fast: disabled for minutes
INIT: ID "6" respawning too fast: disabled for minutes
no more process left in this runlevel

Kann auch nicht mehr zwischen den Konsolen wechseln, so dass ich auch leider keine logs posten kann :-(
Kann es sein, dass ich mir einen Virus eingefangen habe?? Hab mir schon mal nen Virenkiller runtergeladen, den ich dann bei den nächsten Installation mit installiere, aber wird wohl nicht daran liegen. Habe nämlich alle Programme auf dem Rechner von den Homepages der Anbieter gesaugt - und die werden ja wohl keine Viren in ihren Programmen haben, oder???

echo
12.12.03, 05:49
hi,
virus scheint unwarscheinlich, da die anzahl von gefährlichen viren zu gering ist unter linux.
ich würde mal das ram in auge nehmen.
saug dir http://www.memtest86.com/ und probiere das mal in der maximalsten testfase. am besten zwei oder mehr durchgänge.

sollte das nichts bringen tackte den ram runter. im bios unter warte zyklen zu finden. erhöhe die zahl. probiere eine normale arbeit. sollte das auch nichts bringe. schau mal ob du nen ramriegel leihweise bekommmen kannst, der zu deiner maschiene passt. tritt der fehler erneut auf ists wohl nicht der ram.

cu

taylor
12.12.03, 06:36
Hast Du den aktuellsten SuSE Kernel laufen? Welche Version ist das?
Hast Du systemkritische Updates eingespielt?
Hast Du das System in irgendeiner Weise übertaktet?
Hast Du ein Hitzeproblem?
Hast Du den Speicher mit memtest86 überprüft?

HTH,
Taylor

George Mason
12.12.03, 07:27
RAM schon mal getauscht?

bla!zilla
12.12.03, 10:59
Irgendwas an den Rechten gedreht? Libs installiert oder deinstalliert? Speicherzugriffsfehler treten typischerweise bei fehlenden oder fehlerhaften Libs auf, oder bei fehlerhaften Rechten auf kritische Bereiche.

taylor
12.12.03, 11:19
Original geschrieben von blazilla
Speicherzugriffsfehler treten typischerweise bei (...) fehlerhaften Rechten auf kritische Bereiche.
Kannst Du mir erklären, wie das funktioniert? Von sowas hab ich noch nie gehört.

`kk
12.12.03, 11:48
Speicherfehler ? RAM natürlich...


tritt der fehler erneut auf ists wohl nicht der ram.

Es ist der RAM, was soll es sonst sein?? :ugly:

bla!zilla
12.12.03, 12:00
Speicherzugriffsfehler treten bei jedem OS mit Speicherschutz auf. Sobald ein Programm Code in einen Speicherbereich schreibt, der ihm nicht gehört, gibt es einen Speicherzugriffsfehler bzw. Segmentation fault. Sowas kann durch Programmierfehler in Librarys, fehlerhafte bzw. zueinander inkompatible Librarys sein, oder halt auch fehlerhafte Rechte. Für Speicherzugriffsfehler ist in den seltensten Fällen fehlerhafter RAM schuld!

Takeshi
12.12.03, 13:41
@ alle
Habe schon meinen Speicher mit memtest überprüft, sowohl mit der Version, die bei SuSE dabei war, als auch mit ner Version, die ich mir mal von Chip-online runtergezugen habe. Der RAM ist auf alle Fälle i.O.

@ Taylor
Habe den Kernel 2.4.21 laufen (der ist bei SuSE 9.0 dabei).
Habe mir aber den Treiber von NVIDIA gezogen, damit ich meinen 3d-Suport der Grafikkarte aktivieren kann - und der kompiliert ja im Kernel rum. Sollte aber auch nicht das Problem sein, da der Treiber an sich problemlos läuft.
Updates von SuSE habe ich mir noch nicht gezogen - davor gibt der Rechner meistens schon auf.
Übertaktet habe ich auch nichts - auch kein Hitzeproblem.

@blazilla
Nein, habe nichts an den Rechten geändert - wie gesagt: meistens schmiet der Rechner schon ab, wenn ich gerade meine Standard-Software installiere. Dann kann ich wieder von vorne beginnen: will heissen - SUSE-DVD rein - Installation ...

Takeshi
12.12.03, 14:18
Ach ja, Linux ist mir gerade wieder abgeschmiert...
Habe mit YAST "checkkonfig" installiert, dann in der Konsole "checkkonfig --help" eingegeben - und schon kam wieder "Speicherzugriffsfehler"!
Wenn ein Programm aber auf einen Speichersegment zugreift, auf das es nicht darf: ist dass ein Grund, warum das ganze Betriebssystem abstürzt. Und selbst wenn: der RAM ist doch bei einem Neustart leer - dann müsste ich ja das System ganz normal starten können!

George Mason
12.12.03, 14:22
Wie lange hat der Speichertest gedauert?

Takeshi
12.12.03, 14:43
Dauert so ca 30-35 min pro Durchlauf.
Habe den Test gestern so ca 2 Stunden laufen lassen - vor ca 2 Monaten habe ich aber den Test mal ne ganze Nacht gemacht. Alle Durchgänge hat der Speicher bestanden.
Aber wie gesagt: ich denke nicht, dass es am RAM liegt - sonst müsste ja nach einem Neustart alles wieder i.O sein - oder die Neuinstallation müsste Schwierigkeiten machen (war bei meinem anderen Rechner so, der ein defektes Speichermodul hatte).

echo
12.12.03, 15:02
hi,
ramfehler treten sporadisch und willkürlich auf!

wenn du zwei rigel drinn hast, nimm einen raus und fahr die kiste normal hoch. falste nicht zwei hast, leih dir einen von nem freund, bekanten oder ähnlichem.
auch solltest du die warte zyklen erhöhen. laut einem ct-test schreiben einige herstelle falsche einträge zu den zyklen, konfiguriere sie per hand in deinem bios.

andere frage, was war vor dem suse9 drauf??? suse8.x??? lief die stabil? ist seit dem update hardware verändert worden oder hardwareconfiguration verändert worden? wie haste das update gemacht, per neuistallation oder per update aus dem neuem suse?
von einem update würd ich bei suse immer abraten, lieber wichte configs sicher und neu installieren.

gruss

taylor
12.12.03, 15:03
Original geschrieben von blazilla
Sowas kann durch (...) fehlerhafte Rechte
Das hast Du schon geschrieben, aber halt nicht erklärt. :)

Hast Du vieleicht ein Beispiel? Ich kann mir so eine Situation nicht vorstellen.

Takeshi
13.12.03, 14:15
@echo
Vorher liefen SuSE 8.1 und 8.2 stabil drauf. Habe SuSE 9 per Neuinstallation draufgespielt. Keine neue Hardware, nix! Die sporadischen Speicherfehler sollten ja aber nach einem Neustart wieder weg sein, aber:
vielleicht habe ich es nicht explizit gesagt, aber ich muss Linux nach jedem Speicherzugriffsfehler NEU INSTALLIEREN!!!!!!
Egal wie lange ich dem Rechner dann auslasse - es kommt immer die o.g. Fehlermeldung beim Start, die ich nicht wieder wegbekomme!
Glaube deshalb nicht, dass es ein Speicher-Fehler ist. Ausserdem sollte Linux ja mit so einem Fehler umgehen können - kann ja schliesslich nicht sein, dass ein System total crasht und neu installiert werden muss, nur weil irgend jemand was in den Speicher schreiben will, was er nicht darf. So doof ist ja (glaube ich zumindest) nicht mal Windows. Das schmiert dann zwar mit nem Bluescreen ab, lässt sich dann aber wieder hochfahren.

George Mason
14.12.03, 12:22
Hast Du die Festplatte auch mal gecheckt?
Edit: ach ja, sorry!

wisnitom
14.12.03, 13:21
Original geschrieben von Takeshi
SuSE 9.0 - Irgendwann - mal bei der Installation von "MPLAYER", letztes Mal war es bei der Installation der "libdvdcss", kommt bei jeder Eingabe in dem Terminal der Fehlerhinweis "Speicherzugriffsfehler".
hi,

irgendwie verstehe ich nicht so ganz, was du an/mit dem System machst.
Was hast du denn installiert ?
Ein default SuSE9 System ? ... läuft das ?

MPlayer ? .. SuSE 9 enthält keinen Mplayer mehr, welche Pakete installlierst
du da rein .. ??

Speicherzugriffsfehler resultieren, wie hier schon erwähnt, oft daraus, das ein
Programm nicht sauber mit dem Kernel zusammenläuft und daher Speicherbereiche
überschrieben werden. Ein gutes Beispiel hierfür ist vmware .. hat man nicht die
richtige Version, kommt es relativ schnell zum Speicherzugriffsfehler..

grüsse,

floschuh
14.12.03, 13:35
Schonmal probiert die Ramtimings im BIOS umzustellen!!
Das war bei mir das Problem. Hatte nämlich die gleichen "Speicherzugriffsfehler".
Etzt läufts.:)

Kolonar
14.12.03, 15:06
Installierst du den NVidia Treiber immer gleich nach der Installation oder
stürzt er auch ohne diesen Treiber ab

Samba
14.12.03, 19:36
Kann es sein, dass die CD's gebrannt wurden oder per FTP installiert wurde?
Falls ja, lach ich mich mal wieder tot...sorry...einfach deshalb, weil man das als Erstes in Betracht ziehen sollte!

Takeshi
15.12.03, 09:56
@ Samba: nee, hab mir SuSE 9 original gekauft.

@ Kolonar: ich warte mit dem NVIDIA-Treiber i.d.R. immer etwas. Da bei mir die Speicherzugriffsfehler immer in unregelmäßigen Abständen kommen, habe ich den Treiber meistens (nicht immer) schon installiert.

@ floschuh: Nee, noch nicht gemacht.
1 Wie mache ich das und
2. was bewirkt das???

@ wisnitom:
Ich installiere bei mir
1 Kplayer
2. JRE 1.4.2
3. Xine + Videocodecs
4. Flashplayer

Die habe ich alle von den jeweiligen Homepages runtergeladen. Da sollten also keine Probleme auftauchen, v.a. weil es für die Programme normalerweise auch schon rpms für SuSE 9 gibt.

@ alle:
Habe gerade meine Festplatte ausgebaut und ausserdem Aethera (was ich sonst für meine emails verwende) nicht installiert. Seitdem (gestern abend) läuft alles.
Hat jemand von euch gehört, dass ne Terratec-Sounkarte bei Linux Probleme bereitet?
...obwohl ich eher auf Aethera tippe - hat da jemand die gleichen Erfahrungen gemacht???

PS: will mich noch nicht zu weit aus dem Fenster lehnen, denn es kann sein, dass der Computer in der nächsten Zeit wieder seinen Anfall kriegt...

floschuh
15.12.03, 13:36
Also das mit dem Ram funktioniert übers BIOS. Hoffe, du hast win AwardBios
Beim Booten auf DEL (bei mir is es DEL) drücken, und dann im BIOS nach
ADVANCED CHIPSETFEATURES suchen.
Und da drin muss dann irgendwas von RAM stehn. Kann sein, dass da auch was von DELAY oder so steht. WEiß ich etzt net so.

hinter diesem DELAY und den Einstellungen dannach musst du die Zahlen dahinter ändern.

Vermutlich steht bei dir sowas wie 2-2-2-auto
Das änderst du dann mal in 3-3-3-auto

Das, was da passiert, is ganz einfach, dass du dem Speicher eine länger "pause" zwischen den Zugriffen gönnst, wenn du auf 3-3-3 stellst.

Wenns net klar wird, einfach mal googlen, oder auf http://www.setiathope.de/Tips.htm
schaun.
Vielleicht steht auch was hier im Forum. War denk ich scho öfters mal thema.

echo
18.12.03, 05:08
nabend :-)
wenn du schon ein linux am laufen hattest, ist es unwarscheinlich dass ein hardwarefehler vorhanden ist, der mit linux ein problem macht. mein vorgehen:

- immernoch die speicher-warte-zyklen runterschrauben (hab ich glaub ich schon 2 mal erwähnt)
- neuste version von bios besorgen. (vorher vielleicht die doku dazu welzen)
- neuste version von anderen microcode (SCSI, gfx....)
- den suse-kernel schrotten und einen von kernel.org holen.
- im hardware/forum von suse mal rumstöbern.
- die pci-karten rausrupfen und ohne laufen lassen. einen tag mit arbeiten, dann eine pci-karte wieder dazustecken, danach die nächste. sollte dann irgenwann der pc wieder spinnen, diese karte in den verdacht nehmen ;) . nun die positionen der pci-karten tauschen (manche probleme treten nur in bestimmten slots auf).

ich tippe mal, dass es der suse-kernel ist. die hauen da seit kurzem immer wieder mal unstabielen code mit rein. könnte also dein problem betreffen.

hab ne terratec-soundkarte (xlerate), diese beinhaltet generell schlechte treiber. dass dadurch das system abschmiert ist mir aber noch nicht passiert :-)

Takeshi
18.12.03, 11:07
Danke für den Tip mit dem Kernel. Habe mir das auch schon gedacht, aber mich bisher nicht so getraut, einen neuen zu installieren. Habe eine Terratec-TV-Karte, aber an der liegt es auch nicht, da die bisher einwandfrei funktioniert hat - und ich bei allen Installationen die Karte nicht benutzt habe. Das mit den PCI-Karten habe ich schon gemacht - leider ohne Erfolg. Auch kann ich mit dem Rechner ohne Probleme arbeiten, solange ich nichts kompilieren möchte (was wieder auf den Kernel schliessen läßt).
Die einzige Hardware an der es sonst noch liegen könnte wäre das Mainboard.
Wie installiere ich ein neues BIOS (hab ich bis jetzt auch noch nicht gemacht, aber es gibt ja immer ein erstes Mal)
Werde auch gleich meine Speicher -Wartezyklen runterschrauben - hat das Auswirkungen auf die Performance???

echo
18.12.03, 17:16
hi,

Original geschrieben von Takeshi
Auch kann ich mit dem Rechner ohne Probleme arbeiten, solange ich nichts kompilieren möchte (was wieder auf den Kernel schliessen läßt).


hm, intressant, da würd ich eher den speicher und die cpu in verdacht nehmen. ist die cpu mal übertacktet gewesen? läuft sie zur zeit im richtigen tackt? was sagen die temperaturen?
beim compelieren wird die cpu ja sehr gefordert, was die temperatur ansteigen lässt.... auch werden viele cpu-zustände benutzt, die sonst kaum/gar nicht in benutzung sind.
beim compelieren wird auch viel ram verbraucht womit speicherbereiche benutzt werden, die sonst brach liegen, da keine software z.Z. RAM anfordert.....



Die einzige Hardware an der es sonst noch liegen könnte wäre das Mainboard.
Wie installiere ich ein neues BIOS (hab ich bis jetzt auch noch nicht gemacht, aber es gibt ja immer ein erstes Mal)


steht bei jedem mainboardhersteller im faq:
- DOS-DIskette erstellen (fals treiber benötigt (z.B.: SCSI) werden, gleich neuste mitsaugen und ins DOS miteinbinden)
- die flash-software und das neue bios auf ne andere diskette
- von dos-DISK booten
- nach dem hochfahren von DOS, diskette wechseln
- flash-software starten (unter umstenden mit parameter zum neuen bios)
- anweisungen folgen und ein backup, des alten machen.
- beim flashen betten, dass kein stromausfall kommt *g*



Werde auch gleich meine Speicher -Wartezyklen runterschrauben - hat das Auswirkungen auf die Performance???

ja hat es, aber gering.
es gibt dort 3 zahlen, die die warte-zyklen zwichen dem lese-, schreib-, und hab-ich-vergessen-vorgang :-)
steht dort eine 333 bedeutet dass, er waretet halt drei tackten befor er liest.....
möglich ist auch 222, 223, 233 und so weiter


cu

George Mason
19.12.03, 05:48
Das mit dem Lese-Schreib-habichvergessen ist natürlich Käse, aber im Prinzip hast Du Recht.
CAS-Latency, RAS-Precharge-Delay und RAS-to-CAS-Delay haben weniger mit Warten zwischen Lese-und-Schrebvorgang, als vielmehr mit Wechseln zwischen Spalten (Columns) und Zeilen (Rows) einer Speichermatrix zu tun.
OK, aber es sind Wartezyklen.

Takeshi
19.12.03, 18:37
@echo:
nee, habe keine meiner Komponenten jemals übertaktet (weder Grafikkarte, noch CPU, noch irgend was anderes).
Versuche das mal mit dem neuen Kernel und melde mich dann.
Glaube aber nicht, dass es an der Hardware liegt, denn ich habe ja nicht nur das Problem mit dem Crash, sondern dass sich das System dann nicht mehr starten lässt. Ich kann, nachdem die Meldung "Speicherzugriffsfehler" kommt auch noch "arbeiten", d.h. ich kann Programm schliessen, mich abmelden und den Rechner fast ganz runterfahren - nur dann kommt am Ende von runlevel 0 (oder 6) eben eine Fehlermeldung - und nichts geht mehr...
Bei einem Hardwarefehler ist es doch wohl eher so, dass das System abstürzt und ich es dann aber wieder hochfahren kann - eben das ist bei mir nicht der Fall!!

George Mason
20.12.03, 10:34
Original geschrieben von Takeshi
Bei einem Hardwarefehler ist es doch wohl eher so, dass das System abstürzt und ich es dann aber wieder hochfahren kann - eben das ist bei mir nicht der Fall!!

Sorry, aber diese Aussage kann ich überhaupt nicht nachvollziehen.

Takeshi
20.12.03, 14:20
Ich bin der Meinung, dass bei einem Hardwarefehler das System zwar abstürzt, sich dann vielleicht (in einigen Fällen) auch nicht mehr wieder starten lässt, ABER: ich kann das System dann ohne Probleme neu installieren, Knoppix von CD starten o.Ä. Deshalb bin ich der Meinung - obwohl ich mich irren kann - dass es eben kein Hardware-Problem ist. Habe mir deshalb mal den neuen Kernel (2.6.0) runtergezogen und kompiliert - was ohne Probleme möglich war (was auch wieder dagegenspricht, dass es ein Hardwareproblem ist, da mein Rechner so ca 30-40 min ohne Probleme kompiliert hat). Werde mal schauen, ob es damit die gleichen Probleme gibt. Muss dazu aber erstmal den Kernel richtig anpassen - was schwierig werden könnte, da ich davon nicht so die Ahnung habe...