PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Rechner freezed bei Belastung



PeKron
13.06.05, 13:30
Hallo,

komisches Problem:

Habe mir einen XP3200+ mit FSB400 geleistet. Diesen habe ich zusammen mit 2x512MB DDR-400 Dual Channel und 1x Kingston 256MB auf mein Board gepackt.

Meine alten Kernel wollten nicht mehr booten also habe ich einen neuen 2.6 gebaut, mit Knoppix und chroot. Das hat einwandfrei funktioniert, der rechner compilierte ca. 15 Minuten am Kernel und dann lief alles. Nun ist es so das wenn ich den unter Knoppix compilieren 2.6.11.11 Kernel boote und z.B firefox emerge der Rechner nach kurzer Zeit einfach stehenbleibt (bleibt an, Bild bleibt da, nix geht mehr). Erst dachte ich der Ram ist schrott. Also mit Memtest die 3 Module auf einmal geschafft und 2 Fehler gefunden, einen bei 259 und einen bei 54MB. Danach habe ich die Module einzeln mit Memtest getestet und keinen (!) Fehler gefunden.
Dann dachte ich an ein Hitzproblem. Im BIOS finde ich allerdings keine Option die besagt "gehe bei ueberschreiten von X° aus bzw. freez". Nachdem ich dann die sensoren irgendwie ans laufen gekriegt habe und dies waerend eines CPU-Lastigen Tests ueberpruefte kam ich zu dem Schlus das es KEIN Hitzeproblem sein sollte. Normaltemperatur ist 40° , bei Last geht es auf ~55.
Rechner freezte trotzdem.

Dann habe ich noch im Kernel die Option deaktiviert die die CPU Meldungen interpretiert und dementsprechend handelt (Ueberhitzung = shutdown etc...) aber auch das brachte nicht den gewuenschten Erfolg.

Was nun eigentlich jedem klar ist und ich mir auch dachte ist das der CPU schrott ist, besonders da eine Ecke am DIE angeknackst ist. ALLERDINGS wenn ich mit Knoppix boote kann ich lockerflockig rumcompilieren, auch paralell ohne das irgendwas passiert. 2x kernel compilieren hintereinander ohne den CPU runterzutakten bringt mit meinem Kernel nach ca. 60 Sekunden den sicheren Tod, Knoppix macht das ganze Kernel-compilieren 2x durch und laeuft immer noch rund.

Ich habe ja nun auch einen neuen Chipsatz, den nforce2 Ultr400. Die Hardware kenne ich noch nicht, und ich vorher auch noch Kernel 2.4 verwendete bin ich nun unsicher ob irgendwas inkompatibel ist? Hat irgendjemand eine Idee? Beim booten wird ausserdem "noapic" mit angegeben, habe gelesen das das einige Probleme gibt. Beim normalen Betrieb (Mail, Chatten, Surfen, etc... ) laeuft der Rechner ausserdem problemlos.

Im Anhang meine Kernel .config (2.6.11.11), falls das irgendwas hilft!

Hilfe!

Susu
13.06.05, 13:35
Schonmal die Elkos auf Deinem Board angeschaut? Vielleicht ist da was kurz vorm Platzen...

Susu

Nachtrag: Ist das eigentlich so schwer, "Rechner friert bei Belastung ein" zu schreiben?

PeKron
13.06.05, 13:46
Schonmal die Elkos auf Deinem Board angeschaut? Vielleicht ist da was kurz vorm Platzen...

Susu

Nachtrag: Ist das eigentlich so schwer, "Rechner friert bei Belastung ein" zu schreiben?


Hi,

board ist nagelneu.
Der Kuehler (Coolermaster HHC-001) drueckt zwar ein bisschen an einen Kondensator, aber das duerfte es nicht sein, die haben ja immer etwas "spiel".

Aber: http://www.google.de/linux?hl=de&q=k7n2+freeze&btnG=Suche&meta=

Ka, wieso ich erst jetzt drauf komme das das ein nforce2 Problem sein koennte (habe nun mal den Titel entsprechend geaendert) aber anscheinend haben dutzende andere auch dieses Problem mit dem K7N2 (egal welcher Ausstattung). Einige reden von DMA, andere sagen die HD darf nicht auf Cable-Select sein, andere reden vom local-apic support.

Vielleicht doch eine auch hier bekannte Problematik?
Wuerde erklaeren wieso Knoppix im Failsafe keinerlei Probleme hat!

Gruß

alterpinguin
16.06.05, 09:48
daß das nicht zu einem Programmabsturz führen muß hängt meist mit der etwas anderen Speichernutzung des Programmes zusammen. Tritt Dein Problem denn auch mit nur einem Speicherriegel auf? Falls nicht, dann weißt Du dann, daß die Kombination der Speicherriegel mit dem Board, CPU, Takt und Zugriffszeit sich eben nicht verträgt. Nichts anderes hat auch der memtest deutlich gezeigt.
Und nur um etwaige Temperaturprobleme auszuschalten, Du hast den Rechner schon mal offen betrieben und mit einem Ventilator reingeblasen und er friert auch ein? Mit welchem einen Speicherriegel testen ?, natürlich mit dem besten.

PeKron
16.06.05, 11:42
daß das nicht zu einem Programmabsturz führen muß hängt meist mit der etwas anderen Speichernutzung des Programmes zusammen. Tritt Dein Problem denn auch mit nur einem Speicherriegel auf? Falls nicht, dann weißt Du dann, daß die Kombination der Speicherriegel mit dem Board, CPU, Takt und Zugriffszeit sich eben nicht verträgt. Nichts anderes hat auch der memtest deutlich gezeigt.
Und nur um etwaige Temperaturprobleme auszuschalten, Du hast den Rechner schon mal offen betrieben und mit einem Ventilator reingeblasen und er friert auch ein? Mit welchem einen Speicherriegel testen ?, natürlich mit dem besten.

Hi,

also am RAM sollte es nicht liegen.
Es sind 2x Infineon DDR333 512MB und ¹1x Kingston DDR333-512MB verbaut.
Habe alle einzeln mit Memtest gecheckt (keine Fehler) sowie auch zusammen (2 Fehler).
Natuerlich habe ich auch mit jedem einzelnen Modul gebootet und noch verschiedene Kombinationen ausprobiert (2 Module im Dual Channel Mode etc...)
Morgen kriege ich aber sowieso 2 neue Elixir DDR-400 Dual mit Heatspreadern, sollte dann ausgeschlossen sein.

Der CPU laeuft im Leerlauf auf ca

wks pekron # sensors |grep Temp
M/B Temp: +38°C (high = +32°C, hyst = +32°C) sensor = thermistor
CPU Temp: +46.0°C (high = +63°C, hyst = +60°C) sensor = PII/Celeron diode

Und bei Belastung auf maximal 55. Sollte aber kein Ding sein, habe schon CPUs mit 80 Grad am laufen gehabt.

habe den CPU auch mit Windows getestet. Windows installierte soweit ganz ok, dann bei einem CPU Test freezte der Rechner. Ist eigentlich eindeutig das der CPU schrott ist, nur dann frag ich mich wieso knoppix stundenlang rumcompilieren kann...

Gruß

ChandlerBing
16.06.05, 14:59
...nur dann frag ich mich wieso knoppix stundenlang rumcompilieren kann...
Vielleicht ein Problem um den Dunstkreis Festplatte?
Keine Ahnung, ob das wirklich sein kann, aber zumindest dürfte Knoppix (als einziges der von Dir getesteten Systeme) die Festplatte nicht in Betrieb haben.

alterpinguin
17.06.05, 08:55
habe den CPU auch mit Windows getestet. Windows installierte soweit ganz ok, dann bei einem CPU Test freezte der Rechner. Ist eigentlich eindeutig das der CPU schrott ist, nur dann frag ich mich wieso knoppix stundenlang rumcompilieren kann...

Gruß

Das scheinbare stehenbleiben eines Rechners (welcher läuft im Kreis? alle stehen) musst Du genauer Untersuchen. Wenn auf dem PCI-BUS was "hängen bleibt", sieht das ähnlich aus und es liegt nicht an den Speicherriegeln sondern an dem dafür zuzständigen Chipsatz+Karten. Einfachstes Beispiel ein Rechner "hängt sich sofort auf" (also schneid in ab), wenn mehr 3d-Leistung verlangt wird. Ein Austausch der Grafikkarte zeigt das Problem nicht mehr. Die gleiche Graka läuft aber in einem anderen Rechner problemlos (allerdings wg. langsamer CPU scheinbar auch nicht so stark belastet, oder ist es die AGP-Anbindung... etc.). Also Du mußt die einzelnen Komponenten sinnvoll testen und hast zumindest den Vorteil, daß Du mit der Knoppix Compilersession scheinbar einen Test hast der läuft. Preisfrage: Was testest Du damit? Hast Du Knoppix (zumindest das Image) von der Platte laufen, nur von CD, etc. etc.

PeKron
17.06.05, 09:00
Das scheinbare stehenbleiben eines Rechners (welcher läuft im Kreis? alle stehen) musst Du genauer Untersuchen. Wenn auf dem PCI-BUS was "hängen bleibt", sieht das ähnlich aus und es liegt nicht an den Speicherriegeln sondern an dem dafür zuzständigen Chipsatz+Karten. Einfachstes Beispiel ein Rechner "hängt sich sofort auf" (also schneid in ab), wenn mehr 3d-Leistung verlangt wird. Ein Austausch der Grafikkarte zeigt das Problem nicht mehr. Die gleiche Graka läuft aber in einem anderen Rechner problemlos (allerdings wg. langsamer CPU scheinbar auch nicht so stark belastet, oder ist es die AGP-Anbindung... etc.). Also Du mußt die einzelnen Komponenten sinnvoll testen und hast zumindest den Vorteil, daß Du mit der Knoppix Compilersession scheinbar einen Test hast der läuft. Preisfrage: Was testest Du damit? Hast Du Knoppix (zumindest das Image) von der Platte laufen, nur von CD, etc. etc.

Hi,

Knoppix nur von CD.
Als einzige Karte (!) Ist die Grafikkarte eingebaut.
Dazu kommen natuerlich noch die internen Sachen, Gbit Lan, Sound, USb+ Firewire.
Neulich hatte ich noch mal einen Dawicontrol U2W Controller eingebaut, aber da hat sich nix geandert.
Sollte also eigentlich kein IRQ Konflikt oder sowas sein.

Soll ich mal mein komplettes Dmesg posten? *G*

alterpinguin
17.06.05, 13:38
dann kannst Du auch den Knoppix Check der CD laufen lassen (sowas wie md5sum) und hast damit geprüft, daß unter Knoppix der Zugriff auf das CDRom funktioniert. Dann käme der nächste Schritt mit diesem Knoppix auch auf die HD zuzugreifen, z.B. das image rüberkopieren, dabei in Knoppix etwas Spielen (mit Soundausgabe) und wenn das Netzwerk mit anderem Rechner im Netz läuft einen Dauer-ping laufen lassen. Falls Internetanschluss vorhanden, natürlich auch dabei surfen, etc. Gibt der Rechner dann z.B. beim Plattenzugriff den Geist auf, dann weißt Du in welcher Richtung Du suchen musst, etc.
.
hast Du bei Knoppix dma beim Boot angegeben ? Standard bei Knoppix ist immer noch kein dma für Festplattenzugriffe.