w2kServer Software-RAID zerschossen & Systeminstabilität

Alle sonstigen Hardwareprobleme..

Moderators: Rio71, MOD-Team

Post Reply
User avatar
elector
Kongred fast mein Mutter
Posts: 25
Joined: 02.05.2009 - 00:42
Location: Hamburg

w2kServer Software-RAID zerschossen & Systeminstabilität

Post by elector »

Nach langer Zeit mal wieder ein Lebenszeichen von mir ...

Zunächst einmal die Vorgeschichte:

Ich wollte (warum auch immer) mich nicht mit einem Normalo-Mainstream PC abfinden und hab' mir stattdessen ein Dual-Sockel 940 Serverboard besorgt und darauf Windows 2000 Server installiert. Von Anfang an gab's Probleme (zahlreiche Bluescreens und Spontan-Abstürze); dachte zuerst an Treiber, weil ich viel mit instabilen Stereo-Combos herumexperimentieren musste. Habe aber letztendlich erkannt, dass irgendwo ein Hardwaredefekt sein muss und vermute ihn beim Mainboard (Manchmal kommt auch kein Bild hoch, weil der Rechner ständig neu bootet). Der Typ, der's mir (gebraucht) verkauft hat, meinte, bei ihm hätte es einwandfrei gelaufen. Naja ...
Dummerweise tritt der Fehler manchmal ganz lange nicht auf, dann aber wieder clusterweise, sodass man den PC praktisch gar nicht mehr hochkriegt. Irgendwie habe ich deshalb nie eine systematische Fehlersuche hinkriegen können; ich habe daher immer etwas halbherzig und intervallweise an der Eingrenzung des Fehlers gearbeitet, bin dann aber letztendlich an der Vielzahl der Komponenten und den damit verbundenen Fehlerursachen gescheitert (auch von der Motivation her). Wollte den PC eigentlich als Haupt-PC einsetzen, aber das Vertrauen ist weg - ein unzuverlässiger PC ist hierfür nicht (eigentlich für gar nichts!) zu gebrauchen.
Grotesk: Das Ding ist manchmal über Stunden Benchmarkstabil (CPU, Speicher & Co.), manchmal stürzt es dann wieder einfach mehr oder weniger im Leerlauf ab.

Was ich ausschließen kann:
- Treiber (er stürzt teilweise schon beim POST ab)
- Speicher (Memtest ohne Fehler)
- Grafikkarte (er ist bislang mit keiner absturzfrei gelaufen)
- CPUs (Primestabil)

Erweiterungskarte[n] (SCSI) und SATA-Festplatten dürften auch nicht das Problem sein. Es könnte mit dem IDE-Port zu tun haben, da der Bootvorgang ohne angeschlossenes CD/DVD-Laufwerk bisher klappt (waage Erinnerung!). Evtl. liegt's am Kabel - habe aber in der Richtung nicht weiter "geforscht".
Der Fehler scheint sehr temperatursensibel zu sein: Im Winter (kalte Umgebung) tritt er fast nie auf, im Sommer (an besonders heißen Tagen - Dachbodenzimmer!) gab's Zeiten, wo das Ding praktisch unbenutzbar war - abgestürzt im Minutentakt, teilweise gar nicht mehr aus dem Boot gekommen und man konnte nur noch ausschalten und auf einen besseren Tag warten ... aber selbst dafür kann ich meine Hand nicht ins Feuer legen - vielleicht lag's ja auch an anderen Dingen und ich konstruiere hier aus meiner waagen Erinnerung oder einem Zufall eine Tendenz.

Das war aber leider nicht das einzige Problem.
Durch die ganzen Abstürze war mein Software-RAID, was über die SATA-Ports lief, praktisch immer im Rebuild. Dazu kam noch, dass sich bei einer Platte CRC-Fehler im Übertragungsprotokoll gehäuft haben. Ich meine, dass diese Platte auch des öfteren ausgestiegen ist und dabei das System blockiert hat (Aufhänger). Mit der Masse an möglichen Fehlerquellen (Festplatte an sich, Einschubsystem, SATA-Kabel, SATA-Port, SATA-Treiber, RAID-Treiber (OS-nativ über MS Software-Funktionalität, daher eher unwahrscheinlich als Fehlerquelle)) war ich überfordert und habe eher unkoordiniert herumprobiert und kann leider mein Vorgehen auch nicht mehr genau rekonstruieren.
Auf jeden Fall ist mir in diesem Zuge das Missgeschick passiert, dass das RAID seine Integrität verloren hatte und ich dummerweise von der falschen Platte (der desintegrierten) ein Rebuild über die bis dahin noch intakte Platte gemacht habe. Dies habe ich zwar noch bemerkt und das Rebuild abgebrochen, da waren aber schon ein paar Prozent abgeschlossen und damit vmtl. ein Teil der Daten überschrieben. Mit Bordmitteln war es mir dann nicht mehr möglich, wieder ein intaktes Volume einzuhängen. Grundsätzlich scheint es auch ein Problem zu sein, wenn man die Ports der Platten vertauscht (was ich wg. der Fehlersuche gemacht habe). Vmtl. habe ich dadurch das RAID zunächst desintegriert, um es dann bei dem überstürzten Versuch der Wiederherstellung durch Unbedarftheit zu zerschießen!
Die meisten Daten dürften noch da sein und mit etwas Glück lassen sich die fehlenden von der desintegrierten Platte ergänzen. Aber: Wie mache ich das jetzt am Besten? Welche Datenrettungstools können gut mit MS Software RAID (1) umgehen und aus zwei desynchronen Platten, bei denen die Verzeichnis- & Partitionsstruktur teilweise nicht mehr intakt ist, das maximal mögliche an Daten und Verzeichnisstruktur des ursprünglichen Volumes wiederherstellen?
Eine professionelle Datenrettung mit Einschicken kommt für mich nicht infrage, da die Daten im Prinzip nicht (lebens)wichtig sind. Ich hätte sie aber schon gerne wieder, falls es mit überschaubarem Aufwand möglich wäre. Außerdem würde ich grundsätzlich gerne das Vorgehen und die entsprechenden Tools in der Hinterhand haben, falls es einmal wirklich nötig werden sollte.
Die Tools können ruhig etwas kosten, solange es keine "Enterprise-Preise" sind und die Erfolgsaussicht erheblich besser als mit frei erhältlichen ist.



Gruß vom immer noch PIII-S nutzenden

elector


PS.: Für Tipps zur Fehlersuche bzgl. der Systeminstabilität bin ich ebenfalls dankbar; ich lese mir auch gerne gut geschriebene Artikel oder anderweitige Literatur durch, sofern sie mir bei meinen Problemen helfen können.
konkretor
You dont know the power of the dark side
Posts: 1509
Joined: 01.10.2002 - 02:00
Location: aus dem Wald
Contact:

Post by konkretor »

schau dir mal das tool rstudio an damit kann man auch Software Raids retten

Du sollst nicht begehren deines nächsten Schnaps
:drink:
Tualatin never die
Hornet
Mutter von Admin
Posts: 350
Joined: 14.01.2005 - 21:55

Re: w2kServer Software-RAID zerschossen & Systeminstabilität

Post by Hornet »

Kommt jetzt ein bisschen spät... Aber für hört sich das nach Netzteil an.
Hatte ein recht ähnliches Verhalten bei einem meiner Rechner.
Hatte auch erst auf Temp getippt. Den Rechner dann beim kumpel in ein WaKü System eingebaut. Lief dort auch super.

Daheim wieder nur unstabil. Ich hatte damals das NT vom Vergängerrechner genutzt. Hatte viel zu viel Watt damals. Für die Zukunft hatte ich mal gedacht. Auf jeden Fall hab ich das Sys auch öfters nur in den Ruhemodus versetzt. Das hat den Elkos auf jeden Fall nicht so gut getan. War dann halt hin und liegt noch zu hause und wartet auf neue Elkos. Irgendwann mal.. Vielleicht..
Image
User avatar
Vortagh
OS/2 Antiquar
Posts: 4839
Joined: 01.07.2002 - 02:00
Location: Germanistan

Re: w2kServer Software-RAID zerschossen & Systeminstabilität

Post by Vortagh »

Könnte alles Mögliche sein:

Netzteil, wie erwähnt.
Kaputte Elkos auf dem Board.
CPU nicht richtig im Sockel - hatte ich gerade bei einem Kollegen, allerdings auf nem MC Board, keinem PC. Der hatte plötzlich lauter Compilerfehler, obwohl alles andere lief - weil ne CPU nicht richtig im Sockel saß....

Hört sich für mich auf jeden Fall nach einem Hardware Problem an. Hast du mal einfach alles rausgezogen was du nicht brauchst? Hier muss ich jetzt allerdings fragen, ob du den Fehler wirklich finden willst. Sowas kann man natürlich finden, aber es ist ein typisches "Stück für Stück ausbauen und dann gucken wann er auftritt"-Vorgehen. Entweder du willst es finden, oder du schmeisst den Scheiss weg (in meine Richtung, bitte) und lässt es. Aber rumraten und hier und da probieren, wird nur mit Glück helfen - und im Endeffekt ist die ganze Zeit, die man in eine unorganisierte Fehlersuche steckt, vergebens.


Was für ein RAID? Wenn's ein 5 oder 6 war, viel Spaß bei den Rebuild-Times, wenn es überhaupt noch irgendwas zu retten gibt.

'Lo, there do I see my father.
'Lo, there do I see My mother, and my sisters, and my brothers.
'Lo, there do I see The line of my people, back to the beginning.
'Lo, they do call to me. They bid me take my place among them, in the halls of Valhalla.
Where the brave may live......forever.

"Imperials don't visit the bathroom without a plan."
Post Reply