Login: 
Passwort: 
Neuanmeldung 
Passwort vergessen



Das neue Heft erscheint am 1. Mai
Fliegen ohne Flugleiter – wir warten auf ...
Eindrücke von der AERO 2024
Notlandung: Diesmal in echt!
Kontamination von Kraftstoffsystemen
Kölner Handling-Agenten scheitern mit Klage
Unfall: Verunglücktes Änderungsmanagement
Engagierter Journalismus aus Sicht des eigenen Cockpits
Engagierter Journalismus aus Sicht des eigenen Cockpits
Sortieren nach:  Datum - neue zuerst |  Datum - alte zuerst |  Bewertung

Sonstiges | Double Engine Failure im Rechenzentrum: Server-Ausfall am Freitag und Samstag  
29. Juni 2014: Von Jan Brill  Bewertung: +2.00 [2]
Liebe Forums-Nutzer,

wie die meisten sicher bemerkt haben hatten wir am Freitag und Samstag einen längeren Ausfall des frankfurter Servers.

Grund war sozusagen ein zweifacher Triebwerksausfall. Im RAID1 des Servers gab in der Nacht von Donnerstag auf Freitag eine der beiden Platten ihren Geist auf. Das wäre nichts weiter besonderes. Aber: Vier Stunden später wollte dann auch die verbliebene Platte nicht mehr!

Wir sind einigermaßen baff dass zwei Platten innerhalb von vier Stunden schlapp machen.

Inzwischen ist alles wieder neu aufgesetzt und läuft. Ich bitte aber zu beachten, dass E-Mails, die zwischen Donnerstag-Abend und Samstag 17.00 Uhr gesendet wurden uns wahrscheinlich nicht erreicht haben.

Forums-Beiträge dürften dank Live-Backup nicht verloren gegangen sein.

Die Lisa-Flightlogs von Freitag und Samstag erscheinen im System, wenn die Flugzeuge das nächste Mal geflogen sind. Dann übertragen die Flugzeuge ihre Daten erneut.

viele Grüße
Jan Brill
29. Juni 2014: Von  an Jan Brill
RAID 1 ist aber auch ein bisschen sparsam für einen Public Server, normalerweise nimmt man da schon RAID 5, bzw. lässt das auf entsprechender Hardware hosten.
29. Juni 2014: Von Jan Brill an 
RAID 5 ist beim Ausfall zweier Platten genauso mausetot wie RAID 1.
29. Juni 2014: Von Marc T. an Jan Brill
Raid 6 mit 2 Hot Spare wäre nett, aber offenichtlich gab es ja ein funktionierendes Backup - also alles gut, oder?
Und ich dachte schon, euer Server wäre aus dem Raum Braunschweig sabotiert worden... :-)
29. Juni 2014: Von Lutz D. an 
@Jan Ich würde technische Merkmale der Serverarchitektur nicht preisgeben, rein prinzipiell.
@John Raid-5 hat doch eine bedeutend geringere Ausfallsicherheit im Vergleich zu Raid-1??? Die TTF moderner Festplatten ist so hoch, das Erlebnis von Jan liegt ungefähr statistisch bei einem double-mal beim Fallschirmspringen.
@Jan2 Eigener Server? Würde evtl mal prüfen lassen), ob es da nicht einen gemeinsamen Auslöser gab (oder noch gibt).
29. Juni 2014: Von Christof Edel an Lutz D.

Simultaner Plattenausfall ist leider nicht sooo selten bei RAID - oft werden baugleiche Platten aus derselben Serie unter den gleichen Bedingungen eingesetzt.

Stirbt eine Platte den "Zufallstod", dann ist es unwahrscheinlich, daß die andere sofort danach ausfällt.

Stirbt sie den Alterstod, dann kann es schon eher mal passieren.

Beim beobachten von SMART werten fiel mir auch schon ein paar mal auf, daß nach ein paar Jahren Dauerbetrieb die Fehlerraten bei mehreren eingesetzten Platten innerhalb weniger Wochen nach oben liefen.

Da hilft eine Reserveplatte auch nur bedingt, es sei denn, sie wird wirklich abgeschaltet bis sie benötigt wird. Und da das Umschalten auf die Reserveplatte ganz gut Last erzeugt, kann das (zumindest theoretisch) sogar schaden.

30. Juni 2014: Von Lutz D. an Christof Edel
...aber innerhalb von vier Stunden?

7 Beiträge Seite 1 von 1

 

Home
Impressum
© 2004-2024 Airwork Press GmbH. Alle Rechte vorbehalten. Vervielfältigung nur mit Genehmigung der Airwork Press GmbH. Die Nutzung des Pilot und Flugzeug Internet-Forums unterliegt den allgemeinen Nutzungsbedingungen (hier). Es gelten unsere Datenschutzerklärung unsere Allgemeinen Geschäftsbedingungen (hier). Kartendaten: © OpenStreetMap-Mitwirkende, SRTM | Kartendarstellung: © OpenTopoMap (CC-BY-SA) Hub Version 14.22.03
Zur mobilen Ansicht wechseln
Seitenanfang