Minimierung ungeplanter Downtimes

Ausfallzeiten bei Produktiv-Systemen sollen minimiert werden. Zur Erkennung und teilweise zur Lokalisierung von Störungen kommen oft leistungsfähige Monitoring-Lösungen zum Einsatz. In der Analyse und Behebung dagegen wird oft viel Zeit verschenkt, vor allem dann, wenn der Haupt-Ansprechpartner (der das betroffene System im Schlaf bedienen kann) gerade nicht greifbar ist. Ausserdem wird bei größeren Problemen teilweise im Eifer des Gefechts nicht beachtet, dass einige Anwendungen für den Kunden wichtiger sind als andere und daher bei der Entstörung bevorzugt behandelt werden sollten.

Der Vortrag soll Ideen vermitteln, wie man die richtige Menge an Notfall-Dokumentation erstellt, aktuell hält und laufend verbessert, wie man diese sinnvoll strukturiert und wie man die Dokumentation mit einem Monitoring-System so zusammenwachsen lässt, dass die gerade benötigte Information immer nur einen Mausklick entfernt ist. Weiterhin soll bei der Entstörung eine klare Priorisierung auf den ersten Blick erkennbar sein.

Beispiele werden an Hand von Nagios (http://www.nagios.org/) und der Nagios Business Process View (http://nagiosbp.projects.nagiosforge.org/) gezeigt, sind aber auch mit anderen Monitoring-Tools umsetzbar.

Referent

Bernd StrößenreutherBernd Strößenreuther arbeitet als System-Architekt bei der Sparda-Datenverarbeitung eG in Nürnberg und ist dabei für Application-Server, WebServer und Sicherheitsinfrastruktur im Inter- und Intranet-Bereich zuständig sowie für Monitoring-Systeme. Zu seinen Aufgaben gehört dabei unter anderem auch der hochverfügbare und sichere Betrieb der Internet-Homebanking-Plattform für alle Sparda-Banken deutschlandweit sowie der Netbank. Er engagiert sich in der Open-Source-Community unter anderem als Hauptentwickler der Nagios Business Process Addons (http://nagiosbp.projects.nagiosforge.org/).

 

Downloads / Updates

Download: Vortrag als PDF

Download: Sample-Doku als TGZ