Der Eine oder andere hat vielleicht meinen Blogartikel gelesen, in dem ich sehr kurzfristig eine Ausfallzeit unseres Mailservers bekannt geben musste. Das Problem, dass die Festplatte defekt war, lag direkt vor unserer Nase, wir haben es nur nicht gesehen.
Vorzusingen nach der Weise Blowing in the Wind:
The answer, my friend, is written in the logs, …
Auf unseren Servern haben wir Logwatch eingerichtet, um taeglich einen „relevanten“ Auszug aus den Logdateien via E-Mail zu bekommen. Enthaltene Informationen sollten so wichtig sein, dass sie nicht ignoriert werden duerfen. In diesen E-Mails waren auch Anzeichen fuer das Festplatten-Problem zu finden.
Es kam natuerlich wie es kommen musste, die E-Mails kamen tagtaeglich, aber niemand hat sich darum gekuemmert.
Was ist passiert? Die Nachrichten enthielten viel zu viel Zeug, das nicht interessant und nicht wichtig war. Und es zeigt, dass Administrationsaufgaben nicht nur Spass machen, manches ist nervtoetend und trotzdem noetig.
In diesem Artikel wollte ich „eigentlich“ darauf hinweisen, wie ich das Loghandling in den Griff bekommen habe und wie ich schnell und effizient Logs durchsuche und pro-aktiv Fehler finde. Um es kurz zu machen, so ist es nicht. Wenn jemand eine Loesung dafuer hat nur her damit.
Bis dahin werden wir auf Fehler reagieren, die uns das Monitoring zeigt und Tag fuer Tag - wenn die Fehler weniger werden auch wieder weniger intensiv - uns durch die Logs wuehlen und (hoffentlich keine) Fehler finden.
Wir freuen uns immer auf Eure Kommentare und in diesem Fall sind wir besonders interessiert, von Euch zu hoeren, wie Ihr mit Logdateien umgeht.