17.10.2007, 08:54 Uhr
Quelloffene Wächter
Überwachungs- programme helfen, Ausfälle im Unternehmensnetzwerk zu vermeiden. Neben kommerziellen Tools gibt es immer mehr quelloffene Programme. Wir haben diese bezüglich ihrer Leistungsfähigkeit miteinander verglichen.
Peter Heinz ist Geschäftsführer der Wilken AG in Freidorf SG.
Wer weiss, dass ihm ein Problem ins Haus steht, kann vorbeugend aktiv werden und Schaden abwenden. Diesbezüglich ist eine gute Überwachungs-Software eines der wichtigsten Werkzeuge jedes Systemadministrators. Das Überwachungs-Tool kontrolliert selbst komplexe IT-Strukturen und sendet frühzeitig Warnmeldungen an die Techniker. So haben diese genug Zeit, zu reagieren und Fehler zu beheben, noch bevor der Betrieb der IT zum Erliegen kommt.
Neben kommerziellen Produkten wie «OpenView» von Hewlett-Packard (HP) oder «Tivoli» von IBM gibt es zwischenzeitlich auch eine ganze Reihe quelloffener Überwachungs-Tools. Wir haben vier dieser Open-Source-Tools miteinander verglichen und dabei auch geprüft, wie sie im Vergleich mit HP OpenView abschneiden.
HP Openview: Die Referenz
Einer der bekanntesten, kommerziellen Netzwerkwächter ist «OpenView Network Node Manager» von HP. Das ausgereifte Netzmanagementprogramm bietet ausgefeilte Funktionen zur Netzwerk-Fehlerbehebung und -Leistungsüberwachung.
Zum überaus breiten Funktionsumfang des HP-Tools gehören beispielsweise eine automatische Erkennung der Netzwerkumgebung sowie die Möglichkeit einer Statusanzeige. Überdies bietet OpenView das automatische Zeichnen der IP- beziehungsweise IPX-Topologie-Karten anhand der vorgängig ermittelten Daten. Erkannte -Geräte werden dabei entsprechend ihrer Position im Netzwerk in der Topologie angeordnet. Ausserdem ermöglicht der HP OpenView Node Manager das Management jedes SNMP-fähigen (Simple Network Management Protocols) Gerätes beliebiger Hersteller, da auch herstellerspezifische MIB (Management Information Bases) eingebunden werden können. Selbst programmierte, eingebundene Anwendungen haben dabei Zugriff auf die MIB-Datenbank und werden im Menü mit integriert.
Die Ereignisschwellwerte, welche bei Über- beziehungsweise Unterschreiten entsprechende Aktionen auslösen, können frei definiert werden. Darüber hinaus können Netzwerkfehler und Leistungsfähigkeitsprobleme von zentraler Stelle aus ermittelt werden. Auch sind Problemanalysen mittels Trendanzeigen möglich.
Damit wird klar: HP Openview ist ausserordentlich vielfältig und daher fast universell einsetzbar. Allerdings ist das Programm auch verhältnismässig komplex und entsprechend schwierig zu administrieren. Und die Vielfältigkeit hat natürlich ihren Preis - was sich in hohen Lizenzkosten niederschlägt.
Nagios: Alarm, wenns wirklich brennt
Eines der bekanntesten, lizenzkostenfreien Überwachungs-Programme ist «Nagios». Das Tool überwacht sowohl die Verfügbarkeit von Servern als auch von Systemdiensten. Zeigt sich im IT-System ein Problem, löst Nagios ein Ereignis aus.
Dabei gibt sich das Tool bei der Alarmierung angenehm zurückhaltend. Damit der Produktivbetrieb im Rechenzentrum nicht durch überhastet ausgelöste Fehlalarme leidet, wird nicht bei jeder kleinen Unregelmässigkeit sofort eine Nachricht an die Zuständigen gesendet. Stattdessen wird die Prüfung wiederholt, um eine etwaige Fehlmessung auszuschliessen. Erst, wenn das Problem nach einer definierbaren Anzahl von Kontrollen weiterbesteht, wird die IT-Mannschaft in Kenntnis gesetzt.
Diese Alarmierung ist in mehreren Eskalationsstufen möglich: Der Techniker im Bereitschaftsdienst wird umgehend via E-Mail oder SMS verständigt. Sollte der Empfang des Diensthabenden zeitweilig gestört sein, sorgen Eskalationsstufen in der Überwachung für die Benachrichtigung des gesamten Teams der Administration - und zwar rund um die Uhr.
Doch Nagios ist mehr als ein Frühwarnsystem. Die freie Software liefert auch Auswertungen über die Auslastung der eingesetzten Hardware. Der Status verschiedener Dienste wie SSH, FTP oder HTTP kann über diverse Module (Plugins) abgefragt werden. Dies gilt auch für den Festplattenplatz, die Speicher- und die CPU-Auslastung. Da die von Nagios verwendeten Testmethoden unabhängig vom verwendeten Protokoll sind, ist das Tool in der Lage, beliebige Hosts oder Services unabhängig vom Betriebssystem zu überwachen. Das System informiert frühzeitig über Ressourcenknappheit und Probleme bei der Verfügbarkeit von Diensten. So wissen die Kostenstellenverantwortlichen, ob sie wirklich einen neuen Server anschaffen müssen, weil die Auslastung am Limit ist, oder ob sie das Problem durch schlichte Umbelegung von Diensten auf Server, die nur zu 30 Prozent ausgelastet sind, lösen können.
Big Brother: Überwachung via Web
Ein weiteres Open-Source-Überwachungs-Tool ist Big Brother. Dabei handelt es sich um ein webbasiertes System zur Überwachung von Netzknoten und Services. Das Programm zeigt den Status der einzelnen Knoten im Netz an und observiert nicht nur die Verfügbarkeit von Netzwerkdiensten, sondern auch von verschiedenen anderen Services im Netz wie Drucker, Datenbankserver, SMB-Dienste (Server Message Block) und VNC-Server (Virtual Networking Computing). Daneben können auch Benutzeraktivitäten und sogar die Temperatur in einzelnen Räumen kontrolliert werden. Big Brother lässt sich mit zahlreichen Erweiterungen (auch Eigenentwicklungen) ergänzen. Somit bietet Big Brother einen ähnlich vielfältigen Funktionsumfang wie Nagios, ist zudem übersichtlich und schnell. Allerdings ist die Nutzung nur für private Zwecke kostenlos. Unternehmen müssen Lizenzgebühren leisten.
Big Sister: Die kostenfreie Schwester
Big Sister ist unter der GNU General Public Licence (GPL) frei verfügbar, kann also auch von Unternehmen ohne Lizenzkosten eingesetzt werden. Wie beim grossen Bruder handelt es sich um ein webbasiertes System zur Observierung von Netzen mit zahlreichen Funktionen wie Überwachung von Netzwerksystemen, Darstellung des aktuellen Status, Generierung von Alarmfunktionen bei Statusänderungen, Protokollierung der Statusänderungen, Zusammenarbeit mit anderen Instanzen von Big Sister oder Big Brother sowie mit fremden Monitorsystemen wie etwa HP OpenView. Bei Big Sister kann die Darstellungsform weitgehend frei festgelegt werden. Bei Statusänderungen lässt sich eine Alarmfunktion aktivieren, welche den Administrator via E-Mail oder Pager benachrichtigt. Parallel dazu zeigt eine Alarmstatus-Seite Details zu den laufenden Alarmen an. Alle Benachrichtigungen werden protokolliert und können über History-Seiten zurückverfolgt werden. Zusätzlich zeichnet Big Sister verschiedene Performancedaten auf, die mit dem in der Schweiz entwickelten RRD-Tool (Round Robin Database) graphisch dargestellt werden können.
Angel: Ein Engel fürs Firmennetz
Einfach, aber nützlich: So lässt sich das vierte OSS-Netzüberwachungs-Tool Angel charakterisieren. Es besteht aus einem Perl-Programm, das periodisch - etwa alle zehn Minuten - ausgeführt wird und verschiedene Subverarbeitungen (Plugins) zum Test bestimmter Dienste aktiviert. Bei der Statusanzeige werden problematische Dienste durch rot blinkende Balken markiert, während die ordnungsgemäss arbeitenden Services durch grüne Balken gekennzeichnet sind. Zu den wichtigsten Eigenschaften von Angel zählt die zentralisierte Administration. Hosts und Dienste werden dabei über eine Konfigurationsdatei verwaltet. Durch das Plugin-Konzept kann Angel leicht an individuelle Bedürfnisse angepasst und erweitert werden. Auf die HTML-Ausgabe kann von jedem Browser aus zugegriffen werden. Die Übersichtlichkeit und Einfachheit von Angel hat ihren Preis: Das System eignet sich nur für den Einsatz in kleinen Netzen.
Fazit: Nagios macht das Rennen
Betrachtet man die erwähnten Werkzeuge im Vergleich, so sind die Vorteile des Open-Source-Tools Nagios deutlich. Über das Internet ist die Software in Sekundenschnelle verfügbar. Die Bedienung ist einfach. Die verschiedenen Ampelfunktionen machen das System leicht verständlich und übersichtlich. Erweiterungen können schnell mit der Abfragesprache «NagiosQL» umgesetzt werden. Eine Backupmaschine einzurichten, ist ohne grossen Aufwand möglich. Die freie Software ist, was die zu prüfenden Dienste angeht, plattformunabhängig. Prüfungen gehen über mehrere Netze und VPN hinweg (Virtuelles Privates Netz). Eine eventuelle Integration von Spezialprüfungen ist ohne genaue Kenntnisse von SNMP und MIB möglich. Trotzdem können ohne weiteres SNMP-OID (Object Identifier; Objektkennzeichnung) in die Nagiosstruktur eingebunden werden. Die herstellerspezifischen MIB können benutzt werden. Die geplanten Er-weiterungen können auch über selbstgeschriebene Shellscripte erfolgen. Diese Methode eröffnet beispielsweise neue Möglichkeiten, gerade eigene Software ins Monitoring einzubinden. Erwähnenswert ist auch «NagVis», ein Tool, das in Nagios eingebunden, Netzwerkstrukturen visuell darstellen kann.
Aus der Praxis
Was Nagios im Einsatz zu leisten im Stande ist
Bei der Softwareherstellerin Wilken überwacht das Open-Source-Tool Nagios, das wahlweise als Service bezogen oder vor Ort installiert werden kann, das Rechenzentrum, und leistet dabei Folgendes:
o Überwachung von über 200 Maschinen und circa 2000 Diensten
o Prüfung aller relevanten Systemdienste der angebundenen Betriebssysteme, Server und Hardwaregeräte
o Prüfung der Applikationen, Datenbanken und mehrerer Spezialdienste
o Aufzeichnung der Last mit Nagiosgrapher
o Im Störungsfall Benachrichtigung des Administrators via E-Mail und SMS auf das Bereitschaftshandy
o Eskalationsstufen für Störmeldungen (Bereitschaft, Admingruppe, Geschäftsleitung)
Peter Heinz