Operations

Ihr Nutzen

  • Sie überwachen Ihr Netzwerk kontinuierlich und in Echtzeit
  • Sie nutzen Schwellwertanalysen zur effizienten Steuerung
  • Sie erkennen potentielle Engpässe im Vorfeld rechtzeitig
  • Sie konsolidieren die Alarme aller eingesetzten Netzkomponenten zentral auf einer Plattform

Allgemein

Der Betrieb eines Netzmanagements erfordert eine Reihe von Funktionen zur Unterstützung der Netz-Administratoren. Hierzu gehören SNMP-Trap-oder Syslog-Verarbeitung genauso wie eine intelligente Event-Korrelation.

Die zentralen Event-Empfänger sind die ERAMON SATs, welche alle Mechanismen zur Aufnahme der Events beinhalten. Diese übermitteln alle Alarme an den CENTER, von dem aus dann alle Events verarbeitet und zur Anzeige aufbereitet werden. In ERAMON wird zwischen den folgenden Event-Typen (entspricht der Art bzw. dem meldenden Prozess) unterschieden:

  • SNMP-Traps
    Traps durch verschiedenste Parameter variabel einstellbar
  • SNMP-Port-Status
  • IP-Polling
  • Syslog
    Syslog-Meldungen werden anhand des Regelwerkes geprüft und entsprechend verarbeitet
  • Programmmeldungen
  • Ping-Groups
  • Performance Management (EPM)
  • ERA-Health

Korrelation/Zusammenfassung von Events

Innerhalb von ERAMON versteht sich unter Korrelation eine Gruppierung von zusammengehörigen Events im Event-Tool. Deren Zusammengehörigkeit wird durch unterschiedliche Verfahren ermittelt und teilweise auch bewertet (Root-Cause-Analyse). Die Vorteile sind:

  • bessere Übersichtlichkeit durch Gruppierung
  • Zusammenhänge sind sofort ersichtlich
  • zielgerichtetes Announcement
  • vereinfachte Fehleranalyse

Des Weiteren lässt sich die Korrelation individuell anpassen. So kann vom Kunden selbst entschieden werden, welche Events miteinander korrelieren und wie hoch die einzelnen Events gewichtet werden sollen. Hier ein Auszug der vorhandenen Korrelationen:

  • Passiv
    Die passive Korrelation wird angewandt, wenn ein Event mehrmals auftritt. Wo beim erstmaligen Auftreten noch ein Event im Event-Tool erzeugt wird, erfolgt dies bei identischen Folge-Events nicht mehr. Hier wird dann die Event-Anzahl hochgezählt.
  • Normal
    Falls Device/Port/Event-Source übereinstimmen, werden die Events entsprechend gruppiert. Die Event-Source kann man an diversen Stellen wie z. B. Trap-/Syslog-Verwaltung einstellen.
  • Sub-Interfaces
    Da auf physikalischen Interfaces auch logische liegen können, welche bei einem Ausfall des physikalischen zwangsläufig mit betroffen sind, macht es Sinn, diese Events zu korrelieren. Deswegen werden die Events von Sub-Interfaces auf die Events des physikalischen Interfaces korreliert (bei Übereinstimmung der Event-Source).
  • Transfernetze
    Sofern ERAMON eine Gegenstelle über ein Transfernetz (/30) erkennt, werden die entsprechenden Events mit denen der Gegenstelle korreliert.
  • Port-Channels
    Diese Korrelation stellt eine Erweiterung der Transfernetz-Korrelation dar. Ein Port-Channel besteht aus zwei oder mehreren physikalischen Interfaces und einem logischen (virtuellen) Channel-Interface. Geht ein einzelnes physikalisches Interface down, erfolgt die normale Korrelation (siehe oben). Fällt dann aber das zweite physikalische Interface aus (und damit auch der virtuelle Tunnel), so werden alle Events miteinander korreliert. Das Root-Event ist in diesem Fall der Ausfall des Channel-Interfaces. Zusätzlich werden durch die Transfernetz-Korrelation alle Events der Gegenstellen (der physikalischen, aber auch des logischen Interfaces) mit korreliert.
  • OSPF/BGP-Nachbarschaften
    Hier wird aus einem ursprünglichen Geräte-Event (z. B. „OSPF Neighbor Down“) der zugehörige Port ermittelt. Für diesen wird dann ein Ausfall generiert und die Events der Gegenstelle darauf korreliert.

Announcements

Mit Hilfe von Announcements lassen sich automatische Aktionen zur Benachrichtigung für bestimmte Events in ERAMON einrichten. In den Einstellungen für Announcements wird angegeben, wann welche Aktion aufgrund eines Events ausgeführt werden soll.

Beispiel:

Für alle major-Events der Device-Gruppe „Backbone“ ist nachts eine SMS an die Bereitschaft auszuführen und tagsüber eine E-Mail zu generieren.

Als Aktionen stehen dabei folgende Optionen zur Verfügung:

  • E-Mail-Versand: Adresse im nächsten Feld eintragen, mehrere Empfänger per Semikolon trennen
  • Bulk-E-Mail: Sammeln der Announcements bis zur Versendung per Batch-Mail
  • Script: Ausführen eines Scripts auf dem Betriebssystem
  • Trap: Senden eines Traps an einen anderen Server
  • Syslog: Versenden einer Syslog-Nachricht
  • PAM: Erzeugen eines speziellen Events für das Proaktive Management

Device-Backup

Anhand vordefinierter Login-Module erfolgt ein zyklisches Backup der Konfigurationen der Devices. Ebenso kann die Firmware optional gesichert werden. Durch die Verknüpfung mit anderen Funktionen bzw. Modulen ist natürlich auch ein ereignisgesteuertes Ausführen aufgrund z. B. eines bestimmten Traps möglich. Hier ein Auszug aus den verschiedenen Backup-Methoden:

  • FTP
  • TFTP
  • SCP
  • Telnet/SSH
  • SNMP

Mit der Default-Konfiguration werden bis zu 90 verschiedene Konfigurationen pro Device rollierend gesichert.
Im Archiv-Management kann die Anzahl der gesicherten Configs pro Device individuell konfiguriert werden.
Über die Funktion Config-History lässt sich feststellen, wann sich welche Zeile geändert hat bzw. hinzugekommen ist. Mit dem Anwendungsmodul Provisioning ist auch ein Zurückspielen einer beliebigen Konfiguration möglich.

Dienstemonitore

Prüfen auf Services

Als Standard für die Berechnung der Verfügbarkeit des Devices erfolgt eine Ping-Überwachung. Jedoch bei z. B. einem Webserver ist eine reine Ping-Überwachung nicht ausreichend. Hier muss auch die Funktion des Webservers geprüft werden. Ein Device wird einem Dienstemonitor zugeordnet. Innerhalb dieses Monitors wird anhand bestimmter Kriterien das Device als erreichbar bzw. als nicht erreichbar markiert.  Mit Hilfe der Dienstemonitore sind erweiterte Überwachungen der geläufigsten Dienste/Protokolle (z. B.  pop3, radius, smtp, dns, tacacs) integriert.

Wartungsmaßnahmen

Es können geplante Wartungen hinterlegt werden, welche in anschließenden SLA-Berechnungen auch berücksichtigt werden können. Die alarmierten Events während dieser Zeit werden automatisch der Wartungsmaßnahme zugeordnet und nicht aktiv alarmiert.

MPLS

Optionale Erweiterung zum Anwendungsmodul Operations

Auflistung aller im System erfassten VRFs samt Parameter. Detaillierte Angaben zum VRF über Kunde, Port und Devices sowie geroutete Prefixes werden automatisch ermittelt.

VLAN-Manager

Optionale Erweiterung zum Anwendungsmodul Operations

Bei Verwendung von VTP sind die Domains inkl. der Devices ersichtlich, die sich innerhalb der Domäne befinden. Zusätzlich können Gruppierungen als VTP-Domänen-Alternative erstellt und die Integrität der VLAN-Bezeichnungen auf Richtigkeit überprüft werden.