check_ganglia_metric

Screenshot der Software:
check_ganglia_metric
Softwarebeschreibung:
Version: 2012.02.28
Upload-Datum: 15 Apr 15
Lizenz: Frei
Popularität: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric ist ein Nagios Plugin, dass Sie Warnungen auf jedem Ganglien metrischen auslösen können.
check_ganglia_metric war stark von Vladimir Vuksan der check_ganglia_metric.php inspiriert, aber es mit einer Reihe von Verbesserungen kommt.

Installation

# PIP, check_ganglia_metric installieren
... Oder:
# Easy_install check_ganglia_metric
Ganglia Konfiguration
Es sei denn, Ihre Nagios-Server und Ganglia Meta Daemon auf demselben Host ausgeführt werden, müssen Sie wahrscheinlich Ihre gmetad.conf bearbeiten, um Remote-Verbindungen von Ihrem Nagios-Server zu ermöglichen.
Um Verbindungen von nagios-server.example.com ermöglichen:
trusted_hosts nagios-server.example.com
Um Verbindungen von allen Hosts (wahrscheinlich ein Sicherheitsrisiko) zu ermöglichen:
all_trusted auf
Testing in der Befehlszeile
Lassen Sie uns zunächst sehen, ob check_ganglia_metric kann mit der Ganglia Meta Daemon kommunizieren:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Status OK, CPU Idle = 99,3% | cpu_idle = 99,3% ;;;;
Der "Status OK" Meldung besagt, dass check_ganglia_metric funktioniert. Wenn Sie Probleme haben, dies funktioniert, versuchen Sie es erneut mit ausführlicher Protokollierung aktiviert (--verbose), um einen besseren Einblick in was falsch läuft zu gewinnen.
Lassen Sie uns nun versuchen Sie, eine Alarmschwelle:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Status Kritisch, CPU Idle = 99,6% | cpu_idle = 99,6% ;; 99 ;;
Wir sagten check_ganglia_metric um eine "kritische" Status zurück, wenn der Idle CPU war größer als 99. Die "Status Critical" Nachricht zeigt an, dass es funktionierte. Beachten Sie, dass check_ganglia_metric analysiert Bereiche und Grenzwerte nach den offiziellen Nagios-Plugin-Entwicklungsrichtlinien.
Eine vollständige Liste der Befehlszeilenoptionen mit kurzen Erklärungen, mit der Option --help ausgeführt check_ganglia_metric sehen.
Nagios-Konfiguration
Erstellen Sie zunächst eine Befehlsdefinition:
define command {
& Nbsp; command_name check_ganglia_metric
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ ARG3 $
}
Jetzt können Sie den oben genannten Befehl in Ihrem Service-Definitionen zu verwenden:
define service {
& Nbsp; service_description CPU im Leerlauf - Ganglia
& Nbsp; Verwendung ein_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& Nbsp; host_name host.example.com
}
Das funktioniert gut, bis etwas schief geht mit check_ganglia_metric (zB der Cache-Datei kann nicht gelesen / geschrieben, die Ganglia Meta Daemon kann nicht erreicht werden, etc.). An diesem Punkt wird jeder Dienst, der auf check_ganglia_metric beruht nicht, möglicherweise überschwemmen Sie mit Warnungen. Wir können dies durch den Einsatz von Service-Abhängigkeiten zu vermeiden.
Das erste, was wir brauchen, ist eine Befehlsdefinition zur Überprüfung des Alters der Datei:
define command {
& Nbsp; command_name check_file_age
& Nbsp; command_line / usr / lib / nagios / plugins / check_file_age -f $ ARG1 $ w $ ARG2 $ -c $ ARG3 $
}
Als nächstes definieren wir einen Service, der das Alter der Cache-Datei check_ganglia_metric die überprüft. Man beachte, dass, um wirklich effektiv zu sein, muss dieser Dienst mindestens so (vorzugsweise mehr) häufiger als alle anderen Prüfungen, die auf check_ganglia_metric verlassen überprüft werden:
define service {
& Nbsp; service_description Cache für check_ganglia_metric
& Nbsp; Verwendung ein_template
& Nbsp;!! Check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& Nbsp; Hostname localhost
& Nbsp; check_interval 1
& Nbsp; max_check_attempts 1
}
Und schließlich haben wir das eigentliche Dienstabhängigkeit. Beachten Sie, dass ich use_regexp_matching in Nagios, die mich zu regulären Ausdrücken in meinem Richtlinien verwenden können aktiviert werden. Mit dem Festhalten "- Ganglien" am Ende eines jeden Dienst, der auf check_ganglia_metric setzt, kann ich mich retten viel Mühe:
define servicedependency {
& Nbsp; Hostname localhost
& Nbsp; service_description Cache für check_ganglia_metric
& Nbsp; dependent_host_name *.
& Nbsp;. Dependent_service_description * - Ganglia $
& Nbsp; execution_failure_criteria c, p
}
Nun, wenn etwas falsch mit check_ganglia_metric geht, nur eine Warnung erfolgt über die Cache-Datei gesendet werden, und alle abhängigen Service-Prüfungen wird angehalten, bis Sie das Problem, dass check_ganglia_metric Fehler verursacht zu fixieren. Sobald das Problem behoben ist, müssen Sie die Zeitmarke auf der Cache-Datei, um den "Cache für check_ganglia_metric" Service wieder in einen OK-Zustand versetzt (was erlauben wird abhängig Service-Prüfungen weiterhin) zu aktualisieren:
& Nbsp; Touch /var/lib/nagios/.check_ganglia_metric.cache
Tipps und Tricks
Es ist möglich, eine vollständige Liste der verfügbaren Rechner und Metriken, indem du bekommen "ausführlicher" Protokollierung (vv). Da die metric_host und METRIC_NAME Optionen erforderlich sind, müssen Sie ein wenig von einer "Henne und Ei" Problem hier, aber das ist OK. Nur liefern einige Dummy-Daten. Das Plugin wird am Ende mit einem Fehler aus "Host / metrisch nicht gefunden" Fehler, aber nicht, bevor er seinen Cache-Dumps:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = Dummy --metric_name = Dummy -vv

Was ist neu in dieser Pressemitteilung:

  • Add - -metrics_max_age Option
  • Merge CHANGELOG.rst in README.rst

Anforderungen :

  • Python
  • Nagios

Grenzen :

  • Nicht in Verbindung mit Python 2.4 zu arbeiten

Ähnliche Software

cp2fwbuilder
cp2fwbuilder

3 Jun 15

Helm
Helm

11 May 15

WMCPULoad
WMCPULoad

3 Jun 15

CoffeeSaint
CoffeeSaint

11 May 15

Kommentare zu check_ganglia_metric

Kommentare nicht gefunden
Kommentar hinzufügen
Schalten Sie auf die Bilder!