hack-hro wiki:
title:Monitoring
Author: Lars, vm069
description:Hackspace Rostock e.V. Monitoring Workshop
css:workshop_style.css

Themen

  • Wen, wie und warum überwachen?
  • Beobachten
  • Überwachen
  • Eingreifen
  • Praxis!

Warum wollen wir überwachen?

  • Auslastung und Nutzungsmuster analysieren
  • Auswirkungen von Änderungen erkennen
  • Ausfälle erkennen und nachvollziehen
  • Ausfallzeiten minimieren
  • Seiteneffekte erkennen

Wen wollen wir überwachen?

  • Dienste stehen im Fokus
  • diese benötigen:
  • Verkehrsträger (Router, Switches)
  • Ausführende (Server)
  • Infrastruktur (Backup)
  • externe Dienstleister (z.B. Telefonie-Server, Mail-Server)

Wie wollen wir überwachen

  • ohne menschliche Interaktion
  • geringe Beeinflussung des Messobjekts
  • im Detail (von innen)
  • im Überblick (von außen)

Teil I: Beobachten

Ziele:

  • Trends erkennen
  • Auslastungen abschätzen
  • Einfluss von Änderungen prüfen
  • Ursachen bei Problemen ermitteln

Teil I: Beobachten

Typische Schritte:

  • Daten erfassen
  • Daten speichern
  • Daten visualisieren

Teil I: Beobachten

Typische Werkzeuge:

  • cacti
  • collectd
  • ganglia
  • munin
  • ???

Die weitere Diskussion bezieht sich beispielhaft auf munin.


System Message: ERROR/3 (<string>, line 92)

At least one body element must separate transitions; adjacent transitions are not allowed.

data-x:0
data-y:1000
data-z:0
data-rotate:180
data-rotate-z:20
data-rotate-x:90
data-rotate-y:40

(S)imple (N)etwork (M)anagement (P)rotocol

  • Protokoll zur verwaltung von Netzwerfaehigen Geraeten
  • 3 Modi SNMP[1,2c,3]
  • klassisches Monitoring Werkzeug

Unterschiede 1,2c vs 3

  • SNMP 1 & 2 arbeiten mit "communitystrings" fuer Abfragen
    • snmpwalk -v 2c -c community host system
    • snmpget -v 2c -c community host sysUpTime.0
  • SNMP 3 kennt Nutzer und ist auch in der lage Abfragen verschluesselt auszufuehren
    • snmpwalk -v 3 -a MD5 -A password -l authNoPriv -u user host system
    • snmpget -v 3 -a MD5 -A password -l authNoPriv -u user host system.sysUpTime.0
    • DISMAN-EVENT-MIB::sysUpTimeInstance = Timeticks: (627727) 1:44:37.27

MIB & OID's

  • MIB = Management Information Base
  • entweder durch Nummern oder alternativ durch alphanumerische Bezeichnungen (z.b. system == 1.3.6.1.2.1.1)
  • sind in RFC's definiert
  • OID = Object Identifier
  • sind die numerische Darstellung der MIB's (z.b.:1.3.6.1.2.1.1.5==sysUpTime)
  • Vorfuehrung folgt.

SNMP-Traps

  • SNMP Nachrichten die ohne aktive Abfrage gesandt werden (z.B. von Druckern, Routern, ...)
  • Benachrichtigung ueber zu hohe Temperatur im Gehaeuse oder geringen Tonerstand
  • koennen mit spezifischen Deamon aufgenommen werden
  • aehnlich zu syslog jedoch mit genauer (numerischer) Beschreibung des Ereignisses

hack-hro wiki: Workshops/Monitoring (zuletzt geƤndert am 2014-11-19 18:23:54 durch gateway)