#format rst :title: Monitoring :author: Lars, vm069 :description: Hackspace Rostock e.V. Monitoring Workshop Themen ====== * Wen, wie und warum überwachen? * Beobachten * Überwachen * Eingreifen * Praxis! ---- Warum wollen wir überwachen? ============================ * Auslastung und Nutzungsmuster analysieren * Auswirkungen von Änderungen erkennen * Ausfälle erkennen und nachvollziehen * Ausfallzeiten minimieren * Seiteneffekte erkennen ---- Wen wollen wir überwachen? ========================== * Dienste stehen im Fokus * diese benötigen: - Verkehrsträger (Router, Switches) - Ausführende (Server) - Infrastruktur (Backup) - externe Dienstleister (z.B. Telefonie-Server, Mail-Server) ---- Wie wollen wir überwachen ========================= * ohne menschliche Interaktion * geringe Beeinflussung des Messobjekts * im Detail (von innen) * im Überblick (von außen) ---- Teil I: Beobachten ================== Ziele: * Trends erkennen * Auslastungen abschätzen * Einfluss von Änderungen prüfen * Ursachen bei Problemen ermitteln ---- Teil I: Beobachten ================== Typische Schritte: * Daten erfassen * Daten speichern * Daten visualisieren ---- Teil I: Beobachten ================== Typische Werkzeuge: * cacti * collectd * ganglia * munin * ??? Die weitere Diskussion bezieht sich beispielhaft auf **munin**. ---- ---- :data-x: 0 :data-y: 1000 :data-z: 0 :data-rotate: 180 :data-rotate-z: 20 :data-rotate-x: 90 :data-rotate-y: 40 (S)imple (N)etwork (M)anagement (P)rotocol ========================================== * Protokoll zur verwaltung von Netzwerfaehigen Geraeten * 3 Modi SNMP[1,2c,3] * klassisches Monitoring Werkzeug ---- Unterschiede 1,2c vs 3 ======================= * SNMP 1 & 2 arbeiten mit "communitystrings" fuer Abfragen - `snmpwalk -v 2c -c community host system` - `snmpget -v 2c -c community host sysUpTime.0` * SNMP 3 kennt Nutzer und ist auch in der lage Abfragen verschluesselt auszufuehren - `snmpwalk -v 3 -a MD5 -A password -l authNoPriv -u user host system` - `snmpget -v 3 -a MD5 -A password -l authNoPriv -u user host system.sysUpTime.0` ----- MIB & OID's ======================= * MIB = Management Information Base * entweder durch Nummern oder alternativ durch alphanumerische Bezeichnungen (z.b. system == 1.3.6.1.2.1.1) * sind in RFC's definiert * OID = Object Identifier * sind die numerische Darstellung der MIB's (z.b.:1.3.6.1.2.1.1.5==sysUpTime) * Vorfuehrung folgt. ----- SNMP-Traps =========== * SNMP Nachrichten die ohne aktive Abfrage gesandt werden (z.B. von Druckern, Routern, ...) - Benachrichtigung ueber zu hohe Temperatur im Gehaeuse oder geringen Tonerstand - koennen mit spezifischen Deamon aufgenommen werden - aehnlich zu syslog jedoch mit genauer (numerischer) Beschreibung des Ereignisses