ein unternehmen der mehler ag · pdf filesap monitoring exemplarische ... „die...
TRANSCRIPT
Ein Unternehmen der MEHLER AGwww.itnovum.de
Ein Unternehmen der MEHLER AGwww.itnovum.de
SAP Monitoring
Exemplarische Projekterfahrungen
Business Track Nagios Konferenz, 22.September 2006Michael Kienle, Geschäftsführer it-novum GmbH
Ein Unternehmen der MEHLER AGwww.itnovum.de
• Bedeutung & Notwendigkeit der SAP Überwachung
• Kurze Einführung in das SAP-Monitoring-Tool: CCMS– Möglichkeiten CCMS
– Warum Nagios benutzen wenn es CCMS gibt?
– Wie werden die Daten vom CCMS ins Nagios übernommen?
• Auswahl und Eingrenzung: Welche Werte solltenüberwacht werden?
– Welche Werte im CCMS sind sinnvoll?
– Verschiedene Reaktionszeiten
– Schwellwerte
• CCMS vs. SAP Solution Manager
• Fazit: Genügt eine OpenSource Plattform den Anforderungen eines ERP-Monitorings?
Agenda
Ein Unternehmen der MEHLER AGwww.itnovum.de
• IT-Lösungen für den Mittelstand– Sichere, zuverlässige und wirtschaftliche IT
• Komplette Wertschöpfungskette– Beratung, Planung, Umsetzung, Betrieb
• Am externen Markt seit 1999– Überwiegend Regional (FD + 150 km, ~ von KS bis F)– Ca. 50% externer Umsatz, Trend: steigend– Synergieeffekte & Innovationen durch Konzernzugehörigkeit (>2 Mrd €)– Partnerschaften und Zertifizierungen
• Schwerpunkte & Kompetenzen:– Systemmanagement– ServerBasedComputing– Outsourcing/Datacenter/SAP– Konzepte, Analysen und Betrieb– Storage- und Servervirtualisierung, Konsolidierung– IT-Sicherheit, Datenschutz, Datensicherheit
IT-Kompetenz-Zentrum eines Konzerns
Ein Unternehmen der MEHLER AGwww.itnovum.de
• Unternehmenskritische ERP-Anwendungen: Stabilität:– Störung der Betriebsabläufe; bis zum kompletten Stillstand
– Vereinbarung SLA (Service Level Agreements)
– Daher: Kosten sind eher zu vernachlässigen
• Das Systemmanagement sollte dementsprechend:– die Wahrscheinlichkeit eines Ausfalles deutlich verringen
– im Fehlerfall schnellere Fehlerlokalisierung ermöglichen
– übergreifend eine “angemessene” Nutzung sicherzustellen
• In der Praxis bedeutet dieses an Einsatzgebieten:– Incident Management
– Performance Management: Sizing aber auch proaktiveErweiterung
– SLA-Reporting: Verfügbarkeiten, Antwortzeiten
Notwendigkeit des SAP Monitorings
Ein Unternehmen der MEHLER AGwww.itnovum.de
„Die Verwaltung verteilter Client-Server-Systeme stellt hohe Anforderungen an Systemadministratoren. Bei verteilten Systemen, die über die Mindestkonfiguration hinausgehen, sind Werkzeuge zur Unterstützung von Systemadministratoren bei dieser Aufgabe unentbehrlich.“
SAP AG, Dokumentation CCMS
Der Monitor Ansatz von SAP
Ein Unternehmen der MEHLER AGwww.itnovum.de
CCMS I
• CCMS = Computing Center Management System
• SAP Tool Überwachung und Verwaltung:– SAP-Transaktion „rz20“
– Baumstruktur, Komplexität: >n-1.000
• If you can not control it you can not manage it
• BUT do not measure what you will not change
• Praxis (Zitate):
– “leicht den Durchblick verlieren…”
– “Schwierigkeiten zu unterscheiden ob der angezeigte Fehler wirklich einProblem darstelltoder nur zurInformation, temporär…”
Ein Unternehmen der MEHLER AGwww.itnovum.de
• Durchschnitt Dialogschritt• Durchschnitt Netzwerk-
Antwortzeit Frontend-Applikationserver
• Durchschnitt 1 festgelegten Transaktion
• Anzahl eingeloggte User
CCMS II – Dialog Overview
Ein Unternehmen der MEHLER AGwww.itnovum.de
• Mittlere Zeit Dispatcher-Warteschlange
• Mittlere Lade- und Generierungszeit von CUA-Objekte
• Durchschnitt Datenbankanforderung
CCMS III – Dialog Application Service
Ein Unternehmen der MEHLER AGwww.itnovum.de
CCMS IV – Operating System
Ein Unternehmen der MEHLER AGwww.itnovum.de
• TableSpaces
CCMS V - Database
Ein Unternehmen der MEHLER AGwww.itnovum.de
Betriebssystem
SAP / CCMS Netzwerkkomponenten
Umweltbedingungen
• Ziel: Umfassende Übersicht– Nicht: Überwachung einer Summe von Einzelkomponenten– Sondern: vom Enduser “gefühltes” Systemverhalten– Sinnvoll: Übernahme der wichtigsten CCMS-Daten
Warum Nagios benutzen wenn es CCMS gibt? I
Ein Unternehmen der MEHLER AGwww.itnovum.de
• CCMS konzentriert sichausschließlich auf SAP
– z.B. Umweltbedingungen /RZ oder Basissystem/Hardware nicht berücksichtigt.
Warum Nagios benutzen wenn es CCMS gibt? II
Ein Unternehmen der MEHLER AGwww.itnovum.de
Workstation
Applikations-Server
Router
SwitchSwitch
Routerz.B. MPLS
OracleDatenbank
• Performance aus Anwendersicht: – Datenbank, Applikationsserver, Netzwerkanbindung, Workstation
• Übergreifende Überwachung notwendig
Pr ocurve Routing Switch 9308MHP J4138A
Po wer
Fault
C o ns o le
Re se t Cle ar
S elfTest
FanFaul t L E D M od e S e le ctPower
S ta tus
Modu les
1 2 A B C D E F G HAct F Dx M a x
use xl modules on ly
hp procurveswitch 5372xlJ4848A
1
71
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12 13
13
19
1 4 15
2 0 21
1 6
2 2
17
23 18
1 8
2 4
hp procurve10/10 0TXxl Module J4 820A
J4820A 24 port 10/100TX
24
171
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12 13
13
19
1 4 15
2 0 21
1 6
2 2
17
23 18
1 8
2 4
hp procurve10/10 0TXxl Module J4 820A
J4820A 24 port 10/100TX
24
171
2 38 9
5
11
4
1 0
7 12 19
6
6
12 13
13
19
1 4 15
2 0 21
1 6
2 2
17
23 18
1 8
2 4
hp procurve10/10 0TXxl Module J4 820A
J4820A 24 port 10/100TX
24
Po wer
Fault
C ons ole
Re se t Cle ar
S e lfTest
FanFau l t L E D M od e S e le ctPower
S ta tus
Modu les
1 2 A B C D E F G HAct F Dx M a x
u se x l mo du le s on ly
hp procurveswitch 5372xlJ4848A
171
2 38 9
5
11
4
1 0
7 12 19
6
6
12 13
13
19
1 4 15
2 0 21
1 6
2 2
17
23 18
1 8
2 4
hp procurve10/10 0TXxl Module J4 820A
J4820A 24 port 10/100TX
24
171
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12 13
13
19
1 4 15
2 0 21
1 6
2 2
17
23 18
1 8
2 4
hp procurve10/10 0TXxl Module J4 820A
J4820A 24 port 10/100TX
24
171
2 38 9
5
11
4
1 0
7 12 19
6
6
12 13
13
19
1 4 15
2 0 21
1 6
2 2
17
23 18
1 8
2 4
hp procurve10/10 0TXxl Module J4 820A
J4820A 24 port 10/100TX
24
Procurve Routing Switch 9308MHP J4138A
Warum Nagios benutzen wenn es CCMS gibt? III
Ein Unternehmen der MEHLER AGwww.itnovum.de
• Überwachung sämtlicher Komponenten der IT– Business-Prozess-orientierte Sicht vs. eher Infrastruktur-Perspektive
• “Tactical Overview”– systemweiter Überblick, aufkommende Probleme können effizient erkannt und
gezielt beseitigt werden
Warum Nagios benutzen wenn es CCMS gibt? IV
Ein Unternehmen der MEHLER AGwww.itnovum.de
Perfomance-Problem bei CCMS-Plugin, abhängigvom Volumen der zu überwachenden Services
Die einzelnen benötigten Werte finden sich an verschiedenen Stellen der Baumstrucktur. Das Plugin meldet sich für jeden abzuholenden Wert einzeln im SAP-System an: Nagios belastetständig das SAP-System mit mehreren Benutzern.
Lösung: Neuer Monitor. Hier werden dann allegewünschten Werte eingefügt. Dieser Knotenwird dann komplett vom Nagios-CCMS-Pluginabgeholt.
Alternativ: SNMP-Traps möglich
Wie werden Daten vom CCMS ins Nagios übernommen? I
Ein Unternehmen der MEHLER AGwww.itnovum.de
Skript
Ablauf bei der Datenabholung
Nagios ruft ein (selbstentwickeltes) Skript auf, dieses ruft das CCMS-Plugin auf, welches den gesamten Monitor „Nagios/Allgemein“ ausdem SAP ausliest. Diese Daten werden von dem CCMS-Plugin zurückgegeben, welches in eine Datendatei schreibt.
Je nach Erfolg dieser Transaktion, meldet das selbstgeschriebeneSkript den Status „OK“ oder „CRITICAL“ an Nagios zurück.
CCMS-Plugin
Datendatei
Wie werden Daten vom CCMS ins Nagios übernommen? II
Ein Unternehmen der MEHLER AGwww.itnovum.de
Um die Daten möglichst übersichtlich von der Datendatei ins Nagios zu integrieren, wurde ein eigenes Skript entwickelt, welches die gewünschten Information aus der Datendatei holt, den Wert in einen Graph einträgt und den Status und den Wert ans Nagios zurückmeldet.
SkriptDatendatei
ApanSQL
MySQL
RRD-File
Wie werden Daten vom CCMS ins Nagios übernommen? III
Ein Unternehmen der MEHLER AGwww.itnovum.de
Überwachen verschiedener SAP-Puffer auf:
Kriterien
Space Used Pufferspeichers in ProzentHit Ratio Datenbankanfragen/CacheSwap Auslagerungen Swaps pro Minute
Felder
GenericKey ganz/teilweise gepufferte DB-TabellenProgram kompilierte SAP-Programme
Welche Werte im CCMS sind sinnvoll? II
Ein Unternehmen der MEHLER AGwww.itnovum.de
Welche Werte im CCMS sind sinnvoll? III
Diverse wichtige SAP interne Speicher:
R3RollUsed Belegung des RollbereichsRollbereich: Speicherbereich fester, konfigurierbarenGröße, der zu einem Workprozess gehört; enthältbenutzerspezifische Daten und ist der erste Speicher, den ein Workprozess erhält.
EsAct Belegung des Erweiterungsspeichers Der Erweiterungsspeicher enthält den größten Teil des Benutzerkontexts. Die Seitenverwaltung dieses Speichers erfolgt nicht durch das Betriebssystem, sondern direkt durch das SAP-System.
HeapAct Belegung des privaten SpeichersEinem Workprozess wird erst dann privater Speicher zugewiesen,wenn Rollbereich und Erweiterungsspeicher belegt sind; der Workprozess ist dann bis zum Ende der Transaktion für den aktuellen Benutzerkontext reserviert (PRIV-Modus). Laufen zu viele Dialog-Workprozesse im PRIV-Modus, entstehen Performance-Probleme.
Ein Unternehmen der MEHLER AGwww.itnovum.de
Spool-System:
Used Numbers Belegung der Spool-Nummern in Prozent.(Sie müssen alte Ausgabeaufträge löschen, damit diese Zahl nie 100 Prozent erreicht.)
WaitTime Wartezeit im Spool-Service in Sekunden
Utilisation Auslastung der Spool-Workprozesse in Prozent
Welche Werte im CCMS sind sinnvoll? IV
Ein Unternehmen der MEHLER AGwww.itnovum.de
Allgemeine Performance-Werte:
DialogSteps mittlere Anzahl von Dialogschritten pro Minute.
Ein hoher Wert in Verbindung mit einer hohen ResponseTime weist auf generelle Überlastung hin, ein sehr niedriger Wert auf eine Fehlfunktion
Eine der verschiedenen Antwortzeiten
Welche Werte im CCMS sind sinnvoll? V
Ein Unternehmen der MEHLER AGwww.itnovum.de
Welche Werte im CCMS sind sinnvoll? VI
Die Option „AbortedJobs“ meldet alle abgebrochenen (Background-) Jobs im SAP. Im produktiven Einsatz kommt es immer wieder zu Jobabbrüchen, die jedoch nicht immer systemkritische Bedeutung haben.
z.B. Fehleranalyse: Transaktion “sm37” (Dumpanalyse Background)
Ein Unternehmen der MEHLER AGwww.itnovum.de
Verschiedene Reaktionszeiten I
Dialogantwortzeit = durchschnittliche Antwortzeit zur Verarbeitung eines Dialogschritts
Bei diesem Wert kann es zu Ausreißern kommen, die meist nur durch einen einzigen großen Prozess hervorgerufen werden.Diese hohen Werte haben aber leider keine wirkliche Aussage-kraft, da die SAP-Clients der Anwender trotz hoher Werte an dieser Stelle, keine Performanceeinbusen erleiden.
Ein Unternehmen der MEHLER AGwww.itnovum.de
Netzlaufzeit = Zeit für Datentransfer zwischen Frontend und Anwendungsserver
Durchschnittswert aller Netzlaufzeiten. Es lässt erkennen das irgendwelche SAP-Clients durch das Netzwerk verzögert ihre Daten erhalten, aber leider nicht welche Clients genau betroffen sind oder durch welchen Teil des Netzwerks diese Verzögerung ausgelöst wird.
Hier sind mit weiteren Tools genauere Analyse zu erstellen.
Verschiedene Reaktionszeiten II
Ein Unternehmen der MEHLER AGwww.itnovum.de
normierte Antwortzeit = Wie Dialogantwortzeit, nur für eine voreingestellte Standard-transaktion.
Durch das Messen der Zeit die eine immer gleicheStandardtransaktion zur Bearbeitung im SAP benötigt,erhählt man einen realistischen Wert, der die Performance des SAP-Systems gut wiederspiegelt.
Verschiedene Reaktionszeiten III
Das Auftreten von Spitzen deutet auf eine momentane Überlastung des SAP-Systems hin; alle angeschlossenen SAP-Anwender werdenPerformanceeinbußen erleben.
Ein Unternehmen der MEHLER AGwww.itnovum.de
• Überwachung SAP-Server mit einem direkten benachbarten Nagios nicht besonders aussagekräftig
• Einbezug Standorte/RemoteUser („gefühlte Performance“)
• „Simulieren“ eines Benutzers; Zeitmessung:– Einloggen, bestimmte Ein-/Ausgaben & Transaktionen, Ausloggen
– End-2-End Performance (generisch verwendbar)
Verschiedene Reaktionszeiten IV
Ein Unternehmen der MEHLER AGwww.itnovum.de
Schwellwerte I
Zur effizienten Alarmierung sind im Nagios Schwellwerte zu definieren.
Falls für abgefragte Werte noch keine Erfahrungen bestehen, ist es immerempfehlenswert, die im CCMS durch SAP vordefinierten Standardschwellwerte ersteinmal zu übernehmen und dann sukzessive anzupassen.
Schwellwerte des Monitorattributes auf seiner Eigenschaftsseite
Ein Unternehmen der MEHLER AGwww.itnovum.de
Individuelle Schwellwerte lassen sich gut über die aufgezeichneten Graphen bestimmen.
Sinnvoll aber zeitaufwändig (lange Erfahrungen/Messungen notwendig)
Als erster Schritt wurden die Schwellwerte vom CCMS übernommen. Danach erfolgteine längere Messung der “IST-Situation” mit abschließender Analyse der Ergebnisseund der Neueinstellung der Schwellwerte.
CRITICAL WARNING
Schwellwerte II
Ein Unternehmen der MEHLER AGwww.itnovum.de
Screenshot
Ein Unternehmen der MEHLER AGwww.itnovum.de
• CCMS:– Stärken eher in der Infrastruktur– „Tunnelblick“ auf Anwendungen
• Solution Manager:– „Bietet Kunden ein Standard Management Konzept um die Business-
Prozesse in der zugrunde gelegten Systemlandschaft mit der optimalen Verfügbarkeit, optimalen Performance und niedrigen Kosten zu betreiben.“(SAP Solution Manager Dokumentation)
– Zukünftige Anforderungen: Einheitliche und umfassende Überwachung in einem Umfeld das geprägt ist durch:
• Global• Heterogene Lösungen / Systeme• Business Prozesse• Neue Technologien
CCMS vs. Solution Manager
Ein Unternehmen der MEHLER AGwww.itnovum.de
SAP Solution Manager
Ein Unternehmen der MEHLER AGwww.itnovum.de
Business Process Management
Ein Unternehmen der MEHLER AGwww.itnovum.de
“Nagios entlastet mich von einem erheblichen Teil meiner turnusmäßigen Kontrollen. Einige der per Nagios gemeldeten Alerts sind nicht sogleich systemkritisch, zeigen aber einen evtl. vorhandenen Trend an, auf den man dann gezielt reagieren kann. Eine komplette Ablösung von CCMS halte ich – auch gerade da detaillierte Fehler im CCMS analysiert werden– für verfrüht. Ich sehe den Mehrwert von Nagios eher im Bereich derumfassenden Überwachung SAP/Infrastruktur bzw. der guten und schnellen Benachrichtigung außerhalb des Büros und der üblichenDienstzeiten. Viel Know-How ist erforderlich, sowohl auf Seiten CCMS alsauch auf Seiten Nagios.”
K.K., Leiter SAP Basisysteme der Firma xxx GmbH
Statements aus der Praxis
Ein Unternehmen der MEHLER AGwww.itnovum.de
“Genügt eine OpenSource Plattformden Anforderungen für ein SAP-Monitoring?””
• Nagios kann direkt auf das SAP eigene, integrierte Monitoring-Tool CCMS zugreifen, dadurch ergeben sich viele Möglichkeiten.
• Nagios kann (mit Unterstützung) kostengünstig und schnellimplementiert werden; darüber hinaus wird nicht nur den Bereich SAP abgedeckt sondern auch andere IT-Komponenten überwacht.
• Viel Know-How notwendig; sowohl Nagios als CCMS / SAP
• Wir sehen das Einsatzgebiet mit dem Schwerpunkt einer breiteren und umfassenderen Überwachung, welche “weniger in die Tiefe” geht.
• Die Zukunft liegt klar im “Business Process Monitoring” (mySAP ERP Solution Manager). In wie weit diese tiefgehende Integration anderweitig sinnvoll zu realisieren ist, bleibt den zukünftigen Projektenüberlassen.
Fazit
Ein Unternehmen der MEHLER AGwww.itnovum.de
Danke für Ihre Aufmerksamkeit!
Michael KienleGeschäftsführer