meetup geneve monitoring -tcs performance et monitoring
TRANSCRIPT
© Touring Club Suisse 1
IT OPSPerformance et monitoring
Zaïd BOUDAMOUZ Expert applicatif & performance [email protected]
15.10.2015
© Touring Club Suisse 2
Sommaire
- Expert applicatif et performance monitoring- Infra TCS en quelques mots - KPI- Monitoring global au TCS- Monitoring IBM Websphere- Assistance Landscape Websphere - WebSphere Application Server Performance Tuning Toolkit- DEMO et quelques stats- Question
10.2015
© Touring Club Suisse 3
Expert applicatif & performance monitoring
• Expert Applicatif au TCS • Support niveau 2 • Analyse des problèmes «middleware»
• Spécialiste IBM Websphere, anciennement IBM Partner,• Déploiement dans des environnements en cluster
d’applications et de connecteurs SOA• Surveillance des systèmes applicatifs Websphere
• Développeur Senior J2EE, certifié SCJP• 8 ans de consulting (PSA, Delta data, TCS)
10.2015
© Touring Club Suisse 4
INFRA TCS en quelques mots
• 6 ESX VMware Hyperviseur• 3 au sièges du TCS, 3 à Interroute• 330 VM environ, 30 serveurs physiques
• Plus de 100 applications actives 7j/7, 24h/24 • Applications WEB et Mobiles • Client lourd en JAVA • Applications Back end pour B2B • Environ 20 applications dans le cloud
• Plus de 5000 utilisateurs tout application confondu (excepté application mobile)
10.2015
© Touring Club Suisse 5
KPI de la semaine 37 à 41
10.2015
Performance & scalabilité affecte la disponibilité. 99.9% = 8.5h d’indispo/an
Le calcul est le suivant
Disponibilité = (MTBF/(MTBF + MTTR)) X 100
MTBF (mean time between failure) MTTR (mean time to recovery)
© Touring Club Suisse 6
Monitoring global TCS
• Un monitoring global des applications critiques basé sur les produits :• Newtest• Log Nagios• cURL
• Un monitoring Nagios • Plusieurs monitoring spécifiques selon le
domaine (Monitoring Boomi, Monitoring F5 BigIP , Monitoring IBM Websphere )
© Touring Club Suisse 7
Monitoring IBM Websphere
• Monitoring d’applications J2EE
La Java Virtual Machine est la structure d’accueil d’une application J2EE. Les structures d’accueil sont les espaces d’exécution des conteneurs et des composants, elles servent de médiateur entre les conteneurs et les services systèmes. Les serveurs d’applications J2EE
permettent de développer très rapidement des applications complexes capables de supporter plusieurs milliers de transactions par secondes et plusieurs centaines de milliers d’utilisateurs.
© Touring Club Suisse 8
Assistance Landscape Websphere
© Touring Club Suisse 9
Assistance Landscape Websphere
10.2015
Cell=dmgrcell, Profile=dmgr
lge1as073pNode01 (ND 7.0.0.35)
lge3as194pNode01 (ND 7.0.0.35)
lge1as071pNode01 (ND 7.0.0.35)
lge3as193pNode01 (ND 7.0.0.35)
lge1as076pNode01 (ND 7.0.0.35)
lge3as198pNode01 (ND 7.0.0.35)
CLUSTER_A6FRONT
SIB_PRD_01
CLUSTER_A6BACK
CLUSTER_A6INVOICE
CLUSTER_SIBUS
CLUSTER_MUTASSYS
A6_PRD_01 A6_PRD_02 A6_PRD_03 A6_PRD_04
SIB_PRD_02
A6BK_PRD_01 A6BK_PRD_02
A6INV_PRD_02
MUT_PRD_01 MUT_PRD_02
Assys
SIBUS
Assys (back)
Assys Invoice
ATP
© Touring Club Suisse 10
WebSphere Application Server Performance Tuning Toolkit
10.2015
Scénario FonctionsDétecter au plus vite les exceptions
• Détecter les différents type d’erreurs au plus vite (erreurs servlet, transaction (rollback et timeout), JDBC / JCA (erreur de connexion ou timeout), thread hung, et tout autres exceptions
Détecter les problèmes
• Avoir un diagramme détaillé de l’état du système• Définir des règles permettant de détecter les symptômes d’anomalie système
Consolider la configurarion sde performance
• Tuner tous les serveurs depuis une console d’administration• Exécuter des scripts (python) depuis la console
Faciliter la détermination des problèmes
• Générer les thread dump et les heap dump • Activer les traces de runtime • Extraire le contenu des pool de connexion• Extraire les fichiers SystemOut.log/SystemErr.log
© Touring Club Suisse 1110.2015
DEMO
© Touring Club Suisse 12
Demo
• Monitoring globale • Newtest• Boomi• Nagios
© Touring Club Suisse 13
Quelques stats
10.2015
D’après vous quels sont les causes les plus communes des problèmes de performance ?
© Touring Club Suisse 14
Quelques chiffres
10.2015
Les requêtes SQL et l’accès en concurrence sont prioritaires, et problèmes de fuite mémoire persistent en 2015.
Les problèmes de performance lié au réseau sont seulement en 3ème position
15
Quelques chiffres
SOURCE : DZone’s 2015 guide to performance and monitoring
Nagios, Zabbix, et Icinga dominent sur le marché : 70%
© Touring Club Suisse 16
Questions ?
© Touring Club Suisse 17
http://www-01.ibm.com/support/knowledgecenter/SSEQTP_7.0.0/com.ibm.websphere.base.doc/info/aes/ae/welc6topmonitoring.html?lang=fr
http://www-01.ibm.com/support/docview.wss?uid=swg27024925&aid=1
10.2015