Déroulement de l'atelier "Surveiller et améliorer les performances de son serveur"

Plan

Énumération de quelques outils
Quelques exemples d'utilisation à Montréal (nagios, munin, logcheck) et à Dakar (mon)
Recommandations en matière de supervision
Comment améliorer les performances de son serveur ?
Échanges sur les expériences des participants

Déroulement

Mise en contexte

Question ouverte : Pourquoi superviser son serveur ?

1- Énumération de quelques outils

le faire soi-même (pas productif)
- Suivi des journaux d’évènements (les logs)
  - auth.log
  - syslog
  - mail.log
  - dmesg
- quelques commandes
  - top- Process Activity Command
  - vmstat – System Activity, Hardware and System Information
  - w – Find Out Who Is Logged on And What They Are Doing
  - ps – Displays The Processes
  - uptime – Tell How Long The System Has Been Running
  - free – Memory Usage
  - iptraf – Real-time Network Statistics
  - iostat – Average CPU Load, Disk Activity
  - netstat – Network Statistics
  - ss – Network Statistics
  - tcpdump – Detailed Network Traffic Analysis
  - mpstat – Multiprocessor Usage
  - sar – Collect and Report System Activity
  - pmap – Process Memory Usage
  - ipfm - a bandwidth analysis
supervision active (envoi d'alertes)
- Nagios
- Logcheck / logwatch
- smartmontool
supervision passive
- Cacti
- Munin
- Mrtg
- Zabbix
- suivi des modifications : git
En deux liens : http://www.debianhelp.co.uk/monitortools.htm et http://www.cyberciti.biz/tips/top-linux-monitoring-tools.html

2- Quelques exemples de Montréal

Nagios

quelques messages d'alerte

***** Nagios  *****

Notification Type: PROBLEM

Service: Espace disque
Host: vz-aufhorsite
State: WARNING for 0d 0h 3m 1s
Address: 204.136.13.20

Info:

WARNINGbr/: 90% 2386/2818MB used (warning=90% critical=95%)br

Date/Time: Thu Aug 4 13:40:40 EDT 2011


***** Nagios  *****

Notification Type: PROBLEM

Service: Espace disque
Host: vz-aufhorsite
State: CRITICAL for 0d 0h 0m 1s
Address: 204.136.13.20

Info:

CRITICALbr/: 95% 2533/2818MB used (warning=90% critical=95%)br

Date/Time: Fri Aug 5 17:00:40 EDT 2011 


***** Nagios  *****

Notification Type: RECOVERY

Service: Espace disque
Host: vz-aufhorsite
State: OK for 0d 0h 0m 1s
Address: 204.136.13.20

Info:

OK

Date/Time: Sun Aug 7 06:25:40 EDT 2011


**** Nagios *****

Notification Type: PROBLEM
Host: nfs-mtl
State: DOWN for 0d 0h 0m 0s
Address: 10.36.1.200
Info:

CRITICAL - Host Unreachable (10.36.1.200)

Date/Time: Mon Jul 18 17:18:00 EDT 2011

vue générale du système (postes éteints ou en marche)

logcheck

ecurity Events for su
=-=-=-=-=-=-=-=-=-=-=-
Jul 28 15:03:23 10.36.0.17 su[3079]: pam_unix(su:auth): authentication failure; logname=xxxxx uid=1008 euid=0 tty=pts/1 ruser=xxxxx rhost=  user=ftp
Jul 28 15:03:25 10.36.0.17 su[3079]: FAILED su for ftp by xxxxx

Security Events for sudo
=-=-=-=-=-=-=-=-=-=-=-=-
Jul 28 15:01:48 10.36.0.17 sudo: pam_unix(sudo:auth): authentication failure; logname=xxxxx uid=0 euid=0 tty=/dev/pts/1 ruser= rhost=  user=xxxxx

Munin
- suivi des onduleurs : http://superca-munin.ca.auf/onduleurs.html
- suivi de ressources systèmes, exemple de la mémoire :

3- Recommandations en matière de supervision

la rigueur dans le suivi des alertes, prendre soin de lire attentivement TOUS les messages
ne pas remettre à plus tard le traitement des alertes critiques
réviser les seuils d'alerte en fonction des activités des serveurs
suivre régulièrement les graphes : cela permet de déceler les soucis à venir (saturation espace disque ou mémoire, etc.) et d'anticiper

4- Comment améliorer les performances de son serveur ?

un serveur == rôle précis ==> applications précises ==> ne pas y installer n'importe quoi
savoir détecter les signes d’essoufflement (charge constamment élevée, saturation espace disque ou mémoire, processeur, trafic réseau, etc.) et prendre les mesures qui s'imposent (augmentation RAM, carte réseau gigabits, ajout de processeur si possible, etc.)
garder son serveur à jour
changer périodiquement les disques durs (cela minimise aussi les pannes disques HS)

5- Échanges sur les expériences des participants

quels outils sont utilisés ?
existent-ils des scripts/outils perso ?
comment font les autres (qui n'on pas d'outils) ?
affiner le paramétrage de certains logicels (apache, mysql, exim, postfix, )

Projet/SemaineTech/2011/Ateliers/PerformancesDeSonServeur/SupportDePrésentation (dernière édition le 2012-04-02 15:12:51 par VictorBruneau)

-  ⇤ ← Version 4 à la date du 2011-08-15 21:12:53 → 
  Taille: 4910
  Éditeur: MoussaNombre
  Commentaire: suite
+   ← Version 5 à la date du 2011-08-15 21:13:45 → ⇥
  Taille: 5002
  Éditeur: MoussaNombre
  Commentaire:
-Texte supprimé.
+Texte ajouté.
 Ligne 1:
+## page was renamed from Projet/SemaineTech/Ateliers/PerformancesDeSonServeur/Déroulement

WikiTeki / Modifications de « Projet/SemaineTech/2011/Ateliers/PerformancesDeSonServeur/SupportDePrésentation »