Modifications entre les versions 4 et 5
Version 4 à la date du 2006-09-28 11:26:44
Taille: 2312
Éditeur: JérômeSantini
Commentaire:
Version 5 à la date du 2006-09-28 11:51:06
Taille: 2991
Éditeur: ThomasNoël
Commentaire:
Texte supprimé. Texte ajouté.
Ligne 5: Ligne 5:
Vous devez connaître votre système dans ses moindres détails. Ainsi, vous êtes capable d'anticiper, en agissant avant qu'un problème ne se transforme en urgence. Inversement, vous évitez de paniquer inutilement face à de fausses alertes. Enfin, comme des urgences se produisent malgrè tout, vous aurez des éléments pour agir de manière plus efficace.

Connaître son système c'est en faire l'inventaire mais aussi savoir comme il fonctionne habituellement.
Ligne 7: Ligne 11:
 1. Matériel
  1. Les composants internes des serveurs (HD, Proc, type ram)
  1. Réseaux (informatique et électrique)
  1. Interconnexion entre ces éléments
   
 1. Plan logique
  1. Adressage IP
  1. Répartition des services
  1. Interconnexions et dépendances entre ces services
Il est nécessaire de disposer de plans à jour en permanence.
Ligne 17: Ligne 13:
Résultats attendus :
 1. Plans à jour en permanence
 1. Matos etiquetté soigneusement
Au niveau des matériels, vous devez connaître :
 1. les réseaux informatiques, électriques et télécom
 1. le détail des composants internes des serveurs (disques, processeur, mémoire vive, etc.)
 1. les systèmes de protection électriques (puissance, autonomie, etc.)
 1. les interconnexions et les dépendances entre ces éléments
L'étiquettage soigneux et exhaustif du matériel fait partie de la documentation.

Vous devez aussi disposer des plans logiques concernant :
 1. l'adressage IP
 1. la répartition des services par serveur (DNS, messagerie, pare-feu, etc.)
 1. les interconnexions et les dépendances entre ces services
Ligne 24: Ligne 28:
 1. Bruits habituels
 1. Ni
veau des onduleurs
 1. Délai
de démarrage des serveurs
 1. Température habituelle de la clim, des disques
 1. et tous c
es autres petits détails spécifiques à votre installation.
 1. les bruits habituels des disques, des ventilateurs, des climatiseurs
 1. l'autonomie des onduleurs
 1. les délais
de démarrage des serveurs
 1. la température habituelle de la clim, des disques, des processeurs
 1. ... et tous l
es autres petits détails spécifiques à votre installation.
Ligne 32: Ligne 35:
De même pour les logiciels :   1. Charge habituelle des machines
 1. T
aux d'occupation de la mémoire, swap éventuel
 1. Taux d'occupation des disques et évolution dans le temps
 1. L
es alertes qui n'en sont pas vraiment dans les logs
 1. L
es ordres de grandeurs concernant l'utilisation des services (nombre de mails, requetes web,etc)
 1. ''Rajoutez ici vos idées''
De même pour les logiciels, vous devez connaître :
 1. la c
harge habituelle des serveurs
 1. le t
aux d'occupation de la mémoire, le swap éventuel
 1. les taux d'occupation des disques et leur évolution dans le temps
 1. l
es alertes qui n'en sont pas vraiment dans les logs, c'est-à-dire dont vous avez constaté par expérience qu'elles ne prêtent pas à conséquence
 1. l
es ordres de grandeurs concernant l'utilisation des services (nombre de mails, requêtes web, etc.)
 1. ''rajoutez ici vos idées''
Ligne 40: Ligne 43:
Grâce à ces informations, vous êtes capables d'anticiper, en agissant avant qu'un problème ne se transforme en urgence. Inversement, cela vous évite de paniquer inutilement face à de fausses alertes. Enfin, comme, malgré tout, les urgences se produisent quand même, cela vous donne des éléments pour agir de manière plus efficace. Des outils existent pour vous aider à collecter et analyser ces informations : OutilsDeSuivi. Attention, ces outils ne sont pas magiques : les installer n'est pas une fin en soi, il faut les consulter et les compléter.
Ligne 42: Ligne 45:
Des outils existent pour vous aider à collecter et analyser ces informations. Voir ../OutilsDeSuivi. Attention, ces outils ne sont pas magiques : les installer n'est pas une fin en soi, il faut les consulter et les compléter.

Cette page est destinée à aider l'administrateur système dans son travail. On y liste ce qu'il faut faire régulièrement afin de limiter le nombre d'urgence à traiter.

Connaître son système

Vous devez connaître votre système dans ses moindres détails. Ainsi, vous êtes capable d'anticiper, en agissant avant qu'un problème ne se transforme en urgence. Inversement, vous évitez de paniquer inutilement face à de fausses alertes. Enfin, comme des urgences se produisent malgrè tout, vous aurez des éléments pour agir de manière plus efficace.

Connaître son système c'est en faire l'inventaire mais aussi savoir comme il fonctionne habituellement.

Documentation

Il est nécessaire de disposer de plans à jour en permanence.

Au niveau des matériels, vous devez connaître :

  1. les réseaux informatiques, électriques et télécom
  2. le détail des composants internes des serveurs (disques, processeur, mémoire vive, etc.)
  3. les systèmes de protection électriques (puissance, autonomie, etc.)
  4. les interconnexions et les dépendances entre ces éléments

L'étiquettage soigneux et exhaustif du matériel fait partie de la documentation.

Vous devez aussi disposer des plans logiques concernant :

  1. l'adressage IP
  2. la répartition des services par serveur (DNS, messagerie, pare-feu, etc.)
  3. les interconnexions et les dépendances entre ces services

Suivi

Vous devez connaître le comportement habituel de votre matériel :

  1. les bruits habituels des disques, des ventilateurs, des climatiseurs
  2. l'autonomie des onduleurs
  3. les délais de démarrage des serveurs
  4. la température habituelle de la clim, des disques, des processeurs
  5. ... et tous les autres petits détails spécifiques à votre installation.

En conclusion, visitez régulièrement votre local technique, et pas seulement durant les pannes.

De même pour les logiciels, vous devez connaître :

  1. la charge habituelle des serveurs
  2. le taux d'occupation de la mémoire, le swap éventuel
  3. les taux d'occupation des disques et leur évolution dans le temps
  4. les alertes qui n'en sont pas vraiment dans les logs, c'est-à-dire dont vous avez constaté par expérience qu'elles ne prêtent pas à conséquence
  5. les ordres de grandeurs concernant l'utilisation des services (nombre de mails, requêtes web, etc.)
  6. rajoutez ici vos idées

Des outils existent pour vous aider à collecter et analyser ces informations : OutilsDeSuivi. Attention, ces outils ne sont pas magiques : les installer n'est pas une fin en soi, il faut les consulter et les compléter.

Tâches régulières

  • MAJ
  • Suivi sécurité (complémentaires, mais disctincts)

suivi des logs : - aspect quantité - aspect gestion de l'inattendu

planification

  • - reevaluation des besoins utilisateurs - stocks, spare, pannes - dimensionnement et évolution du système

vérification des backups

TravailDeFond (dernière édition le 2008-02-21 22:09:18 par localhost)