Taille: 2312
Commentaire:
|
Taille: 2991
Commentaire:
|
Texte supprimé. | Texte ajouté. |
Ligne 5: | Ligne 5: |
Vous devez connaître votre système dans ses moindres détails. Ainsi, vous êtes capable d'anticiper, en agissant avant qu'un problème ne se transforme en urgence. Inversement, vous évitez de paniquer inutilement face à de fausses alertes. Enfin, comme des urgences se produisent malgrè tout, vous aurez des éléments pour agir de manière plus efficace. Connaître son système c'est en faire l'inventaire mais aussi savoir comme il fonctionne habituellement. |
|
Ligne 7: | Ligne 11: |
1. Matériel 1. Les composants internes des serveurs (HD, Proc, type ram) 1. Réseaux (informatique et électrique) 1. Interconnexion entre ces éléments 1. Plan logique 1. Adressage IP 1. Répartition des services 1. Interconnexions et dépendances entre ces services |
Il est nécessaire de disposer de plans à jour en permanence. |
Ligne 17: | Ligne 13: |
Résultats attendus : 1. Plans à jour en permanence 1. Matos etiquetté soigneusement |
Au niveau des matériels, vous devez connaître : 1. les réseaux informatiques, électriques et télécom 1. le détail des composants internes des serveurs (disques, processeur, mémoire vive, etc.) 1. les systèmes de protection électriques (puissance, autonomie, etc.) 1. les interconnexions et les dépendances entre ces éléments L'étiquettage soigneux et exhaustif du matériel fait partie de la documentation. Vous devez aussi disposer des plans logiques concernant : 1. l'adressage IP 1. la répartition des services par serveur (DNS, messagerie, pare-feu, etc.) 1. les interconnexions et les dépendances entre ces services |
Ligne 24: | Ligne 28: |
1. Bruits habituels 1. Niveau des onduleurs 1. Délai de démarrage des serveurs 1. Température habituelle de la clim, des disques 1. et tous ces autres petits détails spécifiques à votre installation. |
1. les bruits habituels des disques, des ventilateurs, des climatiseurs 1. l'autonomie des onduleurs 1. les délais de démarrage des serveurs 1. la température habituelle de la clim, des disques, des processeurs 1. ... et tous les autres petits détails spécifiques à votre installation. |
Ligne 32: | Ligne 35: |
De même pour les logiciels : 1. Charge habituelle des machines 1. Taux d'occupation de la mémoire, swap éventuel 1. Taux d'occupation des disques et évolution dans le temps 1. Les alertes qui n'en sont pas vraiment dans les logs 1. Les ordres de grandeurs concernant l'utilisation des services (nombre de mails, requetes web,etc) 1. ''Rajoutez ici vos idées'' |
De même pour les logiciels, vous devez connaître : 1. la charge habituelle des serveurs 1. le taux d'occupation de la mémoire, le swap éventuel 1. les taux d'occupation des disques et leur évolution dans le temps 1. les alertes qui n'en sont pas vraiment dans les logs, c'est-à-dire dont vous avez constaté par expérience qu'elles ne prêtent pas à conséquence 1. les ordres de grandeurs concernant l'utilisation des services (nombre de mails, requêtes web, etc.) 1. ''rajoutez ici vos idées'' |
Ligne 40: | Ligne 43: |
Grâce à ces informations, vous êtes capables d'anticiper, en agissant avant qu'un problème ne se transforme en urgence. Inversement, cela vous évite de paniquer inutilement face à de fausses alertes. Enfin, comme, malgré tout, les urgences se produisent quand même, cela vous donne des éléments pour agir de manière plus efficace. | Des outils existent pour vous aider à collecter et analyser ces informations : OutilsDeSuivi. Attention, ces outils ne sont pas magiques : les installer n'est pas une fin en soi, il faut les consulter et les compléter. |
Ligne 42: | Ligne 45: |
Des outils existent pour vous aider à collecter et analyser ces informations. Voir ../OutilsDeSuivi. Attention, ces outils ne sont pas magiques : les installer n'est pas une fin en soi, il faut les consulter et les compléter. |
Cette page est destinée à aider l'administrateur système dans son travail. On y liste ce qu'il faut faire régulièrement afin de limiter le nombre d'urgence à traiter.
Connaître son système
Vous devez connaître votre système dans ses moindres détails. Ainsi, vous êtes capable d'anticiper, en agissant avant qu'un problème ne se transforme en urgence. Inversement, vous évitez de paniquer inutilement face à de fausses alertes. Enfin, comme des urgences se produisent malgrè tout, vous aurez des éléments pour agir de manière plus efficace.
Connaître son système c'est en faire l'inventaire mais aussi savoir comme il fonctionne habituellement.
Documentation
Il est nécessaire de disposer de plans à jour en permanence.
Au niveau des matériels, vous devez connaître :
- les réseaux informatiques, électriques et télécom
- le détail des composants internes des serveurs (disques, processeur, mémoire vive, etc.)
- les systèmes de protection électriques (puissance, autonomie, etc.)
- les interconnexions et les dépendances entre ces éléments
L'étiquettage soigneux et exhaustif du matériel fait partie de la documentation.
Vous devez aussi disposer des plans logiques concernant :
- l'adressage IP
- la répartition des services par serveur (DNS, messagerie, pare-feu, etc.)
- les interconnexions et les dépendances entre ces services
Suivi
Vous devez connaître le comportement habituel de votre matériel :
- les bruits habituels des disques, des ventilateurs, des climatiseurs
- l'autonomie des onduleurs
- les délais de démarrage des serveurs
- la température habituelle de la clim, des disques, des processeurs
- ... et tous les autres petits détails spécifiques à votre installation.
En conclusion, visitez régulièrement votre local technique, et pas seulement durant les pannes.
De même pour les logiciels, vous devez connaître :
- la charge habituelle des serveurs
- le taux d'occupation de la mémoire, le swap éventuel
- les taux d'occupation des disques et leur évolution dans le temps
- les alertes qui n'en sont pas vraiment dans les logs, c'est-à-dire dont vous avez constaté par expérience qu'elles ne prêtent pas à conséquence
- les ordres de grandeurs concernant l'utilisation des services (nombre de mails, requêtes web, etc.)
rajoutez ici vos idées
Des outils existent pour vous aider à collecter et analyser ces informations : OutilsDeSuivi. Attention, ces outils ne sont pas magiques : les installer n'est pas une fin en soi, il faut les consulter et les compléter.
Tâches régulières
- MAJ
- Suivi sécurité (complémentaires, mais disctincts)
suivi des logs : - aspect quantité - aspect gestion de l'inattendu
planification
- - reevaluation des besoins utilisateurs - stocks, spare, pannes - dimensionnement et évolution du système
vérification des backups