3564
Commentaire: Ajout de protocol des tests
|
1486
Mise à jour
|
Texte supprimé. | Texte ajouté. |
Ligne 1: | Ligne 1: |
## page was renamed from ZA/Montréal/ToIP/JournalDesIncidents = ToIP : journal des évènements = |
= Journal des évènements des serveurs bureautique = |
Ligne 4: | Ligne 3: |
== NFS-AUTHNSS == | |
Ligne 5: | Ligne 5: |
|| ||Serveur non fonctionnel|| ||réinstallation du serveur|| ||NM - DS||Achat express et configuration du serveur secours|| || ||Carte analogique Sangoma A202 HS|| ||Changement de carte|| ||NM||- C'est la 2ème carte qui tombe en panne.<<BR>> - Hypothèse : court-circuit dû à une différence de potentiel aux ports de la carte|| || ||remplacement de la carte analogique par des modules ATA (analog téléphon adapter) SPA2102||-||achat des [[ZA/Montréal/ToIP/AnalogTelephoneAdapter|modules et installation]]||-||NM|| || ||30/07/2010 9h||service téléphonique non stable (téléphones non connecté, communication interrompu ou impossible, etc.)||29/07/2010 ~17h36||- Constat : serveur très très chargé avec le processus asterisk qui bourrine à fond sur le CPU <<BR>> - restart d'asterisk||30/07/2010 9h11||NM à distance|| || ||13/08/2010||service téléphonique non stable||~14h42||- Constat : encore process asterisk, charge très haute <<BR>> - Restart asterisk||14h58||NM|| || ||20/09/2010||service téléphonique non stable||~17h30||- Charge élevée <<BR>> - Restart==>service toujours non fonctionnel car wanpipe planté à cause de la dernière mise à jour du noyau <<BR>> - retour au noyau précédent, restauration des drivers dans le bon répertoire du noyau||~2h ou 3h du mat||DS - JC|| || ||30/09/2010||téléphonie HS, serveur inaccessible par ssh||~17h21||Restart Asterisk||21h28||NM|| || ||19/10/2010||Certains téléphones sans service||avant 9h||- serveur RAS <<BR>> - brancher les postes concernés sur d'autres port du switch poe||9h45||DS - NM||- seul les postes branchés le 3ème bloc de 8 ports du switch étaient HS <<BR>> - Après reboot du switch, ils sont à nouveau fonctionnel|| ||23/10/2010||Mise à jour système (aptitude)||10h00||- aptitude safe-upgrade <<BR>> - récompilation driver wanpipe <<BR>> - restauration fichiers de config wanpipe, zaptel, zapata.conf||11h||DS sur place <<BR>> NM à distance||- Opération faite en week end à cause du plantage dû à la mise à jour du noyau <<BR>> - Reboot après compilation du driver|| ||29/11/2010||service téléphonique non stable||~15h50||- Constat : encore process asterisk, charge de CPU très haute <<BR>> - Restart asterisk||16h01||DS|| || ||20612/2010||service téléphonique non stable||~14h57||- Constat : encore process asterisk, charge de CPU très haute <<BR>> - Restart asterisk||15h01||DS|| - Julien G. était en ligne quand ça arrivé. Sa communication a été simplement coupé, le compteur de temps continuait à fonctionner de coté téléphone. <<BR>> - 1 minute avant la plantage Nora recouperait ses messages vocales. || |
||10/05/2011 15h20||Constat : Internet inaccessible, résolution dns impossible, ... postes gelés ... <<BR>> - sur la console : message "outof memory, killed mysql (ou autre) qui défile sans cesse||10/05/2011 ???||Reboot serveur||15h30||NM, DS et JC pour investigations||- C'est le second crash identique qui arrive : le premier était le 3 mai vers 15h46, et a conduit à l'augmentation de la RAM hier <<BR>> - un premier crash avait eu lieu le 20 avril après 16h|| ||09/05/2011||Augmentation de la mémoire : de 3.5GB à 9GB||09/05/2011 19h55||- installation de nouvelles barrettes <<BR>> - installation du noyau Debian pour les bigmem||09/05/2011 21h15||NM||On a au total 14GB de mémoire ; pour ne pas accepter les 5GB de online spare proposé par le bios, nous avons carrement désactivé la redondance mémoire|| ||19/01/2011||ouverture des sessions d'usagers impossible ||19/01/2011 - 7h17 || Redemarrage du serveur || 19/01/2011 à 9h01 || Darko Stanar || le ping fonctionnait; ssh non fonctionel ; impossible d'ouvrir la session local sur la console ; serveur gelé; aucun message dans le log: aucun trace depuis 7h17 jusqu'au redemarrage ; RAID 1 matériel contenant la partition /home resynchronisé après le redemarrage; conclusion:on ne sait pas ce qui s'est passé || |
Ligne 20: | Ligne 12: |
= ToIP : protocol des tests apres la màj de noyau = || Date et heure || Appel sortant vers exterieur || Appel entrant de l'exterieur || Appel sortant local || Appel entrant local || Messagerie vocal || FAX - reception || FAX - l'envoi || Test effectué par:|| || <<BR>> || || || || || || || || || || <<BR>> || || || || || || || || || |
Journal des évènements des serveurs bureautique
NFS-AUTHNSS
Date constat |
Evenement |
date début |
Actions |
date reprise service |
Intervenants |
Observations |
10/05/2011 15h20 |
Constat : Internet inaccessible, résolution dns impossible, ... postes gelés ... |
10/05/2011 ??? |
Reboot serveur |
15h30 |
NM, DS et JC pour investigations |
- C'est le second crash identique qui arrive : le premier était le 3 mai vers 15h46, et a conduit à l'augmentation de la RAM hier |
09/05/2011 |
Augmentation de la mémoire : de 3.5GB à 9GB |
09/05/2011 19h55 |
- installation de nouvelles barrettes |
09/05/2011 21h15 |
NM |
On a au total 14GB de mémoire ; pour ne pas accepter les 5GB de online spare proposé par le bios, nous avons carrement désactivé la redondance mémoire |
19/01/2011 |
ouverture des sessions d'usagers impossible |
19/01/2011 - 7h17 |
Redemarrage du serveur |
19/01/2011 à 9h01 |
Darko Stanar |
le ping fonctionnait; ssh non fonctionel ; impossible d'ouvrir la session local sur la console ; serveur gelé; aucun message dans le log: aucun trace depuis 7h17 jusqu'au redemarrage ; RAID 1 matériel contenant la partition /home resynchronisé après le redemarrage; conclusion:on ne sait pas ce qui s'est passé |