14773
Commentaire: Mise à jour
|
19010
|
Texte supprimé. | Texte ajouté. |
Ligne 1: | Ligne 1: |
#addacl GroupeAUF:read,write | #acl GroupeAUF:read,write All:read |
Ligne 5: | Ligne 5: |
= Mission : Installation de l'espace Ifadem de Jacmel + travaux au BC = | = Mission : 17 au 28 novembre 2015 à Port-au-Prince = |
Ligne 9: | Ligne 9: |
* Aller (départ de Montréal) : lundi 23 mai 2011 * Retour (départ de Port-au-Prince) : lundi 06 juin 2011 |
||<<MonthCalendar(,2015,11,,,1)>> || * Départ de Montréal : mardi 17 novembre à 9h30 -- arrivée PaP à 13h50 (Air Canada vol 1814) * Départ de Port-au-Prince : samedi 28 novembre à 16h15 (American AirLine vol 201) -- Miami 18h26-20h04 (AA, vol 1465)-- arrivée Montréal à 23h38 |
Ligne 13: | Ligne 16: |
* mettre en place l'espace Ifadem de Jacmel : serveur, réseau, Internet, parefeu, installation des meubles et des portables, électricité * travaux sur le système informatique du BC |
|
Ligne 16: | Ligne 17: |
__NB__ : '''prendre les dispositions pour travailler samedi et dimanche''' | * restructuration de l’infrastructure technique (réduction/optimisation du nombre de serveurs, mutualisation de certains services vers le central) * on passera de 4 à 2 serveurs (voire 1 serveur) * le service de partage de fichiers se fera via nuage.auf.org * mise en place d'un dispositif d'accès distant * analyse/résolution des difficultés/soucis techniques récurrents * entretiens de recrutement d'un technicien '''NB''' : 1. il faudra prévoir de '''travailler les samedi et dimanche''' de la mission afin de procéder à la mise en production de la nouvelle infrastructure (arrêts et redémarrages des serveurs) sans perturber les collègues et les abonnés. 1. '''informer les abonnés des changements à venir''' (ils n'auront plus d'espace de stockage sur les machines) et les mesures d'accompagnement (à préciser et mettre en place) 1. prévoir la '''fermeture du CNF le Jour 1 à partir de 14h''' (une heure plus tôt que d'habitude) : modification à apporter aux postes et au serveur. __Les sauvegardes__ : 1. Il n'y aura aucune sauvegarde des postes public (CNF), cf NB 2 ci-dessus 1. Les postes du personnel seront sauvegardés vers un espace disque sur super-bc via '''[[http://doc.ubuntu-fr.org/deja-dup|Déjà-Dup]]''' (installé par défaut sur nos postes). . Ce qui donne, au passage, une grande autonomie au personnel sur leurs données et les besoins restaurations en cas de nécessité. . Du coup, on n'a plus besoin du serveur de sauvegarde . [Faire une sauvegarde des clés de chiffrement] 1. La sauvegarde des serveurs se fera vers Montréal (OVH) durant la nuit (aucun impact pour les utilisateurs le jour) == Travaux préliminaires == * Par LBM : * configuré et tester Déjà-Dup sur son poste * Par NM (à Montréal) : * procéder aux achats de matériel * [[ZC/CNFPaP/SuperBC|serveur]] : * installer Debian Jessie (firmeware-nonfree) + Libvirt/qemu + config de la VM gw.ht.auf (cf photo plus bas) sur les nouveaux disques achetés * transfert de la VM pfsense * conversion/transfert du CT voip * configuration du [[ZC/CNFPaP/KVMIP|kvm-ip et du pcu]] * préparation suppression du NFS * postes du personnel (migration des partages dans nuage.auf.org) * [LBM] installer client owncloud 2.0 sur les postes du personnel . cocher option confirmation pour le téléchargement de dossier/fichier de plus de [10Mo ?] * [NM/LBM] transférer dans nuage.auf.org les dossiers partagés (coordonner avec PatrickHétu) . [PatrickHétu] création du partage '''[[AUF-partage-BC]]''' avec un admin principal et des sous dossiers (droits à gérer par l'admin) * [LBM] désactiver autofs (exit 0 dans /etc/default/autofs) * [LBM] au passage, check list : * TB : activation de la synchro imap et des contacts * home : chiffré ? * postes du CNF * NM : valider procédure de bascule * fonctionnement avec des comptes type "invité" : profil dans /home/tmp/[username], shell particulier (cf compte guest d'Ubuntu) * création des homedir : activer pam-mkhomedir * nettoyage des homedir : cron de nettoyage des tmp : ajouter /home/tmp/*, [garder 7jours ???] * /home/tmp : partition séparée si possible ou activer quota disque (pour ne pas que les usagers bousillent toute la partition /) * vérifier le miroir * vérifier/maj configs preseed local == Planning et compte-rendu == ||'''Quand'''||'''Quoi'''||'''Qui'''||'''Compte-rendu au jour le jour'''|| ||<|2> Jour 1 : mercredi 18||<(> [Matinée] : <<BR>> * Réunion avec la Direction : <<BR>> ** peaufiner les derniers détails du planning de la mission <<BR>> ** point sur les ressources techniques du Bureau (notamment la connexion Internet, le projet de déménagement et le personnel informatique) <<BR>> * Réunion technique avec LBM avant le début des travaux||NM/LBM/Direction||<(> * NB : ce jour est férié en Haïti. Nous avons donc travaillé juste une demie-journée <<BR>> * La réunion avec la Direction est reportée à jeudi|| ||<(> [Après-midi] ''NB :'' '''Il faudra fermer le CNF à compter de 14h''' <<BR>> * modification des postes du CNF (désactivation de NFS, pam-mkhomedir, nettoyage tmp, quota ou partion séparée, etc) <<BR>> * modification des comptes a-d-u : HOMEDIR=/home/tmp/`username` <<BR>> * transfert des disques du serveur auth-nfs sur le serveur new-vz-bc (Attention : rm de udev/70-net) : auth-nfs devient '''super-bc''' <<BR>> * remise en service du serveur auth-nfs (en fait new-vz-bc qui contient les disques du auths-nfs) (service d'authentification pour le CNF et dossiers partagés du personnel)||NM/LBM||<(> * NFS désactivé sur les postes <<BR>> ** on garde le /home/username <<BR>> ** exit 0 dans /etc/default/autofs <<BR>> ** suppression du lien /home <<BR>> ** mkdir /home <<BR>> ** activer pam_mkhomedir (modif dans /etc/pam.d/common_session) <<BR>> ** nettoyage du /home à chaque démarrage des postes (rm -rf /home* dans /etc/rc.local) <<BR>> * Pas touché aux serveurs; le [[ZC/CNFPaP/SuperBC|nouveau serveur]] acheté à Montréal sera finalisé pour la prod.|| ||<|5> Jour 2 : jeudi 19||<(> [Matinée] <<BR>> * installation des "disk-from-Mtl" dans super-bc <<BR>> * installation de super-bc (installation dans le rack, connexion réseau, configuration switch vlan)||NM||<(> * '''Arrivée au bureau : 8h45''' <<BR>> * Rien n'a été installé dans le rack vu que les anciens serveurs y sont encore. On fera tout ça le week-end (sortir les anciens et mettre les nouveaux). <<BR>> * les disques ont été installés dans le serveur. Mais, grosse surprise : encore une carte RAID physique impossible de désactiver ! Finalement, en raid0, ça marche, on arrive à booter sur les disques. <<BR>> * J'ai passé énormément de temps à vouloir intégrer le super-bc et la vm passerelle dans le réseau actuel avec de "vraies" IP sans cassé la prod actuelle. <<BR>> * On s'y attendait : il y a un soucis avec les bridges : rien ne sort n'y entre ! ... '''A REVOIR''' <<BR>> * La vm de base pour voip est prête, reste à installer Asterisk 1.8 et migrer la config <<BR>> * Réunion avec la Direction : point sur la présélections des candidats pour le poste de tech bureautique, procédures de sélection (entretien avec questions générales et techniques, pas de test écrit), présentation des éléments clés (changements à venir) de la mission, point sur les démarches en cours pour l’acquisition de la liaison Internet Digicel et l'augmentation du débit de Natcom|| ||* installation du KVM-IP et du PCU (installation dans le rack et connexion aux serveurs||LBM||Reporté au week-end || ||<(> [Après-midi] <<BR>> * configuration du KVM-IP et du PCU||NM||Juste changé l'IP du KVM. Le PCU n'est pas encore installé, sera fait le week-end. || ||<(> * installation du client owncloud 2.0 sur les postes du personnel (activer le filtre de limitation de téléchargement selon la taille) <<BR>> * configuration de Déjà-Dup sur les postes du personnel <<BR>> * désactiver l'accès NFS||LBM||<(> * Config owncloud : OK <<BR>> * Config DéjàDup : commencée ... '''À FINALISER''' || ||[Fin de journée - 15h] * lancer le transfert des données des partages NFS dans nuage.auf.org||LBM||<(> * Déjà fait par NM depuis Montréal <<BR>> * '''Départ du bureau : 15h30 !!!''' (suite à l'hôtel sur une connexion Internet qui marche tant bien que mal ... quel calvaire !!!)|| ||<|4> Jour 3 : vendredi 20||<(> * suite de la configuration des services parefeu, de la gestion des 2 liens Internet et de l'accès au RPV AUF||NM||Plutôt attardé sur la résolution des soucis de bridges. Heureusement la grosse expérience de ProgFou a permis de débloquer la situation rapidement (cf les [[ZC/Missions/2015/Novembre/FeuilleDeRoute#A.2BAMk-changes_avec_JC_sur_les_soucis_de_bridges|échanges]] plus bas) <<BR>> * (soir à l'hôtel) cette histoire de raid matériel risque de nous causer des soucis : j'ai remarqué que les disques sont vus finalement comme des /dev/mdabc (genre (/dev/md123 pour sda). Je n'ai pas réussi à mettre en place mon raid logiciel sur la 2ème paire de disques ... '''A REVOIR'''|| || * finalisation de la VM pfsense (reconfiguration des interfaces réseaux)||LBM||Fait par NM || || * finalisation et mise en service de la Voip||LBM||Début de la conversion du CT asterisk18 en vm voip ... '''A FINALISER''' || || * configuration des sauvegardes hors site (Duplicity) des serveurs||LBM||Reste le cas des VM (comment faire ???) || ||<|1> Jour 4 - samedi 21||<(|2> * on récupère (offline) un des disques du RAID de super-bc pour le mettre sur super-bc-secours <<BR>> * mise en production de la nouvelle infrastructure <<BR>> * test de la bascule d'un lien Internet à l'autre||<(|2> NM/LBM ||<(> * Finalisation des règles de filtrage <<BR>> * Malgré mes mises en garde et mon désaccord, des travaux de câblage pour le déménagement de la salle serveurs ont commencé au même moment où je devais mettre en prod la nouvelle infra. Du coup 2 équipes qui se télescopent, des câbles et des goulottes partout, moi qui suis obligé d'intervenir dans ces travaux ... difficile de travailler sereinement et d'avancer comme prévu ! <<BR>> * Tant bien que mal : les anciens serveurs sont démontés et sortis du rack <<BR>> * je démonte une porte et une partie de son cadre pour faire passer le rack dans son nouveau local <<BR>> * installation du nouveau serveur, du pcu et du kvm <<BR>> * j'arrive, en jonglant (le câblage n'est pas fini), à brancher les câbles réseaux au serveur pour les premiers tests en vrais (bonnes IP aux bonnes places) et pour pouvoir travailler de l'hôtel <<BR>> * longue journée : 8h40 à 18h|| ||<|1> Jour 5 - dimanche 22||<(> * La journée commence super bien : <<BR>> ** vu que j'ai changé de chambre la nuit (encore) et que cela n'a pas été consigné, le chauffeur m'attend pendant 30min parceque le consiège n'a fait qu'appeler mon ancienne chambre <<BR>> ** on arrive au bureau et surprise tout est fermé et celui qui a la clé a fait une crevaison <<BR>> ** conclusion : la belle journée commence à 10h ! <<BR>> ** Ah ! J'oubliais : coupure d'électricité ~8h15 à 11h46. <<BR>> * Encore du temps passé sur cette question de RAID matériel, à tenter encore une fois, de le désactiver pour finalement ne pas y arriver. L'idée était d'éviter d'avoir 2 couches de RAID (le matériel et le logiciel fait depuis Montréal). Du coup, on verra donc comment monter des disques en RAID matériel et transférer tout le système. <<BR>> * Par la suite, on procède aux tests pour vérifier chacun des services et procéder aux ajustements (dhcp, dns, surtout parefeu, cnf, réseau du personnel, etc.) <<BR>> * Le câblage continue mais ne sera pas finalisé. RDV mardi pour la suite <<BR>> * Il faut corriger libnss sur tous les postes pour modifier l'IP du serveur mysql. Et comme on a oublié de copier la clé privée du root, LBM passe sur tous les postes et moi je rebranche l'ancien NFS pour récupérer ce qu'il faut. <<BR>> * La vm voip préparée par LBM n'est pas complète : il manque tous les fichiers de config. Pour aller au plus rapide (il commence à se faire tard et il faut rentrer), je rebranche l'ancien serveur vz-bc et je transfert le ct voip (lenny asterisk 1.4) en vm. J'arrête sur un soucis d'installation de noyau, on verra la suite demain. <<BR>> * Nous quittons le bureau à 19h16 en laissant la salle serveurs en état de chantier, certains bureau ne sont pas raccordés au réseau, la voip n'est pas fonctionnelle, le portail captif non plus, le switch vlan central est quelque part sur une chaise haute avec des câbles qui pendent partout, etc. etc. || ||<|1> Jour 6 - lundi 23||<(> * gestion des éventuels soucis découlant des changements effectués <<BR>> * assistance générale : <<BR>> ** impossibilité d'utiliser nos lignes téléphoniques fixes pour appeler l'international <<BR>> ** la connexion des ordinateurs à un réseau wifi empêche de profiter simultanément de la connexion internet et de l'accès aux fichiers (je sais, ça semble bizarre mais Beethoven sait de quoi je parle...) <<BR>> ** Divers||NM/LBM||Journée principalement consacrée aux entretiens de sélection pour le poste de tech bureautique. <<BR>> * Entre 2 entretiens : je désactive le squid (paquet installé mais non configuré) pour permettre aux abonnés d'avoir Internet <<BR>> * Je finalise la vm voip (pas de noyau, elle utilisera celle de l'hôte, en attendant de passer en Wheezy) <<BR>> * Travaux sur ipsecd : marche toujours pas :( <<BR>> * Connexion du wifi-auf : on se connecte bien au wifi, mais on n'a pas Internet <<BR>> * Suite à l'hôtel : <<BR>> ** Pfsense réglé : le gateway spécifié était encore l'ancienne IP du parefeu, de même que le dns.'''A VALIDER''' <<BR>> ** on attaque ipsecd ... || ||<|2> Jour 7 - mardi 24||* suite assistance <<BR>> * finalisation du serveur secours||NM||<(> *Finalement ni le captif, ni ipesecd n'étaient réglé <<BR>> * Suite et fin des entretiens dans la matinée <<BR>> * Digicel a commencé a installer le nouveau lien (fibre optique) <<BR>> * le câbleur arrive finalement à 15h ; il doit aussi installé le nouveau coffret pour les switchs <<BR>> * Début des travaux avec JC pour résoudre les problèmes bloquants (ipsecd, raid et lenteur de la vm passerelle) <<BR>> * Les travaux vont se poursuivre (JC chez lui à la maison et moi à l'hôtel) jusqu'à tard (~23h) et seront couronnés de succès : les 3 soucis sont résolus <<BR>> * ipsecd : il manquait la route vers le 10.0.0.0/8 (il y avait une erreur dans la config /etc/network/interfaces), un eth0.100 trainait encore quelque part <<BR>> * RAID : les nouveaux disques ont été partitionnés et ajoutés au raid logiciel en aggrandissant les volumes; et la synchro automatique s'est lancée. Reste plus qu'à enlever ces anciens disques plus tard <<BR>> * lenteur : elle était due au fait que la vm avait été créée sur un serveur AMD et maintenant roule sur du Xéon. Nous avons donc créer une nouvelle vm en utilisant le même disque <<BR>> * Modification dans la voip : intégrer les config du goip dans le ficher extensions-pstn.local et résoudre le problème des appels internationaux qui ne passent pas '''A VALIDER''' || ||* retrait et mise au rencart des serveurs inutilisés (old vz-bc, backup, boukman)||LBM|| || ||<|2> Jour 8 - mercredi 25|| * mise à jour de la documentation globale (mise à jour du wiki) <<BR>> * rédaction d'une procédure de bascule en cas de panne du serveur principal||NM|| || ||* réunion de synthèse avec la Direction||NM/LBM/Direction|| || ||<|1> Jour 9 - jeudi 26||<(|2> Entretiens et tests de recrutement d'un technicien||<(|2> NM/LBM/JPM||<|2> || ||<|1> Jour 10 - vendredi 27|| ||<|1> Jour 11 - samedi 28||départ pour Montréal ||NM|| || || Réinstallation des postes clients en Trusty|| == Schémas de l'infrastructure == ||{{attachment:schemas-it-bc.png|schémas avant et après|width=400}}||{{attachment:infra3.0.png|Infra Tech 3.0|width=400}}|| == Besoin en matériel == * KVM-IP * PCU * Disques durs : 4 x 1TB * Barrettes mémoires (pour auth-nfs et new-vz-bc) == Annexes == === Échanges avec JC sur les soucis de bridges === {{{ (13:01:51) moussa.nombre@auf.org/3277039268144837733412656: je suis embourbé dans cette histoire d'interfaces/ponts (13:02:39) moussa.nombre@auf.org/3277039268144837733412656: hier nuit, finalement tout était bien, mes interfaces de passerelle fonctionnaient (13:02:54) moussa.nombre@auf.org/3277039268144837733412656: j'y avait accès depuis le lan (13:03:24) moussa.nombre@auf.org/3277039268144837733412656: et là ce matin, j'arrive au bureau, il y a eu panne de courant, tout a rebooté, et pouf plus rien ne marche (13:03:28) moussa.nombre@auf.org/3277039268144837733412656: bizarre (13:04:42) Progfou : ok (13:04:46) moussa.nombre@auf.org/3277039268144837733412656: dès que tu as 1 minute ... (13:04:51) Progfou : donc je dirais : forwarding (13:05:03) Progfou : filtrages sur les bridges (13:05:08) Progfou : rp_filter (13:05:11) Progfou : choses de ce genre (13:06:29) moussa.nombre@auf.org/3277039268144837733412656: root@super-bc:~# cat /etc/sysctl.d/local.conf net.bridge.bridge-nf-call-ip6tables = 0 net.bridge.bridge-nf-call-iptables = 0 net.bridge.bridge-nf-call-arptables = 0 net.ipv6.conf.all.disable_ipv6 = 1 root@super-bc:~# (13:11:17) Progfou : vérifies que c'est effectivement actif (13:11:44) Progfou : car j'avais eu des soucis avec le sysctl -p qui n'appliquait pas mes config' dans /etc/sysctl.d/ (qui est pourtant la bonne place) (13:12:13) Progfou : (vérifier = grep . /proc/sys/net/bridge/bridge-nf-call-*) (13:12:46) moussa.nombre@auf.org/3277039268144837733412656: ah ha ! (13:12:53) moussa.nombre@auf.org/3277039268144837733412656: root@super-bc:~# sysctl -a | grep bridge net.bridge.bridge-nf-call-arptables = 1 net.bridge.bridge-nf-call-ip6tables = 1 net.bridge.bridge-nf-call-iptables = 1 net.bridge.bridge-nf-filter-pppoe-tagged = 0 net.bridge.bridge-nf-filter-vlan-tagged = 0 net.bridge.bridge-nf-pass-vlan-input-dev = 0 root@super-bc:~# grep . /proc/sys/net/bridge/bridge-nf-call-* /proc/sys/net/bridge/bridge-nf-call-arptables:1 /proc/sys/net/bridge/bridge-nf-call-ip6tables:1 /proc/sys/net/bridge/bridge-nf-call-iptables:1 (13:13:19) Progfou : ok (13:13:53) moussa.nombre@auf.org/3277039268144837733412656: faut les déplacer dans le sysctl.conf alors ? ( (13:14:37) Progfou : oui, mets les dans le principal en attendant de comprendre pourquoi ça se fait pas en dessous (13:14:52) Progfou : ou sinon mets des appels sysctl dans ton script firewall (13:15:09) Progfou : ce sera peut-être plus robuste en cas d'upgrade (13:15:32) moussa.nombre@auf.org/3277039268144837733412656: aurais-tu un exemple pour moi ( (13:16:06) Progfou : sysctl -w net.bridge.bridge-nf-call-arptables=1 (13:16:36) Progfou : sysctl -w net/bridge/bridge-nf-call-arptables=1 (13:17:01) Progfou : l'intérêt c'est que tu peux copier-coller depuis un chemin parcouru dans le shell (en retirant juste le préfixe /proc/sys/) (13:21:30) moussa.nombre@auf.org/3277039268144837733412656: comme d'hab : tu es un génie :) (13:21:48) moussa.nombre@auf.org/3277039268144837733412656: ça marche tout de suite :) (13:21:52) moussa.nombre@auf.org/3277039268144837733412656: ouf ouf ouf }}} |
Ligne 19: | Ligne 167: |
== Travaux préliminaires == cf [[ZC/Missions/2011/MaiJuin/00TravauxPréliminaires]] ---- __Jour 0 - lundi 23 mai - arrivée à PaP :Points avant départ pour Jacmel -- NM & LBM * certains matos à emporter ne sont pas récupérés de l'entrepôt * la location du véhicule a été annulée avant mon arrivée (on pensait que le serveur resterait à la douane et que nous ne pourrions pas aller à Jacmel comme prévu) * je n'ai pas retrouvé, à l'arrivée à PaP, ma valise contenant le switch vlan de l'espace Ifadem * la connexion Internet n'est pas installée * les travaux de câblage électrique ne sont pas terminés. * Conclusion : il est plus sage de changer de programme et reporter le départ pour Jacmel au dimanche prochain, et rester travailler à PaP cette semaine == Planning pour BC == ||'''Quand'''||'''Quoi'''||'''Qui'''||'''Compte-rendu'''|| ||<|3>Jour 1 - mardi 24 mai ||configuration new-fw ||NM||<|3> '''NB''' : le travail préliminaire d'installation de Squeeze sur les serveurs à installer n'a pas été fait tel que planifié <<BR>> - LBM : installation de Squeeze sur les futurs parefeu et backup (serveurs récupérés des débris de l'IFGCAR) ; tout au long, assistance pour la configuration du raid logicielle et du lvm <<BR>> - NM : rencontre avec l'administratrice du Bureau <<BR>> - NM : montage du rack <<BR>> - NM : coup de fils à Air Canada pour le suivi de la valise disparue ; dans l'après midi, on reçoit un coup de fils d'un monsieur qui dit avoir ma valise avec lui, il se serait trompé, il me l'amènera jeudi à son retour à PaP|| ||configuration new-backup||LBM|| ||configuration serveur ht.auf (dns, dhcp, NFS, authnss)||NM & LBM|| ||<|3>Jour 2 - mercredi||déballage et installation du rack ||NM & LBM||<|3> - NM, LBM : réunion avec l'administratrice du bureau sur la nouvelle feuille de route de LBM <<BR>> - NM : préparation (il a fallu en redresser quelques uns) et montage des rails dans le rack <<BR>> - installation des nouveaux parefeu et backup dans le rack <<BR>> - LBM : installation backuppc et copie des configs et données ; transfert de la config du parefeu <<BR>> - NM : mise en place d'un template squeeze sur le vz|| ||configuration switch vlan||LBM|| ||installation des serveurs dans le rack||NM & LBM|| ||<|2>Jour 3 - jeudi ||migration auf-poste-client ||NM & LBM & CP||<|2> - NM : passé un câble de la salle serveurs à l'espace visio, avec ce câble on ne débranchera plus le personnel connecté sur l'unique câble uplink existant, pour faire de la visio, et et on enlèvera le personnel du wifi <<BR>> - NM : début de mise en place du nouveau ct mail/dns ht.refer.org <<BR>> - NM, LBM : récupération de la valise perdue à l'aéroport <<BR>> - NM : plan de la config vlan + explications sur la mise en place du vlan et le concept de port taggé <<BR>> - LBM : config du switch vlan + config vlan sur le nouveau parefeu <<BR>> - après la fermeture du bureau : arrêt de tous les serveurs - montage dans le rack - repasser les câbles - rebrancher les serveurs et switchs - redemarrer le système, et ... <<BR>> - surprise : la config vlan na marche pas, on a passé du temps à tenter de comprendre et corriger, en vain. De plus on n'a plus accès au switch. En définitive, on rebranche l'ancien parefeu sans vlan, on vérifie la connexion Internet et on se barre|| ||udpcast / preseed||NM & LBM|| || ||<|4>Jour 4 - vendredi|| proxy||LBM||<|4> Journée poste client : <<BR>> - NM : on commence par une présentement des briques de base et leur intégration dans le système d'authentification centralisée couplée au nfs + auf-django-user <<BR>> - NM : vérif de la config du serveur <<BR>> - LBM : config et test d'un client authnss+nfs : authnss ok, mais le nfs bug, au finish il y a un soucis sur le poste de test, on change de poste et tout se passe bien <<BR>> - le réseau n'est pas stable : le poste de test a tantôt une adresse 10., tantôt 192. on arrête tout pour y voir clair : puisqu'on n'a plus accès au switch via le web, on installe le dlink console utility et surprise, l'ip du switch est son ip tel que sorti de l'usine, de même il n'y a plus aucune config vlan, rien que le truc par défaut ; que s'est-il passé, où est passé la config faite par LBM hier ??? du coup, on comprend la source de nos misères de la veille. <<BR>> - NM : reconfiguration du switch vlan, test rapide du parefeu en vlan, ça commence par marcher et ça plante quelques instants plus tard. Allez, on remet le truc traditionnel, on regardera cette histoire de vlan, demain samedi <<BR>> - NM : mise en place de auf-mkhomedir. Modification de /usr/local/bin/inetd_auf-mkhomedir pour que les répertoires soient créés dans /home et éviter que le homedir ne soit créé tel que définit dans la base mysql (/net/nfs/hone/xxx). Les tests sont concluants <<BR>> - NM : transfert des data du miroir lucid du serveur de Jacmel au miroir du cnf <<BR>> - on commence auf-poste-client, mais on n'ira pas bien loin, il est l'heure de fermer, le chauffeur me le fait stratégiquement savoir en faisant les cent pas dans la salle. Dur dur de travailler dans ces horaires : arrivée au bureau à 9h, départ à 16h !!! <<BR>> - NM : sur le pas de cource, échange avec l'administratrice sur le futur terrain et batiment du BC. Les vérifications sont encore en cours et je devrai prendre contact avec André L. pour le suivi avec l'architecte|| ||revision parefeu||NM|| ||backup hors site||NM & LBM|| ||messagerie ht.refer.org||NM & LBM|| ||<|3>Jour 5 - samedi||visite espace numérique ESIH ||NM & LBM||<|3> ça se résume à : t*b*rn*ce d'osti de m*rde, je veux rentrer chez moi ! les choses les plus simples du monde deviennent compliquées et ne marchent pas dans cette partie du globe ; de plus les gens sont de mauvaise volonté et ... <<BR>> - m'enfin ... <<BR>> - explication et mise en place de auf-poste-client "manuel" ; une chose au moins qui s'est passé sans embrouille. <<BR>> - parallèlement (NM) : debranchement de tous les câbles et recâblage de façon propre et correcte. <<BR>> - le rpv et le reseau cnf fonctionnent bien, mais soucis avec la dmz : les paquets ne passent pas alors que la config réseau est correct. Du coup, vérification, reconfiguration, ping, reping, débranchement, re-branchement ; sans succès. <<BR>> - on termine la journée, qui avait d'ailleurs mal commencé avec certains qui sont arrivés en retard par rapport à l'heure fixée par eux-même, on termine donc la journée par une chicane à cause d'une alimentation de portable supposée défectueuse qui en définitive est fonctionnelle || ||dossier wifi||NM & LBM|| ||suivi budget 2011||NM & LBM|| ||Jour 6 - dimanche||déplacement à Jacmel||NM & LBM||- NM : arrivé au bureau à 10h25, vérification et relance des règles du parefeu ; et ... le réseau dmz est à nouveau fonctionnel <<BR>> - NM : je vérifie que tout marche bien : dhcp/dns du rpv et du cnf, voip, Internet, ... <<BR>> - NM : Je vérifie, corrige et lance le nouveau backuppc <<BR>> - NM : je continue sur le mail et le miroir, mais il est écrit que ça n'avancera pas plus que les jours précédent : coupure d'électricité, tous les serveurs s'éteignent. <<BR>> - LBM : arrivé au bureau vers 13h : charge les éqipuements de Jacmel dans le camion. <<BR>> - NM : la génératrice en marche, je continue ... mais pas pour longtemps : subitement, le trafic réseau est coupé. Le coupable est vite trouvé : le switch a encore perdu sa config vlan !!! Après quelques fouille, je remarque une options "enregistrer la configuration" que nous n'avions pas remarqué les fois précédente. Je reconfigure et clique sur cette option, ensuite fais un backup de la config pour faciliter un éventuel restore par Chamback en notre absence <<BR>> - NM et LBM et le chauffeur : départ pour Jacmel à 14h20|| ---- == Planning pour JACMEL == ||'''Quand'''||'''Quoi'''||'''Qui'''||'''Compte-rendu'''|| ||Jour 0||arrivée à Jacmel||NM & LBM||- arrivée peu après 17h à Jacmel, on passe réserver nos chambres à l'hôtel de la place et ensuite direction l'EFACAP <<BR>> - EFACAP : accueil par le Directeur, visite des lieux, déchargement des équipements <<BR>> - test rapide de la connexion Internet : aucun signal ! à revoir demain <<BR>> - allez zou, à la recherche d'un bon endroit pour manger du homard ... || ||<|5>Jour 1 - lundi 31 mai||visites des locaux||NM & LBM||<|5>- bon, il est difficile ... enfin ... disons impossible de trouver du homard à Jacmel, je me suis contenté d'un poisson, hyper salé en plus <<BR>> - NM, LBM : re-vérification de la connexion Internet : ça ne marche toujours pas. On appelle le tech de AccessHaïti ; trente minutes plus tard, le tech est sur place les tests sont concluants. <<BR>> - NM : constat : le courant issus du circuit mise en place par Gatcieent n'est pas stable, hmmm ... n'est pas continue ... hmmmm ... quel est le bon terme ... peut-être avec une phrase : le courant se coupe pendant quelques dixièmes de secondes <<BR>> - NM, LBM : montage du rack <<BR>> - NM : mise en place d'un réseau ad hoc en attendant de monter tout ça dans le rack après les configs <<BR>> - LBM : config dhcp, dns, squid <<BR>> - NM : config vlan (dgs 1224T) <<BR>> - NM : montage des rails, du switch, du pdu, fait passer le câble Internet dans la goulotte, passer le lot de câbles dans le rack <<BR>> - NM : vérification, correction, démarrage et tests du dhcp <<BR>> - LBM : montage du serveur et de l'onduleur dans la baie <<BR>> - coups de fils, négociation, calculs, verbiage pour trouver le peintre le moins disant pour passer une couche de peinture dans la salle Ifadem. En fin d'après-midi tout est ok, le directeur de l'Efacap fera venir le peintre dès demain matin. <<BR>> - 16h45 : fin de la journée, aurons-nous plus de chance pour la bouffe|| ||vérification du câblage informatique||NM & LBM|| ||vérification et tests du système électrique ||NM & LBM|| ||déballage du matos (baie, switch, serveur)||NM & LBM|| ||mise en place du rack (baie, switch, serveur, pdu, etc.)||NM & LBM|| ||<|3>Jour 2 - mardi||configuration du serveur ||LBM||<|3> - décidement, Jacmel n'est vraiment pas, l'endroit où il fait bon manger : hier soir, 1h30 à la recherche d'un resto convenable et pas trop cher ... de quoi couper l'appétit <<BR>> - LBM : config firewall (copie de la config de ifadem-lescayes), accès Internet sur le serveur <<BR>> - LBM : mise en place réseau wifi <<BR>> - NM : inventaire des adresses MAC et étiquetage des portables <<BR>> - config du dhcp static couplé au dns. Zut, comment renouveller les ip des postes (récupérer les nouvels IP) <<BR>> - 3 portables n'arrivent pas à accéder au wifi <<BR>> - toujours pas de peinture en vue <<BR>> - NM : modif de /etc/network/if-up.d/ip pour insérer le dns local dans /etc/resolv.conf en plus des dns du FAI|| ||tests du serveur||NM & LBM|| ||configuration du switch vlan||LBM|| ||<|3>Jour 3 - mercredi||branchement et configuration du réseau et de la connexion Internet ||LBM||<|3>- NM : mauvaise nouvelle matinale : l'écran de mon portable est brisé (au vrai sens du terme) <<BR>> - LBM : re-udpcaste les 3 postes récalcitrants <<BR>> - NM : raccordement de la salle Efacap et test de la connexion : tout est nickel <<BR>> - LBM : installation de nut <<BR>> - Gatcieent est sur place pour finaliser les travaux électriques (déplacer une des bais de batteries, installer le climatiseur, etc.) <<BR>> - NM cherche comment réinitialiser les lease dhcp <<BR>> - toujours pas de peintre en vue <<BR>> - NM : solution pour réinitialiser les leases dhcp : supprimmer les fichiers dhcpd.leases (côté serveur) et dhclient.leases (côté poste client) et relancer le dhclient (au besoin avec l'option -1) <<BR>> - NM : suite config du serveur mail/dns ht.refer.org : dns OK. Mise en place d'une synchro (/usr/local/sbin/synchro-bd_mail.py sur le serveur authnss avec un cron à chaque 10 min) pour alimenter la BdB de messagerie à partir des comptes authnss. <<BR>> - LBM : recherche de comment paramétrer l'onduleur eaton powerware avec nut. Rien trouvé, on garde les valeurs par défaut : message de shutdown à 1 minute d'autonomie de la batterie et l'onduleur laisse passer le jus après 1min30 de charge de la batterie <<BR>> - LBM : recherche sur le pipsecd dans Squeeze. Finalement cf liste tech pour le SOS. <<BR>> - Enfin, enfin, une première couche de peinture est faite. <<BR>> - Gatcieent : le bloc de batterie est déplacé et le câble pour le climatiseur est installé, on n'attend plus que le climatiseur lui-même. <<BR>> - NM : étiquetage du reste des portables <<BR>> - Définitivement, l'onduleur Eaton Powerware fait bon ménage avec l'inverter Xantrex, c'est une excellente nouvelle!|| ||configuration et installation des routeurs wifi||LBM|| || ||tests du réseau wifi||NM & LBM|| || ||<|3>Jour 4 - jeudi (férié en Haïti, pour fête de l'Ascension)||installation des meubles ||NM & LBM||<|3> - il a plu toute la nuit, et ça continue, résultats : 1) on n'a pas de connexion Internet, 2) le peintre ne viendra pas passer la seconde couche de peinture (surtout que c'est férié) <<BR>> - LBM : vérification de la cohérence des étiquettes et des adresses MAC <<BR>> - LBM : vérification et étiquetage des interrupteurs avec Gatcieent <<BR>> - à 13h, on vide les lieux <<BR>> - après-midi : quartier libre pour tout le monde.|| ||déballage et installation des portables||NM & LBM|| ||configuration des portables||NM & LBM|| ||<|2>Jour 5 - vendredi ||finalisation de la configuration des portables ||NM & LBM||<|2> - on fait nettoyer la salle <<BR>> - LBM : déploiement des postes (portable - clavier -souris) <<BR>> - NM : modif des leases dhcp et renouvellement des IP <<BR>> - NM : modif (via un petit dsh) des sources.list pour pointer sur le miroir local <<BR>> - dernières vérifications : salle serveur, espace Ifadem. Tout est nickel ; on peut rentrer ... || ||tests des portables||NM & LBM|| || ||<|2>Jour 6 - samedi||dernières vérifications||NM & LBM|| || ||retour sur Port-au-Prince||NM & LBM|| || |
Sommaire
Mission : 17 au 28 novembre 2015 à Port-au-Prince
Dates
|
- Départ de Montréal : mardi 17 novembre à 9h30 -- arrivée PaP à 13h50 (Air Canada vol 1814)
Départ de Port-au-Prince : samedi 28 novembre à 16h15 (American AirLine vol 201) -- Miami 18h26-20h04 (AA, vol 1465)-- arrivée Montréal à 23h38
Objectifs principaux
- restructuration de l’infrastructure technique (réduction/optimisation du nombre de serveurs, mutualisation de certains services vers le central)
- on passera de 4 à 2 serveurs (voire 1 serveur)
- le service de partage de fichiers se fera via nuage.auf.org
- mise en place d'un dispositif d'accès distant
- analyse/résolution des difficultés/soucis techniques récurrents
- entretiens de recrutement d'un technicien
NB :
il faudra prévoir de travailler les samedi et dimanche de la mission afin de procéder à la mise en production de la nouvelle infrastructure (arrêts et redémarrages des serveurs) sans perturber les collègues et les abonnés.
informer les abonnés des changements à venir (ils n'auront plus d'espace de stockage sur les machines) et les mesures d'accompagnement (à préciser et mettre en place)
prévoir la fermeture du CNF le Jour 1 à partir de 14h (une heure plus tôt que d'habitude) : modification à apporter aux postes et au serveur.
Les sauvegardes :
- Il n'y aura aucune sauvegarde des postes public (CNF), cf NB 2 ci-dessus
Les postes du personnel seront sauvegardés vers un espace disque sur super-bc via Déjà-Dup (installé par défaut sur nos postes).
- Ce qui donne, au passage, une grande autonomie au personnel sur leurs données et les besoins restaurations en cas de nécessité.
- Du coup, on n'a plus besoin du serveur de sauvegarde
- [Faire une sauvegarde des clés de chiffrement]
- La sauvegarde des serveurs se fera vers Montréal (OVH) durant la nuit (aucun impact pour les utilisateurs le jour)
Travaux préliminaires
- Par LBM :
- configuré et tester Déjà-Dup sur son poste
- Par NM (à Montréal) :
- procéder aux achats de matériel
serveur :
- installer Debian Jessie (firmeware-nonfree) + Libvirt/qemu + config de la VM gw.ht.auf (cf photo plus bas) sur les nouveaux disques achetés
- transfert de la VM pfsense
- conversion/transfert du CT voip
configuration du kvm-ip et du pcu
- préparation suppression du NFS
- postes du personnel (migration des partages dans nuage.auf.org)
- [LBM] installer client owncloud 2.0 sur les postes du personnel
- cocher option confirmation pour le téléchargement de dossier/fichier de plus de [10Mo ?]
[NM/LBM] transférer dans nuage.auf.org les dossiers partagés (coordonner avec PatrickHétu)
[PatrickHétu] création du partage AUF-partage-BC avec un admin principal et des sous dossiers (droits à gérer par l'admin)
- [LBM] désactiver autofs (exit 0 dans /etc/default/autofs)
- [LBM] au passage, check list :
- TB : activation de la synchro imap et des contacts
- home : chiffré ?
- [LBM] installer client owncloud 2.0 sur les postes du personnel
- postes du CNF
- NM : valider procédure de bascule
- fonctionnement avec des comptes type "invité" : profil dans /home/tmp/[username], shell particulier (cf compte guest d'Ubuntu)
- création des homedir : activer pam-mkhomedir
- nettoyage des homedir : cron de nettoyage des tmp : ajouter /home/tmp/*, [garder 7jours ???]
- /home/tmp : partition séparée si possible ou activer quota disque (pour ne pas que les usagers bousillent toute la partition /)
- vérifier le miroir
- vérifier/maj configs preseed local
- NM : valider procédure de bascule
- postes du personnel (migration des partages dans nuage.auf.org)
Planning et compte-rendu
Quand |
Quoi |
Qui |
Compte-rendu au jour le jour |
Jour 1 : mercredi 18 |
[Matinée] : |
NM/LBM/Direction |
* NB : ce jour est férié en Haïti. Nous avons donc travaillé juste une demie-journée |
[Après-midi] NB : Il faudra fermer le CNF à compter de 14h |
NM/LBM |
* NFS désactivé sur les postes |
|
Jour 2 : jeudi 19 |
[Matinée] |
NM |
* Arrivée au bureau : 8h45 |
* installation du KVM-IP et du PCU (installation dans le rack et connexion aux serveurs |
LBM |
Reporté au week-end |
|
[Après-midi] |
NM |
Juste changé l'IP du KVM. Le PCU n'est pas encore installé, sera fait le week-end. |
|
* installation du client owncloud 2.0 sur les postes du personnel (activer le filtre de limitation de téléchargement selon la taille) |
LBM |
* Config owncloud : OK |
|
[Fin de journée - 15h] * lancer le transfert des données des partages NFS dans nuage.auf.org |
LBM |
* Déjà fait par NM depuis Montréal |
|
Jour 3 : vendredi 20 |
* suite de la configuration des services parefeu, de la gestion des 2 liens Internet et de l'accès au RPV AUF |
NM |
Plutôt attardé sur la résolution des soucis de bridges. Heureusement la grosse expérience de ProgFou a permis de débloquer la situation rapidement (cf les échanges plus bas) |
* finalisation de la VM pfsense (reconfiguration des interfaces réseaux) |
LBM |
Fait par NM |
|
* finalisation et mise en service de la Voip |
LBM |
Début de la conversion du CT asterisk18 en vm voip ... A FINALISER |
|
* configuration des sauvegardes hors site (Duplicity) des serveurs |
LBM |
Reste le cas des VM (comment faire ???) |
|
Jour 4 - samedi 21 |
* on récupère (offline) un des disques du RAID de super-bc pour le mettre sur super-bc-secours |
NM/LBM |
* Finalisation des règles de filtrage |
Jour 5 - dimanche 22 |
* La journée commence super bien : |
||
Jour 6 - lundi 23 |
* gestion des éventuels soucis découlant des changements effectués |
NM/LBM |
Journée principalement consacrée aux entretiens de sélection pour le poste de tech bureautique. |
Jour 7 - mardi 24 |
* suite assistance |
NM |
*Finalement ni le captif, ni ipesecd n'étaient réglé |
* retrait et mise au rencart des serveurs inutilisés (old vz-bc, backup, boukman) |
LBM |
|
|
Jour 8 - mercredi 25 |
* mise à jour de la documentation globale (mise à jour du wiki) |
NM |
|
* réunion de synthèse avec la Direction |
NM/LBM/Direction |
|
|
Jour 9 - jeudi 26 |
Entretiens et tests de recrutement d'un technicien |
NM/LBM/JPM |
|
Jour 10 - vendredi 27 |
|||
Jour 11 - samedi 28 |
départ pour Montréal |
NM |
|
Réinstallation des postes clients en Trusty |
Schémas de l'infrastructure
Besoin en matériel
- KVM-IP
- PCU
- Disques durs : 4 x 1TB
- Barrettes mémoires (pour auth-nfs et new-vz-bc)
Annexes
Échanges avec JC sur les soucis de bridges
(13:01:51) moussa.nombre@auf.org/3277039268144837733412656: je suis embourbé dans cette histoire d'interfaces/ponts (13:02:39) moussa.nombre@auf.org/3277039268144837733412656: hier nuit, finalement tout était bien, mes interfaces de passerelle fonctionnaient (13:02:54) moussa.nombre@auf.org/3277039268144837733412656: j'y avait accès depuis le lan (13:03:24) moussa.nombre@auf.org/3277039268144837733412656: et là ce matin, j'arrive au bureau, il y a eu panne de courant, tout a rebooté, et pouf plus rien ne marche (13:03:28) moussa.nombre@auf.org/3277039268144837733412656: bizarre (13:04:42) Progfou : ok (13:04:46) moussa.nombre@auf.org/3277039268144837733412656: dès que tu as 1 minute ... (13:04:51) Progfou : donc je dirais : forwarding (13:05:03) Progfou : filtrages sur les bridges (13:05:08) Progfou : rp_filter (13:05:11) Progfou : choses de ce genre (13:06:29) moussa.nombre@auf.org/3277039268144837733412656: root@super-bc:~# cat /etc/sysctl.d/local.conf net.bridge.bridge-nf-call-ip6tables = 0 net.bridge.bridge-nf-call-iptables = 0 net.bridge.bridge-nf-call-arptables = 0 net.ipv6.conf.all.disable_ipv6 = 1 root@super-bc:~# (13:11:17) Progfou : vérifies que c'est effectivement actif (13:11:44) Progfou : car j'avais eu des soucis avec le sysctl -p qui n'appliquait pas mes config' dans /etc/sysctl.d/ (qui est pourtant la bonne place) (13:12:13) Progfou : (vérifier = grep . /proc/sys/net/bridge/bridge-nf-call-*) (13:12:46) moussa.nombre@auf.org/3277039268144837733412656: ah ha ! (13:12:53) moussa.nombre@auf.org/3277039268144837733412656: root@super-bc:~# sysctl -a | grep bridge net.bridge.bridge-nf-call-arptables = 1 net.bridge.bridge-nf-call-ip6tables = 1 net.bridge.bridge-nf-call-iptables = 1 net.bridge.bridge-nf-filter-pppoe-tagged = 0 net.bridge.bridge-nf-filter-vlan-tagged = 0 net.bridge.bridge-nf-pass-vlan-input-dev = 0 root@super-bc:~# grep . /proc/sys/net/bridge/bridge-nf-call-* /proc/sys/net/bridge/bridge-nf-call-arptables:1 /proc/sys/net/bridge/bridge-nf-call-ip6tables:1 /proc/sys/net/bridge/bridge-nf-call-iptables:1 (13:13:19) Progfou : ok (13:13:53) moussa.nombre@auf.org/3277039268144837733412656: faut les déplacer dans le sysctl.conf alors ? ( (13:14:37) Progfou : oui, mets les dans le principal en attendant de comprendre pourquoi ça se fait pas en dessous (13:14:52) Progfou : ou sinon mets des appels sysctl dans ton script firewall (13:15:09) Progfou : ce sera peut-être plus robuste en cas d'upgrade (13:15:32) moussa.nombre@auf.org/3277039268144837733412656: aurais-tu un exemple pour moi ( (13:16:06) Progfou : sysctl -w net.bridge.bridge-nf-call-arptables=1 (13:16:36) Progfou : sysctl -w net/bridge/bridge-nf-call-arptables=1 (13:17:01) Progfou : l'intérêt c'est que tu peux copier-coller depuis un chemin parcouru dans le shell (en retirant juste le préfixe /proc/sys/) (13:21:30) moussa.nombre@auf.org/3277039268144837733412656: comme d'hab : tu es un génie :) (13:21:48) moussa.nombre@auf.org/3277039268144837733412656: ça marche tout de suite :) (13:21:52) moussa.nombre@auf.org/3277039268144837733412656: ouf ouf ouf