Vous l'aurez peut-être remarqué, mais hier, le 20/02/2019, le serveur de L'Air du Bois est resté inaccessible pendant presque 2h entre 18h30 et approximativement 20h30.
Ceci est la suite est quelques ralentissements que vous avez peut-être ressenti depuis quelques mois. Ralentissements pour lesquels l'équipe technique était en pleine investigation depuis plusieurs semaines.
Pour faire court, le serveur s'est coupé de lui même à 18h30 après de gros ralentissements. Et ensuite, il était impossible de le redémarrer normalement. Du coup, le temps de réunir le soutien technique maethor, qla et de contacter le support de l'hébergeur, il s'est écoulé ces 2h avant que le problème soit identifié. Ca peut paraitre long, mais le temps file à tout allure dans ce genre de cas.
Il semble que le soucis vienne d'un problème d'accès aux disques durs du serveur ce qui l'a fait basculer dans un mode de sécurité pour ne pas corrompre toutes les données.
Les bonnes nouvelles, c'est que nous avons fini par pouvoir relancer le serveur, que c'est le genre de panne rare et que nous n'avons pas vu de dommage ou de perte de données.
Je profite donc de ce petit billet dans le blog pour remercier chaleureusement maethor et qla qui étaient là sur le pont pour trouver solution au problème.
PS : Pour information, il y a à aujourd'hui de nombreuses réflexions qui sont en train de se mettre en place pour améliorer la résilience du service et surtout pour profiter de l'expertise de chaque participant à l'équipe technique pour le rendre plus robuste à l'accroissement du trafic.
Discussions
J ai pu constater et je vois votre réactivité....Merci à vous 3
On réussit encore (mais pour combien de temps?) à vivre 2h sans l'ADB. En tout cas bravo et merci pour la réactivité!
Bravo et merci pour votre dévouement
Je n'avais pas remarqué, mais c'est TRÈS BIEN que l'équipe technique ne se résume plus à seulement Boris !! Il faut le ménager si on veut que ça dure !! Merci à toute l'équipe !
Par curiosité, quel est la nature du souci "d'accès aux HD" ? Vous êtes sur un serveur physique ou un VPS ? Disques dédiés ou SAN ?
Dans tous les cas, c'est du domaine de responsabilité de l'hébergeur.
VPS. Quant à la nature réelle du problème, difficile à dire puisque plus aucun log ne pouvait s'écrire non plus.
Je n'avais pas remarqué mais merci à vous d'être aussi réactif
Merci à l'équipe pour leur réactivité.
Bonne continuation à toutes et tous.
2 heures, c'est pas grand chose, surtout pour une équipe de bénévoles à l'heure de profiter de la famille.
Bravo à vous, et merci pour tout !
Merci de travailler à cette belle oeuvre que l'air du bois! de sauvegarder cette expérience, riche, bienveillante et ... gratuite!
ho oui ! maethor est là aussi \o/, salut à toi.
Si je comprend bien, le nom de domaine est chez 1and1 et l'hébergement chez OVH ?
Et si l'hébergement était migré chez des Gresille ou d'autres hébergeurs "sympas" comme par exemple ouvaton ?
J'avais rencontré Gresille il y 3 ans (je crois). Mais j'avais peur que nous avions besoin de plus de disponibilité que ce qu'ils pouvaient nous offrir gracieusement.
Ouvaton, je ne connais pas.
je ne connais pas ouvaton, mais je suis plus que satisfait de à2switch, qui henerge pour moi et mes etudiants -( site web, et env 1,4To de données, pour la modique somme de 5€/mois.
Serveur basés a clermont-ferrand, equipe technique tres reactive.
eric
J'avais remarqué, en tout cas merci pour vôtre dévouement et tout particulièrement à Boris Beaulant
Ha, heu, au fait, tant qu'ils existent encore ... les insectes ont 6 pattes
C'est pas un insecte, c'est un bug informatique :P
Mes clients MOA, qui étaient des enseignants, disaient qu'ils allaient me cafarder quand ils trouvaient un bug.
Subtil jeu de mot très à propos dans leur univers scolaire.
Bravo pour la réactivité et merci pour l'explication! J'avais cru que le problème venait de chez moi.
Excellent Merci à tous. Moi qui travaille dans les données des entreprises (BI et Data architect) je trouve que 2h pour une mini équipe c'est super! Et pas de corruption encore mieux :)
Bonne journée Bobo
Merci à toute l'équipe pour ce travail permanent de maintenance et d'amélioration.
bien joué a vous! ce genre de problème est relativement courant sur les serveur avec de gros volume de données (photos). C'est preuve de la bonne santé de l'ADB
Bravo à tous et merci
Problème .... ! Dieu que nous sommes conditionnés et accros !!!
Quelles drogues sommes nous en train de consommer ???
Pour ma part à x ...ante quatre ans, deux heures Bof... Peu de choses !!!
Par contre le serveur, n'aurait pu être rétabli, cela aurait été fort ennuyeux ... Mais bon tout est revenu dans l'ordre ...
Merci encore pour toutes vos contributions
Nimbus54
Bravo et Merci à vous
GG à Boris et l'équipe technique pour une réactivité digne de super pros !
Rassuré aussi de savoir qu'il ne s'agit pas d'une attaque DDoS.
D'un autre côté, ça doit faire du bien au serveur de redémarrer de temps en temps ;)
Non, pas de DDoS ;)
Bonjour,
Si seulement les serveurs pouvaient être aussi facile à gérer que les servantes... Félicitations à vous donc.