Histoire de continuité d’activité…

Ou pourquoi le nos erreurs se voient parfois…

Généré avec raphael.ai – robot qui code en bash !:°)

Ce soir (13 octobre 2025) un peu après 21h00, les sites du cluster1 ne répondaient plus.

Nous avons remis en route nos services manuellement un peu après 23h00 et souhaitions vous parler un peu de l’envers du décor dans un court article de blog.

Le cluster 1 qui connu une panne entre entre 21h00 et 23h30 repose pour son fonctionnement sur des centaines de milliers de ligne de code dans différents langages.

Certains scripts de maintenance passent leurs temps à récupérer les connexions pas fermées, les scripts php qui durent trop longtemps, les connexions sql trop longues ou trop nombreuses et encore une foule d’autres sujets que nos robots scrutent en permanence pour maintenir le service opérationnel.

Nous travaillons également en permanence à l’amélioration de nos infrastructures et procédons. Ces jours-ci nous réalisons des tests de continuité d’activité nous mettant d’être résilients sur des coupures électriques.

Ce soir, il ne s’agit pas d’une attaque, mais bien d’un bon vieux bug sur des scripts de maintenance qui n’ont pas pu faire leur office dû aux tests d’arrêt de certains systèmes.

Ces systèmes n’étant pas disponibles, ils ne pouvaient pas délivrer le service attendu. L’anomalie de ce soir nous a permis de déterminer l’origine de la faiblesse de ce script et d’y remédier.

Veuillez nous excuser pour la gêne occasionnée et soyez assurés que nous sommes dans une logique d’amélioration continue avec objectif de renforcer la sécurité et la résilience de nos services.

Cet incident a eu lieu sur le cluster1, le cluster2 qui héberge nos services cloud, les vds, les serveurs dédiés n’ont pas été touchés par cet incident.

Si vous avez des besoins spécifiques vous pouvez dès à présent disposer de nos services pour vous aider à définir une architecture cible de SI.
Exemple sur le schéma suivant avec un firewall dédié, un ou plusieurs services opérés dans un espace réseau dédié, un accès par VPN:

Contactez-nous pour un diagnostic et une étude:
https://www.swiiptel.net,
– Ou https://www.easy-hebergement.fr/contact