Technologie : Récupération des capteurs CrowdStrike Falcon suite à une erreur de codage
La majorité des capteurs CrowdStrike Falcon touchés par une mise à jour de réponse rapide défectueuse ont été rétablis avant le week-end des 27 et 28 juillet. Les efforts pour résoudre l’incident survenu le 19 juillet, qui a provoqué l’arrêt de plus de huit millions de machines Windows, se poursuivent.
Dans un message publié sur LinkedIn le 26 juillet, George Kurtz, PDG de CrowdStrike, a indiqué que, depuis le jeudi 25 juillet, « plus de 97 % » des capteurs Windows étaient de nouveau opérationnels. Il a souligné que cette avancée était le fruit des efforts inlassables de leurs clients, partenaires et de l’équipe de CrowdStrike. Cependant, il a également précisé que le travail n’était pas encore terminé et que l’entreprise restait déterminée à restaurer tous les systèmes affectés.
Kurtz a exprimé ses excuses pour les désagréments causés par cette panne, affirmant que la mission de CrowdStrike était de gagner la confiance de ses clients en protégeant leurs opérations. Il a promis une réponse rapide et efficace, bien qu’il ne puisse garantir la perfection.
Les efforts de remédiation ont été grandement facilités par l’utilisation de techniques de récupération automatisées et par la mobilisation de toutes les ressources disponibles pour soutenir les clients touchés. Kurtz a réaffirmé l’engagement de CrowdStrike à prévenir les violations de sécurité, tout en mettant l’accent sur le contrôle et la résilience des clients, comme l’indiquait le rapport préliminaire sur l’incident publié la semaine précédente.
Mise à jour corrective prévue prochainement
En parallèle, CrowdStrike a confirmé à TechTarget Security que l’erreur logique dans son outil de validation, à l’origine de ce désastre, a été corrigée. Des tests intensifs sont en cours avant que la mise à jour puisse être déployée sur ses systèmes en backend, prévue dans les jours à venir.
La mise à jour problématique faisait partie d’un déploiement de réponse rapide habituellement utilisé par CrowdStrike pour améliorer les mécanismes de protection dynamique de sa plateforme Falcon. Ce type de mise à jour est conçu pour identifier de nouveaux problèmes de cybersécurité et aider les clients à les atténuer.
Bien que l’entreprise effectue régulièrement de telles mises à jour, un contenu problématique dans un fichier de canal a échappé à l’attention de l’outil de validation de contenu automatisé de CrowdStrike. Cette combinaison de problèmes a entraîné une condition de mémoire hors limites, provoquant une exception qui a submergé le système d’exploitation Windows, entraînant l’arrêt des appareils vulnérables et le célèbre écran bleu de la mort.
Pour éviter que ce problème ne se reproduise, CrowdStrike prévoit d’améliorer la résilience de ses mises à jour de réponse rapide grâce à des tests renforcés à plusieurs niveaux et à l’ajout de nouvelles vérifications de validation à l’outil de validation de contenu automatisé. L’entreprise envisage également de déployer les mises à jour de manière échelonnée, afin de les appliquer plus lentement sur la base de capteurs Falcon et d’utiliser des déploiements « canari » pour détecter d’éventuels problèmes majeurs avant qu’ils ne se propagent.
Cette approche permettra un suivi amélioré des performances des capteurs et des systèmes, et à terme, les clients de CrowdStrike auront plus d’options pour gérer eux-mêmes les mises à jour de réponse rapide.
Conséquences dans le monde réel
Les répercussions de cette panne continuent de se faire sentir, notamment avec des retards, des réajustements et des annulations de vols dans le monde entier. Parmi les histoires marquantes, celle d’un homme de 83 ans, Patrick Bailey, qui a été l’objet d’une opération de recherche aux États-Unis. Prévu pour rentrer de Floride en Californie le 19 juillet, il a été logé dans un hôtel local après l’annulation de son vol.
Bien qu’il ait quitté l’hôtel le lendemain matin, il a accidentellement oublié son téléphone portable dans sa chambre et a disparu pendant plusieurs jours. Il a finalement été retrouvé en Californie le 28 juillet, ayant décidé de traverser le pays en bus Greyhound.