« La voie à suivre est de supposer que la défaillance des infrastructures critiques se produira de manière imprévue, et de commencer à intégrer ces hypothèses dans la conception globale du système. Vincent Caldeira, chef technologue pour le FSI, APAC, a déclaré aux PYMNTS. Découvrez comment Caldeira construit pour la résilience dans Black Swan, un rapport spécial exclusivement de PYMNTS.
Ce qui suit est un extrait de Black Swan, contribué par Vincent Caldeira, Technologue en chef de Red Hat pour le FSI, APAC.
La limitation que les cygnes noirs mettent réellement en évidence est notre aveuglement face au hasard – en particulier, les événements aberrants ayant un impact extrêmement important, qui peuvent être causés et exacerbés par le fait qu’ils sont inattendus. C’est un sujet très pertinent dans notre approche du renforcement de la résilience des infrastructures technologiques essentielles du système financier qui soutient notre économie.
Traditionnellement, la conception d’une telle infrastructure pour une haute résilience implique l’évaluation des systèmes pour les points de défaillance uniques potentiels et leur suppression, la redondance de toutes les couches possibles de l’infrastructure et des logiciels, et l’automatisation des processus de récupération contre tous les scénarios de défaillance potentiels connus.
Bien que cela soit absolument nécessaire, je pense qu’il serait également peu clairvoyant de penser que cela est suffisant. Les institutions financières (IF) transfèrent par exemple leur charge de travail à des fournisseurs publics de services dans le nuage, estimant que les systèmes distribués dans le nuage avec plusieurs centres de données offrant une redondance transparente seront moins vulnérables aux défaillances que leur propre infrastructure. Cependant, en avril 2011, de nombreux clients d’Amazon Web Services (AWS), y compris certains sites web très connus, ont perdu l’accès à leurs systèmes suite à une panne dans l’un des centres de données nord-américains.
La réalité est que dans des conditions normales, les systèmes en nuage – qui sont conçus pour être autosurveillés et autoréparés – peuvent gérer les défaillances prévues de manière transparente, avec peu ou pas d’impact sur les utilisateurs. Cependant, lorsque quelque chose d’inattendu se produit, le comportement de systèmes aussi complexes devient difficile à prévoir.
Par conséquent, la voie à suivre est de supposer que la défaillance des infrastructures critiques se produira de manière imprévue, et de commencer à intégrer ces hypothèses dans la conception globale du système. Cette approche ne reposerait pas simplement sur la redondance, mais plutôt sur la conception d’un système distribué, composé de composants de services et de magasins de données faiblement couplés, de sorte que les applications « critiques » puissent continuer à fonctionner même si les choses tournent mal. Cette approche est également liée aux architectures distribuées basées sur les micro-services et la communication interservices pilotée par les événements, et à la capacité de déplacer automatiquement les composants du système à travers le nuage hybride pour fournir des ressources de calcul et de stockage en cas de besoin à court terme.
Lisez le point de vue des dirigeants sur la crise COVID-19 à Black Swan.