La promesse de l’IA : Mettez l’informatique en pilotage automatique

Sercompe Business Technology fournit des services cloud essentiels à environ 60 entreprises clientes, prenant en charge un total d’environ 50 000 utilisateurs. Il est donc crucial que l’infrastructure informatique sous-jacente de l’entreprise de Joinville, au Brésil, fournisse un service fiable avec des performances élevées prévisibles. Mais avec un environnement informatique complexe qui comprend plus de 2 000 machines virtuelles et 1 pétaoctet, soit l’équivalent d’un million de gigaoctets, de données gérées, il était écrasant pour les administrateurs réseau de trier toutes les données et alertes pour comprendre ce qui se passait en cas de problème. surgi. Et il était difficile de s’assurer que la capacité du réseau et du stockage était là où elle devait être, ou quand effectuer la prochaine mise à niveau.

Pour aider à démêler la complexité et accroître l’efficacité de ses ingénieurs de support, Sercompe a investi dans une plate-forme d’opérations d’intelligence artificielle (AIOps), qui utilise l’IA pour accéder à la cause première des problèmes et avertir les administrateurs informatiques avant que les petits problèmes ne deviennent importants. Aujourd’hui, selon le chef de produit cloud Rafael Cardoso, le système AIOps effectue une grande partie du travail de gestion de son infrastructure informatique, un atout majeur par rapport aux anciennes méthodes manuelles.

« Déterminer quand j’avais besoin de plus d’espace ou de capacité, c’était un gâchis avant. Nous avions besoin d’obtenir des informations à partir de tant de points différents lors de la planification. Nous n’avons jamais obtenu le bon numéro », explique Cardoso. « Maintenant, j’ai une vue complète de l’infrastructure et une visualisation depuis les machines virtuelles jusqu’au disque final dans le rack. » AIOps apporte une visibilité sur l’ensemble de l’environnement.

Avant de déployer la technologie, Cardoso était là où d’innombrables autres organisations se trouvaient : enchevêtrées dans un réseau complexe de systèmes informatiques, avec des interdépendances entre les couches de matériel, la virtualisation, le middleware et enfin les applications. Toute interruption ou temps d’arrêt pourrait entraîner un dépannage manuel fastidieux et, en fin de compte, un impact négatif sur l’entreprise : un site Web qui ne fonctionnera pas, par exemple, et des clients en colère.

Les plates-formes AIOps aident les responsables informatiques à maîtriser la tâche d’automatisation des opérations informatiques en utilisant l’IA pour fournir des informations rapides sur le fonctionnement de l’infrastructure – les zones qui fonctionnent par rapport aux zones qui risquent de déclencher un événement d’indisponibilité. Le mérite d’avoir inventé le terme AIOps en 2016 revient à Gartner : il s’agit d’une large catégorie d’outils conçus pour surmonter les limites des outils de surveillance traditionnels. Les plateformes utilisent des algorithmes d’auto-apprentissage pour automatiser les tâches de routine et comprendre le comportement des systèmes qu’elles surveillent. Ils tirent des informations des données de performance pour identifier et surveiller les comportements irréguliers sur l’infrastructure et les applications informatiques.

La société d’études de marché BCC Research estime que le marché mondial de l’AIOps passera de 3 milliards de dollars en 2022 à 9,4 milliards de dollars d’ici 2026, à un taux de croissance annuel composé de 26 %.1 Les analystes de Gartner écrivent dans leur « Market Guide for AIOps Platforms » d’avril que Le taux croissant d’adoption de l’AIOps est motivé par la transformation numérique de l’entreprise et la nécessité de passer de réponses réactives aux problèmes d’infrastructure à des actions proactives.

« Avec des volumes de données atteignant ou dépassant les gigaoctets par minute sur une douzaine de domaines différents ou plus, il n’est plus possible pour un humain d’analyser les données manuellement », écrivent les analystes de Gartner. L’application systématique de l’IA accélère les connaissances et permet la proactivité.

Selon Mark Esposito, directeur de l’apprentissage de la société de technologie d’automatisation Nexus FrontierTech, le terme «AIOps» a évolué à partir de «DevOps» – la culture et la pratique du génie logiciel qui vise à intégrer le développement et les opérations logicielles. « L’idée est de prôner l’automatisation et la surveillance à toutes les étapes, de la construction du logiciel à la gestion de l’infrastructure », explique Esposito. L’innovation récente dans le domaine comprend l’utilisation de l’analyse prédictive pour anticiper et résoudre les problèmes avant qu’ils n’affectent les opérations informatiques.

L’AIOps aide l’infrastructure à se fondre en arrière-plan

Les administrateurs réseau et informatiques harcelés par l’explosion des volumes de données et la complexité croissante pourraient bénéficier de cette aide, déclare Saurabh Kulkarni, responsable de l’ingénierie et de la gestion des produits chez Hewlett Packard Enterprise. Kulkarni travaille sur HPE InfoSight, une plate-forme AIOps basée sur le cloud pour la gestion proactive des systèmes de centre de données.

« Les administrateurs informatiques passent des tonnes et des tonnes de temps à planifier leur travail, à planifier les déploiements, à ajouter de nouveaux nœuds, à calculer, à stocker, etc. Et quand quelque chose ne va pas dans l’infrastructure, il est extrêmement difficile de déboguer ces problèmes manuellement », explique Kulkarni. « AIOps utilise des algorithmes d’apprentissage automatique pour examiner les modèles, examiner les comportements répétés et en tirer des leçons pour fournir une recommandation rapide à l’utilisateur. » Au-delà des nœuds de stockage, chaque élément de l’infrastructure informatique enverra une alerte distincte afin que les problèmes puissent être résolus rapidement.

Le système InfoSight collecte les données de tous les appareils dans l’environnement d’un client, puis les corrèle avec les données des clients HPE avec des environnements informatiques similaires. Le système peut identifier un problème potentiel afin qu’il soit rapidement résolu. Si le problème se reproduit, le correctif peut être automatiquement appliqué. Alternativement, le système envoie une alerte afin que les équipes informatiques puissent résoudre le problème rapidement, ajoute Kulkarni. Prenons le cas d’un contrôleur de stockage qui est tombé en panne parce qu’il n’est pas alimenté. Plutôt que de supposer que le problème concerne exclusivement le stockage, la plate-forme AIOps examine l’ensemble de la pile d’infrastructure, jusqu’à la couche d’application, pour identifier la cause première.

« Le système surveille les performances et peut détecter les anomalies. Nous avons des algorithmes qui s’exécutent constamment en arrière-plan pour détecter tout comportement anormal et alerter les clients avant que le problème ne survienne », explique Kulkarni. La philosophie d’InfoSight est de « faire disparaître l’infrastructure » ​​en réunissant les systèmes informatiques et toutes les données de télémétrie dans une seule fenêtre. En examinant un ensemble géant de données, les administrateurs peuvent rapidement comprendre ce qui ne va pas avec l’infrastructure.

Kulkarni rappelle la difficulté de gérer un vaste environnement informatique à partir d’emplois antérieurs. « Je devais gérer un grand ensemble de données, et j’ai dû appeler tant de fournisseurs différents et être en attente pendant plusieurs heures pour essayer de résoudre les problèmes », dit-il. « Parfois, il nous a fallu des jours pour comprendre ce qui se passait vraiment. »

En automatisant la collecte de données et en exploitant une multitude de données pour comprendre les causes profondes, AIOps permet aux entreprises de réaffecter le personnel de base, y compris les administrateurs informatiques, les administrateurs de stockage et les administrateurs réseau, en consolidant les rôles à mesure que l’infrastructure est simplifiée et en passant plus de temps à assurer les performances des applications. « Auparavant, les entreprises avaient plusieurs rôles et différents départements s’occupant de choses différentes. Ainsi, même pour déployer une nouvelle zone de stockage, cinq administrateurs différents devaient chacun faire leur part », explique Kulkarni. Mais avec AIOps, l’IA gère une grande partie du travail automatiquement afin que le personnel informatique et de support puisse consacrer son temps à des initiatives plus stratégiques, augmentant l’efficacité et, dans le cas d’une entreprise qui fournit un support technique à ses clients, améliorant les marges bénéficiaires. Par exemple, Cardoso de Sercompe a pu réduire le temps moyen que ses ingénieurs de support passent sur les appels des clients, reflétant une meilleure expérience client tout en augmentant l’efficacité.

Téléchargez le rapport complet.

Ce contenu a été produit par Insights, la branche de contenu personnalisé de MIT Technology Review. Il n’a pas été rédigé par la rédaction de MIT Technology Review.