Un programme informatique crucial pour la physique des particules risque l’obsolescence

Récemment, j’ai regardé un collègue physicien des particules parle d’un calcul qu’il a poussé à un nouveau niveau de précision. Son outil ? Un programme informatique des années 1980 appelé FORM.

Les physiciens des particules utilisent certaines des équations les plus longues de toute la science. Pour rechercher des signes de nouvelles particules élémentaires dans les collisions au Large Hadron Collider, par exemple, ils dessinent des milliers d’images appelées diagrammes de Feynman qui décrivent les résultats possibles des collisions, chacune encodant une formule compliquée pouvant comporter des millions de termes. Il est impossible de résumer des formules comme celles-ci avec un stylo et du papier ; même les ajouter avec des ordinateurs est un défi. Les règles d’algèbre que nous apprenons à l’école sont assez rapides pour les devoirs, mais pour la physique des particules, elles sont terriblement inefficaces.

Des programmes appelés systèmes de calcul formel s’efforcent de gérer ces tâches. Et si vous voulez résoudre les plus grandes équations du monde, depuis 33 ans un programme se démarque : FORM.

Développé par le physicien des particules néerlandais Jos Vermaseren, FORM est un élément clé de l’infrastructure de la physique des particules, nécessaire pour les calculs les plus difficiles. Cependant, comme pour de nombreux éléments essentiels de l’infrastructure numérique, la maintenance de FORM repose en grande partie sur une seule personne : Vermaseren lui-même. Et à 73 ans, il a commencé à prendre du recul par rapport au développement de FORM. En raison de la structure incitative du milieu universitaire, qui récompense les articles publiés, et non les outils logiciels, aucun successeur n’a émergé. Si la situation ne change pas, la physique des particules pourrait être forcée de ralentir considérablement.

FORM a fait ses débuts au milieu des années 1980, lorsque le rôle des ordinateurs évoluait rapidement. Son prédécesseur, un programme appelé Schoonschip, créé par Martinus Veltman, a été publié sous la forme d’une puce spécialisée que vous avez branchée sur le côté d’un ordinateur Atari. Vermaseren voulait créer un programme plus accessible pouvant être téléchargé par les universités du monde entier. Il a commencé à le programmer dans le langage informatique FORTRAN, qui signifie Formula Translation. Le nom FORM était un riff là-dessus. (Il est ensuite passé à un langage de programmation appelé C.) Vermaseren a sorti son logiciel en 1989. Au début des années 90, plus de 200 institutions à travers le monde l’avaient téléchargé, et le nombre ne cessait d’augmenter.

Depuis 2000, un article sur la physique des particules qui cite FORM est publié tous les quelques jours, en moyenne. « La plupart [high-precision] les résultats que notre groupe a obtenus au cours des 20 dernières années étaient fortement basés sur le code FORM », a déclaré Thomas Gehrmann, professeur à l’Université de Zurich.

Une partie de la popularité de FORM est venue des algorithmes spécialisés qui ont été construits au fil des ans, comme une astuce pour multiplier rapidement certains éléments d’un diagramme de Feynman et une procédure pour réorganiser les équations afin d’avoir le moins de multiplications et d’additions possible. Mais l’avantage le plus ancien et le plus puissant de FORM est la façon dont il gère la mémoire.

Tout comme les humains ont deux types de mémoire, à court terme et à long terme, les ordinateurs en ont deux types : principal et externe. La mémoire principale (la RAM de votre ordinateur) est facile d’accès à la volée, mais sa taille est limitée. Les périphériques de mémoire externes tels que les disques durs et les disques SSD contiennent beaucoup plus d’informations mais sont plus lents. Pour résoudre une longue équation, vous devez la stocker dans la mémoire principale afin de pouvoir travailler facilement avec.

Dans les années 80, les deux types de mémoire étaient limités. « FORM a été conçu à une époque où il n’y avait presque pas de mémoire, ni d’espace disque. En gros, il n’y avait rien », a déclaré Ben Ruijl, un ancien étudiant de Vermaseren et développeur de FORM, qui est maintenant chercheur postdoctoral à l’Institut fédéral suisse de Technologie Zürich. Cela posait un défi : les équations étaient trop longues pour être gérées par la mémoire principale. Pour en calculer un, votre système d’exploitation devait traiter votre disque dur comme s’il s’agissait également de la mémoire principale. Le système d’exploitation, ne sachant pas quelle taille attendre de votre équation, stockait les données dans une collection de « pages » sur le disque dur, passant fréquemment de l’une à l’autre au fur et à mesure que différentes pièces étaient nécessaires – un processus inefficace appelé échange.

Cette bande dessinée xkcd illustre bien la situation.

Illustration : xkcd.com

FORM contourne l’échange et utilise sa propre technique. Lorsque vous travaillez avec une équation dans FORM, le programme attribue à chaque terme une quantité fixe d’espace sur le disque dur. Cette technique permet au logiciel de suivre plus facilement l’emplacement des éléments d’une équation. Cela permet également de ramener facilement ces pièces dans la mémoire principale lorsqu’elles sont nécessaires sans accéder au reste.

La mémoire a augmenté depuis les débuts de FORM, passant de 128 kilo-octets de RAM dans l’Atari 130XE en 1985 à 128 giga-octets de RAM dans mon bureau gonflé, une amélioration d’un million de fois. Mais les astuces développées par Vermaseren restent cruciales. Alors que les physiciens des particules parcourent des pétaoctets de données du Grand collisionneur de hadrons pour rechercher des preuves de nouvelles particules, leur besoin de précision, et donc la longueur de leurs équations, s’allonge.

François Zipponi
Je suis François Zipponi, éditorialiste pour le site 10-raisons.fr. J'ai commencé ma carrière de journaliste en 2004, et j'ai travaillé pour plusieurs médias français, dont le Monde et Libération. En 2016, j'ai rejoint 10-raisons.fr, un site innovant proposant des articles sous la forme « 10 raisons de... ». En tant qu'éditorialiste, je me suis engagé à fournir un contenu original et pertinent, abordant des sujets variés tels que la politique, l'économie, les sciences, l'histoire, etc. Je m'efforce de toujours traiter les sujets de façon objective et impartiale. Mes articles sont régulièrement partagés sur les réseaux sociaux et j'interviens dans des conférences et des tables rondes autour des thèmes abordés sur 10-raisons.fr.