IBM a mis au point un système de débat automatique appelé Project Debater qui recherche un sujet, présente un argument, écoute une réfutation humaine et formule sa propre réfutation. Mais réussit-il le test de Turing? Ou le test de Turing est-il plus important?

Le test de Turing a été introduit pour la première fois en 1950, souvent cité comme la première année pour la recherche sur l’IA. Il demande: «Les machines peuvent-elles penser?». Aujourd’hui, nous sommes plus intéressés par les machines qui peuvent intelligemment faire des recommandations de restaurants, conduire notre voiture le long de l’autoroute fastidieuse pour aller et revenir du travail, ou identifier la fleur surprenante sur laquelle nous venons de tomber. Tout cela correspond à la définition de l’IA en tant que machine capable d’exécuter une tâche nécessitant normalement l’intelligence d’un humain. Bien que comme vous le verrez ci-dessous, le test de Turing n’était même pas pour l’intelligence ou même pour la réflexion, mais plutôt pour déterminer le sexe d’un sujet de test.

Le jeu d’imitation

Test de Turing avec machine
Test de Turing avec machine

Le test de Turing tel que nous le connaissons aujourd’hui consiste à voir si une machine peut tromper quelqu’un en lui faisant croire que c’est un humain. Il s’agit d’un interrogateur et d’une machine avec la machine cachée de l’interrogateur. L’interrogateur pose des questions à la machine en utilisant uniquement le clavier et l’écran. Le but des questions de l’interrogateur est de l’aider à décider s’il parle à une machine ou à un humain. S’il ne peut pas le dire, la machine passe le test de Turing.

Souvent, le test est effectué avec un certain nombre d’interrogateurs et la mesure du succès est le pourcentage d’interrogateurs qui ne peuvent pas le dire. Dans un exemple, pour donner un avantage à la machine, le test consistait à déterminer s’il s’agissait d’une machine ou d’un garçon ukrainien de 13 ans. Le jeune âge a largement excusé l’étrangeté de sa conversation. Cela a trompé 33% des interrogateurs.

Jeu d'imitation avec une machine et un homme
Jeu d’imitation avec une machine et un homme

Naturellement, Turing n’a pas appelé son test «le test de Turing». Au lieu de cela, il l’appelait le jeu d’imitation, car le but était d’imiter un humain. Dans l’article de Turing, il donne deux versions du test. Le premier concerne trois personnes, l’interrogateur, un homme et une femme. L’homme et la femme sont assis dans une pièce séparée de l’interrogateur et la communication à l’époque de Turing se faisait idéalement par téléimprimeur. Le but est que l’interrogateur devine qui est un homme et qui est une femme. Le but de l’homme est de tromper l’interrogateur en lui faisant prendre la mauvaise décision et celui de la femme est de l’aider à prendre la bonne décision.

Le deuxième test dans l’article de Turing remplace la femme par une machine mais la machine est maintenant le trompeur et l’homme essaie d’aider l’interrogateur à prendre la bonne décision. L’interrogateur essaie toujours de deviner qui est un homme et qui est une femme.

Mais ne vous laissez pas tromper par cet objectif. Le vrai but du jeu était de remplacer sa question «Une machine peut-elle penser?». Si le jeu réussissait, Turing pensa que sa question aurait reçu une réponse. Aujourd’hui, nous sommes tous les deux plus sophistiqués sur ce qui constitue «penser» et «intelligence», et nous nous contentons également de voir la machine afficher un comportement intelligent, qu’il s’agisse de «penser» ou non. Pour déballer tout cela, prenons le récent Project Debater d’IBM sous le microscope.

Le grand débatteur

Le Project Debater d’IBM est un exemple de ce que nous appellerions une IA composite par opposition à une IA étroite. Un exemple d’IA étroite serait de présenter une image à un réseau de neurones et le réseau de neurones étiqueterait les objets de cette image, une tâche étroitement définie. Une IA composite, cependant, effectue une tâche plus complexe nécessitant un certain nombre d’étapes, beaucoup plus proche d’un cerveau humain.

Format de débat

Le débatteur de projet reçoit d’abord la motion à débattre. Vous pouvez lire l’article sur la page Web d’IBM pour les détails de ce qu’il fait ensuite, mais en gros, il passe 15 minutes à rechercher et à formuler un discours d’ouverture de 4 minutes soutenant un côté de la motion. Il convertit également le discours en langage naturel et le livre à un public. Pendant ces 15 premières minutes, il compile également des pistes pour l’argument opposé et formule des réponses. Ceci est en préparation pour sa réfutation ultérieure. Il écoute ensuite la réfutation de ses adversaires, le convertissant en texte à l’aide du discours-texte Watson d’IBM. Il analyse le texte et, en combinaison avec les réponses qu’il avait précédemment formulées, propose sa propre réfutation de 4 minutes. Il convertit cela en discours et se termine par un discours de synthèse de 2 minutes.

Toutes ces étapes, dont certaines sont considérées comme une IA étroite, s’additionnent à une IA composite. Le tout est fait avec des réseaux de neurones ainsi que des données conventionnelles d’exploration, de traitement et d’analyse.

La vidéo suivante est d’un débat en direct entre Project Debater et Harish Natarajan, détenteur du record du monde pour le nombre de concours de débats remportés. Jugez par vous-même à quel point cela fonctionne.

Project Debater passe-t-il le test de Turing? Il n’a pas passé le test formel, cependant, vous pouvez en juger par vous-même en imaginant la lecture d’une transcription de ce que Project Debater avait à dire. Pouvez-vous dire s’il a été produit par une machine ou un humain? Si vous pouvez le prendre pour un humain, il peut passer le test de Turing. Il répond également à l’argument du débatteur humain, semblable à la réponse aux questions du test de Turing.

Gardez à l’esprit que le débatteur du projet avait 15 minutes pour préparer le discours d’ouverture et qu’aucun chiffre n’est donné sur le temps qu’il a fallu pour trouver les autres discours, donc si le temps de réponse est un facteur, il peut y perdre. Mais est-ce important?

Le test de Turing est-il important?

Est-ce important que l’une des IA d’aujourd’hui puisse passer le test de Turing? Ce n’est le plus souvent pas le but. La plupart des IA finissent par être des produits commercialisés, même ceux qui ne commencent pas de cette façon. Après tout, quelqu’un finit par payer pour la recherche. Tant qu’ils font le travail, cela n’a pas d’importance.

L’objectif d’IBM pour Project Debater est de produire des arguments convaincants et de prendre des décisions bien informées sans parti pris personnel, un outil utile pour vendre aux entreprises et aux gouvernements. L’objectif de Tesla pour son IA est de conduire des véhicules. Les chatbots abondent pour gérer des demandes téléphoniques et en ligne spécifiques. Tous font quelque chose qui requiert normalement l’intelligence d’un humain avec plus ou moins de succès. Le critère qui compte alors est de savoir si oui ou non ils accomplissent leurs tâches assez bien pour que les gens puissent les payer.

Peut-être que demander si une machine peut penser, ou même si cela peut passer pour un humain, n’est pas vraiment pertinent. La façon dont nous les utilisons exige seulement qu’ils puissent accomplir leurs tâches. Parfois, cela peut exiger un comportement «humain», mais le plus souvent non. Si nous n’utilisons pas l’IA pour tromper les gens de toute façon, le test de Turing est-il toujours pertinent?

LAISSER UN COMMENTAIRE

Rédigez votre commentaire !
Entrez votre nom ici