L’IA fait peut-être revivre les langues mortes

Bien que le transporteur de Star Trek soit difficile à imaginer – un mouvement parfait de la matière sur de grandes distances sans équipement à une extrémité – ce n’est peut-être pas la technologie la plus farfelue de l’Enterprise. Bien qu’il y ait plusieurs prétendants, je soupçonne fortement que le traducteur universel est le MacGuffin le plus improbable. Après tout, comment déchiffreriez-vous une langue totalement inconnue en temps réel ? Bien sûr, personne ne veut regarder 30 épisodes de télévision sur la façon dont nous avons finalement compris ce que les Klingons appellent les nuages, donc à peu près tous les films de science-fiction ont une explication à la main pour parler la langue du spectateur. Farscape avait des microbes, certains extraterrestres ont une télépathie qui fonctionne avec des cerveaux extraterrestres de toutes sortes, et d’autres encore étudient l’anglais à distance pendant des décennies hors caméra. Babelfish quelqu’un?

J’y ai pensé à cause d’un article que j’ai lu par [Alizeh Kohari] sur [Jiaming Luo’s] travailler en utilisant l’IA pour décoder les langues mortes. Bien que cela puisse sembler similaire au traducteur de Spock, ce n’est vraiment pas le cas. Les langues humaines changent avec le temps et la distance. Il suffit de regarder la BBC ou de lire quelque chose écrit par Thomas Jefferson pour le voir. Mais il y a encore beaucoup de points communs, du moins dans certains domaines.

Tu n’es qu’humain

Si vous êtes de langue maternelle anglaise, vous pouvez probablement déchiffrer beaucoup de mots à partir d’un texte, par exemple en espagnol ou en français. La plupart de ces langues ont commencé ou emprunté au latin et partagent des racines avec des langues comme le grec, de sorte que vous pouvez souvent déchiffrer un signe avec un peu de contexte. Essayez maintenant avec l’arabe ou le mandarin. La plupart d’entre nous n’en ont aucune idée. Lisez-vous de droite à gauche ? Quels sont les personnages ? Il n’y a rien à saisir à moins que vous ne connaissiez la langue ou une langue similaire. Par exemple : « 每天閱讀 Hackaday » ne vous donne probablement aucun indice autre qu’il s’agit de Hackaday.

L’IA n’est pas très différente. Le logiciel a appris comment les langues changent à mesure qu’elles évoluent en étudiant les modèles entre des langues apparentées comme l’ougaritique et l’hébreu. Vous pourriez penser que les langues se développent ad hocmais il existe des modèles définis – au moins, parmi les langues humaines.

Par exemple, bien que toutes les langues n’aient pas les mêmes mots pour les couleurs, on sait depuis 1969 environ que les humains ont tendance à développer des mots pour les couleurs dans le même ordre. C’est en noir et blanc obtenir des noms avec le rouge. Puis, plus tard, des noms pour d’autres couleurs apparaissent. Vous pouvez regarder une vidéo intéressante sur cet effet ci-dessous.

Relations étroites

En supposant que l’IA puisse traduire une langue apparentée dans une autre, que se passe-t-il si vous la nourrissez de langues apparentées, mais que nous ne savons plus lire ?

Sceau contenant Indus Script
Une empreinte d’un sceau cylindrique d’Iran datant de quelques milliers d’années. photo par [ALFGRN]CC-BY-SA-2.0.

Par exemple, [Kohari] souligne l’écriture Indus – Harappan – trouvée sur des milliers de petits timbres ou sceaux autour du Pakistan et aussi loin que l’Irak. Malgré des décennies d’analyse, personne ne sait ce qu’ils disent. Il y a même eu des théories selon lesquelles les sceaux ne disent rien, mais l’analyse mathématique montre que les symboles ne sont pas placés au hasard et semblent être en corrélation avec d’autres langues.

Le problème pour l’IA est que personne ne sait quelles langues pourraient être liées au script Indus. [Luo] et son équipe ont travaillé pour concevoir un algorithme capable de dire à quel point deux scripts sont proches même s’il ne peut pas les comprendre. Cela pourrait aider. Nous verrons si son ordinateur peut éventuellement lire la langue morte de l’Indus.

Si cela fonctionne, cela pourrait ouvrir beaucoup d’archéologie. Il existe de nombreuses langues qui ont été oubliées comme l’étrusque et le rongorongo. Si vous saviez qu’ils s’étaient transformés en d’autres langues que nous connaissons, cela pourrait aider à les déverrouiller. Même les langues que nous comprenons assez bien aujourd’hui n’étaient pas toujours connues à l’époque moderne. Les hiéroglyphes égyptiens, par exemple, étaient un mystère jusqu’à la découverte de la pierre de Rosette qui avait le même message dans les hiéroglyphes, l’écriture démotique égyptienne et le grec. Au moins, nous savions lire le grec.

Hype de l’IA

Si nous avions le véritable traducteur universel, ce serait amusant de voir ce que les dauphins et les abeilles se disent. Il semble que si nous pouvions faire cela, lire Indus serait facile. La vérité est, cependant, que l’IA est loin de pouvoir remplacer totalement les humains et la perspicacité humaine dans la résolution créative de problèmes et il est important de s’en souvenir car les gens nous considèrent comme des personnes qui comprennent la technologie pour les aider à prendre des décisions concernant l’IA.

Par exemple, les chercheurs pensent que les personnes qui ont écrit les sceaux de l’écriture Indus écrivaient de droite à gauche parce que parfois les caractères de gauche sont froissés, comme cela arrive parfois lorsque vous vous approchez du bord de votre papier. Cependant, puisque les sceaux étaient probablement destinés à être utilisés comme tampons, cela n’implique pas nécessairement que la langue elle-même soit de droite à gauche. Par exemple, le chinois s’écrivait de haut en bas et de droite à gauche, mais dans les formats modernes, il s’écrit de gauche à droite. Les deux styles persistent, mais vous savez comment lire à partir du contexte. De telles idées sont toujours du ressort des humains, du moins pour le moment.

J’ai lu récemment que l’IA était peut-être déjà consciente. Si vous en savez beaucoup sur le fonctionnement du cerveau et sur le fonctionnement de l’IA moderne, vous trouverez probablement cette affirmation aussi improbable que moi. Nous pourrions un jour reproduire un cerveau électronique qui incarne cette chose qui nous rend «humains» ou même simplement conscients. Mais ce jour semble bien loin, en effet. D’ailleurs, si c’est le cas, qui peut dire que nous n’aurons pas autant de mal à parler avec eux qu’avec les dauphins ?