Vous avez un courrier : lire les adresses avec OCR

La dernière fois que j’ai livré cette chronique, je vous ai parlé des tentatives de l’USPS d’automatiser entièrement un bureau de poste. Bien sûr, c’est un terme un peu abusif, puisqu’il fallait 1 500 employés pour faire fonctionner l’endroit au quotidien. Bien que le projet Turnkey au Rhode Island et le projet Gateway en Californie aient été des terrains d’essai pour toutes sortes d’équipements de tri et de traitement du courrier, le fait de lire réellement les adresses et d’acheminer le courrier vers sa destination finale nécessitait toujours une intervention humaine et un codage manuel.

Aujourd’hui, la poste traite chaque jour des centaines de millions d’articles de courrier à l’aide de divers équipements. L’un de ces équipements importants est le lecteur d’adresses OCR, qui parvient à donner un sens à toutes sortes d’égratignures de poulet.

Tous les regards sont tournés vers l’OCR

Image via le musée postal Smithsonian

Dans ses efforts toujours croissants pour éliminer l’humain des opérations de tri du courrier, l’USPS a regardé avec amour la reconnaissance optique de caractères, ou OCR.

La poste a été l’une des premières à adopter l’OCR, commençant sa R&D dans les années 1950. Pendant ce temps, la Farrington Manufacturing Company a commencé à développer son lecteur d’adresse automatique sous contrat avec l’USPS.

En quelques séries de prototypes, cette machine pouvait reconnaître et enregistrer les adresses presque n’importe où sur le recto de l’enveloppe, qu’elles soient dactylographiées, manuscrites ou imprimées, étroitement espacées ou non, et que les lignes soient alignées ou décalées. Après avoir confirmé les adresses, la machine triait le courrier dans différents emplacements pour les destinations locales, longue distance et internationales.

Bien qu’il existe deux manières pour une machine de reconnaître les caractères – optique et magnétique – la méthode optique a finalement pris le dessus. L’opération optique utilisait des cellules photoélectriques afin de détecter l’envoi de courrier et de lire ensuite l’adresse. La méthode magnétique recherche l’encre contenant des oxydes de fer. Ils avaient tous deux leurs mérites ; Même si l’OCR présentait des problèmes de manque de contraste et parfois de surmarquage des adresses, c’était finalement le choix le plus pratique.

Comme vous le verrez dans la vidéo ci-dessous, les machines OCR pouvaient lire 42 000 adresses par heure en 1970 grâce à une opération appelée Line Find. La machine effectuait trois étapes pour chaque pièce de courrier. Premièrement, il trouve soit la dernière ligne (ville et état), soit l’avant-dernière ligne (adresse postale) selon que la lettre est locale ou sortante, puis deuxièmement, il mesure la hauteur du caractère. Enfin, il lit la ligne.

Comment fait-il cela ? Un tube cathodique projette un faisceau de lumière à travers un « système optique en expansion » situé sur la face de l’enveloppe. Le faisceau produit une trame qui balaye de droite à gauche jusqu’à ce qu’il trouve le bloc d’adresse. Ensuite, il trouve le caractère le plus à gauche et s’arrête. Tout cela se passe en cinq millièmes de seconde.

Ensuite, le raster passe à un balayage plus fin et examine la première lettre de la ligne pour déterminer sa taille. Sur cette base, le raster ne gaspille aucune énergie sur l’espace vide, s’ajustant à la hauteur du reste de la ligne. Le système optique utilise les caractéristiques des lettres telles que les lignes horizontales à gauche et diverses courbes et lignes à droite pour déterminer la lettre. Il y a bien plus que cela, mais je ne vais pas gâcher cette vidéo courte mais informative pour vous.

La malédiction de la cursive

Comme vous pouvez l’imaginer, les variations extrêmes de l’écriture manuscrite des gens ont causé des problèmes aux machines OCR. Mais en analysant la longueur et l’emplacement des traits, certaines écritures manuscrites pourraient être analysées. Aujourd’hui, l’OCR peut lire presque tout : environ 99 % des adresses, même celles écrites en cursive serrée ou en boucle. De nos jours, si une adresse ne peut pas être lue par OCR, une image est envoyée au Remote Encoding Center (REC) de Salt Lake City, UT pour être décodée par des yeux humains.

Découvrez ce clavier spécial qu’ils utilisent au REC.

En effet, les opérations du REC sont si vitales qu’elles disposent de trois FAI venant sur trois lignes de fibre optique à différents points pour assurer la redondance. Il y avait autrefois des dizaines de CER à travers les États-Unis, mais l’OCR est devenu si performant qu’ils n’ont besoin que d’un seul centre de nos jours.

Malgré cela, le REC traite 1,2 million d’articles de courrier par jour, nécessitant au minimum 7 150 frappes par heure de la part de chaque opérateur. Cela signifie qu’ils traitent en moyenne un courrier toutes les quatre secondes. Comme vous pouvez le constater, le mouvement du courrier nécessite encore aujourd’hui une manipulation humaine.

Dans la vidéo ci-dessous, Tom Scott se rend au REC et apprend à lire et à encoder le courrier afin qu’il puisse avancer et être livré. C’est un processus intéressant qui nécessite un clavier spécial avec les chiffres sur la ligne d’accueil, ainsi qu’une multitude de modificateurs et d’éléments à leur place en haut.

Tout d’abord, à moins qu’elle ne soit entièrement absente, la partie C de l’adresse (le code postal) est déchiffrée et codée, puis la partie extérieure de l’adresse (ville et état), et enfin la partie intérieure (l’adresse postale). Le REC a toutes les bonnes adresses connues en Amérique sur ses serveurs, et une fois qu’ils obtiennent une correspondance, l’usine qui possède l’envoi postal est immédiatement informée de l’endroit où l’envoyer, et l’envoi avance. Tout cela pour le prix bas de 66 cents l’once. Incroyable, n’est-ce pas ?

Mais attends, il y a plus

Restez à l’écoute pour en savoir plus sur les avancées de l’USPS, notamment les codes postaux, les distributeurs automatiques et ce qu’on appelle le v-mail. Nous examinerons également les façons dont l’USPS a tenté d’améliorer la productivité et le service ainsi que l’expérience client. Et non, je n’ai pas oublié cette petite anecdote que j’avais promise.

François Zipponi
Je suis François Zipponi, éditorialiste pour le site 10-raisons.fr. J'ai commencé ma carrière de journaliste en 2004, et j'ai travaillé pour plusieurs médias français, dont le Monde et Libération. En 2016, j'ai rejoint 10-raisons.fr, un site innovant proposant des articles sous la forme « 10 raisons de... ». En tant qu'éditorialiste, je me suis engagé à fournir un contenu original et pertinent, abordant des sujets variés tels que la politique, l'économie, les sciences, l'histoire, etc. Je m'efforce de toujours traiter les sujets de façon objective et impartiale. Mes articles sont régulièrement partagés sur les réseaux sociaux et j'interviens dans des conférences et des tables rondes autour des thèmes abordés sur 10-raisons.fr.