Depuis l’aube de l’iPhone, la plupart des smarts dans les smartphones sont venus d’ailleurs : les ordinateurs d’entreprise connus sous le nom de cloud. Les applications mobiles ont envoyé les données des utilisateurs vers le cloud pour des tâches utiles telles que la transcription de discours ou la suggestion de réponses aux messages. Aujourd’hui, Apple et Google affirment que les smartphones sont suffisamment intelligents pour effectuer eux-mêmes certaines tâches d’apprentissage automatique cruciales et sensibles.

Lors de l’événement WWDC d’Apple ce mois-ci, la société a déclaré que son assistant virtuel Siri transcrirait le discours sans utiliser le cloud dans certaines langues sur les iPhones et iPads récents et futurs. Lors de son propre événement pour développeurs d’E/S le mois dernier, Google a déclaré que la dernière version de son système d’exploitation Android disposait d’une fonctionnalité dédiée au traitement sécurisé des données sensibles sur l’appareil, appelée Private Compute Core. Ses utilisations initiales incluent l’alimentation de la version de la fonction Smart Reply de l’entreprise intégrée à son clavier mobile qui peut suggérer des réponses aux messages entrants.

Apple et Google affirment tous deux que l’apprentissage automatique sur l’appareil offre plus de confidentialité et des applications plus rapides. Ne pas transmettre de données personnelles réduit le risque d’exposition et permet de gagner du temps à attendre que les données traversent Internet. Dans le même temps, la conservation des données sur les appareils s’aligne sur l’intérêt à long terme des géants de la technologie de garder les consommateurs liés à leurs écosystèmes. Les personnes qui entendent que leurs données peuvent être traitées de manière plus privée pourraient devenir plus disposées à accepter de partager plus de données.

La récente promotion par les entreprises de l’apprentissage automatique sur appareil intervient après des années de travail sur la technologie pour restreindre les données que leurs clouds peuvent « voir ».

En 2014, Google a commencé à collecter des données sur l’utilisation du navigateur Chrome grâce à une technique appelée confidentialité différentielle, qui ajoute du bruit aux données collectées de manière à restreindre ce que ces échantillons révèlent sur les individus. Apple a utilisé la technique sur les données recueillies à partir des téléphones pour informer les emoji et les prédictions de frappe et pour les données de navigation Web.

Plus récemment, les deux entreprises ont adopté une technologie appelée apprentissage fédéré. Il permet à un système d’apprentissage automatique basé sur le cloud d’être mis à jour sans récupérer de données brutes ; au lieu de cela, les appareils individuels traitent les données localement et ne partagent que les mises à jour digérées. Comme pour la confidentialité différentielle, les entreprises n’ont discuté de l’utilisation de l’apprentissage fédéré que dans des cas limités. Google a utilisé cette technique pour maintenir ses prédictions de frappe sur mobile à jour avec les tendances linguistiques ; Apple a publié des recherches sur son utilisation pour mettre à jour les modèles de reconnaissance vocale.

Rachel Cummings, professeure adjointe à Columbia qui a déjà été consultante sur la confidentialité pour Apple, déclare que le passage rapide à l’apprentissage automatique sur les téléphones a été frappant. « Il est incroyablement rare de voir quelque chose passer de la première conception au déploiement à grande échelle en si peu d’années », dit-elle.

Ces progrès ont nécessité non seulement des avancées en informatique, mais aussi des entreprises pour relever les défis pratiques du traitement des données sur les appareils appartenant aux consommateurs. Google a déclaré que son système d’apprentissage fédéré n’exploite les appareils des utilisateurs que lorsqu’ils sont branchés, inactifs et sur une connexion Internet gratuite. La technique a été rendue possible en partie par l’amélioration de la puissance des processeurs mobiles.

Le matériel mobile Beefier a également contribué à l’annonce de Google en 2019 selon laquelle la reconnaissance vocale pour son assistant virtuel sur les appareils Pixel serait entièrement sur l’appareil, sans la béquille du cloud. La nouvelle reconnaissance vocale sur l’appareil d’Apple pour Siri, annoncée à la WWDC ce mois-ci, utilisera le « moteur neuronal » que la société a ajouté à ses processeurs mobiles pour alimenter les algorithmes d’apprentissage automatique.

Les prouesses techniques sont impressionnantes. On peut se demander dans quelle mesure ils changeront de manière significative la relation des utilisateurs avec les géants de la technologie.

Les présentateurs de la WWDC d’Apple ont déclaré que le nouveau design de Siri était une « mise à jour majeure de la confidentialité » qui abordait le risque associé à la transmission accidentelle de l’audio vers le cloud, affirmant que c’était la plus grande préoccupation des utilisateurs en matière de confidentialité concernant les assistants vocaux. Certaines commandes Siri, telles que le réglage des minuteries, peuvent être reconnues entièrement localement, ce qui permet une réponse rapide. Pourtant, dans de nombreux cas, les commandes transcrites à Siri, y compris probablement à partir d’enregistrements accidentels, seront envoyées aux serveurs Apple pour que le logiciel décode et réponde. La transcription vocale Siri sera toujours basée sur le cloud pour les haut-parleurs intelligents HomePod couramment installés dans les chambres et les cuisines, où l’enregistrement accidentel peut être plus préoccupant.

Google promeut également le traitement des données sur l’appareil comme une victoire en matière de confidentialité et a indiqué qu’il étendrait la pratique. La société s’attend à ce que des partenaires tels que Samsung qui utilisent son système d’exploitation Android adoptent le nouveau Privacy Compute Core et l’utilisent pour des fonctionnalités qui reposent sur des données sensibles.

Google a également fait de l’analyse locale des données de navigation une caractéristique de sa proposition de réinventer le ciblage des publicités en ligne, baptisé FLoC et prétendu être plus privé. Des universitaires et certaines entreprises technologiques rivales ont déclaré que la conception aiderait probablement Google à consolider sa domination des publicités en ligne en rendant le ciblage plus difficile pour d’autres entreprises.