Pourquoi il est si difficile de distinguer les spams pornographiques des robots d’État chinois

Mais ce contenu de spam n’a peut-être rien à voir avec le gouvernement chinois après tout, selon un rapport publié lundi par le Stanford Internet Observatory. « Bien que le spam ait noyé le contenu légitime lié aux manifestations, rien ne prouve qu’il ait été conçu pour le faire, ni qu’il s’agisse d’un effort délibéré du gouvernement chinois », a écrit David Thiel, l’auteur du rapport.

Au lieu de cela, ils n’étaient probablement que les robots de spam commerciaux habituels qui tourmentent Twitter depuis toujours. Ces comptes particuliers existent pour attirer l’attention des utilisateurs chinois qui se rendent sur des réseaux étrangers pour accéder au porno.

Alors le « hausse significative” dans le spam était juste une coïncidence ? La réponse courte est : très probable. Il y a deux raisons principales pour lesquelles Thiel ne pense pas que les bots soient liés au gouvernement chinois.

Tout d’abord, ces comptes publient des spams depuis longtemps. Et ils ont envoyé encore plus de tweets, et plus régulièrement, avant que les manifestations ont éclaté, selon une analyse de données sur les activités de plus de 600 000 comptes du 15 au 29 novembre. Une autre analyse montre qu’ils ont également continué à diffuser du spam alors même que les discussions sur les manifestations se sont éteintes.

Consultez ces deux graphiques (pour référence, les manifestations ont culminé vers le 27 novembre):

Un graphique linéaire montrant des tweets de spam cohérents entre le 15 et le 29 novembre. Au-dessus du graphique, il est indiqué qu'il s'agit d'une analyse de 7 541 382 tweets au total.
Un graphique linéaire montrant l'augmentation des tweets de spam entre le 29 novembre et le 4 décembre. Au-dessus du graphique, il est indiqué qu'il s'agit d'une analyse de 6 088 596 tweets au total.

Alors est-ce juste ressentir comme si l’activité de spam augmentait pendant les manifestations ? Ce graphique montre que de nombreux autres comptes de robots ont en fait été créés en novembre :

Un graphique à barres montrant que les comptes de spam créés en novembre sont largement plus nombreux que les comptes créés au cours des derniers mois.

Mais Thiel souligne que la modération de contenu prend du temps. Les gens ont tendance à ignorer l’effet appelé « biais de survie » : le contenu et les comptes de spam plus anciens sont constamment supprimés de la plate-forme, mais les chercheurs ne disposent pas de données sur les comptes suspendus. Ainsi, un graphique comme celui-ci ne montre que les comptes qui Survécu Les filtres anti-spam de Twitter. C’est pourquoi le pic de novembre semble si important : ce sont de nouveaux comptes créés le plus récemment pour remplacer leurs pairs décédés et qui sont toujours debout, mais tous ne survivront pas, donc ils ne seraient pas là si nous devions revoir ce graphique dans, disons, un quelques mois. En d’autres termes, si vous procédiez à une analyse des données juste après les manifestations, il serait certainement sembler ce ce type de spam vient de commencer récemment. Mais ce n’est pas nécessairement toute la vérité.

Deuxièmement, si les comptes de spam étaient destinés à enterrer des informations sur les manifestations, ils ont fait un travail assez médiocre. Alors que le spam publicitaire d’escorte comportait de nombreux noms de villes chinoises comme mots-clés et hashtags, Thiel a constaté qu’ils ne ciblaient pas les hashtags réellement utilisés pour discuter des manifestations, comme #A4Revolution ou #ChinaProtest2022, « ce qui est ce que vous supposeriez que le gouvernement serait intéressé à sauter dessus s’ils essayaient de faire taire les choses », me dit-il. Sur les quelque 30 000 tweets qu’il a analysés contenant ces hashtags plus influents, « il n’y a pas de spam à proprement parler là-dedans ».

François Zipponi
Je suis François Zipponi, éditorialiste pour le site 10-raisons.fr. J'ai commencé ma carrière de journaliste en 2004, et j'ai travaillé pour plusieurs médias français, dont le Monde et Libération. En 2016, j'ai rejoint 10-raisons.fr, un site innovant proposant des articles sous la forme « 10 raisons de... ». En tant qu'éditorialiste, je me suis engagé à fournir un contenu original et pertinent, abordant des sujets variés tels que la politique, l'économie, les sciences, l'histoire, etc. Je m'efforce de toujours traiter les sujets de façon objective et impartiale. Mes articles sont régulièrement partagés sur les réseaux sociaux et j'interviens dans des conférences et des tables rondes autour des thèmes abordés sur 10-raisons.fr.