Mais ce contenu de spam n’a peut-être rien à voir avec le gouvernement chinois après tout, selon un rapport publié lundi par le Stanford Internet Observatory. « Bien que le spam ait noyé le contenu légitime lié aux manifestations, rien ne prouve qu’il ait été conçu pour le faire, ni qu’il s’agisse d’un effort délibéré du gouvernement chinois », a écrit David Thiel, l’auteur du rapport.
Au lieu de cela, ils n’étaient probablement que les robots de spam commerciaux habituels qui tourmentent Twitter depuis toujours. Ces comptes particuliers existent pour attirer l’attention des utilisateurs chinois qui se rendent sur des réseaux étrangers pour accéder au porno.
Alors le « hausse significative” dans le spam était juste une coïncidence ? La réponse courte est : très probable. Il y a deux raisons principales pour lesquelles Thiel ne pense pas que les bots soient liés au gouvernement chinois.
Tout d’abord, ces comptes publient des spams depuis longtemps. Et ils ont envoyé encore plus de tweets, et plus régulièrement, avant que les manifestations ont éclaté, selon une analyse de données sur les activités de plus de 600 000 comptes du 15 au 29 novembre. Une autre analyse montre qu’ils ont également continué à diffuser du spam alors même que les discussions sur les manifestations se sont éteintes.
Consultez ces deux graphiques (pour référence, les manifestations ont culminé vers le 27 novembre):


Alors est-ce juste ressentir comme si l’activité de spam augmentait pendant les manifestations ? Ce graphique montre que de nombreux autres comptes de robots ont en fait été créés en novembre :

Mais Thiel souligne que la modération de contenu prend du temps. Les gens ont tendance à ignorer l’effet appelé « biais de survie » : le contenu et les comptes de spam plus anciens sont constamment supprimés de la plate-forme, mais les chercheurs ne disposent pas de données sur les comptes suspendus. Ainsi, un graphique comme celui-ci ne montre que les comptes qui Survécu Les filtres anti-spam de Twitter. C’est pourquoi le pic de novembre semble si important : ce sont de nouveaux comptes créés le plus récemment pour remplacer leurs pairs décédés et qui sont toujours debout, mais tous ne survivront pas, donc ils ne seraient pas là si nous devions revoir ce graphique dans, disons, un quelques mois. En d’autres termes, si vous procédiez à une analyse des données juste après les manifestations, il serait certainement sembler ce ce type de spam vient de commencer récemment. Mais ce n’est pas nécessairement toute la vérité.
Deuxièmement, si les comptes de spam étaient destinés à enterrer des informations sur les manifestations, ils ont fait un travail assez médiocre. Alors que le spam publicitaire d’escorte comportait de nombreux noms de villes chinoises comme mots-clés et hashtags, Thiel a constaté qu’ils ne ciblaient pas les hashtags réellement utilisés pour discuter des manifestations, comme #A4Revolution ou #ChinaProtest2022, « ce qui est ce que vous supposeriez que le gouvernement serait intéressé à sauter dessus s’ils essayaient de faire taire les choses », me dit-il. Sur les quelque 30 000 tweets qu’il a analysés contenant ces hashtags plus influents, « il n’y a pas de spam à proprement parler là-dedans ».