Un humain numérique pourrait être votre prochaine célébrité préférée ou conseiller financier

Humain numérique créé par Baidu AI Cloud et inspiré de la célébrité chinoise Simon Gong.

« La demande croissante est à l’origine du boom des humains numériques », déclare Shiyan Li, responsable de l’activité humaine numérique et robotique chez Baidu, qui a créé l’acteur-modèle numérique, Gong. « En Chine seulement, il y a plus de 400 millions de fans d’ACGN (animation, bandes dessinées, jeux et romans) et un marché d’entreprise d’une valeur de centaines de milliards de dollars centré sur les humains numériques. » Et selon une société qui suit les enregistrements d’entreprises, Qichacha, la Chine compte désormais plus de 280 000 entreprises qui se livrent à des activités numériques liées à l’humain.

Un numérique différent

Les débuts de la célébrité numérique de Baidu peuvent ne pas sembler beaucoup au début, car le concept d ‘«idoles virtuelles» existe depuis des années. Par exemple, l’influenceur virtuel américain Lil Miquela apparaît aux côtés de vraies célébrités humaines dans des publicités en ligne et des publicités télévisées depuis 2016, gagnant plus de trois millions de followers sur Instagram. Cependant, il y a quelque chose de différent à propos de la star chinoise virtuelle : un humain numérique avec la capacité d’écouter, de parler et d’interagir avec de vrais humains à un niveau jamais vu auparavant. Et les tâches numériques de Gong ne se limitent pas au chant. Sur la dernière mise à jour de Baidu App, la principale application de recherche et de flux en Chine, Gong apparaît sur les téléphones des utilisateurs, aidant les recherches et les requêtes en utilisant la vraie voix de l’acteur modèle. Depuis que cette expérience de recherche interactive a été lancée en 2021, elle a augmenté de 18,2 % le nombre de requêtes de recherche vocale sur l’application Baidu.

Baidu AI Cloud a commencé à développer un employé numérique en 2019 en collaboration avec Shanghai Pudong Development (SPD) Bank. Par la suite, ils ont concentré leurs efforts sur la construction d’un conseiller financier numérique pour fournir un service équivalent à celui d’un représentant de banque humain lorsque les employés réels n’étaient pas disponibles. Aujourd’hui, SPD Bank affirme que plus de 460 000 clients comptent sur les humains numériques pour les services bancaires et la gestion de portefeuille chaque mois. « L’accès à des humains numériques en dehors des heures normales de bureau permet à SPD Bank d’offrir un service client 24h/24 et 7j/7 à faible coût et très efficace », déclare un représentant de la banque.

Plus récemment, une ancre virtuelle créée par Baidu a fourni des commentaires en direct en langue des signes aux Jeux d’hiver de Pékin 2022 pour les téléspectateurs malentendants. En plus de ressembler à une vraie personne, l’avatar était doté de capacités de reconnaissance vocale et d’interprétation en langue des signes pour assurer une entrée et une sortie rapides et très précises. Avec environ 430 millions de personnes dans le monde souffrant de perte auditive « invalidante », selon l’Organisation mondiale de la santé, il existe un fort potentiel d’utilisation de cette technologie pour accroître leur capacité à accéder à un large éventail de contenus.

Un interprète en langue des signes créé par XiLing de Baidu AI Cloud.

XiLing : Une nouvelle génération sur une plateforme d’IA

Du divertissement aux services publics, les humains numériques sont appelés à jouer un plus grand rôle dans notre vie quotidienne. Mais derrière leur apparence naturelle et sans effort se cache un réseau complexe de technologies nouvelles et émergentes qui repoussent les limites de l’innovation en IA.

La célébrité numérique et les ancres virtuelles de langue des signes de Baidu AI Cloud ont été créées via XiLing, une nouvelle plate-forme numérique lancée en 2021. Lors de l’événement Baidu World 2022 qui s’est tenu le 21 juin, la société a annoncé une nouvelle capacité sur XiLing, qui prend en charge la création de des humains qui peuvent être des hôtes de diffusion en direct qui peuvent chanter, danser et répondre aux commentaires en temps réel, sans jamais avoir besoin d’une seule pause. XiLing est unique dans sa capacité à prendre en charge l’ensemble du processus de création d’un humain numérique, de la création d’un personnage réaliste à la dotation de compétences conversationnelles et de génération de contenu. L’un de ses attributs les plus frappants est la vitesse. La plate-forme peut générer un avatar 3D basé sur une personne réelle en une à deux semaines, tandis qu’un avatar 2D peut être créé en quelques minutes seulement.

De plus, en utilisant les outils de dialogue intelligents de XiLing, les créateurs peuvent rapidement personnaliser la capacité conversationnelle d’un humain numérique, lui permettant de s’adapter et d’apprendre au fil du temps. Cette capacité est alimentée par PLATO de Baidu, un modèle de dialogue de cent milliards de paramètres qui permet aux humains numériques de participer à des conversations en domaine ouvert, c’est-à-dire de comprendre n’importe quel sujet et de fournir des réponses pertinentes. La reconnaissance vocale très précise et la synchronisation labiale avec une précision supérieure à 98,5 % permettent à l’humain numérique d’avoir des interactions plus fluides et plus humaines. « L’utilisation de technologies d’IA avancées continuera de réduire le coût de la construction d’humains numériques et améliorera considérablement leurs interactions avec de vrais humains », déclare Li.

Tout comme chaque véritable humain possède son propre ensemble de compétences et de talents, il en va de même pour la nouvelle génération d’humains numériques. Cela peut même inclure de donner aux humains numériques la capacité d’être eux-mêmes créatifs, grâce aux progrès récents réalisés par de grands modèles d’IA comme ERNIE de Baidu, qui peuvent générer des textes et créer des images réalistes lorsqu’ils y sont invités. Les humains numériques conçus pour servir de porte-parole de la marque, par exemple, peuvent créer et publier de manière indépendante sur les réseaux sociaux, concevoir des affiches et jouer dans des vidéos.