Source
https://fr.sott.net/article/41767-Une-intelligence-artificielle-capable-de-reproduire-fidelement-la-voix-d-une-personne
Vous connaissiez les deepfakes, ces vidéos où le visage d'une personne célèbre était recopié pour lui faire dire tout et n'importe quoi par un imitateur ? Eh bien, la startup ElevenLabs vient de dévoiler la première version d'un programme qui viendra compléter l'attirail : une intelligence artificielle capable de reproduire fidèlement la voix d'une personne.
Basé sur le modèle de Dall-E ou ChatGPT, l'outil est très simple : il suffit d'inscrire un texte qui sera ensuite récité par le modèle pré-enregistré, des voix synthétiques mais réalistes (uniquement en anglais pour le moment). L'idée est par exemple de produire des livres audio facilement.
Mais le véritable coup de force de cette startup, fondée par d'anciens employés de Google et de Palantir, est de s'inspirer de simples extraits audio, au format MP3, que l'utilisateur peut soumettre à l'algorithme. Au total, il est possible de le faire travailler sur cinquante extraits pour une même voix.
Voici, par exemple, ce que la rédaction de Tech&Co a pu créer en utilisant la voix de Donald Trump, soudainement devenu fan d'Eddy Mitchell.
Et voici Barack Obama qui se plaint du métro parisien.
Cet outil, qui repose tout de même sur une base légale fragile, a évidement rapidement été repris sur les forums où les utilisateurs ont multiplié les blagues plus ou moins tendancieuses. "Alors que nous voyons notre technologie être massivement utilisée de façon positive, nous constatons aussi un nombre croissant de cas d'utilisation abusive du clonage de la voix" a d'ailleurs signalé ElevenLabs sur Twitter.
https://fr.sott.net/article/41767-Une-intelligence-artificielle-capable-de-reproduire-fidelement-la-voix-d-une-personne
Add a review