Clonage de voix et synthèse vocale : des IA qui parlent (presque) comme des humains — The Conversation
Publié le : jeu 29 juin 2023Views: 992

Publié dans : Technologie

[yarpp]

Le clonage et la synthèse vocale sont des technologies basées sur des systèmes d’intelligence artificielle. Elles gagnent en maturité et sont amenées à faire progressivement partie de notre quotidien.

La synthèse vocale, une des nombreuses applications de l’apprentissage profond

Les progrès accomplis par l’IA durant ces dernières années sont principalement liés à l’essor de l’apprentissage profond (deep learning), méthode se basant sur les « réseaux de neurones ».

Bien qu’il s’agisse d’un domaine de recherche très vaste et varié, le principe de fonctionnement reste le même que l’on traite de du texte, de l’image ou de l’audio : on collecte une très grande quantité de données, que l’on essaye d’abstraire sous une forme numérique qui soit facilement manipulable par un ordinateur, et qui puisse être utilisée de façon fiable pour réaliser diverses tâches liées aux données.

Les limites de la synthèse vocale et la dépendance aux données annotées

Des systèmes d’intelligences artificielles sont donc capables d’assimiler et d’abstraire différents concepts (phonèmes, identités, émotions) véhiculés dans la voix pour les manipuler et générer de nouveaux contenus. Mais il faut garder à l’esprit que la capacité de génération des réseaux de neurones se cantonne aux concepts vus durant leur apprentissage. Il faut donc une grande variété de concepts, en quantité suffisante, pour espérer une synthèse naturelle et expressive.

Cela nous amène au point commun reliant les éléments cités plus tôt qui ont récemment attiré l’attention du grand public (Hôtel du Temps, doublage, deepfakes vocaux) : un acteur doit prêter sa voix, apporter ce que l’IA ne maîtrise pas encore (l’émotion l’expressivité), pour que le clonage devienne méprenable. De fait, l’humain est toujours nécessaire pour la création de voix synthétiques expressives. Le text-to-speech peut se passer de notre intervention, mais perd alors de sa naturalité.

—————

Repéré depuis https://theconversation.com/clonage-de-voix-et-synthese-vocale-des-ia-qui-parlent-presque-comme-des-humains-205668

Abonnez-vous à notre Newsletter : https://staging.digital-learning-academy.com/abonnement-newsletter

Partagez cet article