Robotiser la voix

Revue des voix proposées

L'application propose plus de 20 langues mais aujourd’hui, il y a peu de voix françaises et certaines sont réservées aux abonnés pro. Vous pouvez choisir entre une voix de femme ou d’homme.

Un choix d’âge est proposé (jeune ou âge moyen), notez qu'il n’y a pas de voix « mature »… Il n’existe pas de proposition de registres de voix ou de tessitures vocales (basse, soprano, alto…).

Abonnements

Il y a quatre abonnements free, basic, pro et entreprise avec des prix s’étalant de 0 à 167 $ par mois pour un abonnement mensuel.

La version gratuite permet de partager un fichier audio mais pas de l’exporter.

Une ergonomie efficace

L’interface est très intuitive, pas besoin de trop chercher pour importer son texte (format txt). Le menu d’icônes, à gauche, permet de choisir une voix, une langue, d’ajouter une vidéo.

L’outil vous propose de découper votre texte en phrases ou en paragraphes. Ce qui vous permet ensuite de choisir votre locuteur ou voix-off pour l’ensemble du texte ou si vous avez des dialogues, comme dans mon exemple, plus bas, d’alterner entre plusieurs voix que vous sélectionnez selon les paragraphes ou phrases.

Au bas de d’écran, sur la timeline (ligne de temps) vous pouvez déplacer le bloc ou segment (phrases ou paragraphes), ajouter une vidéo, une image ou de la musique.

Vous pouvez écouter chaque segment séparément et changer deux réglages : le pitch et la vitesse mais à utiliser avec précautions car ils dénaturent beaucoup la voix.

Il est possible d’ajouter une pause au milieu du segment. Et de les ré-agencer très facilement.

Voice Changer : cet outil permet de charger un fichier audio ou vidéo pour changer la voix sans écrire le texte. (L’interprétation des mots et phrases sera à bien vérifier tout de même).

Ajouter une musique

Un gros stock de musique au mètre est disponible avec une grande variété de styles

Les exportations de fichier

Bonne nouvelle, l’export de fichiers de sous titre SRT est offert en version free.

Ensuite il faudra payer pour les autres téléchargements.

Un export en vidéo est proposé en mp4 ou en mov.

L’export audio est possible par segment (phrase ou paragraphe) ou pour l'ensemble du document. Vous pouvez choisir différentes qualités :haute qualité à la fréquence de 48 kHz et 16 bits ou très basse et différents formats : MP3, WAV ou FLAC

Comparaison entre voix humaine et voix de synthèse

Ecoutez la différence entre nos voix humaines, ici celle de François Jonquières, la mienne versus la voix de synthèse de Victor M (middle aged) et Renée F (young adult).

Lien vers le fichier sur l'application Murf avec des voix robotisées

https://murf.ai/share/la7yldt8

Le fichier original avec des voix humaines

No comment !

Text to Speech ou comédien ?

Certes les progrès sont indéniables mais on est encore loin de la voix du comédien qui interprète son texte selon vos indications et transmet des émotions à ses auditeurs.

En formation, entendre la voix de son formateur donne un sentiment de proximité et rassure quant à sa présence même si elle n’est que virtuelle. Une formation à distance doit inclure du tutorat ou un accompagnement synchrone sans quoi l’apprenant se sentira abandonné. La voix synthétique me donne le même sentiment d’abandon ou d’impuissance que lorsqu’on est face à un répondeur qui ne propose pas de réponse à votre besoin.

Il y a tout de même des fonctions intéressantes comme l’export de fichier sous-titres ou l’export de voix par phrase ou paragraphe.

Si vous voulez tester : https://murf.ai