Ouvrir le menu principal

MacGeneration

Recherche

Translatotron : Google cherche à garder l'intonation et la voix du locuteur dans les traductions vocales

Stéphane Moussie

jeudi 16 mai 2019 à 11:24 • 7

Logiciels

Les ingénieurs de Google travaillent sur un tout nouveau système de traduction vocale pouvant notamment mieux conserver l’intonation du locuteur.

La traduction vocale fonctionne généralement en trois étapes, expliquent Ye Jia et Ron Weiss sur le blog Google AI. Premièrement, le système transcrit la parole en texte. Deuxièmement, ce texte est traduit dans la langue désirée. Et troisièmement, le texte traduit est prononcé par une synthèse vocale.

Ce système fragmenté, à l’œuvre dans Google Traduction par exemple, fonctionne globalement bien, mais il y a matière à faire mieux, estiment les ingénieurs qui expérimentent un nouveau mécanisme.

Architecture du Translatotron

Le Translatotron, le nom de leur nouveau système, fait l’impasse sur l’étape de conversion de la parole en texte. En traduisant plus directement les paroles, le Translatotron est censé offrir plusieurs avantages : plus de vitesse, pas d’erreur possible entre la reconnaissance et la traduction, une meilleure gestion des mots qui n’ont pas besoin d’être traduits (comme les noms propres) et la conservation de l’intonation.

Source (en espagnol)
Traduction avec le système traditionnel
Traduction avec le Translatotron

Pour l’heure, le Translatotron donne de moins bons résultats que la méthode traditionnelle en ce qui concerne la fidélité de la traduction. Mais il se démarque d’ores et déjà en matière de reproduction de l’intonation.

Google veut même aller plus loin en conservant la voix du locuteur. Imaginez un peu : c’est comme si c’était vous qui parliez chinois ou néerlandais. Des échantillons d’essais entre l’espagnol et l’anglais sont disponibles sur cette page. Les résultats ne sont pas très probants pour le moment pour la conservation de la voix, mais le Translatotron est toujours en plein développement.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Guide : les meilleures extensions Safari pour iPhone, iPad et Mac

18/01/2025 à 11:00

• 30


Disney+ : plus que quelques jours pour profiter de l'offre à 1,99 € pendant 1 an 🆕

18/01/2025 à 10:00

• 77


Promo : -220 € sur l'iMac M4 en 24/512 Go

18/01/2025 à 08:30

• 0


Sortie de veille : comment Apple va-t-elle négocier la nouvelle présidence Trump ?

18/01/2025 à 08:00

• 30


Deux sénateurs se posent des questions sur les dons à l’investiture de Trump, et demandent des réponses à Tim Cook

17/01/2025 à 22:15

• 32


Quel avenir pour les usines de processeurs sous l’ère Trump ?

17/01/2025 à 21:00

• 6


TSMC : les usines américaines ne fabriqueront pas les puces les plus avancées

17/01/2025 à 18:30

• 14


Deezer a été optimisé pour les Mac Apple Silicon

17/01/2025 à 17:30

• 20


DSA : Google ne veut pas de fact-checking dans Search ou sur YouTube

17/01/2025 à 16:00

• 131


Soldes : promo générale à la Fnac sur de gros MacBook Pro M3 Pro

17/01/2025 à 14:15

• 17


Trade In Apple Store : quels tarifs de reprise pour les anciens iPhone, iPad, Mac…

17/01/2025 à 12:30

• 16


Les cœurs E des puces M4 plus rapides que ceux des puces M4 Pro

17/01/2025 à 12:15

• 8


Apple présente un ordinateur vintage de sa filiale Lumon sur sa page d'accueil

17/01/2025 à 11:15

• 22


Microsoft augmente les tarifs de ses formules Microsoft 365 pour y ajouter Copilot

17/01/2025 à 10:30

• 29


Avec Focus, Raycast propose une alternative au mode de concentration de macOS

17/01/2025 à 08:00

• 8


Ce keynote de 1997 montre le fossé entre l'Apple des années 90 et celui des années 2020

16/01/2025 à 21:30

• 30