Ouvrir le menu principal

MacGeneration

Recherche

Translatotron : Google cherche à garder l'intonation et la voix du locuteur dans les traductions vocales

Stéphane Moussie

jeudi 16 mai 2019 à 11:24 • 7

Logiciels

Les ingénieurs de Google travaillent sur un tout nouveau système de traduction vocale pouvant notamment mieux conserver l’intonation du locuteur.

La traduction vocale fonctionne généralement en trois étapes, expliquent Ye Jia et Ron Weiss sur le blog Google AI. Premièrement, le système transcrit la parole en texte. Deuxièmement, ce texte est traduit dans la langue désirée. Et troisièmement, le texte traduit est prononcé par une synthèse vocale.

Ce système fragmenté, à l’œuvre dans Google Traduction par exemple, fonctionne globalement bien, mais il y a matière à faire mieux, estiment les ingénieurs qui expérimentent un nouveau mécanisme.

Architecture du Translatotron

Le Translatotron, le nom de leur nouveau système, fait l’impasse sur l’étape de conversion de la parole en texte. En traduisant plus directement les paroles, le Translatotron est censé offrir plusieurs avantages : plus de vitesse, pas d’erreur possible entre la reconnaissance et la traduction, une meilleure gestion des mots qui n’ont pas besoin d’être traduits (comme les noms propres) et la conservation de l’intonation.

Source (en espagnol)
Traduction avec le système traditionnel
Traduction avec le Translatotron

Pour l’heure, le Translatotron donne de moins bons résultats que la méthode traditionnelle en ce qui concerne la fidélité de la traduction. Mais il se démarque d’ores et déjà en matière de reproduction de l’intonation.

Google veut même aller plus loin en conservant la voix du locuteur. Imaginez un peu : c’est comme si c’était vous qui parliez chinois ou néerlandais. Des échantillons d’essais entre l’espagnol et l’anglais sont disponibles sur cette page. Les résultats ne sont pas très probants pour le moment pour la conservation de la voix, mais le Translatotron est toujours en plein développement.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Données personnelles : comment Incogni supprime ce que les autres ne peuvent pas 📍

09:17

• 0


DMA : Bruxelles inflige une amende de 500 millions à Apple et de 200 millions à Meta 🆕

08:15

• 115


Une très involontaire journée portes ouvertes à l'Apple Store d'Amsterdam vu dans iHostage

07:57

• 8


Perplexity met une méchante claque à Apple en montrant ce qu’ils pourraient faire de Siri

23/04/2025 à 21:00

• 84


QEMU passe en version 10 et gagne quelques fonctions graphiques sur les Mac

23/04/2025 à 18:00

• 14


Kernel Panic : 20 ans d’Intel, merci et bon débarras ?

23/04/2025 à 17:00

• 3


OpenAI voudrait bien acheter Chrome, si le navigateur de Google était à vendre

23/04/2025 à 16:00

• 29


Intel pourrait licencier environ 20 000 personnes de plus

23/04/2025 à 15:03

• 16


Smash Smash, une app qui permet de se défouler (virtuellement) sur l’écran de son Mac

23/04/2025 à 14:00

• 13


Google ne changera rien pour les cookies tiers dans Chrome : l'abandon est bien abandonné

23/04/2025 à 12:12

• 19


Apple a mis à jour XProtect, l'anti-malware de macOS

23/04/2025 à 11:15

• 23


La troisième bêta de macOS 15.5 est disponible 🆕

23/04/2025 à 10:11

• 9


Choisissez le moniteur parfait pour votre Mac

23/04/2025 à 09:09

• 0


Tesla aurait de nouveau perdu de l’argent au premier trimestre 2025 sans les crédits carbone

23/04/2025 à 08:30

• 111


Apple réorganise Siri avec des équipes du Vision Pro

23/04/2025 à 08:13

• 9


Hausse de Netflix : Canal+ augmente légèrement le prix de l’option Premium, Free ne change rien pour le moment

22/04/2025 à 22:16

• 18