Ouvrir le menu principal

MacGeneration

Recherche

Le « Traducteur universel » de Google double les vidéos à l'aide de l'IA et s'occupe même de la synchronisation labiale

Félix Cattafesta

jeudi 11 mai 2023 à 17:15 • 20

Ailleurs

Google a profité de la Google I/O pour déballer ses nouveautés en matière d'IA, et a levé le voile sur une technologie permettant de « traduire » une vidéo de manière assez impressionnante. Le service va artificiellement doubler un passage dans une autre langue et faire en sorte que les lèvres d'une personne soient synchronisées de façon convaincante. Cela donne l'impression d'un locuteur natif sans avoir besoin de véritablement doubler une vidéo. Une petite démo a été présentée pendant la conférence (1:15:00).

En coulisse, l'algorithme va transcrire la vidéo puis traduire le texte. Il va ensuite le faire lire à l'IA en recréant la voix du locuteur tout en faisant en sorte de garder l'intonation et le style. La piste est par la suite intégrée à la vidéo, avec une synchronisation labiale permettant d'offrir un résultat convaincant. Il y a encore une marge de progression pour Google (on peut voir les ficelles si on se concentre sur les lèvres), mais cela reste bluffant.

L'intérêt de la technologie est évident : Google montre que l'on pourrait par exemple doubler un cours en plusieurs langues sans devoir faire appel à plusieurs locuteurs natifs ou recourir à des sous-titres. Cependant, on peut également craindre les scénarios dans lesquels elle serait utilisée à mauvais escient. Google est bien conscient des risques et a expliqué sur scène ne pas trop savoir sur quel pied danser. L'entreprise y voit une « tension » entre audace et sécurité, précisant que le concept pourrait être repris pour créer des deepfakes malveillants visant à faire raconter n'importe quoi à n'importe qui.

Ce « Traducteur Universel » ne sera donc proposé qu'à des partenaires certifiés et intégrera des garde-fous pour éviter les abus. Google a aussi promis de mettre en place un système de filigrane dans ses modèles, qui devrait aider à « relever le défi de la désinformation ».

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

DMA : Apple et Meta pourraient écoper de modestes amendes

10/03/2025 à 23:04

• 3


Portal Kombat : quand le narratif russe infiltre l’intelligence artificielle

10/03/2025 à 22:00

• 16


iOS 19 et macOS 16 auraient une toute nouvelle interface inspirée de visionOS

10/03/2025 à 21:56

• 19


macOS 15.4 bêta 3 disponible pour les développeurs

10/03/2025 à 19:23

• 0


Un bricoleur case des aimants dans l’iPhone 16e

10/03/2025 à 17:45

• 21


Le nouveau Siri pourrait avoir été repoussé pour des raisons de sécurité

10/03/2025 à 16:30

• 34


PD2730S : un moniteur 27 pouces 5K pensé pour le Mac chez BenQ

10/03/2025 à 15:00

• 28


La finesse de l’hypothétique iPhone 17 Air présentée en vidéo

10/03/2025 à 11:27

• 49


Google fait disparaître des commémorations dans son calendrier 🆕

10/03/2025 à 10:53

• 184


L'émulateur de PlayStation Gamma est désormais disponible sur Mac

10/03/2025 à 10:45

• 23


Le pass Navigo Liberté+ disponible en juin sur iPhone et Android

10/03/2025 à 09:51

• 107


Incogni, l’outil indispensable pour protéger vos données personnelles, est à petit prix 📍

09/03/2025 à 23:23


Concentrée sur la WWDC et la reprise en main de l’équipe Vision : la semaine Apple

09/03/2025 à 20:30

• 37


iPhone 16e : comment pallier l’absence de MagSafe ?

09/03/2025 à 11:22

• 38


Mon écran d’accueil : Nicolas et les apps choisies par Siri

09/03/2025 à 09:24

• 35


Tesla, quand une marque et ses acheteurs se retrouvent pris au piège d’un patron en roue libre

08/03/2025 à 20:45

• 253