Ouvrir le menu principal

MacGeneration

Recherche

Le « Traducteur universel » de Google double les vidéos à l'aide de l'IA et s'occupe même de la synchronisation labiale

Félix Cattafesta

jeudi 11 mai 2023 à 17:15 • 20

Ailleurs

Google a profité de la Google I/O pour déballer ses nouveautés en matière d'IA, et a levé le voile sur une technologie permettant de « traduire » une vidéo de manière assez impressionnante. Le service va artificiellement doubler un passage dans une autre langue et faire en sorte que les lèvres d'une personne soient synchronisées de façon convaincante. Cela donne l'impression d'un locuteur natif sans avoir besoin de véritablement doubler une vidéo. Une petite démo a été présentée pendant la conférence (1:15:00).

En coulisse, l'algorithme va transcrire la vidéo puis traduire le texte. Il va ensuite le faire lire à l'IA en recréant la voix du locuteur tout en faisant en sorte de garder l'intonation et le style. La piste est par la suite intégrée à la vidéo, avec une synchronisation labiale permettant d'offrir un résultat convaincant. Il y a encore une marge de progression pour Google (on peut voir les ficelles si on se concentre sur les lèvres), mais cela reste bluffant.

L'intérêt de la technologie est évident : Google montre que l'on pourrait par exemple doubler un cours en plusieurs langues sans devoir faire appel à plusieurs locuteurs natifs ou recourir à des sous-titres. Cependant, on peut également craindre les scénarios dans lesquels elle serait utilisée à mauvais escient. Google est bien conscient des risques et a expliqué sur scène ne pas trop savoir sur quel pied danser. L'entreprise y voit une « tension » entre audace et sécurité, précisant que le concept pourrait être repris pour créer des deepfakes malveillants visant à faire raconter n'importe quoi à n'importe qui.

Ce « Traducteur Universel » ne sera donc proposé qu'à des partenaires certifiés et intégrera des garde-fous pour éviter les abus. Google a aussi promis de mettre en place un système de filigrane dans ses modèles, qui devrait aider à « relever le défi de la désinformation ».

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

OpenAI affronte directement Google en ouvrant ChatGPT Search à tous

05/02/2025 à 22:00

• 45


Prise en main d'Apple Invitations : carton en vue pour cette nouvelle app ?

05/02/2025 à 20:30

• 20


Les pièces et outils pour réparer les Mac M4 déjà disponibles sur le site self-repair d'Apple 🆕

05/02/2025 à 20:15

• 6


Dailymotion va supprimer les vidéos que personne n'a regardées l'année dernière

05/02/2025 à 18:00

• 22


L'Apple M5 serait en production

05/02/2025 à 16:30

• 43


Concurrence : la Chine s’apprêterait à ouvrir une enquête sur l’App Store

05/02/2025 à 15:45

• 29


La carte RISC-V pour se construire un PC portable Framework est disponible

05/02/2025 à 12:45

• 8


Spotify enregistre son premier bénéfice annuel net depuis 2006

05/02/2025 à 12:23

• 50


OpenAI : Hollywood ne serait pas particulièrement emballé par Sora

05/02/2025 à 12:00

• 19


Pieoneer renouvelle la vieille idée du menu circulaire pour ouvrir des apps ou des fonctions

05/02/2025 à 08:19

• 16


Régulation des Big Tech : la triste capitulation de la Commission européenne

04/02/2025 à 23:30

• 59


Firefox 135 abandonne Do Not Track, comme prévu

04/02/2025 à 23:00

• 20


Invitations Apple : la nouvelle app pour des fêtes et des événements

04/02/2025 à 18:04

• 80


macOS Sequoia 15.3 améliore grandement les performances en Thunderbolt 5

04/02/2025 à 16:30

• 2


Le jeu de plateau Apple des années 90 a été préservé

04/02/2025 à 15:45

• 10


Promo : le MacBook Air M2 démarre à seulement 799 €

04/02/2025 à 14:40

• 28