Ouvrir le menu principal

MacGeneration

Recherche

Gemini : la vidéo de présentation du nouveau super-modèle de Google a été grandement retouchée en postproduction

Félix Cattafesta

vendredi 08 décembre 2023 à 10:00 • 29

Ailleurs

La vidéo de présentation de Gemini, le nouveau grand modèle de langage de Google dévoilé il y a quelques jours, est impressionnante. On peut y voir le modèle raisonner à partir d'images, de sons, de vidéos, de codes et de textes, le tout sans temps mort dans ce qui semble être une expérience impressionnante. Seul problème : la vidéo en question a été largement retouchée pour réduire les temps de réflexion de l’IA, ce qui donne l’impression d’une utilisation ultra fluide.

Ce n’est pas vraiment un secret : Google explique dans la description de sa vidéo que « la latence a été réduite et les réponses de Gemini ont été raccourcies pour des raisons de concision ». Mais ce n'est pas le seul trucage. Bloomberg a demandé des détails à ce sujet dans le but de savoir à quel point la vidéo avait été retouchée. Google a admis que la vidéo n’avait pas été filmée en temps réel, mais qu’elle avait rédigé des invites textuelles envoyées à Gemini accompagné d’images fixes. Une réalité bien différente de ce qu’essaye de montrer Google, présentant une personne discutant en temps réel avec Gemini pendant que le modèle analyse et répond en direct à ce qu’il voit.

Si Bloomberg estime qu’il y a tromperie, Google ne voit pas les choses de la même manière. « Toutes les commandes et les résultats de la vidéo sont réels, mais raccourcis par souci de concision », explique le vice-président de la recherche et chef du deep learning chez Google DeepMind. « La vidéo illustre ce à quoi pourraient ressembler les expériences utilisateur multimodales construites avec Gemini. Nous l'avons réalisée pour inspirer les développeurs », avance-t-il.

Un petit coup de pouce au montage n’est pas très surprenant sur ce genre de vidéo, mais le fait qu’une grande partie ait visiblement été retouchée en postproduction a de quoi décevoir. Le modèle Gemini de Google n’est pas le premier à pouvoir interagir avec des images envoyées à côté d’une commande : GPT-4 peut le faire depuis bientôt 10 mois. Le fait de présenter son produit à l’aide d’une vidéo retouchée évite d’éventuels couacs, mais rassure moins le public et les investisseurs. On se souviendra du flop d’Ernie Bot, le ChatGPT chinois de Baidu dont la présentation a reposé sur des vidéos préenregistrées. Résultat des courses : l’action du groupe a chuté de 10 % pendant la présentation et a terminé en baisse de 6,4 %.

Google cherche à rattraper son retard sur OpenAI, qui l’a pris par surprise l’année dernière en lançant ChatGPT. Si elle promet que Gemini sera loin devant GPT-4, la réalité est moins reluisante. Les benchmarks montrent que la différence entre les deux modèles est loin d’être marquée alors que GPT-4 n’est plus de première jeunesse. De plus, la version la plus puissante de Gemini ne sera pas disponible avant l’année prochaine, ce qui montre que Google a encore un peu de pain sur la planche. Mountain View est un habitué des couacs avec ses vidéos sur l’IA : on se souviendra par exemple de la vidéo de présentation de Bard… dans laquelle le bot effectuait une erreur factuelle.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Apple a invité des influenceurs du monde entier pour les 10 ans de l'Apple Watch

27/04/2025 à 22:18

• 66


Test d'un traqueur Bluetooth à moins de 4 € : est-il vraiment aussi bien qu'un AirTag ?

27/04/2025 à 22:18

• 19


Fin des remaniements internes, déplacement d’usines et projets de réalité augmentée : la semaine Apple

27/04/2025 à 20:30

• 21


Émulation : comment jouer à ses vieux jeux sur iPhone ou iPad ?

26/04/2025 à 10:49

• 9


Pour le producteur de La Maison, « Apple est la pire boîte marketing de l’univers »

26/04/2025 à 00:08

• 96


Upscaling vidéo et restauration photo plus rapides sur Mac/PC : VideoProc AI mis à jour est à - 62 % 📍

25/04/2025 à 17:44

• 0


Derniers jours Apple week à la Fnac : -10 % sur des MacBook Pro, iPhone 15 Pro à 16 Pro Max et iPad Pro M4

25/04/2025 à 16:00

• 7


dav1d, le décodeur AV1 le plus optimisé qu'Apple refuse d'utiliser

25/04/2025 à 14:00

• 6


Microsoft a conçu une publicité par IA et personne n’a rien vu

25/04/2025 à 13:45

• 33


Razer lance sa première souris ergonomique verticale face à Logitech

25/04/2025 à 12:15

• 13


Yahoo! veut acheter Chrome

25/04/2025 à 10:45

• 39


Slate veut repartir de zéro avec un pick-up électrique compact et épuré pour moins de 20 000 $

25/04/2025 à 10:00

• 114


iPadOS 19 verrait apparaître une barre de menus sur iPad

25/04/2025 à 09:24

• 48


Huit ans après DeX, Apple s’ouvrirait peu à peu à un bureau sur écran externe pour iOS 19

25/04/2025 à 09:23

• 55


John Giannandrea aurait aussi perdu l'équipe en charge de la robotique chez Apple

25/04/2025 à 07:39

• 16


Les procès antitrust contre les GAFAM se poursuivent aux USA, malgré les changements de présidence

24/04/2025 à 21:30

• 31