DALL-E 3 gère mieux le texte dans les images et s'intègre avec ChatGPT

Félix Cattafesta

jeudi 21 septembre 2023 à 12:45 • 22

OpenAI a présenté une nouvelle version de DALL-E, son modèle d'intelligence artificielle qui permet de générer une image à partir d'une simple description textuelle. Cette troisième mouture semble radicalement plus puissante, et est désormais en mesure d'écrire correctement du texte dans une image. Le dessin ci-dessous a été réalisé grâce à la commande suivante :

Illustration d'un avocat assis sur la chaise d'un thérapeute, disant « Je me sens si vide à l'intérieur », avec un trou de la taille d'une assiette en son centre. Le thérapeute, une cuillère, prend des notes.

C'est une belle avancée, car le texte était jusqu'à présent un des gros défauts des images générées par IA : les lignes affichées donnaient généralement un gloubi-boulga incompréhensible. OpenAI n'est pas la seule à progresser dans le domaine, la dernière version de Stable Diffusion présentée dans le courant de l'été s'étant également améliorée sur ce point.

OpenAI explique que DALL-E 3 permet de plus facilement créer des images intéressantes sans qu'il soit nécessaire d'avoir à bidouiller sa requête en glissant des termes ciblés spécifiques. Les alternatives comme Midjourney ou Stable Diffusion impliquent souvent d'ajouter des mots précis pour obtenir un résultat convenable, comme « hyper réaliste », « détaillé », « qualité photographique », « HDR » etc. Cela ne devrait donc plus être le cas ici, ce qui va simplifier la création. Le système gère désormais plus efficacement les petits détails comme les mains, et se veut plus fidèle aux descriptions données.

« *Une peinture à l'huile expressive d'un joueur de basket-ball qui fait un dunk, représenté comme une explosion d'une nébuleuse* ». À droite, DALL-E 2, à gauche, DALL-E 3.

DALL-E gagne une intégration avec ChatGPT, ce qui va permettre de retoucher une image simplement en discutant avec le bot. On pourra lui demander de l'aide pour trouver de l'inspiration, et ChatGPT sera en mesure de créer une image à partir d'une conversation.

OpenAI tente de répondre à la pression montante autour des IA génératives, qui sont formées à partir d'énormes quantités de contenus trouvés en ligne sans se soucier des questions de droits d'auteurs. Le service ne pourra pas reproduire le style d'un artiste vivant, et les créateurs pourront remplir un formulaire demandant à OpenAI de ne par utiliser leur création pour l'entrainement de leurs prochains modèles. Comme par le passé, l'IA ne pourra pas créer d'image à caractère violent, sexuel ou représentant une célébrité.

Image générée avec DALL-E 3. Rappelons qu'elle a été soigneusement sélectionnée par OpenAI : il est fort probable que le résultat ne soit pas aussi impressionnant à chaque tentative.

Cette nouvelle version de Dall-E est actuellement proposée en avant-première pour les chercheurs. Elle sera disponible pour les clients ChatGPT Plus et Enterprise en octobre, via l'API et dans les Labs plus tard cet automne.

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

DALL-E 3 gère mieux le texte dans les images et s'intègre avec ChatGPT

Pour aller plus loin :

Rejoignez le Club iGen

Actualités

Émulation : comment jouer à ses vieux jeux sur iPhone ou iPad ?

Pour le producteur de La Maison, « Apple est la pire boîte marketing de l’univers »

Upscaling vidéo et restauration photo plus rapides sur Mac/PC : VideoProc AI mis à jour est à - 62 % 📍

Derniers jours Apple week à la Fnac : -10 % sur des MacBook Pro, iPhone 15 Pro à 16 Pro Max et iPad Pro M4

dav1d, le décodeur AV1 le plus optimisé qu'Apple refuse d'utiliser

Microsoft a conçu une publicité par IA et personne n’a rien vu

Razer lance sa première souris ergonomique verticale face à Logitech

Yahoo! veut acheter Chrome

Slate veut repartir de zéro avec un pick-up électrique compact et épuré pour moins de 20 000 $

iPadOS 19 verrait apparaître une barre de menus sur iPad

Huit ans après DeX, Apple s’ouvrirait peu à peu à un bureau sur écran externe pour iOS 19

John Giannandrea aurait aussi perdu l'équipe en charge de la robotique chez Apple

Les procès antitrust contre les GAFAM se poursuivent aux USA, malgré les changements de présidence

Prise en main de Supercharge, l’app à tout faire qui rend bien des services sur le Mac

TSMC annonce la gravure en 1.4 nm, quand la Russie espère atteindre les 28 nm en 2030

Données personnelles : comment Incogni supprime ce que les autres ne peuvent pas 📍

Image du moment

Tests

Test du BenQ MA270U : un écran 4K pensé pour le Mac

Test du QNAP QNA-UC10G1T, le premier adaptateur Ethernet 10 Gb/s en USB4, parfait pour profiter de la fibre ultra-rapide

Test des Mac Studio de 2025 : une drôle de gamme

Test des MacBook Air M4 : faut-il lâcher la M1 ?

Test d’écrans portables à bas prix : bonne affaire ou déception garantie ?

Test du LaCie Rugged SSD Pro5, un SSD externe Thunderbolt 5 capable d'atteindre 6 Go/s