Ouvrir le menu principal

MacGeneration

Recherche

DALL-E 3 gère mieux le texte dans les images et s'intègre avec ChatGPT

Félix Cattafesta

jeudi 21 septembre 2023 à 12:45 • 22

Services

OpenAI a présenté une nouvelle version de DALL-E, son modèle d'intelligence artificielle qui permet de générer une image à partir d'une simple description textuelle. Cette troisième mouture semble radicalement plus puissante, et est désormais en mesure d'écrire correctement du texte dans une image. Le dessin ci-dessous a été réalisé grâce à la commande suivante :

Illustration d'un avocat assis sur la chaise d'un thérapeute, disant « Je me sens si vide à l'intérieur », avec un trou de la taille d'une assiette en son centre. Le thérapeute, une cuillère, prend des notes.

C'est une belle avancée, car le texte était jusqu'à présent un des gros défauts des images générées par IA : les lignes affichées donnaient généralement un gloubi-boulga incompréhensible. OpenAI n'est pas la seule à progresser dans le domaine, la dernière version de Stable Diffusion présentée dans le courant de l'été s'étant également améliorée sur ce point.

La dernière version de Stable Diffusion gère mieux les mains et les textes dans les images

La dernière version de Stable Diffusion gère mieux les mains et les textes dans les images

OpenAI explique que DALL-E 3 permet de plus facilement créer des images intéressantes sans qu'il soit nécessaire d'avoir à bidouiller sa requête en glissant des termes ciblés spécifiques. Les alternatives comme Midjourney ou Stable Diffusion impliquent souvent d'ajouter des mots précis pour obtenir un résultat convenable, comme « hyper réaliste », « détaillé », « qualité photographique », « HDR » etc. Cela ne devrait donc plus être le cas ici, ce qui va simplifier la création. Le système gère désormais plus efficacement les petits détails comme les mains, et se veut plus fidèle aux descriptions données.

« Une peinture à l'huile expressive d'un joueur de basket-ball qui fait un dunk, représenté comme une explosion d'une nébuleuse ». À droite, DALL-E 2, à gauche, DALL-E 3.

DALL-E gagne une intégration avec ChatGPT, ce qui va permettre de retoucher une image simplement en discutant avec le bot. On pourra lui demander de l'aide pour trouver de l'inspiration, et ChatGPT sera en mesure de créer une image à partir d'une conversation.

OpenAI tente de répondre à la pression montante autour des IA génératives, qui sont formées à partir d'énormes quantités de contenus trouvés en ligne sans se soucier des questions de droits d'auteurs. Le service ne pourra pas reproduire le style d'un artiste vivant, et les créateurs pourront remplir un formulaire demandant à OpenAI de ne par utiliser leur création pour l'entrainement de leurs prochains modèles. Comme par le passé, l'IA ne pourra pas créer d'image à caractère violent, sexuel ou représentant une célébrité.

Image générée avec DALL-E 3. Rappelons qu'elle a été soigneusement sélectionnée par OpenAI : il est fort probable que le résultat ne soit pas aussi impressionnant à chaque tentative.

Cette nouvelle version de Dall-E est actuellement proposée en avant-première pour les chercheurs. Elle sera disponible pour les clients ChatGPT Plus et Enterprise en octobre, via l'API et dans les Labs plus tard cet automne.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

iOS 18.4 bêta 2 est disponible, pour les iPhone 12 et 16e aussi

03/03/2025 à 20:54

• 38


macOS 15.4 : la seconde bêta est disponible pour les développeurs

03/03/2025 à 19:27

• 5


Google simplifie la suppression d’informations personnelles de ses résultats de recherche

03/03/2025 à 18:30

• 5


Taxis autonomes : Waymo a doublé ses trajets hebdomadaires en moins d'un an

03/03/2025 à 17:30

• 10


Tim Cook annonce que quelque chose est « dans l’air » cette semaine

03/03/2025 à 17:06

• 45


Ubiquiti démocratise le Wi-Fi 7 avec une borne « Lite » autour de 100 €

03/03/2025 à 17:00

• 26


Utilitaire : PairPods diffuse le son de votre Mac sur deux casques Bluetooth

03/03/2025 à 15:30

• 10


Apple TV+ : une série dérivée pour Mythic Quest le 26 mars

03/03/2025 à 14:14

• 11


Promo : le gros dock Thunderbolt 4 conçu par Ugreen à 280 € au lieu de 400

03/03/2025 à 13:00

• 3


MWC : des dalles qui se plient, du triple écran et des PC à recharge solaire chez Lenovo

03/03/2025 à 11:15

• 6


Six mois après, cette publicité vantant le nouveau Siri ressemble plus que jamais à de la science-fiction

03/03/2025 à 10:51

• 78


Apple semble avoir oublié Swift Assist, son outil dopé à l’IA pour créer des apps

03/03/2025 à 10:14

• 12


L’intelligence artificielle, le train raté à rattraper d’urgence : la semaine Apple

02/03/2025 à 20:00

• 76


Les MacBook Air M4 pourraient arriver cette semaine

02/03/2025 à 15:20

• 44


Le cache pSLC clarifié (2/2) : ses pièges pour la vitesse des SSD

02/03/2025 à 10:00

• 10


L’autopilot de Tesla montre des difficultés à s’adapter à la Chine

01/03/2025 à 20:30

• 76