Mise à jour le 27 mars à 9:20 : Finalement, ce générateur d’image ne sera pas accessible tout de suite pour les utilisateurs gratuits. Sam Altman a indiqué que la nouveauté avait attiré plus de monde de prévu, et que le déploiement pour tous sera « malheureusement retardé pendant un certain temps ».
Article original : OpenAI améliore son système de génération d’images. L’entreprise vient d’annoncer que son modèle GPT-4o pouvait désormais créer des images, plus crédibles et plus consistantes qu’auparavant. Tout cela passe directement par ChatGPT, ce qui permet de facilement modifier une image ou d’en demande une dans la continuité d’une autre.

Le modèle s’est bien amélioré dans la gestion du texte. Si les versions précédentes affichaient généralement un gloubiboulga sur les pages de livres ou les panneaux, cette révision peut désormais produire des images avec du texte complexe ou même des BD sans sourciller. Quelques exemples ont été partagés, où l’on peut par exemple, voir un menu de restaurant ou un carton d’invitation en anglais sans faute.

Il est possible d’affiner l’image créée, ou encore de l’utiliser comme inspiration pour d’autres créations. On pourra par exemple demander l’ajout d’éléments spécifiques, mais aussi de changer complètement le concept tout en en gardant une partie. OpenAI affirme que le modèle gère mieux les demandes de plusieurs éléments distincts sans tout mélanger, par exemple pour générer une grille d’autocollants variés. Il devrait également mieux intégrer et comprendre les éléments provenant d’une image envoyée.


OpenAI indique que son modèle s’en sort mieux pour certains styles particuliers et pour les images photoréalistes. Il devrait également mieux gérer certains concepts abstraits sur lesquels il butait jusqu'à présent (par exemple un vélo à roues triangulaires), ou laisser la possibilité de créer des PNG à fond transparent. De nombreuses limitations restent à noter, comme le fait que le modèle a parfois tendance à élaguer les images ou a mal gérer certains alphabets, comme le coréen. L’entreprise assure avoir tout fait pour bloquer les éventuelles dérives, en plus d’intégrer des métadonnées indiquant qu’une image a été générée par IA.
La génération d’image avec GPT-4o est en cours de déploiement pour les utilisateurs gratuits de ChatGPT, mais aussi pour ceux avec un compte Plus ou Pro. La nouveauté vient prendre la relève de DALL-E, qui a été transformé en GPT (les versions personnalisées de ChatGPT accessibles depuis le tchatbot). Elle est également disponible dans Sora, le générateur de vidéo d’OpenAI.