Apple continue de discrètement présenter ses avancées liées à l’intelligence artificielle. L’entreprise a mis en ligne un nouveau modèle baptisé MGIE permettant de modifier une image à l’aide d’indications données de manière naturelle. Il peut gérer différents aspects de la retouche, que ce soit des changements précis ou beaucoup plus généraux.
MGIE (pour MLLM-Guided Image Editing) repose sur l’utilisation d’un modèle de langage multimodal pouvant à la fois interagir avec des images et du texte. Il peut gérer différentes manipulations : recadrer une photo, ajouter un filtre, changer l’arrière-plan, supprimer des objets… De manière plus globale, le modèle peut améliorer la qualité de la photo en retouchant la luminosité, le contraste ou les couleurs. Il pourra carrément changer le style d’une photo en y ajoutant des effets artistiques, donnant par exemple un style cartoon ou de peinture.
Mais MGIE peut aussi modifier certaines parties spécifiques d’une image, par exemple en retouchant les cheveux d’une personne ou ses habits. La couleur, taille ou texture des différents éléments pourra être modifiée. Il est également possible d’effacer de manière naturelle certains éléments, ou bien encore d’en ajouter d’autres. Le modèle est en capacité de raisonner : si l’utilisateur lui demande de rendre une pizza « plus saine pour la santé », l’IA ajoutera des légumes à la garniture. Le modèle a été créé en partenariat avec des chercheurs de l’université de Californie, et est disponible sur GitHub (une démo est proposée via navigateur).
Apple suit de près le développement des IA liées aux images. Elle a présenté en début d’année son modèle multimodal Ferret, qui peut identifier les différents éléments d’un cliché pour en faire des déductions. En novembre dernier, Cupertino avait publié un rapport sur une nouvelle technologie de génération d'images et de vidéos.
Si rien n’est visible pour le moment sur nos appareils, on peut s’attendre à ce que toutes ces découvertes émergent d’une manière ou d’une autre dans iOS 18, qui devrait être une mise à jour d’ampleur « historique ». Les rumeurs voudraient que l’IA soit au cœur d’une grosse refonte de Siri, tout en infusant dans différentes parties du système (suite iWork, Xcode, Apple Music…). Fin décembre dernier, Apple a publié un travail de recherche montrant comment utiliser la mémoire flash d’un appareil pour faire tourner un modèle d’IA.
Source : VentureBeat