Ouvrir le menu principal

MacGeneration

Recherche

IA : Qualcomm s'intéresse à la génération d'images en local

Félix Cattafesta

mercredi 21 juin 2023 à 15:04 • 4

Ailleurs

Qualcomm s'intéresse aux modèles d'IA génératives tournant en local. L'entreprise vient de dévoiler ControlNet, un modèle de langage-vision dans la même veine que Stable Diffusion ou MidJourney. Une démo a été présentée, dans laquelle on peut voir une image générée sur un téléphone en moins de 12 secondes, sans passer par le cloud.

Qualcomm explique avoir utilisé une série d'optimisations au niveau de l'architecture du modèle, du logiciel d'IA et des accélérateurs du moteur neuronal pour obtenir ce résultat. La référence du téléphone utilisé n'est pas précisée, mais on peut voir que l'entreprise a mis la main à la pâte pour optimiser son modèle de 1,5 milliard de paramètres. Ce n'est pas la première fois que l'on peut utiliser un modèle du genre sur smartphone : une démo de Stable Diffusion sur Android a été présentée en début d'année. Sur iOS, il est possible de se servir du modèle de langage via des apps comme Draw Things ou AI Photo.

Le fait de pouvoir faire tourner des modèles d'IA générative en local est important : cela permet de moins dépendre du cloud, ce qui est toujours bon pour la protection de ses données privées. Si la nouveauté sert pour le moment à générer des images à partir de mots, elle pourrait rapidement infuser ici et là dans l'appareil. Qualcomm a par exemple dévoilé un modèle de langage utilisé pour donner voix à un coach de gym virtuel. Le concept se base sur un second modèle d'IA pouvant détecter et identifier les positions de gym, ce qui permet de générer des réponses dans le contexte.

La réalité mixte (au cœur du futur Vision Pro d'Apple) n'est pas en reste, et Qualcomm a également fait quelques annonces de ce côté-là. L'entreprise a notamment présenté un système de reconstruction 3D pour les apps XR mais aussi des avancées dans la création d'avatars 3D. Qualcomm a une carte à jouer dans le domaine : c'est elle qui produit les puces qui équipent les casques de Meta, principal opposant à Apple sur le terrain de la réalité mixte.

L'entreprise a également présenté ses avancées dans différents domaines, comme pour ce qui touche à l'encodage de vidéos 1080p sur smartphone ou de meilleurs algorithmes de vision par ordinateur pour les caméras de surveillance. Elle a aussi mis en avant un système de surveillance du conducteur pour véhicule, vérifiant l'état du chauffeur et le prévenant lorsqu'il détecte une pratique dangereuse (somnolence, distraction).

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Être poli avec ChatGPT coûte des millions de dollars en électricité pour OpenAI

14:50

• 2


Avec la Firefly, Nio espère concurrencer les citadines électriques européennes

12:00

• 28


Apple Watch : retour sur 10 ans de succès et d'échecs

10:09

• 14


Kwack fait cancaner le Mac à chaque fois que vous appuyez sur une touche de clavier

09:14

• 21


Un humanoïde boucle le semi-marathon de Pékin en 2h40

20/04/2025 à 19:05

• 18


Incogni : la vie privée, enfin prise au sérieux (par quelqu’un d’autre que vous) 📍

20/04/2025 à 14:00

• 0


À la découverte de l’écosystème UniFi, l’équipement réseau des pros accessible au grand public

20/04/2025 à 10:00

• 74


Promo : les prix des MacBook Air M4 et MacBook Pro M4 continuent de baisser - jusqu'à 10 % de remise ! 🆕

19/04/2025 à 15:56

• 10


Sortie de veille : le futur de l’iPad se trouve-t-il dans le Mac ?

19/04/2025 à 08:00

• 20


Quand Apple a sorti... une molaire

18/04/2025 à 22:15

• 54


Redonnez vie à vos photos floues : l'IA d’Aiarty passe à la vitesse supérieure 📍

18/04/2025 à 22:01

• 0


Clap de fin pour Mythic Quest, qui voit son épisode final modifié pour mieux clore la série

18/04/2025 à 21:30

• 33


Un support pour Mac mini M4 qui en bouche un coin(-coin)

18/04/2025 à 20:45

• 50


Choosy permet de choisir un navigateur web différent en fonction du lien à ouvrir

18/04/2025 à 18:00

• 19


Doom, Mario, Civilization : les IA génératives peuvent-elles terminer des jeux des années 90 ?

18/04/2025 à 17:30

• 11


Les agences immobilières peuvent intégrer DossierFacile sur leur site

18/04/2025 à 15:04

• 9