Ouvrir le menu principal

MacGeneration

Recherche

Apple améliore les performances des GPU Nvidia pour l'IA

Pierre Dandumont

vendredi 20 décembre 2024 à 17:45 • 35

Ailleurs

Dans un post de blog, Apple vient d'annoncer avoir amélioré les performances lors de l'étape de l'inférence dans les LLM (Large Language Models, les grands modèles de langage comme ChatGPT). Et cette annonce est intéressante sur deux points.

Le premier, c'est que les gains sont importants. La méthode développée chez Apple porte le nom de ReDrafter, elle est open source et elle permet de multiplier les performances par 2,7. L'inférence est une étape importante pour les utilisateurs : elle intervient quand une personne pose une question à une « IA ». La solution d'Apple accélère donc un moment crucial : celui où vous attendez une réponse. La technologie a été intégrée dans les bibliothèques de Nvidia, qui permettent d'accéder aux unités dédiées des cartes graphiques de Nvidia. La marque a d'ailleurs aussi posté un message sur un blog technique, pour donner des détails.

Des gains importants selon Apple.

Les gains sont intéressants, car ils peuvent avoir un effet indirect. S'il est possible de simplement accélérer la livraison des données, il est (surtout) aussi possible de réduire le nombre de cartes nécessaires et donc la consommation des serveurs qui fournissent la réponse, tout en réduisant la latence dans la fourniture des réponses.

Le second point est qu'Apple travaille avec Nvidia, ce qui n'est pas anodin. Dans le domaine graphique, les Mac ont abandonné les cartes GeForce depuis une grosse dizaine d'années et la rupture semblait consommée entre Apple et Nvidia. Mais Nvidia est un incontournable dans le domaine de l'IA, tant pour les performances de ses cartes que pour ses capacités à fournir le matériel nécessaire. Si Apple met en avant ses propres serveurs pour Apple Intelligence et travaillerait avec Broadcom pour des puces dédiées, une partie des infrastructures reposent tout de même probablement sur des cartes Nvidia, ne serait-ce que tout ce qui est délégué à OpenAI et ChatGPT.

Private Cloud Compute : comment Apple veut faire rimer « intelligence » et « confidentialité »

Private Cloud Compute : comment Apple veut faire rimer « intelligence » et « confidentialité »

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

L’UE recale un projet de loi voulant récupérer les données de navigation des français

20/02/2025 à 22:15

• 23


QNAP annonce un switch Ethernet 10 Gb/s 5 ports à un prix correct

10:20

• 0


Canal+ supprime la 4K aux abonnés sans engagement

09:44

• 67


L’UE recale un projet de loi voulant récupérer les données de navigation des français

20/02/2025 à 22:15

• 23


Refurb : large choix de Mac mini M4 de 589 € à 2 349 €

20/02/2025 à 21:00

• 28


Tim Cook vu à la Maison Blanche pour y rencontrer Donald Trump

20/02/2025 à 20:15

• 36


iPhone 16e : l’absence de MagSafe, un faux problème ?

20/02/2025 à 17:44

• 30


Canal+ propose maintenant Apple Music Familial à - 30 % à ses abonnés

20/02/2025 à 14:26

• 58


Amazon lance de nouveaux routeurs Eero Wi-Fi 7 plus abordables

20/02/2025 à 10:32

• 28


Les lacunes plus ou moins étonnantes de l’iPhone 16e

20/02/2025 à 09:11

• 147


Refurb : le MacBook Pro 14" M4 à 1 600 € et des versions à 1 ou 4 To de SSD

20/02/2025 à 07:31

• 19


Acer, premier constructeur à réajuster ses prix suite à la nouvelle taxe Trump sur la Chine

19/02/2025 à 21:45

• 52


Apple présente l’iPhone 16e pour remplacer l’iPhone SE 3

19/02/2025 à 18:12

• 286


Apple ferme sa boutique en ligne avant de présenter ses nouveautés

19/02/2025 à 16:54

• 30


Pi-hole bloque les publicités plus vite et plus fort

19/02/2025 à 15:30

• 66


Apple In China, un nouveau livre à paraître sur l’histoire d’Apple en Chine

19/02/2025 à 14:45

• 2


iPhone SE 4 ou iPhone 16E ?

19/02/2025 à 14:02

• 76