« Avec sa puce M1 », disions-nous l’an passé, « Apple est tout simplement en train de remettre à zéro les échelles de comparaison » des performances des ordinateurs portables. Puisque la puce M1 Pro comporte deux fois plus de cœurs graphiques que la puce M1, et que la puce M1 Max comporte à son tour deux fois plus de cœurs graphiques que la puce M1 Pro, il était évident que la même phrase pourrait s’appliquer aux performances graphiques des stations de travail mobiles.
Mais avant de mesurer les nouveaux MacBook Pro 14" et 16", nous n’avions pas encore réalisé qu’il faudrait encore changer d’échelle, et comparer ces machines au Mac Pro ! « Accrochez-vous », « une nouvelle dimension », « un monstre de puissance », « les chevaux sont lâchés »… Choisissez la métaphore que vous voulez : elle est vraie.
Deux et deux font quatre
Avec la plateforme M1, Apple prouve qu’elle maitrise parfaitement le principe des « blocs de propriété intellectuelle », ces circuits que l’on peut empiler comme des briques pour former une puce. Sans faire offense aux équipes de Johny Srouji, on peut voir les puces M1 Pro et M1 Max comme des recombinaisons des circuits de la puce M1.
Ainsi, le processeur reprend les cœurs « économes » Icestorm et les cœurs « performants » Firestorm, que l’on commence à bien connaitre. La puce M1 combinait quatre cœurs de chaque variété, mais n’utilisait les cœurs Firestorm qu’en dernière extrémité, si bien que les performances moyennes étaient surtout déterminées par les petits cœurs Icestorm.
Or s’ils sont étonnamment puissants pour des cœurs censément économes, ils sont nettement moins performants que les gros cœurs Firestorm. Les puces M1 Pro et M1 Max ne possèdent que deux cœurs Icestorm réunis dans un « E-cluster », mais jusqu’à huit cœurs Firestorm, sous la forme d’une paire de « P-clusters » bénéficiant chacun d’un cache L2 de 12 Mo.
La quantité de cache système est triplée sur la puce M1 Pro (24 Mo) et sextuplée sur la puce M1 Max (48 Mo). En théorie, l’agrandissement et la complexification des circuits allongent le temps de transfert des données et augmentent la latence. En pratique, la répartition des tâches entre les deux clusters permet de profiter d’une bande passante de plus de 200 Go/s, un chiffre digne des meilleures puces de classe serveur.
Sauf que ces puces sont conçues pour des ordinateurs portables. La fréquence des cœurs varie selon leur utilisation, d’une fréquence de base de 600 MHz jusqu’à 2 064 MHz en cinq paliers pour les cœurs Icestorm1 et jusqu’à 3 228 MHz en quinze paliers pour les cœurs Firestorm2. Chaque P-cluster peut gérer la fréquence de ses cœurs indépendamment de l’autre, la fréquence maximale baissant avec le nombre de cœurs actifs3.