Microsoft a plus d'un tour dans son sac pour rester dans le peloton de tête de la course à l'IA. Alors que l'entreprise a déjà investi plusieurs milliards dans OpenAI, The Information affirme aujourd'hui qu'elle travaillerait sur ses propres puces spécialisées sur l'IA et destinées à ses serveurs. Lancé en 2019, le projet serait déjà bien avancé : certains employés de Microsoft auraient même eu l'occasion de l'essayer pour voir ce qu'elle donnait avec de gros modèles de langage, comme le tout récent GPT-4.
L'entraînement et l'utilisation de modèles de langage demandent énormément de puissance. Le mois dernier, Microsoft expliquait comment elle avait mis sur pied une infrastructure massive reposant sur des milliers de cartes graphiques NVIDIA optimisées pour l'IA. L'entreprise a annoncé intégrer des puces H100, spécialisées pour ce type de tâche et facturée plus de 30 000 € unité.
L'essor des IA pourrait créer une nouvelle pénurie de GPU
Il n'est donc pas très surprenant d'apprendre que Microsoft essaye de moins dépendre de NVIDIA et d'économiser sur le long terme, même si elle ne compte pas complètement se débarrasser de son collaborateur. Les deux entreprises disposent de plusieurs partenariats concernant le cloud et l'IA. La firme de Redmond aurait cependant mis un coup de fouet à son projet (surnommé « Athena » en interne) et aurait déjà planifié une feuille de route avec plusieurs évolutions. La première version devrait être gravée en 5 nm par TSMC.
Difficile de savoir si ces puces seront accessibles aux clients Azure ou si elles resteront uniquement utilisées en interne. Microsoft développerait ses puces maison depuis des années : Bloomberg affirmait en 2020 que l'entreprise préparait des modèles ARM pour ses centres de données. D'autres géants de la tech comme Amazon, Google ou Meta planchent eux-aussi sur des puces spécialisées dans l'IA. En attendant les annonces, NVIDIA reste le numéro 1 du secteur.