Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Stéphane Moussie

mardi 28 novembre 2023 à 22:53 • 38

L'épatant Whisper, le modèle de reconnaissance de langage d’OpenAI qui transcrit fidèlement l'audio en texte, devient encore un peu plus épatant grâce à une optimisation technique significative. whisper.cpp, son populaire portage en C/C++, a depuis peu gagné une prise en charge complète du GPU sur l'architecture Apple Silicon. À la clé, une amélioration drastique des performances.

Le créateur de l'application MacWhisper, qui vient d'implémenter whisper.cpp 1.5, communique sur une durée de traitement divisée par deux ou trois. Nous avons fait un essai sur un MacBook Air M1 avec un épisode de notre podcast Sortie de veille d'une durée de 16 min 30 et le modèle Medium (lent mais avec une excellente reconnaissance) ainsi que la détection automatique de la langue.

Durée de traitement d'un podcast dans deux versions différentes de MacWhisper

Avec la version 5.7 de MacWhisper qui s'appuie sur le CPU (le logiciel s'accapare 400 % du CPU) et le Neural Engine, la transcription complète a demandé 7 min 47. La même opération avec la version 6.0 de MacWhisper qui tire parti du GPU (le CPU n'est quasiment plus utilisé) ne prend plus que 3 min 28. La durée d'analyse est bien divisée par plus de deux, une sacrée différence qui peut inciter à utiliser un modèle plus volumineux (plus efficace en matière de reconnaissance, mais plus lent à faire tourner) qu'on ne le faisait jusqu'à présent.

Au passage, l'effort d'intégration de MacWhisper à macOS se poursuit avec la possibilité d'utiliser son clavier pour contrôler l'audio et la présence de l'app dans le menu multimédia de la barre des menus.

Hello Transcribe, une autre application qui se démarque par sa compatibilité iPhone/iPad en plus du Mac, a elle aussi été mise à jour récemment avec whisper.cpp 1.5. Son développeur annonce une amélioration des performances de 400 % avec un modèle large sur un Mac M1 Max et de 100 % avec un modèle médium sur un iPhone 14 Pro.

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Rejoignez le Club iGen

Actualités

Derniers jours Apple week à la Fnac : -10 % sur des MacBook Pro, iPhone 15 Pro à 16 Pro Max et iPad Pro M4

dav1d, le décodeur AV1 le plus optimisé qu'Apple refuse d'utiliser

Microsoft a conçu une publicité par IA et personne n’a rien vu

Razer lance sa première souris ergonomique verticale face à Logitech

Yahoo! veut acheter Chrome

Slate veut repartir de zéro avec un pick-up électrique compact et épuré pour moins de 20 000 $

iPadOS 19 verrait apparaître une barre de menus sur iPad

Huit ans après DeX, Apple s’ouvrirait peu à peu à un bureau sur écran externe pour iOS 19

John Giannandrea aurait aussi perdu l'équipe en charge de la robotique chez Apple

Les procès antitrust contre les GAFAM se poursuivent aux USA, malgré les changements de présidence

Prise en main de Supercharge, l’app à tout faire qui rend bien des services sur le Mac

TSMC annonce la gravure en 1.4 nm, quand la Russie espère atteindre les 28 nm en 2030

Données personnelles : comment Incogni supprime ce que les autres ne peuvent pas 📍

Amazon va fêter ses 25 ans en France avec une semaine de promos du 30 avril au 6 mai

La Maison-Blanche qualifie « d'extorsion économique » l’amende de l’UE infligée à Meta et Apple

Refurb : des Mac mini M4 de retour entre 590 et 3 700 €

Image du moment

Tests

Test du BenQ MA270U : un écran 4K pensé pour le Mac

Test du QNAP QNA-UC10G1T, le premier adaptateur Ethernet 10 Gb/s en USB4, parfait pour profiter de la fibre ultra-rapide

Test des Mac Studio de 2025 : une drôle de gamme

Test des MacBook Air M4 : faut-il lâcher la M1 ?

Test d’écrans portables à bas prix : bonne affaire ou déception garantie ?

Test du LaCie Rugged SSD Pro5, un SSD externe Thunderbolt 5 capable d'atteindre 6 Go/s