Ouvrir le menu principal

MacGeneration

Recherche

Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Stéphane Moussie

mardi 28 novembre 2023 à 22:53 • 38

Logiciels

L'épatant Whisper, le modèle de reconnaissance de langage d’OpenAI qui transcrit fidèlement l'audio en texte, devient encore un peu plus épatant grâce à une optimisation technique significative. whisper.cpp, son populaire portage en C/C++, a depuis peu gagné une prise en charge complète du GPU sur l'architecture Apple Silicon. À la clé, une amélioration drastique des performances.

Le créateur de l'application MacWhisper, qui vient d'implémenter whisper.cpp 1.5, communique sur une durée de traitement divisée par deux ou trois. Nous avons fait un essai sur un MacBook Air M1 avec un épisode de notre podcast Sortie de veille d'une durée de 16 min 30 et le modèle Medium (lent mais avec une excellente reconnaissance) ainsi que la détection automatique de la langue.

Durée de traitement d'un podcast dans deux versions différentes de MacWhisper

Avec la version 5.7 de MacWhisper qui s'appuie sur le CPU (le logiciel s'accapare 400 % du CPU) et le Neural Engine, la transcription complète a demandé 7 min 47. La même opération avec la version 6.0 de MacWhisper qui tire parti du GPU (le CPU n'est quasiment plus utilisé) ne prend plus que 3 min 28. La durée d'analyse est bien divisée par plus de deux, une sacrée différence qui peut inciter à utiliser un modèle plus volumineux (plus efficace en matière de reconnaissance, mais plus lent à faire tourner) qu'on ne le faisait jusqu'à présent.

Au passage, l'effort d'intégration de MacWhisper à macOS se poursuit avec la possibilité d'utiliser son clavier pour contrôler l'audio et la présence de l'app dans le menu multimédia de la barre des menus.

Hello Transcribe, une autre application qui se démarque par sa compatibilité iPhone/iPad en plus du Mac, a elle aussi été mise à jour récemment avec whisper.cpp 1.5. Son développeur annonce une amélioration des performances de 400 % avec un modèle large sur un Mac M1 Max et de 100 % avec un modèle médium sur un iPhone 14 Pro.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

L’intelligence artificielle, le train raté à rattraper d’urgence : la semaine Apple

02/03/2025 à 20:00

• 56


Les MacBook Air M4 pourraient arriver cette semaine

02/03/2025 à 15:20

• 34


Le cache pSLC clarifié (2/2) : ses pièges pour la vitesse des SSD

02/03/2025 à 10:00

• 6


L’autopilot de Tesla montre des difficultés à s’adapter à la Chine

01/03/2025 à 20:30

• 70


Apple permet enfin de fusionner deux comptes Apple en Europe

01/03/2025 à 11:02

• 73


Sortie de veille : iOS 18.4 et Apple Intelligence font leurs débuts en France

01/03/2025 à 08:00

• 15


La folie des datacenters devrait nécessiter l’équivalent de 30 nouveaux réacteurs nucléaires au Texas d’ici 2030

28/02/2025 à 20:45

• 73


Un écran 5K à seulement 700 € chez JapanNext

28/02/2025 à 18:00

• 38


Le 5 mai 2025, Skype disparaitra dans le nuage

28/02/2025 à 17:00

• 41


L'iPhone 16e est en vente avec quelques réductions de prix

28/02/2025 à 16:38

• 19


Une vente aux enchères propose un Apple I, des prototypes de Mac, des cartes de visite… ou une chemise hawaïenne

28/02/2025 à 16:15

• 9


Sora sort en Europe pour créer des vidéos plus fausses que nature

28/02/2025 à 12:30

• 32


L'iMac M4 arrive sur le refurb d'Apple, d'abord en Belgique

28/02/2025 à 11:35

• 15


Skype pourrait être fermé dans quelques mois par Microsoft

28/02/2025 à 11:15

• 34


Pocket City 2 s’adapte au Mac avec une version enrichie

28/02/2025 à 10:31

• 29


Le cache pSLC clarifié (1/2) : l'arme secrète des SSD modernes

28/02/2025 à 09:38

• 10