Ouvrir le menu principal

MacGeneration

Recherche

Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Stéphane Moussie

mardi 28 novembre 2023 à 22:53 • 38

Logiciels

L'épatant Whisper, le modèle de reconnaissance de langage d’OpenAI qui transcrit fidèlement l'audio en texte, devient encore un peu plus épatant grâce à une optimisation technique significative. whisper.cpp, son populaire portage en C/C++, a depuis peu gagné une prise en charge complète du GPU sur l'architecture Apple Silicon. À la clé, une amélioration drastique des performances.

Le créateur de l'application MacWhisper, qui vient d'implémenter whisper.cpp 1.5, communique sur une durée de traitement divisée par deux ou trois. Nous avons fait un essai sur un MacBook Air M1 avec un épisode de notre podcast Sortie de veille d'une durée de 16 min 30 et le modèle Medium (lent mais avec une excellente reconnaissance) ainsi que la détection automatique de la langue.

Durée de traitement d'un podcast dans deux versions différentes de MacWhisper

Avec la version 5.7 de MacWhisper qui s'appuie sur le CPU (le logiciel s'accapare 400 % du CPU) et le Neural Engine, la transcription complète a demandé 7 min 47. La même opération avec la version 6.0 de MacWhisper qui tire parti du GPU (le CPU n'est quasiment plus utilisé) ne prend plus que 3 min 28. La durée d'analyse est bien divisée par plus de deux, une sacrée différence qui peut inciter à utiliser un modèle plus volumineux (plus efficace en matière de reconnaissance, mais plus lent à faire tourner) qu'on ne le faisait jusqu'à présent.

Au passage, l'effort d'intégration de MacWhisper à macOS se poursuit avec la possibilité d'utiliser son clavier pour contrôler l'audio et la présence de l'app dans le menu multimédia de la barre des menus.

Hello Transcribe, une autre application qui se démarque par sa compatibilité iPhone/iPad en plus du Mac, a elle aussi été mise à jour récemment avec whisper.cpp 1.5. Son développeur annonce une amélioration des performances de 400 % avec un modèle large sur un Mac M1 Max et de 100 % avec un modèle médium sur un iPhone 14 Pro.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Orange commence à démanteler son réseau ADSL en France

12:37

• 18


Magazine des 25 ans : plus que quelques jours pour précommander votre exemplaire

10:30

• 6


2,35 milliards d’appareils Apple actifs dans le monde

10:20

• 25


Comment empêcher son MacBook de démarrer automatiquement à l'ouverture de l'écran ou au branchement sur secteur

07:37

• 41


Résultats Apple T1 2025 : l'iPad et le Mac à la fête, l'iPhone en difficulté

30/01/2025 à 23:10

• 81


Le Pentagone bloque l’accès à DeepSeek à ses employés, après avoir constaté de nombreux accès au chatbot

30/01/2025 à 21:45

• 22


Payer son ticket avec sa carte bancaire dans les transports parisiens, ce n’est pas pour demain

30/01/2025 à 21:29

• 67


Le fondateur de TSMC explique pourquoi Apple a abandonné Intel

30/01/2025 à 15:01

• 31


Meta accepte de payer 25 millions de dollars à Donald Trump pour avoir banni ses comptes en 2021

30/01/2025 à 12:17

• 98


Promo : l'Apple Watch Series 10 Noir de Jais à 377 € (-72 €) 🆕

30/01/2025 à 09:19

• 12


Promo sur des Apple Pencil, Magic Mouse et Magic Keyboard

30/01/2025 à 07:50

• 2


Aperty : l'allié parfait des photographes de portraits professionnels et semi-professionnels est là 📍

29/01/2025 à 23:33


Des actionnaires mettent en doute la vertu d’Apple concernant les données d’entraînement de son IA

29/01/2025 à 21:30

• 17


Comment faire tourner DeepSeek-R1 (ou un autre LLM) sur votre Mac

29/01/2025 à 17:23

• 15


Promo : le Mac mini M2 Pro 16/512 Go à 770 € 🆕

29/01/2025 à 17:00

• 20


Promo : la console portable ROG Ally d’Asus à seulement 470 €

29/01/2025 à 16:30

• 16