Pour améliorer la qualité d’une fonction, multiplier les composants n’est pas forcément l’approche la plus pertinente. C’est ce que veut démontrer la start-up 2Hz dans le milieu de l’audio. De la même manière que l’unique appareil photo du Pixel 3 surclasse quasiment tous les double ou triple modules des autres smartphones, Krisp montre que l’on peut très bien supprimer le bruit ambiant lors d’un appel avec un seul micro.
Pour mettre en avant la voix, la plupart des terminaux embarquent en effet un ou plusieurs micros supplémentaires servant spécialement à capter le bruit ambiant pour le filtrer aussitôt (les casques à réduction de bruit active exploitent le même principe). Krisp, de son côté, peut se contenter du micro principal pour filtrer les bruits indésirables. À l’instar de l’appareil photo du Pixel 3, pas de magie noire là-dedans, mais de l’intelligence artificielle.
Des centaines d’heures d’enregistrements de voix et de bruits ambiants ont nourri un réseau de neurones artificiels afin que celui-ci puisse distinguer automatiquement et rapidement un bruit indésirable d’une élocution. Des explications plus techniques sont données sur un blog de Nvidia.
Nous avons testé Krisp lors d’un appel audio Skype entre un Mac et un iPad, ainsi que d’un appel FaceTime audio entre un Mac et un iPhone. Le fonctionnement est assez simple ; après l’installation de l’app sur Mac, il faut sélectionner Krisp comme entrée et comme sortie audio dans les réglages des apps (dans Skype : Paramètres > Audio et vidéo / dans FaceTime : menu Vidéo). Puis lors de l’appel, il suffit d’activer la fonction de suppression de bruit ambiant dans la barre des menus.
La technologie fonctionne des deux côtés : on peut supprimer le bruit ambiant qui nous entoure, ainsi que celui de son correspondant, et ce, sans qu’il ait à installer l’app.
L’efficacité est bel et bien là : quand j’ai activé la suppression de bruit alors que je frappais dans mes mains, mes correspondants n’ont plus entendu mes claquements de main, mais ma voix était toujours audible. Le bruit ambiant n’était pas seulement réduit, il était complètement effacé. L’inverse est également vrai : quand j’ai activé la fonction, les claquements de main de mes correspondants sur iOS ont disparu, mais j’entendais toujours leur voix. Le même test avec de la musique a été concluant.
La technologie n’est pas parfaite non plus. J’ai pu entendre le tout début d’un claquement de mains, mais une fois le bruit reconnu et supprimé par Krisp, il ne s’est plus fait entendre. À l’autre bout du fil, Nicolas a trouvé que ma voix était un petit peu étouffée quand la fonction était activée pour mon micro.
Enfin, Krisp ne filtre pas les voix alentour. Nicolas entendait distinctement les personnes qui discutaient à côté de moi. En l’état actuel des choses, l’application n’est donc pas la solution rêvée pour les appels passés dans des open space. Elle n’en reste pas moins bluffante pour tous les autres bruits environnants.
Krisp est disponible gratuitement sur Mac. L’application fonctionne avec tous les services de communication qui permettent de sélectionner l’entrée et la sortie audio (Skype, FaceTime, WebEx, Hangouts…). À ce sujet, 2Hz assure que la confidentialité des appels est respectée. La start-up certifie que le traitement se fait entièrement en local, que rien n’est envoyé sur ses serveurs.
Un portage sur mobile est compliqué par le fait qu’iOS et Android ne permettent pas de définir une app comme micro ou haut-parleur virtuel. 2Hz, qui commercialise par ailleurs sa technologie auprès des éditeurs en vue d’une intégration à leurs apps, cherche néanmoins une solution.