Ouvrir le menu principal

MacGeneration

Recherche

ChatGPT : OpenAI commence à déployer son mode vocal digne de « Her »

Stéphane Moussie

Wednesday 31 July 2024 à 13:30 • 29

Ailleurs

Une petite partie des utilisateurs de ChatGPT peut maintenant bavarder de manière naturelle avec le robot conversationnel. OpenAI a commencé à déployer la fonction vocale avancée de GPT-4o qui avait fait sensation lors de sa présentation au printemps.

Avec ce nouveau mode, ChatGPT est normalement capable de tenir une conversation orale de manière naturelle et en temps réel, en pouvant être interrompu et en tenant même compte des émotions transparaissant dans la voix de son interlocuteur humain. De quoi donner à ChatGPT un petit air de Samantha, l’intelligence artificielle du film Her tellement crédible que son utilisateur en tombe amoureux. Un petit air renforcé par le fait que la voix « Sky » du robot lors de la démo était très similaire à celle de Scarlett Johansson, l’actrice qui joue Samantha, au point qu’OpenAI a dû se justifier et retirer la voix litigieuse.

La nouvelle fonction vocale comprend finalement quatre voix (Breeze, Cove, Ember et Juniper) créées en collaboration avec des acteurs vocaux. ChatGPT ayant désormais les moyens de produire des paroles naturelles, OpenAI a mis en place des garde-fous pour éviter des détournements malveillants. Ainsi, le robot n’est pas censé pouvoir imiter les voix d’autres personnes, qu’il s’agisse de personnalités publiques ou d’anonymes. Dans la même veine, il doit normalement rester muet si on lui demande de générer des contenus audio protégés par des droits d’auteur. À voir si ces protections sont vraiment efficaces.

Le mode vocal avancé est en train d’être déployé en version alpha pour un panel d’utilisateurs de ChatGPT Plus (abonnement autour de 20 €/mois). Les utilisateurs concernés recevront une notification dans l'application ChatGPT et un email contenant des instructions. La nouveauté devrait être accessible à tous les abonnés à l’automne. Pas encore de date de disponibilité communiquée pour les utilisateurs gratuits. Les fonctionnalités vidéo et le partage d'écran, deux autres capacités innovantes de GPT-4o, seront lancés à une date ultérieure.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner