Grosse semaine pour OpenAI, qui a lancé hier deux nouveaux modèles d’IA présentés comme plus malins et ayant la capacité de « raisonner ». Baptisés o1 et o1-mini, ceux-ci auraient été entrainés à affiner leur processus de réflexion et à essayer différentes stratégies avant de donner une réponse. Des modèles qui peuvent se « fact-checker » en quelques sorte, et qui pourraient « reconnaître leurs erreurs ».
OpenAI n’y va pas avec le dos de la cuillère dans son communiqué, affirmant que certains de ces modèles ont obtenu des résultats similaires à ceux des doctorants sur des tâches exigeantes en physique, chimie et biologie. Ils auraient également découvert qu'ils « excellent en mathématiques et en programmation ». Les papiers techniques présentent des modèles formidables avec des résultats parfois bien meilleurs que GPT-4o. On attendra de voir ce qu’en pensent les testeurs indépendants pour se forger un avis, les benchmarks d’IA n’étant pas forcément des plus fiables.
Un chercheur d’OpenAI a expliqué à The Verge que ces modèles étaient entraînés d’une manière « fondamentalement différente » avec « un tout nouvel algorithme d'optimisation » spécialement conçu pour eux. S’il y a visiblement des progrès, la méthode ne règle pas complètement le souci d’hallucination, à savoir le fait que le modèle peut raconter n’importe quoi. Cela reste la principale faille de cette technologie, qui peut résoudre des problèmes de mathématiques très complexes mais rame pour certaines questions beaucoup plus simples.
Si les promesses sont intéressantes, tout est pour le moment limité : le modèle n’a pas accès au web et ne peut pas recevoir d’images. Le coût pour les développeurs est bien plus élevé que pour GPT-4o, avec des tarifs étant 3 à 4 fois plus chers. OpenAI présente ce modèle comme un « aperçu » et nous prévient que GPT-4o restera plus performant à court terme pour de nombreuses tâches. Face à la vague d’enthousiasme des utilisateurs, la gestionnaire de produit d’OpenAI a dû calmer le jeu en rappelant que les nouveaux modèles n’étaient pas « des modèles miracles » avant de promettre que ceux-là allaient « continuer de s’améliorer ».
o1 est livré dans une version standard et mini, qui a l’avantage d’être plus rapide tout en étant conçue pour « répondre aux questions en sciences, technologie, ingénierie et mathématiques ». Les deux peuvent être essayés par les abonnés à ChatGPT Plus et Team, et OpenAI a promis que la version o1-mini sera accessible aux utilisateurs gratuits par la suite.
Aux dernières nouvelles, le ChatGPT d'OpenAI compte plus de 10 millions d'abonnés payants, auxquels s’ajoutent 1 million d'abonnés supplémentaires faisant partie de plans pour les équipes professionnelles. OpenAI aurait annoncé à ses investisseurs être en pourparlers avec un fonds d'investissement soutenu par les Émirats arabes unis dans le but de lever jusqu'à 7 milliards de dollars supplémentaires.