Ouvrir le menu principal

MacGeneration

Recherche

OpenAI affirme que DeepSeek a siphonné ses données pour entrainer ses modèles

Félix Cattafesta

mercredi 29 janvier 2025 à 15:30 • 110

Services

L’arroseur arrosé. OpenAI, qui a formé ChatGPT en moissonnant l’intégralité des sites du web, affirme aujourd’hui que l’entreprise chinoise DeepSeek a utilisé ses données pour former son modèle. Selon le Financial Times, Microsoft aurait détecté un siphonnage massif via les API d’OpenAI à la fin 2024. Le duo suspecte que les comptes utilisés soient liés à DeepSeek, qui fait les gros titres depuis cette semaine.

L’entreprise chinoise propose des modèles d’IA présentés comme aussi performants que ses principaux concurrents tout en étant bien moins gourmands en énergie à former. Si tout cela est discutable sur certains points, le lancement a fait trembler les grands du domaine : Meta a lancé une cellule d’urgence pour disséquer ces nouveaux modèles, tandis que l’app DeepSeek a dépassé celle de ChatGPT sur l’App Store américain.

DeepSeek, la tempête boursière dans un verre de ChatGPT 4o

DeepSeek, la tempête boursière dans un verre de ChatGPT 4o

OpenAI affirme avoir les preuves d’une « distillation », qu’elle suspecte venir de DeepSeek. Cette technique consiste à utiliser les résultats de modèles plus grands et plus performants pour entraîner des modèles plus petits. Une bonne alternative évitant de devoir dépenser les fortunes investies par les mastodontes du secteur. Bien qu’OpenAI propose ses API aux développeurs, elle interdit formellement de s’en servir pour créer un modèle rival.

La startup américaine n’a pas donné de détails sur les preuves qu’elle a récoltées. Plusieurs experts ont observé des réponses des modèles de DeepSeek laissant penser qu’ils pourraient avoir été entraînés sur le GPT-4 d’OpenAI. Un point intéressant vient du fait que les modèles de l’entreprise de Sam Altman sont entièrement gardés sous clef, là où ceux de la startup chinoise sont partiellement ouverts (les données d’entrainement restent privées). Autrement dit, l’arrivée de DeepSeek pourrait donner un nouveau souffle au secteur de l’open source.

« Nous savons que les entreprises basées en Chine - et d'autres - essaient constamment de distiller les modèles des principales entreprises américaines d'IA », a déclaré OpenAI dans un communiqué avant d’ajouter prendre des contre-mesures pour protéger « sa propriété intellectuelle ». « Nous pensons [...] qu'il est essentiel que nous travaillions en étroite collaboration avec le gouvernement américain pour protéger au mieux les modèles les plus performants des efforts déployés par les adversaires et les concurrents pour s'emparer de la technologie américaine », conclut l’entreprise.

Pour rappel, le New York Times ainsi que de nombreux médias et artistes ont attaqué OpenAI en justice pour une exploitation sans autorisation de leurs contenus. La startup s’était alors défendue en déclarant que « l’entraînement de modèles d'intelligence artificielle à l'aide de documents accessibles au public sur l'internet est un usage légitime ». Elle avait également déclaré qu’il était « impossible » de créer des produits comme ChatGPT sans utiliser des matériaux protégés par le droit d’auteur.

Mise à jour à 16 h : Ajout d’un paragraphe rappelant plusieurs procédures en cours contre OpenAI.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

QEMU passe en version 10 et gagne quelques fonctions graphiques sur les Mac

23/04/2025 à 18:00

• 13


Kernel Panic : 20 ans d’Intel, merci et bon débarras ?

23/04/2025 à 17:00

• 3


OpenAI voudrait bien acheter Chrome, si le navigateur de Google était à vendre

23/04/2025 à 16:00

• 26


Intel pourrait licencier environ 20 000 personnes de plus

23/04/2025 à 15:03

• 12


Smash Smash, une app qui permet de se défouler (virtuellement) sur l’écran de son Mac

23/04/2025 à 14:00

• 12


Google ne changera rien pour les cookies tiers dans Chrome : l'abandon est bien abandonné

23/04/2025 à 12:12

• 18


Apple a mis à jour XProtect, l'anti-malware de macOS

23/04/2025 à 11:15

• 22


La troisième bêta de macOS 15.5 est disponible 🆕

23/04/2025 à 10:11

• 7


Choisissez le moniteur parfait pour votre Mac

23/04/2025 à 09:09

• 0


Tesla aurait de nouveau perdu de l’argent au premier trimestre 2025 sans les crédits carbone

23/04/2025 à 08:30

• 102


Apple réorganise Siri avec des équipes du Vision Pro

23/04/2025 à 08:13

• 9


Hausse de Netflix : Canal+ augmente légèrement le prix de l’option Premium, Free ne change rien pour le moment

22/04/2025 à 22:16

• 18


Le prochain routeur Starlink va être Wi-Fi 6E

22/04/2025 à 21:49

• 15


ChatGPT Search pourrait bientôt gagner ses galons de très grand moteur de recherche en Europe

22/04/2025 à 16:50

• 38


Pearl aurait repris l'enseigne Macway

22/04/2025 à 16:10

• 19


Counterpoint : le MacBook Air M4 et la crainte des droits de douane ont poussé les ventes d'Apple

22/04/2025 à 15:19

• 26