Ouvrir le menu principal

MacGeneration

Recherche

OpenAI affirme que DeepSeek a siphonné ses données pour entrainer ses modèles

Félix Cattafesta

mercredi 29 janvier 2025 à 15:30 • 108

Services

L’arroseur arrosé. OpenAI, qui a formé ChatGPT en moissonnant l’intégralité des sites du web, affirme aujourd’hui que l’entreprise chinoise DeepSeek a utilisé ses données pour former son modèle. Selon le Financial Times, Microsoft aurait détecté un siphonnage massif via les API d’OpenAI à la fin 2024. Le duo suspecte que les comptes utilisés soient liés à DeepSeek, qui fait les gros titres depuis cette semaine.

L’entreprise chinoise propose des modèles d’IA présentés comme aussi performants que ses principaux concurrents tout en étant bien moins gourmands en énergie à former. Si tout cela est discutable sur certains points, le lancement a fait trembler les grands du domaine : Meta a lancé une cellule d’urgence pour disséquer ces nouveaux modèles, tandis que l’app DeepSeek a dépassé celle de ChatGPT sur l’App Store américain.

DeepSeek, la tempête boursière dans un verre de ChatGPT 4o

DeepSeek, la tempête boursière dans un verre de ChatGPT 4o

OpenAI affirme avoir les preuves d’une « distillation », qu’elle suspecte venir de DeepSeek. Cette technique consiste à utiliser les résultats de modèles plus grands et plus performants pour entraîner des modèles plus petits. Une bonne alternative évitant de devoir dépenser les fortunes investies par les mastodontes du secteur. Bien qu’OpenAI propose ses API aux développeurs, elle interdit formellement de s’en servir pour créer un modèle rival.

La startup américaine n’a pas donné de détails sur les preuves qu’elle a récoltées. Plusieurs experts ont observé des réponses des modèles de DeepSeek laissant penser qu’ils pourraient avoir été entraînés sur le GPT-4 d’OpenAI. Un point intéressant vient du fait que les modèles de l’entreprise de Sam Altman sont entièrement gardés sous clef, là où ceux de la startup chinoise sont partiellement ouverts (les données d’entrainement restent privées). Autrement dit, l’arrivée de DeepSeek pourrait donner un nouveau souffle au secteur de l’open source.

« Nous savons que les entreprises basées en Chine - et d'autres - essaient constamment de distiller les modèles des principales entreprises américaines d'IA », a déclaré OpenAI dans un communiqué avant d’ajouter prendre des contre-mesures pour protéger « sa propriété intellectuelle ». « Nous pensons [...] qu'il est essentiel que nous travaillions en étroite collaboration avec le gouvernement américain pour protéger au mieux les modèles les plus performants des efforts déployés par les adversaires et les concurrents pour s'emparer de la technologie américaine », conclut l’entreprise.

Pour rappel, le New York Times ainsi que de nombreux médias et artistes ont attaqué OpenAI en justice pour une exploitation sans autorisation de leurs contenus. La startup s’était alors défendue en déclarant que « l’entraînement de modèles d'intelligence artificielle à l'aide de documents accessibles au public sur l'internet est un usage légitime ». Elle avait également déclaré qu’il était « impossible » de créer des produits comme ChatGPT sans utiliser des matériaux protégés par le droit d’auteur.

Mise à jour à 16 h : Ajout d’un paragraphe rappelant plusieurs procédures en cours contre OpenAI.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Meta accepte de payer 25 millions de dollars à Donald Trump pour avoir banni ses comptes en 2021

12:17

• 47


Promo générale sur les Apple Watch SE et Series 10 aluminium et titane

09:19

• 8


Promo sur des Apple Pencil, Magic Mouse et Magic Keyboard

07:50

• 2


Aperty : l'allié parfait des photographes de portraits professionnels et semi-professionnels est là 📍

29/01/2025 à 23:33


Des actionnaires mettent en doute la vertu d’Apple concernant les données d’entraînement de son IA

29/01/2025 à 21:30

• 16


Comment faire tourner DeepSeek-R1 (ou un autre LLM) sur votre Mac

29/01/2025 à 17:23

• 14


Promo : le Mac mini M2 Pro 16/512 Go à 770 € 🆕

29/01/2025 à 17:00

• 18


Promo : la console portable ROG Ally d’Asus à seulement 470 €

29/01/2025 à 16:30

• 16


OpenAI affirme que DeepSeek a siphonné ses données pour entrainer ses modèles

29/01/2025 à 15:30

• 108


Deux failles des dernières puces Apple Silicon permettent d’extraire des données de Safari et Chrome à distance

29/01/2025 à 11:00

• 45


Office pour Mac colle ses premiers widgets sur le bureau

29/01/2025 à 10:21

• 23


Coup d’œil sur le nouveau cadran « Unité en rythme » de watchOS 11.3

29/01/2025 à 09:17

• 20


e/OS/ et Iodé, les deux Android français qui tracent leur route sans Google

29/01/2025 à 09:16

• 18


Votre consentement sera en théorie nécessaire pour tout démarchage téléphonique

29/01/2025 à 09:09

• 93


Coup d'œil sur les AirPods 4 et l'AirTag de l'année du serpent 🐍, deux éditions limitées

29/01/2025 à 09:00

• 3


Kernel Panic : après un an, le Vision Pro a-t-il tenu ses promesses ?

29/01/2025 à 07:30

• 8