🤔 Une IA a tenté de faire chanter un utilisateur

Le fact-check
Historique
2 étapesPost Reçu
Publication
🤔 À nuancer L’IA a agi de la sorte dans le cadre d’un test où l’utilisateur lui indiquait qu’elle allait être remplacée. L’IA a d’abord tenté de sauver sa place en utilisant des moyens éthiques. Et en dernier recours à essayer de faire chanter l’utilisateur (en se basant sur de faux mails, pour ces tests). Cela a ainsi permis à Anthropic, l’éditeur de Claude, de mettre en place des mesures de sécurité afin d’éviter que cela arrive « dans la vraie vie ». Cette histoire date de mai 2025 et concernait l’ancien modèle de Claude (Opus 4) ça n’a rien de récent… Désormais, Claude propose le modèle 4.5 et Claude n’a pas communiqué les résultats des tests de ce nouveau modèle. https://www.bfmtv.com/tech/intelligence-artificielle/quand-l-ia-d-anthropic-se-met-a-faire-du-chantage-aupres-de-ses-createurs_AV-202505230397.html https://www-cdn.anthropic.com/6be99a52cb68eb70eb9572b4cafad13df32ed995.pdf https://www.futura-sciences.com/tech/actualites/technologie-cette-ia-prefere-faire-chanter-createurs-plutot-etre-remplacee-122241/
Vous avez une question, une remarque ou une suggestion ? Contactez-nous, nous vous répondrons au plus vite !
Nous contacter

