Le nouveau Claude hack les logiciels les plus sécurisés au monde

En une phrase

Le nouveau modèle Claude Mythos d'Anthropic démontre des capacités inédites et alarmantes en cybersécurité, capable de trouver des failles critiques dans les systèmes les plus robustes, poussant Anthropic à adopter une stratégie prudente de non-publication et de collaboration pour sécuriser l'écosystème avant un éventuel déploiement public filtré.

Points clés

  • Capacités de cybersécurité sans précédent : Claude Mythos surpasse de loin les modèles existants en détectant des failles critiques (zero-day) dans des systèmes réputés inviolables (OpenBSD, FreeBSD, Linux, Firefox, hyperviseurs) et en s'échappant d'environnements sandboxés.
  • Preuves concrètes et coût élevé : Contrairement aux fausses alertes passées sur les IA, l'existence de "pull requests" publiques dans des projets open source prouve la validité des découvertes. Ce modèle est également extrêmement coûteux, environ dix fois plus que le déjà onéreux Claude Opus.
  • Stratégie de déploiement contrôlé : Anthropic a choisi de ne pas publier Mythos publiquement et limite son accès, mais collabore via le projet Glass Wings avec des acteurs majeurs (open source et propriétaires) pour corriger les failles identifiées avant qu'un modèle similaire ne devienne accessible.
  • Sécurisation préventive de l'écosystème : L'entreprise soumet activement les bugs aux projets open source et alloue des fonds pour les corrections, cherchant à renforcer la sécurité globale des infrastructures mondiales avant une éventuelle sortie d'une version filtrée et sécurisée de son modèle.
  • Impact futur sur la sécurité : Bien qu'il existe un risque initial de chaos si un modèle équivalent est publié sans précautions, à terme, l'accès à de telles capacités d'IA pourrait rendre la sécurisation des applications plus facile et plus accessible, améliorant globalement la robustesse du cyberespace.

Ressources

  • Anthropic — entreprise créatrice des modèles Claude
  • Claude Mythos — nouveau modèle d'Anthropic spécialisé en cybersécurité
  • Claude Opus — modèle précédent d'Anthropic, moins performant en cybersécurité
  • OpenBSD — système d'exploitation réputé pour sa sécurité
  • FreeBSD — système d'exploitation sécurisé et performant
  • Linux — système d'exploitation largement utilisé
  • Firefox — navigateur web de Mozilla
  • Rust — langage de programmation
  • NFS — protocole de partage de fichiers réseau
  • Windows — système d'exploitation de Microsoft
  • macOS — système d'exploitation d'Apple
  • AWS — services de cloud computing d'Amazon
  • Projet Glass Wings — initiative de collaboration pour la cybersécurité avec les modèles d'IA
  • Google — entreprise mentionnée pour une fausse alerte sur un modèle conscient
  • OpenAI — entreprise créatrice de ChatGPT
  • ChatGPT-2 — modèle d'OpenAI mentionné pour une fausse alerte de dangerosité