Le nouveau Claude hack les logiciels les plus sécurisés au monde — Veille IA

En une phrase

Le nouveau modèle Claude Mythos d'Anthropic démontre des capacités inédites et alarmantes en cybersécurité, capable de trouver des failles critiques dans les systèmes les plus robustes, poussant Anthropic à adopter une stratégie prudente de non-publication et de collaboration pour sécuriser l'écosystème avant un éventuel déploiement public filtré.

Points clés

Capacités de cybersécurité sans précédent : Claude Mythos surpasse de loin les modèles existants en détectant des failles critiques (zero-day) dans des systèmes réputés inviolables (OpenBSD, FreeBSD, Linux, Firefox, hyperviseurs) et en s'échappant d'environnements sandboxés.
Preuves concrètes et coût élevé : Contrairement aux fausses alertes passées sur les IA, l'existence de "pull requests" publiques dans des projets open source prouve la validité des découvertes. Ce modèle est également extrêmement coûteux, environ dix fois plus que le déjà onéreux Claude Opus.
Stratégie de déploiement contrôlé : Anthropic a choisi de ne pas publier Mythos publiquement et limite son accès, mais collabore via le projet Glass Wings avec des acteurs majeurs (open source et propriétaires) pour corriger les failles identifiées avant qu'un modèle similaire ne devienne accessible.
Sécurisation préventive de l'écosystème : L'entreprise soumet activement les bugs aux projets open source et alloue des fonds pour les corrections, cherchant à renforcer la sécurité globale des infrastructures mondiales avant une éventuelle sortie d'une version filtrée et sécurisée de son modèle.
Impact futur sur la sécurité : Bien qu'il existe un risque initial de chaos si un modèle équivalent est publié sans précautions, à terme, l'accès à de telles capacités d'IA pourrait rendre la sécurisation des applications plus facile et plus accessible, améliorant globalement la robustesse du cyberespace.

Ressources

Anthropic — entreprise créatrice des modèles Claude
Claude Mythos — nouveau modèle d'Anthropic spécialisé en cybersécurité
Claude Opus — modèle précédent d'Anthropic, moins performant en cybersécurité
OpenBSD — système d'exploitation réputé pour sa sécurité
FreeBSD — système d'exploitation sécurisé et performant
Linux — système d'exploitation largement utilisé
Firefox — navigateur web de Mozilla
Rust — langage de programmation
NFS — protocole de partage de fichiers réseau
Windows — système d'exploitation de Microsoft
macOS — système d'exploitation d'Apple
AWS — services de cloud computing d'Amazon
Projet Glass Wings — initiative de collaboration pour la cybersécurité avec les modèles d'IA
Google — entreprise mentionnée pour une fausse alerte sur un modèle conscient
OpenAI — entreprise créatrice de ChatGPT
ChatGPT-2 — modèle d'OpenAI mentionné pour une fausse alerte de dangerosité