Doorbraak of grote bluf? De waarheid achter de ‘gevaarlijke’ nieuwe AI van Anthropic

6

Vorige week werd de technologie-industrie in een neerwaartse spiraal gebracht door een verrassende aankondiging van Anthropic: ze hebben een AI-model ontwikkeld dat zo krachtig is op het gebied van cyberbeveiliging dat het als te gevaarlijk wordt beschouwd om publiekelijk te worden vrijgegeven.

Het model, genaamd Claude Mythos Preview, is naar verluidt in staat duizenden zeer ernstige kwetsbaarheden in grote besturingssystemen en webbrowsers te identificeren. Om dit risico te beheersen heeft Anthropic Project Glasswing gelanceerd, een initiatief dat alleen op uitnodiging toegankelijk is en waarmee geselecteerde organisaties het model kunnen testen en hun digitale infrastructuur kunnen beveiligen.

Hoewel de aankondiging aanleiding gaf tot nooddiscussies onder financiële leiders en de angst voor wijdverbreide hacking aanwakkerde, blijft een centrale vraag bestaan: Is dit een echte sprong in de AI-mogelijkheden, of een berekende PR-stunt die is ontworpen om investeringen op gang te brengen?

Een pleidooi voor een publiciteitsstunt: “Bedrijfstheater”

Critici en sceptici beweren dat de ‘veiligheid eerst’-benadering van Anthropic een tweeledig doel dient: het publiek beschermen en een merk van onmisbare macht opbouwen.

  • Vage gegevens: AI-veiligheidsingenieur Heidy Khlaaf wijst erop dat Anthropic kritische meetgegevens heeft achtergehouden, zoals het aantal ‘valse positieven’ en hoeveel menselijke tussenkomst nodig was om de bevindingen van het model te verifiëren. Zonder deze gegevens kunnen onafhankelijke deskundigen de claims niet valideren.
  • De ‘Marketing Flex’: Tal Kollender, CEO van cyberbeveiligingsbedrijf Remedio, beschrijft de stap als ‘briljant bedrijfstheater’. Door het model ‘te gevaarlijk om vrij te geven’ te bestempelen, creëert Anthropic een aura van mystiek en signaleert het een enorme technologische dominantie bij investeerders.
  • Historisch precedent: Anthropic heeft een geschiedenis van het geven van ernstige waarschuwingen over zijn eigen modellen. Sceptici merken op dat een aantal eerdere ‘gevaarlijke’ gedragingen feitelijk het resultaat waren van sterk gecontroleerde, kunstmatige testomgevingen en niet van autonome modelintenties.

Een pleidooi voor een echte dreiging: een nieuwe schaal van uitbuiting

Ondanks het scepticisme blijkt uit onafhankelijke tests dat Claude Mythos niet alleen maar een hype is. Het AI Security Institute (AISI) heeft onlangs geverifieerd dat Mythos cyberbeveiligingstests heeft doorstaan ​​die geen enkel ander grensmodel met succes heeft voltooid.

Het echte gevaar is niet noodzakelijkerwijs een ‘Hollywood-scenario’ waarin een tiener een elektriciteitsnet hackt, maar eerder een verschuiving in de schaal en snelheid van cyberaanvallen :

  1. Geautomatiseerde detectie: In tegenstelling tot de huidige tools kan Mythos de ontdekking van ‘zero-day’-kwetsbaarheden (voorheen onbekende fouten) op een ongekende schaal automatiseren.
  2. Snelle exploitatie: Geavanceerde hackgroepen zouden dergelijke modellen kunnen gebruiken om zwakke punten sneller te vinden en te exploiteren dan menselijke verdedigers ze kunnen patchen.
  3. Bewezen mogelijkheden: Onderzoekswetenschapper Nicholas Carlini merkte op dat Mythos al kwetsbaarheden in Linux heeft geïdentificeerd die ongeoorloofde administratieve toegang mogelijk maken, wat de technische potentie ervan bewijst.

De middenweg: een tweesnijdend zwaard

Voor veel deskundigen is het antwoord niet ‘of/of’, maar beide. Anthropic vertelt waarschijnlijk de waarheid over de kracht van het model en gebruikt die waarheid tegelijkertijd om zijn marktpositie te versterken.

“Ik zou zeggen dat het allebei is, en dat is geen kritiek… Elke grote platformuitrol in dit tijdperk zal er voor verschillende doelgroepen anders uitzien, afhankelijk van hun spreekvaardigheid en hun angsttolerantie.”
Howie Xu, Chief AI & Innovation Officer bij Gen

De huidige realiteit is een asymmetrische wapenwedloop. Hoewel Claude Mythos een aanzienlijk veiligheidsrisico met zich meebrengt, biedt dezelfde technologie een enorm voordeel voor degenen die de digitale grens verdedigen. Naarmate AI beter in staat wordt bugs te vinden, zullen de organisaties die deze moeten oplossen, even krachtige tools krijgen om de verdediging te automatiseren.


Conclusie: Claude Mythos vertegenwoordigt een echte technologische sprong die de ontdekking van digitale kwetsbaarheden automatiseert, maar de uitrol van Anthropic met hoge inzet is ook een masterclass in strategische positionering. De werkelijke impact zal worden bepaald door de vraag of verdedigers dezelfde ‘gevaarlijke’ tools kunnen gebruiken om de hackers te slim af te zijn.