© Anthropic

© Anthropic

De vijand van mijn vijand: dit is hoe Anthropic wil voorkomen dat AI alles kapotmaakt

Update: 9 april 2026 om 16:08
Praat mee!
Redacteur

Amazon, Apple, Google, Microsoft, Nvidia en een boel andere bedrijven zitten samen met Anthropic aan tafel. Ze doen dat niet om over patenten te steggelen of andere alledaagse zaken te bespreken. Ze willen samen een groot probleem oplossen: een AI-model dat naar verluidt zo krachtig is, dat zelfs zijn eigen schepper het niet op de wereld durft los te laten.

Dat model heet Claude Mythos. En Anthropic, het bedrijf dat het bouwde, heeft deze week Project Glasswing aangekondigd. Dat is een coalitie van twaalf grote technologie- en financebedrijven die samen aan de slag gaan met Mythos om hun digitale infrastructuur veilig te stellen. Op het spel staat de digitale veiligheid van letterlijk miljarden mensen. Dat is het officiële verhaal althans.

Het model dat zichzelf overtrof

Spoel even terug naar eind maart. Onderzoekers van de Universiteit van Cambridge en beveiligingsbedrijf LayerX Security hebben toen ontdekt dat bijna 3.000 interne documenten van Anthropic onbeschermd op het internet stonden. Een medewerker had het contentmanagementsysteem verkeerd ingesteld. Bestanden die je uploadt zijn daar standaard zichtbaar voor iedereen, tenzij je dat handmatig uitschakelt. Iemand had vergeten dat te doen.

Tussen een boel ongebruikte logo's en onschuldige conceptafbeeldingen voor oude blogposts dook één document op dat de wenkbrauwen van de onderzoekers deed fronsen. Het waren plannen voor een model met de interne codenaam "Capybara". Op de markt zou het Claude Mythos gaan heten. Het ging om een gloednieuwe klasse AI-model, ver boven alles wat Anthropic of welk ander bedrijf dan ook momenteel aanbiedt.

Anthropic had geen keuze dan te bevestigen dat Mythos inderdaad echt is. Inmiddels is het model ook officieel aangekondigd. Maar Anthropic wil het nog niet publiekelijk beschikbaar maken. Noem het misschien marketinghype, maar het bedrijf lijkt oprecht bang te zijn dat het model té goed is in het opsporen van beveiligingsproblemen in software. En dat zou het internet zoals wij het kennen kunnen kapotmaken.

Digitale sleutelbos

Wat maakt Mythos dan zo bijzonder? Het model doet niet alleen wat eerdere AI-systemen al konden, namelijk kwetsbaarheden in software opsporen. Het gaat een stuk verder.

Dit is hoe Anthropic wil voorkomen dat AI alles kapotmaakt