
© Unsplash
Dit gelekte AI-model is zo krachtig dat zelfs zijn maker er een beetje bang voor is
AI-bedrijf Anthropic heeft zichzelf in verlegenheid gebracht. Een verkeerd ingestelde database heeft onderzoekers toegang gegeven tot duizenden documenten die nooit gepubliceerd hadden mogen zijn. De meest pikante vondst: plannen voor een AI-model dat alles overtreft wat het bedrijf eerder maakte.
Het lek ontstond door een simpele fout. Anthropic geeft inmiddels toe dat een medewerker het contentmanagementsysteem (CMS) verkeerd had ingesteld. Elk bestand dat je uploadt naar dat systeem is meteen zichtbaar voor de hele wereld, behalve als je zelf de instellingen aanpast. Iemand was dat kennelijk vergeten te doen voor bijna 3.000 bestanden.
Onderzoekers van de Universiteit van Cambridge en het bedrijf LayerX Security stuitten vervolgens op deze digitale schatkist vol interne bestanden. Nieuwssite Fortune gaf het bedrijf vervolgens een seintje (nadat het uiteraard de bestanden onder de loep nam). Binnen enkele uren was de toegang dichtgetimmerd.
Codenaam Capybara
De meest opmerkelijke vondst was een document over een model dat intern "Capybara" wordt genoemd. Voor consumenten zou het in de toekomst op de markt komen als Claude Mythos. Het gaat om een volledig nieuwe klasse die uitstijgt boven alles wat Anthropic momenteel aanbiedt.