©Unsplash

©Unsplash

Claude’s nieuwe AI-model Opus 4.8 gaat je de harde waarheid vertellen

Praat mee!
Redacteur

Claude heeft zijn nieuwe AI-model op de wereld losgelaten en het heet Opus 4.8. Anthropic noemt het een merkbare, maar wel bescheiden verbetering is ten opzichte van zijn voorganger. Het gaat daarbij vooral om de eerlijkheid van de AI wanneer het eigenlijk niet zo zeker van zijn zaak is.

In een blog legt Anthropic meer uit over het nieuwe model, waarbij het onder andere aangeeft dat het model wat eerlijker is. Het betekent dat hij geen dingen meer gaat zeggen die hij niet kan beargumenteren. Anthropic zegt dat het een algemeen probleem is met AI-modellen dat ze soms iets te kort door de bocht zijn en vervolgens met een bepaalde attitude presenteren wat ze hebben bedacht, ook als daar eigenlijk maar weinig bewijs voor is. 

Opus 4.8

Opus 4.8 zal het niet altijd goed doen, maar zal eerder bepaalde onzekerheden laten blijken. Het zou 4 keer minder snel dan zijn voorganger oké zijn met fouten in de code die het heeft geschreven. “De evaluatie toonde ook aan dat Opus 4.8 aanzienlijk minder vaak misalignment-gedrag vertoont (zoals misleiding of medewerking aan verkeerd gebruik) dan Opus 4.7, en vergelijkbaar scoort met ons best afgestemde model, Claude Mythos Preview.“

Nieuw is ook dat je als gebruiker meer kunt bepalen over hoeveel moeite Opus 4.8 in een taak steekt. Als iets meer moeite kost, kost het meer tokens en je krijgt dan de optie om een antwoord te krijgen waar minder moeite in is gestoken. Zo houd je iets meer grip op de limieten van de AI. Ook komt het met het nieuws dat Claude grotere taken dan eerder aankan. Het maakt daarbij gebruik van dynamische workflows in de research-preview, waardoor Claude het werk plant en honderden subagenten kan aansturen die op hun beurt weer allemaal activiteiten uitvoeren. Het checkt vervolgens waar die agents mee terugkomen en dan krijg je dat als gebruiker terug.

Claude Mythos Preview

Anthropic geeft aan wat de toekomst brengt: “Daarnaast zijn we van plan om een nieuwe klasse modellen uit te brengen met een nog hogere intelligentie dan Opus. Als onderdeel van Project Glasswing gebruikt een klein aantal organisaties momenteel Claude Mythos Preview voor cybersecurity-werkzaamheden. Modellen van dit niveau vereisen sterkere cyberbeveiligingen voordat ze algemeen beschikbaar gesteld kunnen worden. We boeken snelle vooruitgang bij het ontwikkelen van deze veiligheidsmaatregelen en verwachten Mythos-klasse modellen in de komende weken naar al onze klanten te kunnen brengen.”

Claude Opus 4.8 is vanaf nu beschikbaar. 

Video