©Unsplash

Beveiliging chatbots te omzeilen met ASCII-kunst

13 maart om 12:11

Laatste update: 13 maart om 20:20

Andrei Stiru
Redacteur

Ingebouwde veiligheidsmaatregelen in chatbots als ChatGPT, Google Gemini en Claude kunnen omzeild worden door prompts in de vorm van ASCII-kunst in te geven. Dat blijkt uit een Amerikaanse studie.

Onderzoekers hebben een tool ontwikkeld waarmee chatbots in de maling kunnen worden genomen. De tool, ArtPrompt, maakt gebruikt van ASCII-kunst. Dat is een vorm van kunst waarbij afbeeldingen worden gemaakt met behulp van ASCII-karakters. Deze karakters zijn de symbolen die te vinden zijn op een standaardtoetsenbord, zoals letters, cijfers, leestekens en speciale symbolen.

Met ArtPrompt is het mogelijk om ingebouwde veiligheidsmaatregelen van chatbots te omzeilen. Daardoor is het mogelijk om vragen te stellen waarop een chatbot normaal gezien niet kan antwoorden. In een paper die op preprintplatform arXiv gepubliceerd werd, beschrijven de onderzoekers bijvoorbeeld hoe ze ChatGPT zover kregen om uit te leggen hoe je een bom maakt. Een ander voorbeeld in de paper beschrijft hoe de chatbot na een prompt uitlegt hoe je vervalst geld kan produceren.

Meer nodig om chatbots veilig te maken

De technologie werkt op twee manieren. Eerst worden gevoelige woorden in een opdracht gemaskeerd door het systeem, zodat de chatbot niet doorheeft wat er gevraagd wordt. Daarna wordt het woord vervangen door ASCII-kunst. Chatbots hebben daar geen ingebouwd defensiemechanisme tegen en lezen de ASCII-kunst gewoon alsof het een woord is.

ArtPrompt werkt met meerdere versies van ChatGPT, Claude, Gemini en Llama2. De onderzoekers hebben het programma ontwikkeld om aan te tonen dat huidige mechanismen niet volstaan om chatbots veilig te maken. Zij roepen ontwikkelaars op om meer te doen tegen potentieel misbruik. Om misbruik van hun onderzoek te voorkomen, zeggen de wetenschappers dat ze de code en prompts die ze gebruikten zullen delen met de ontwikkelaarsgemeenschap, zodat die de veiligheid van chatbots kan verbeteren.

Meer over AI, of blijf op de hoogte via de Bright Nieuwsbrief.

Meest recent Nieuws
Deze EV-batterij van Samsung is in 9 minuten opgeladen
4 uur en 41 minuten geleden
Nooit meer een CrowdStrike-storing? Deze verandering in Windows moet het voorkomen
6 uur geleden
Blijvende schade aan gecrashte chips van Intel: 'De patch lost niks op'
7 uur geleden
Komt de release van GTA 6 in gevaar door een grote staking?
7 uur geleden
Op dit gebied is Tesla nu ingehaald door de concurrentie
8 uur geleden
Deze update van Philips Hue jaagt inbrekers de stuipen op het lijf
9 uur geleden
Dit zijn de vijf beste elektrische auto’s voor op vakantie
11 uur geleden
VodafoneZiggo blijft maar klanten verliezen, nu ruim 100.000 in een jaar tijd
11 uur geleden
Zo zorg je dat X je berichten niet gebruikt voor het trainen van zijn AI
11 uur geleden
Windows en Android werken binnenkort beter samen
12 uur geleden
Adblockers hebben moeite met nieuw soort reclame op YouTube
13 uur geleden
Fortnite eindelijk weer naar iOS, maar game verdwijnt uit de Galaxy Store
14 uur geleden
Thuisbatterij van Zonneplan heeft nu 'zelfconsumptie': optimaal gebruik van je eigen zonnestroom
16 uur geleden
Acteurs staken weer, na films en series zijn nu games aan de beurt
18 uur geleden
Volvo lijkt terug te komen op EV-belofte en blijft in hybrides investeren
1 dag en 1 uur geleden
Dit lijkt de dikste fatbike van allemaal, maar hij is niet legaal
1 dag en 2 uur geleden
25 juli 2024
Dit weten we nu al over de nieuwe Google Pixel 9-telefoons
1 dag en 4 uur geleden
Sonos zegt sorry voor de app-problemen en komt met deze verbeteringen
1 dag en 6 uur geleden
Google moet nu écht oppassen want hier is SearchGPT
1 dag en 7 uur geleden
iPhones kunnen straks beter tegen een stootje dankzij dit nieuwe Apple-project
1 dag en 7 uur geleden
Deze handige functie van de Google-chatbot komt nu ook naar Nederland
1 dag en 7 uur geleden
Video
Opgelet: jouw iPhone lijkt zo op een Android
1 dag en 11 uur geleden
Project March XI laat lichter exoskelet zien met nieuw enkelgewricht
1 dag en 11 uur geleden
Amerikaans bedrijf wil een zonnepark in de ruimte bouwen
1 dag en 11 uur geleden
Wetenschappers in België gaan misdaden voorspellen met behulp van AI
1 dag en 12 uur geleden

Meer nodig om chatbots veilig te maken

Meest recent Nieuws

Deze EV-batterij van Samsung is in 9 minuten opgeladen

Nooit meer een CrowdStrike-storing? Deze verandering in Windows moet het voorkomen

Blijvende schade aan gecrashte chips van Intel: 'De patch lost niks op'

Komt de release van GTA 6 in gevaar door een grote staking?

Op dit gebied is Tesla nu ingehaald door de concurrentie

Deze update van Philips Hue jaagt inbrekers de stuipen op het lijf

Dit zijn de vijf beste elektrische auto’s voor op vakantie

VodafoneZiggo blijft maar klanten verliezen, nu ruim 100.000 in een jaar tijd

Zo zorg je dat X je berichten niet gebruikt voor het trainen van zijn AI

Windows en Android werken binnenkort beter samen

Adblockers hebben moeite met nieuw soort reclame op YouTube

Fortnite eindelijk weer naar iOS, maar game verdwijnt uit de Galaxy Store

Thuisbatterij van Zonneplan heeft nu 'zelfconsumptie': optimaal gebruik van je eigen zonnestroom

Acteurs staken weer, na films en series zijn nu games aan de beurt

Volvo lijkt terug te komen op EV-belofte en blijft in hybrides investeren

Dit lijkt de dikste fatbike van allemaal, maar hij is niet legaal

25 juli 2024

Dit weten we nu al over de nieuwe Google Pixel 9-telefoons

Sonos zegt sorry voor de app-problemen en komt met deze verbeteringen

Google moet nu écht oppassen want hier is SearchGPT

iPhones kunnen straks beter tegen een stootje dankzij dit nieuwe Apple-project

Deze handige functie van de Google-chatbot komt nu ook naar Nederland

VideoOpgelet: jouw iPhone lijkt zo op een Android

Project March XI laat lichter exoskelet zien met nieuw enkelgewricht

Amerikaans bedrijf wil een zonnepark in de ruimte bouwen

Wetenschappers in België gaan misdaden voorspellen met behulp van AI

Video
Opgelet: jouw iPhone lijkt zo op een Android