Unsplash

Google’s AI Overview liegt miljoenen keren per uur, blijkt uit onderzoek
Iedereen die wel eens iets opzoekt via Google, is inmiddels bekend met hun AI Overview. Bovenaan de zoekresultaten verschijnen door Gemini gegenereerde antwoorden. Maar heel betrouwbaar zijn die AI-antwoorden niet altijd. Uit een nieuw onderzoek van The New York Times blijkt nu dat 1 op de 10 antwoorden niet klopt, en dat is behoorlijk veel.
Kritiek op de AI Overview is er eigenlijk al sinds de release in 2024. The New York Times wilde weten hoe accuraat de resultaten nou echt zijn. Dus gingen ze de antwoorden analyseren met behulp van een startup genaamd Oumi. Door een verifieerbare vragenlijst van meer dan 4000 vragen door Gemini te laten beantwoorden, kan worden vastgesteld hoe waarheidsgetrouw het is. Ten tijde van Gemini 2.5 was dat 85%, en met Gemini 3 is het 91%.
Dat is een verbetering, maar gezien de hoeveelheid zoekopdrachten die Google krijgt, komt het aantal foute antwoorden nog steeds behoorlijk hoog uit. Zeker tientallen miljoenen resultaten per dag kloppen niet.
Vreemde fouten
Er worden verschillende voorbeelden gegeven waarbij de AI fouten maakt. Zo is één van de vragen: “Sinds welk jaar is Bob Marley’s oude huis een museum?” Bij deze vraag citeert de AI drie pagina’s, waarvan twee die datum niet eens noemen. De derde bron is Wikipedia, en deze pagina meldt twee conflicterende datums, waarvan Gemini zelfverzekerd de verkeerde kiest.
Ook werd gevraagd wanneer Yo Yo Ma werd opgenomen in de ‘Classical Music Hall of Fame’. Maar volgens de AI bestaat deze Hall of Fame helemaal niet, terwijl de site van de organisatie werd gebruikt als bron.
Google zet zijn vraagtekens bij deze test. Woordvoerder Ned Adriance zegt tegen de Times dat de vragenlijst simpelweg foutieve informatie bevat. “Er zitten serieuze gaten in dit onderzoek. Het reflecteert niet wat mensen daadwerkelijk op Google zoeken.”







