©Unsplash

Google's nieuwste AI, Gemini 1.5, doet één ding gigantisch veel beter dan GPT-4

Google's nieuwste AI, Gemini 1.5, doet één ding gigantisch veel beter dan GPT-4

16 februari - 11:15

Google is echt op stoom in zijn strijd met OpenAI op het gebied van kunstmatige intelligentie. Het nieuwe Gemini 1.5 scoort 87 procent beter dan Gemini 1.0 en heeft een gigantisch referentiekader.

De eerste AI van Google, Bard, leek een verschrikte reactie op het plotselinge succes van ChatGPT van OpenAI. Inmiddels zijn we een jaar verder en is Bard opgegaan in Gemini – dat nu een grote nieuwe versie heeft. Gemini 1.5 is de nieuwste versie van Google's large language model. Binnenkort komt het beschikbaar voor alle gebruikers, vanaf vandaag al voor bedrijven en ontwikkelaars. Het taalmodel moet dan ook alles kunnen van persoonlijke assistent tot veelzijdige tool voor bedrijven.

Het eerste model dat wordt getest is Gemini 1.5 Pro, volgens Google een taalmodel van gemiddeld formaat dat toch al op hetzelfde niveau functioneert als het onlangs onthulde Gemini 1.0 Ultra. Dat klinkt vaag, en daarom concreter: Gemini 1.5 Pro verslaat 1.0 Pro in 87 procent van de benchmark-tests. Bovendien belooft het nieuwe model sneller en efficiënter te werkt te gaan.

Enorm 'referentiekader', groter dan GPT-4

De werking van AI wordt altijd meteen ontzettend technisch. Een belangrijke graadmeter is het context window, een soort van het referentiekader waar de AI naar kijkt. Hoe groter, hoe beter want dan heeft de AI meer informatie om mee te werken, en kan het sneller en completer antwoord geven. Dat 'referentiekader' wordt gemeten in tokens, waarbij elke token een paar tekens van een woord bevat. GPT-4 van OpenAI heeft een kader van 128.000 tokens, Gemini 1.0 Pro haalt de 32.000 maar dan Gemini 1.5: die heeft een enorme 1 miljoen tokens.

Google-topman Sundar Pichai maakt het tastbaar: "Dat is 10 of 11 uur aan video, tienduizenden regels programmeertaal." En als dat allemaal in dat in dat context window past, kan de chatbot over al die informatie parate antwoorden geven. Volgens Pichai werkt Google al een aan context window van 10 miljoen tokens groot: daar past heel Game of Thrones in één keer in. Je kan de AI dan hele specifieke vragen stellen: 'laat me precies die en die scène zien' bijvoorbeeld, of 'hoeveel minuten zijn de draken in beeld'?

Wat heb je daar praktisch aan? Volgens Pichai kan zijn AI dan simpelweg met meer factoren rekening houden, door meer informatie bij elkaar te pakken. Bedrijven kunnen plannen aanvullen met persoonlijke profielen van medewerkers. Filmmakers kunnen volgens Pichai hun hele film in Gemini laden en vragen wat recensenten ervan zouden vinden. De AI kan met gemak heel veel financiële informatie bekijken, controleren en vergelijken."

Meer kunstmatige intelligentie en blijf op de hoogte met onze nieuwsbrief.