©Unsplash

Dit wordt mogelijk de techniek achter de nieuwe Siri
Volgens Bloomberg staan Google en Apple aan de vooravond van een miljardendeal die moet leiden tot een vernieuwde versie van Siri, aangedreven door Google's Gemini-model. Maar wat wordt dan precies de techniek erachter?
Het zou gaan om een taalmodel met 1,2 biljoen parameters dat volledig draait op Apple’s eigen Private Cloud Compute-servers, wat betekent dat Google geen toegang zal hebben tot de data.
Geen vergelijkingsmateriaal
Maar is 1,2 biljoen parameter ‘genoeg’? Dat is moeilijk te evalueren, want er is geen vergelijkingsmateriaal. Grote AI-bedrijven zoals OpenAI, Anthropic en Google zelf maken de grootte van hun nieuwste modellen namelijk niet meer openbaar. Het blijft dus gissen hoe Gemini zich verhoudt tot andere AI-vlaggenschepen
Mixture of experts-architectuur
De nieuwe Siri zal daarnaast mogelijk beschikken over een mixture of experts-architectuur. Dat houdt in dat meerdere gespecialiseerde AI-submodellen samenwerken. Siri zal na een verzoek alleen de relevante ‘experts’ activeren. Zo kan een model met miljarden parameters werken alsof het veel kleiner is.
Dit werkt als volgt: een model met in totaal 1,2 biljoen parameters kan 32 ‘experts’ gebruiken, waarvan er per invoer slechts 2 tot 4 actief zijn. Dat betekent dat op elk moment slechts zo’n 75 tot 150 miljard parameters daadwerkelijk berekeningen uitvoeren – waardoor het model de kracht heeft van een enorm systeem, maar de rekenkosten vergelijkbaar blijven met die van een veel kleiner model.
Als de deal rondkomt wordt Siri volgend jaar dus niet alleen slimmer, maar waarschijnlijk ook een stuk efficiënter.