©Unsplash

OpenAI introduceert nieuwe spraakfuncties voor AI-apps
OpenAI zet vol in op spraakgestuurde AI. Het bedrijf heeft donderdag meerdere nieuwe functies aangekondigd waarmee ontwikkelaars apps kunnen bouwen die gesprekken kunnen voeren, live kunnen vertalen en direct spraak naar tekst kunnen omzetten.
Het doel van OpenAI is om voice AI een stuk slimmer en bruikbaarder te maken dan de huidige generatie chatbots en spraakassistenten.
GPT-Realtime-2
De belangrijkste toevoeging is GPT-Realtime-2, een nieuw stemmodel dat realistische gesprekken moet kunnen voeren met gebruikers. Volgens OpenAI gaat het model verder dan simpele vraag-en-antwoordinteracties. Het systeem is gebouwd met redeneervermogen op GPT-5-niveau, waardoor het complexere opdrachten en gesprekken beter moet begrijpen.
In de praktijk betekent het vooral dat AI minder robotachtig moet aanvoelen. In plaats van korte, losse reacties moet de technologie gesprekken beter kunnen volgen, context onthouden en logischer reageren terwijl iemand praat.
Live vertaalfunctie
Daarnaast introduceert OpenAI GPT-Realtime-Translate. Die functie kan gesprekken live vertalen terwijl iemand praat, zonder merkbare vertraging. Het systeem ondersteunt meer dan zeventig talen als invoer en kan vertalen naar dertien talen als output.
Dat opent de deur naar realtime gesprekken tussen mensen die compleet verschillende talen spreken. Denk aan klantenservice, internationale meetings, onderwijs of livestreams waarbij een AI direct vertaalt terwijl iemand aan het woord is.
Transcribeerfunctie
Ook presenteerde het bedrijf GPT-Realtime-Whisper, een nieuwe spraak-naar-tekstfunctie die gesprekken live kan transcriberen terwijl ze plaatsvinden. In feite verandert OpenAI hiermee audio direct in tekst terwijl een gesprek nog bezig is.
AI kan straks echt meedenken tijdens een gesprek
Volgens OpenAI verschuift voice AI daardoor van simpele spraakcommando’s naar systemen die daadwerkelijk kunnen meedenken tijdens een gesprek. De technologie moet niet alleen luisteren, maar ook redeneren, vertalen, transcriberen en uiteindelijk acties uitvoeren terwijl een conversatie bezig is.
Voor bedrijven zijn de toepassingen duidelijk. Vooral klantenservices, onderwijsplatforms, mediaorganisaties en creatorplatforms kunnen profiteren van AI die realtime gesprekken verwerkt. Een klantenservicebot die direct meerdere talen spreekt of een livestream die automatisch vertaald en ondertiteld wordt, komt hiermee dichterbij.
Gevaar ligt ook op de loer
Tegelijkertijd roept de technologie ook vragen op. Hoe realistischer AI-stemmen worden, hoe makkelijker ze theoretisch kunnen worden misbruikt voor spam, fraude of manipulatie. OpenAI zegt daarom beveiligingen te hebben ingebouwd die gesprekken kunnen stoppen wanneer systemen schadelijke of misbruikende inhoud detecteren.



















