Deze computerstemmen van Amazon klinken als mensen: 'Grootste AI-spraakmodel ooit'

©Unsplash

19 februari om 23:22

Laatste update: 22 februari om 12:28

Mark Nuyens
Redacteur

Wie wel eens iets heeft laten voorlezen door de computer of de smartphone, zal het niet ontgaan zijn: een 'cringy' stem die met onverwachte intonaties je zinnen uitspuugt. Maar dankzij AI wordt tekst-naar-spraak ook steeds beter. Amazon heeft nu een nieuw AI-model onthuld, waarmee computerstemmen veel natuurlijker en menselijker klinken.

Onderzoekers van Amazon zeggen 's werelds grootste AI-model te hebben ontwikkeld voor tekst naar spraak, genaamd BASE TTS. Een beetje vergelijkbaar met ChatGPT voor teksten, maar dan voor stemmen. Het nieuwe spraakmodel heeft unieke eigenschappen om zelflerend te zijn en is gerelateerd aan de ontwikkeling van artificial general intelligence (AGI), de fase waarin AI-systemen dezelfde intellectuele taken als mensen kunnen uitvoeren.

Eerst horen, dan geloven...

Bij zo'n aankondiging wil je natuurlijk horen hoe realistisch die stemmen dan wel niet klinken. Amazon heeft hier dan ook een aantal voorbeelden van gepubliceerd, waarvan je hieronder een selectie kan beluisteren. Volgens de onderzoekers zijn de gebruikte zinnen geen toeval: ze horen tot de moeilijkste zinnen voor een computer om correct uit te spreken, omdat ze een complexe opbouw gebruiken.

Toepassingen met andere AI-tools

Tools zoals ChatGPT hebben al aangetoond hoe menselijk AI een antwoord kan geven op bepaalde vragen. Bovendien lanceerde OpenAI vorige week Sora, een tool om realistische video's mee te maken op basis van een tekstuele omschrijving. Voeg hier een zeer realistische stem aan toe en we zullen straks mogelijk niet meer mens van machine kunnen onderscheiden.

Volgens de Amazon-onderzoekers kan hun taalmodel complexe woorden gebruiken, emoties tonen, leestekens correct interpreteren en op een slimme manier vragen stellen.

Hoe meer 'knopjes', hoe beter

De AI-experts bij Amazon AGI hebben hun prestatie gedetailleerd beschreven in een paper, waarin zij aangeven dat hun model gebruik heeft gemaakt van 980 miljoen parameters. Dit betekent dat er bijna een miljard verschillende 'knopjes' zijn die het model kan aanpassen om zijn spraak te verbeteren.

Denk aan een gigantische controlekamer waar elk knopje een klein detail van de spraak beïnvloedt. Bovendien ontdekten de onderzoekers dat er vanaf 150 miljoen parameters een enorme verbetering plaatsvond.

Brits accent het moeilijkst?

Het model is getraind op 100.000 uur opgenomen spraak afkomstig van openbare sites. Bovendien hebben de onderzoekers het model verrijkt door voorbeelden van gesproken woorden en zinnen uit verschillende talen op te nemen, waardoor het naadloos kan omgaan met specifieke nuances en uitspraken. Hoewel het model slaagde voor de Amerikaanse en Spaanse uitspraak, kon het gek genoeg een Brits accent niet helemaal repliceren.

Risico's

Het team van Amazon AGI heeft er momenteel voor gekozen om het model niet vrij te geven aan het publiek uit ethische overwegingen. Bewust van het potentiële misbruik van zulke technologie, gebruiken ze het voorlopig alleen intern als leermiddel. Dit lijkt een slimme keuze, vooral als je bedenkt dat er later dit jaar in de Verenigde Staten presidentsverkiezingen worden gehouden en desinformatie daarbij een groot probleem vormt.

Lees meer nieuws over chatbots en blijf op de hoogte met onze nieuwsbrief.

Meest recent Nieuws
Deze EV-batterij van Samsung is in 9 minuten opgeladen
3 uur en 57 minuten geleden
Nooit meer een CrowdStrike-storing? Deze verandering in Windows moet het voorkomen
5 uur geleden
Blijvende schade aan gecrashte chips van Intel: 'De patch lost niks op'
6 uur geleden
Komt de release van GTA 6 in gevaar door een grote staking?
7 uur geleden
Op dit gebied is Tesla nu ingehaald door de concurrentie
8 uur geleden
Deze update van Philips Hue jaagt inbrekers de stuipen op het lijf
9 uur geleden
Dit zijn de vijf beste elektrische auto’s voor op vakantie
10 uur geleden
VodafoneZiggo blijft maar klanten verliezen, nu ruim 100.000 in een jaar tijd
10 uur geleden
Zo zorg je dat X je berichten niet gebruikt voor het trainen van zijn AI
10 uur geleden
Windows en Android werken binnenkort beter samen
11 uur geleden
Adblockers hebben moeite met nieuw soort reclame op YouTube
12 uur geleden
Fortnite eindelijk weer naar iOS, maar game verdwijnt uit de Galaxy Store
13 uur geleden
Thuisbatterij van Zonneplan heeft nu 'zelfconsumptie': optimaal gebruik van je eigen zonnestroom
16 uur geleden
Acteurs staken weer, na films en series zijn nu games aan de beurt
18 uur geleden
Volvo lijkt terug te komen op EV-belofte en blijft in hybrides investeren
1 dag geleden
Dit lijkt de dikste fatbike van allemaal, maar hij is niet legaal
1 dag en 1 uur geleden
25 juli 2024
Dit weten we nu al over de nieuwe Google Pixel 9-telefoons
1 dag en 4 uur geleden
Sonos zegt sorry voor de app-problemen en komt met deze verbeteringen
1 dag en 6 uur geleden
Google moet nu écht oppassen want hier is SearchGPT
1 dag en 6 uur geleden
iPhones kunnen straks beter tegen een stootje dankzij dit nieuwe Apple-project
1 dag en 6 uur geleden
Deze handige functie van de Google-chatbot komt nu ook naar Nederland
1 dag en 7 uur geleden
Video
Opgelet: jouw iPhone lijkt zo op een Android
1 dag en 10 uur geleden
Project March XI laat lichter exoskelet zien met nieuw enkelgewricht
1 dag en 10 uur geleden
Amerikaans bedrijf wil een zonnepark in de ruimte bouwen
1 dag en 11 uur geleden
Wetenschappers in België gaan misdaden voorspellen met behulp van AI
1 dag en 11 uur geleden

Eerst horen, dan geloven...

Toepassingen met andere AI-tools

Hoe meer 'knopjes', hoe beter

Brits accent het moeilijkst?

Risico's

Meest recent Nieuws

Deze EV-batterij van Samsung is in 9 minuten opgeladen

Nooit meer een CrowdStrike-storing? Deze verandering in Windows moet het voorkomen

Blijvende schade aan gecrashte chips van Intel: 'De patch lost niks op'

Komt de release van GTA 6 in gevaar door een grote staking?

Op dit gebied is Tesla nu ingehaald door de concurrentie

Deze update van Philips Hue jaagt inbrekers de stuipen op het lijf

Dit zijn de vijf beste elektrische auto’s voor op vakantie

VodafoneZiggo blijft maar klanten verliezen, nu ruim 100.000 in een jaar tijd

Zo zorg je dat X je berichten niet gebruikt voor het trainen van zijn AI

Windows en Android werken binnenkort beter samen

Adblockers hebben moeite met nieuw soort reclame op YouTube

Fortnite eindelijk weer naar iOS, maar game verdwijnt uit de Galaxy Store

Thuisbatterij van Zonneplan heeft nu 'zelfconsumptie': optimaal gebruik van je eigen zonnestroom

Acteurs staken weer, na films en series zijn nu games aan de beurt

Volvo lijkt terug te komen op EV-belofte en blijft in hybrides investeren

Dit lijkt de dikste fatbike van allemaal, maar hij is niet legaal

25 juli 2024

Dit weten we nu al over de nieuwe Google Pixel 9-telefoons

Sonos zegt sorry voor de app-problemen en komt met deze verbeteringen

Google moet nu écht oppassen want hier is SearchGPT

iPhones kunnen straks beter tegen een stootje dankzij dit nieuwe Apple-project

Deze handige functie van de Google-chatbot komt nu ook naar Nederland

VideoOpgelet: jouw iPhone lijkt zo op een Android

Project March XI laat lichter exoskelet zien met nieuw enkelgewricht

Amerikaans bedrijf wil een zonnepark in de ruimte bouwen

Wetenschappers in België gaan misdaden voorspellen met behulp van AI

Video
Opgelet: jouw iPhone lijkt zo op een Android