© Microsoft

Microsoft-software herkent spraak even goed als mensen
Spraakherkenning van Microsoft is in staat om gesproken taal net zo nauwkeurig te registeren als mensen.
Onderzoekers van Microsoft schrijven over de door hen ontwikkelde software in een paper. Volgens Microsoft is dit de meest geavanceerde spraakherkenningssoftware die er bestaat. In het onderzoek wordt gesproken van een foutmarge van 5,9 procent. Dat zou overeen komen met hoe mensen spraak transcriberen.
"Deze mijlpaal betekent niet dat de computer elk woord perfect herkent", schrijven de onderzoekers. "Dat doen mensen trouwens ook niet." De software verstaat woorden soms net iets anders dan ze worden uitgesproken. Zo hoort de computer soms 'have' als er 'is' wordt gezegd, of 'a' in plaats van 'the'. Dat komt overeen met wat mensen verstaan.
Neuraal netwerk
Een maand geleden had de software een foutmarge van 6,3 procent. Het doel van onderzoekers was toen om nauwkeurigheid van mensen te evenaren, wat nu al is gelukt. De software maakt gebruik van een neuraal netwerk waarmee het data op een soortgelijke manier verwerkt als mensen. Deze technologie zou gebruikt kunnen worden voor de spraakassistent Cortana en de Xbox die werkt met spraakherkenning. Ook zou de spraakherkenningssoftware in productiviteitsapps gebruikt kunnen worden, bijvoorbeeld om te dicteren in Word.
Google en Apple
Microsoft is overigens niet het enige bedrijf dat hard werkt aan het verbeteren van spraakherkenningssoftware. Ook Google en Apple timmeren met hun spraakassistenten hard aan de weg.
Voor het verbeteren van Google Assistent wordt bijvoorbeeld ook een neuraal netwerk gebruikt, net zoals voor Apple's Siri. Ook Google Translate gebruikt zo'n netwerk om net zo goed te worden in vertalen als menselijke tolken.




