Nu je het zegt

stemmen | Moeiteloos herkennen we stemmen. Wetenschappers weten alleen niet hoe. Gelukkig ontdekten ze iemand die geen stem van een andere kan onderscheiden.

Ze is de vrouw die geen stemmen kan herkennen. Deze Britse, die we alleen kennen bij haar initialen: K.H., weet zelfs niet met wie ze spreekt als haar dochter belt en zegt: 'Hoi, met mij'. K.H. is in de zestig, en heeft een carrière als consultant in het bedrijfsleven achter de rug. Op kantoor had ze allerlei handigheidjes bedacht om haar probleem te omzeilen. Zo nam ze alleen de telefoon op als iemand had afgesproken haar te bellen.


Op een dag las ze nietsvermoedend in een populair-wetenschappelijk tijdschrift over mensen die geen gezichten kunnen herkennen. "Dat heb ik ook", dacht ze meteen, "maar dan met stemmen".


Onderzoekers aan het University College Londen wilden haar graag testen. Ze kenden al voorbeelden van patiënten die door hersenletsel of dementie moeite hadden met stemherkenning, maar deze vrouw had dat naar eigen zeggen al van kinds af aan. En warempel, als de onderzoekers K.H. een stem lieten horen, en een kwartier later weer, had ze geen idee of het om dezelfde persoon ging. Ook stemmen van beroemdheden als Margaret Thatcher deden bij haar geen belletjes rinkelen. Alleen de stem van Bond-acteur Sean Connery pikte ze eruit; zijn Schotse tongval verraadde hem.


K.H. bleek verder gezond, haar gehoor en spraak werkten goed en ze kon prima horen of een spreker blij klonk of boos. Alleen het koppelen van een stem aan een persoon ging niet. Phonagnosie, wordt haar aandoening genoemd. In 2008 werd haar casus beschreven in het wetenschappelijke tijdschrift Neuropsychologia. Nu de aandoening bekendheid krijgt duiken er meer mensen op die zich erin herkennen; in 2014 werden twee Duitse gevallen beschreven.


Iemand met phonagnosie treffen is voor stemonderzoekers als het vinden van een parel in een oester: zeldzaam en waardevol. De aandoening lijkt erop te wijzen dat stemherkenning in de hersenen werkt via een ander mechanisme dan spraakherkenning. Het is een eerste stapje op weg naar het beantwoorden van een grote vraag waarover steeds meer wetenschappers zich buigen: hoe komt het dat mensen zo goed zijn in stemmen herkennen?


Het lijkt een triviale vraag, maar de Amerikaanse onderzoekster Jody Kreiman vindt het een smet op het blazoen van de wetenschap dat we zo weinig over stemherkenning weten. "Het is een tekort in ons begrip van het menselijk gedrag."


Kreiman is professor in hoofd- en nekchirurgie aan de Universiteit van Californië in Los Angeles (UCLA). Haar titel doet vermoeden dat ze aan de operatietafel staat, maar ze is taalkundige en werkt in het stemperceptie-laboratorium van de universiteit.


Onmisbaar


In haar onderzoek probeert Kreiman erachter te komen welke kenmerken van een stem ervoor zorgen dat die herkenbaar is. Uiteindelijk zouden de keel-neus-oorartsen gebaat kunnen zijn bij haar resultaten. Zij willen maar al te graag weten welke kenmerken van een stem cruciaal zijn voor herkenning, om patiënten met stem-of gehoorproblemen beter te kunnen helpen.


Het herkennen van een stem is een onmisbare sociale vaardigheid. Evolutionair gezien is het een zelfs een overlevingsmechanisme. Jagers en verzamelaars konden elkaar in een donker bos herkennen aan een elkaars stem. Baby's herkennen de stem van hun moeder. Een moederdier hoort aan een enkele schreeuw of haar jong in de problemen is. Een stem draagt allerlei informatie in zich. Je kunt aan je zus horen of ze moe is, en in een stem kan doorklinken of iemand het beste met je voor heeft. Als dat niet zo lijkt te zijn, pas je je gedrag daarop aan.


Een stem is geen simpele optelsom van fysieke factoren zoals de bouw van ons strottenhoofd of de lengte van de stembanden, zegt Kreiman. Ja, een mannenstem is lager dan een vrouwenstem omdat zijn stembanden langer zijn. En de positie van je tong speelt een rol in het geluid dat je produceert. Maar toch kun je niet precies voorspellen hoe iemand klinkt. Emoties, ademhaling en houding spelen ook een rol.


Stel je voor, zegt Kreiman, dat je een bepaalde zin dagelijks uitspreekt in een opnameapparaat, op honderd achtereenvolgende dagen. Iedere dag zal er een miniem verschil zijn. De ene keer dat je hem uitspreekt zit je net op een ander moment in je ademhalingscyclus. De volgende dag ben je hees door dat feestje. Zelfs of je rechtop zit of onderuitgezakt zal je stem beïnvloeden. Toch is het waarschijnlijk dat je vrienden je herkennen in de meeste opnames. Aardig knap, van ons brein.


Stukje bij beetje proberen Kreiman en haar team nieuwe puzzelstukjes te leggen die bijdragen aan een beter begrip van stemherkenning. In een van haar recente onderzoeken vroeg ze vijftig vrouwen om vijf zinnen op drie verschillende dagen tweemaal te lezen. Die stemmen analyseert ze op de computer. Ze kijkt dan naar zo'n vijftien akoestische kenmerken, zoals als de grondtoon van de stem, toonhoogte, luidheid en timbreverschillen. Digitaal kan ze die aspecten manipuleren, kleine veranderingen maken. Als ze de originele en bewerkte geluidsfragmenten voorlegt aan luisteraars, kan ze steeds accurater bepalen wat een stem herkenbaar maakt en wanneer een stem onherkenbaar wordt.


Hersenonderzoek


Om uit te vinden hoe het komt dat mensen zo goed zijn in het herkennen van stemmen wordt ook veel hersenonderzoek gedaan. Aan het Max Planck Instituut voor Psycholinguïstiek in Nijmegen ontdekten wetenschappers bijvoorbeeld meer over de manier waarop we stemmen opslaan in ons brein.


Taalwetenschapper Attila Andics bekeek tijdens zijn promotieonderzoek met behulp van fMRI-scans - een techniek om hersenactiviteit te meten tijdens het uitvoeren van een taak of opdracht- welke hersengebieden actief werden als luisteraars bekende of nieuwe stemmen hoorden.


Andics speelde verschillende opnames van woorden af en vroeg luisteraars te benoemen of ze dezelfde spreker of een andere spreker hoorden. Wat bleek? De ene spreker was makkelijker te herkennen dan de andere, en sommige klanken gaven meer informatie over een spreker. Als iemand een M-klank uitspreekt, is het bijvoorbeeld makkelijker om die persoon te herkennen, dan bij een L.


Hoe dat komt, dat weten we nog niet precies, zegt James McQueen, hoogleraar spraak en leren aan de Radboud Universiteit. Maar wat we wel weten is dat iedereen een soort prototypische stem heeft opgebouwd. In je leven hoor je heel veel stemmen en geleidelijk aan bouw je een representatie op van de gemiddelde stem. "Als je een nieuwe stem hoort, plaats je die vervolgens op afstand van dat prototype", zegt McQueen. Een stem of klank die lijkt op veel stemmen en klanken die je eerder hebt gehoord, zal moeilijker te onderscheiden zijn.


Aan een nieuwe stem moet je even wennen, weet McQueen. Je brein is in de eerste paar minuten van een gesprek als het ware bezig te analyseren hoe iemand praat. Denk aan een machine die moet worden afgesteld. Stel, je ontmoet Johan, die een hele diepe stem heeft, waardoor de klanken die hij uitspreekt net iets anders klinken. Daar stelt je brein zich op in, om uiteindelijk de boodschap makkelijker te kunnen begrijpen. Na een tijdje weet je brein dat, en kun je je helemaal op de boodschap richten. Je bent dan sneller geworden in het herkennen van de volgende woorden die Johan zegt.


Het wonderlijke is dat die configuraties volgens McQueen lang bewaard blijven in ons geheugen. Het doet hem denken aan een archiefkast, met laatjes waarin alle sprekers en spreeksters zitten opgeslagen. Die archiefkast is goed geordend, want als je Johan over een jaar weer tegenkomt, kan je brein zijn laatje opentrekken, zegt McQueen. "Je zult zijn boodschap sneller oppikken, dan toen hij voor het eerst tegen je praatte."


Betekent dit dat het makkelijker is om te luisteren naar mensen die we al kennen, dan naar onbekenden? McQueen denkt van wel, maar hij wil door onderzoek nog meer te weten komen over de rol van de stemverschillen in het verwerken van spraak. Over het herkennen van stemmen is het laatste woord dus nog niet gezegd.

Luid en duidelijk betalen

Wat hebben we eraan om meer te leren over de ingenieuze manier waarop mensen stemmen herkennen? Niet alleen robotbouwers willen dat graag weten; steeds vaker worden biometrische gegevens gebruikt in veiligheidssystemen. In de toekomst zou een luchtvaartmaatschappij bijvoorbeeld stemherkenning kunnen gebruiken om reizigers te identificeren. ING Bank heeft al een mobiele applicatie die het mogelijk maakt om in te loggen en betalingen te autoriseren met je stem. De software vraagt een gebruiker eerst om deze zin uit te spreken: 'Luister naar mijn stem en je weet wie ik ben'. Vervolgens wordt dit unieke stemprofiel opgeslagen.


Hoe kan het dat de bank deze technologie al gebruikt, terwijl wetenschappers nog zoveel vraagtekens hebben over stemherkenning?


Het gaat hier om authenticatie, niet om identificatie, zegt de Amerikaanse stemexpert Jody Kreiman. Ze noemt twee redenen waarom deze spraaktechnologie al veilig gebruikt kan worden: de wachtwoordzin bestaat uit steeds weer dezelfde woorden, én de gebruiker doet z'n best om herkend te worden. Bovendien is het geen ramp als de gebruiker niet wordt binnengelaten, bijvoorbeeld omdat hij verkouden is. "Dan is er in dit soort systemen vaak nog een pincode of wachtwoord als achtervang."

Meer over

Wilt u iets delen met Trouw?

Tip hier onze journalisten

Op alle verhalen van Trouw rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@trouw.nl.
© 2020 DPG Media B.V. - alle rechten voorbehouden