Spraakherkenning

Om een raadsvergadering te ondertitelen, zal een computer de stad moeten leren kennen

Raadsvergadering in Den Haag ANP BART MAATBeeld ANP

Informatie op overheidswebsites moet toegankelijk zijn voor iedereen. De techniek van spraakherkenning helpt daarbij.  

Iedere Utrechter weet dat Kanaleneiland een wijk is, en ‘op Kanaleneiland’ een logisch zinsdeel. Maar hoe leer je dat een computer? Voor die uitdaging staan gemeenten en softwareontwikkelaars nu raadsvergaderingen moeten worden ondertiteld.

Het voordeel van een raadsvergadering is dat raadsleden in een microfoon spreken en – als het meezit – niet allemaal door elkaar praten. Dat betekent dat de software die het gesproken woord moet vertalen in geschreven tekst, kan werken met helder geluid. Maar er zijn genoeg uitdagingen, ondervond Scriptix, een Nederlands bedrijf dat raadsvergaderingen automatisch ondertitelt.

Neem politiek jargon, namen van raadsleden, verhaspelingen, dialecten of typische regiogebonden termen. “Dat moet je trainen”, zegt Arthur Brockhoff van Arbor Media, de partner van Scriptix. “In het ideale geval per gemeente. We hebben daar in Den Haag bijvoorbeeld 1600 vergaderingen uit het verleden met bijbehorende transcripten voor gebruikt.”

Eerste stappen naar toegankelijkheid

Overheidswebsites moeten sinds een maand hun digitale toegankelijkheid op orde hebben. Dat betekent dat iedereen alle informatie op de sites moet kunnen begrijpen, dus ook slechtzienden en slechthorenden. De verplichting geldt voor video’s die online worden gezet, maar niet voor live uitzendingen.

Hoewel niet bekend is hoeveel gemeenten video’s van hun raadsvergaderingen inmiddels ondertitelen, is wel duidelijk dat de toegankelijkheid op veel plekken nog niet op orde is. Van de overheidssites met een toegankelijkheidsverklaring voldeed eind vorige maand 4 procent volledig aan alle eisen en 20 procent voldeed gedeeltelijk. De helft heeft wat eerste stappen gezet en een kwart doet nog niets.

De gemeente Den Haag gebruikt, net als Utrecht en de provincie Noord-Brabant, de techniek van Scriptix. D66-raadslid Daniël Scheper maakte zich hard voor ondertiteling. “Toegankelijkheid staat niet bovenaan de prioriteitenlijst. Ik ben zelf kind van dove ouders, voor mij is het logisch om ermee bezig te zijn. Juist bij zoiets dicht bij huis als de gemeentepolitiek heb je de verantwoordelijkheid dat iedereen moet kunnen volgen wat er gebeurt.” Bovendien heeft een groeiende groep ouderen baat bij ondertiteling, aldus Scheper. 

De context meewegen

De software van Scriptix probeert vast te stellen wat er wordt gezegd tijdens een raadsvergadering. Daarbij kijkt het  programma niet alleen naar elk woord apart, maar ook naar de context waarin iets wordt gezegd. Zo kan de meest logische vertaling worden gekozen.

Dat betekent niet dat de computer ook snapt waar het over gaat. Net zo min herkent die emotie. Arthur Brockhoff: “Dat sentiment kan tijdens een raadsvergadering wel heel belangrijk zijn. Als je het bijvoorbeeld hebt over ‘de jongens van de Rabobank’, dan zorgt de intonatie ervoor of je dat positief of negatief bedoelt. De techniek van de emotieherkenning is wel in ontwikkeling, maar het speelt bij ondertiteling nu geen rol.” Of dat afdoet aan de toegankelijkheid? “Gelukkig kan de doelgroep over het algemeen heel goed non-verbale communicatie lezen.”

Perfect is de spraakherkenning trouwens niet. Volgens Brockhoff zit de software van Scriptix er, na een specifieke training voor een gemeente, bij zo’n 8 procent van de woorden naast. Dat is in de wereld van de spraakherkenning een goede score, zegt hij. Het betekent wel dat je handmatig woorden die de computer niet goed heeft herkend moet verbeteren. Daar leert de software dan weer van. “Dat trainen zal je altijd moeten blijven doen, want een taal leeft. Covid werd een paar maanden geleden ook nog niet herkend.”

Lees ook:

Cadeautje bestellen? Google Assistent spreekt Nederlands

Tal van bedrijven, waaronder Google, werken aan de verbetering van spraakherkenning. 

Meer over

Wilt u iets delen met Trouw?

Tip hier onze journalisten

Op alle verhalen van Trouw rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@trouw.nl.
© 2021 DPG Media B.V. - alle rechten voorbehouden