Stemherkenning

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Stemherkenning of sprekerherkenning is een techniek waarbij de stem van een specifieke persoon wordt herkend, bijvoorbeeld ten behoeve van identificatie. Stemherkenning moet niet worden verward met spraakherkenning, dat bedoeld is om gesproken tekst automatisch om te zetten naar geschreven tekst of computeropdrachten. Stemherkenning kent twee toepassingsgebieden:

  • het herkennen van een persoon zonder dat deze tevoren bekend is
  • het bevestigen van een identiteit

In het eerste geval zal het stempatroon moeten worden vergeleken met een serie stemmen in een database, in het tweede geval met een enkel stempatroon waarvan vaststaat dat het bij de persoon hoort.

Er zijn diverse problemen die men tegenkomt bij een implementatie van stemherkenning. Een ervan is, dat de menselijke stem onder bepaalde omstandigheden vervormd kan worden, zoals bij een verkoudheid. Ook zal van veel personen de stem bij het ouder worden enigszins veranderen. Een ander probleem is achtergrondruis die de stemherkenning kan bemoeilijken: het spraaksignaal dient adequaat te worden onderscheiden van de ruis. Verder dient men mogelijk misbruik tegen te gaan, in de vorm van imitatie of het afspelen van geluidsopnames.

Vanwege het feit, dat de identificatie van een persoon op grond van stemherkenning vaak niet volledig sluitend is, wordt deze techniek wel in aanvulling op andere technieken gebruikt, zoals het nemen van een vingerafdruk of irisscan.

ABN AMRO gaat stemherkenning gebruiken als verificatiemiddel bij telefonisch bankieren[1]. Hierbij moeten klanten het rekeningnummer inspreken. Het is dus een combinatie van stem- en spraakherkenning.

Partijen die stemidentificatie engines leveren zijn:

Partijen die stemidentificatie software integreren in applicaties zijn:

Bronnen, noten en/of referenties