Al zolang er hoortoestellen met directionele microfoons bestaan, wordt verondersteld dat dragers kijken naar degene die ze willen verstaan. Dat is een interessante en veelgehoorde theorie die aannemelijk lijkt maar dat vaak niet is. Neem nou dit voorbeeld. Stel dat u op de derde rij zit bij een lezing over hoortoestellen. De spreker staat op een podium, ongeveer 60° links van u, en praat over directionele microfoons. Met een laserpen geeft hij op een scherm recht voor u uitleg bij een diagram. Kijkt u naar de spreker of naar het scherm?

Deze situatie is geen uitzondering. Ga maar na. Een ober vraagt over uw schouder of u vis of rund wilt eten. Uw kinderen praten vanaf de achterbank van de auto. Kijkt u naar hen of naar de weg? Uw partner leunt in de kerk naar u toe en fluistert dat u een koffievlek op uw overhemd heeft. Kortom, een groot deel van de tijd kijken we niet naar degene naar wie we luisteren.

Hoe vaak zijn interessante signalen eigenlijk ergens anders dan recht voor ons? Walden et al. (2004)1 zochten het uit. Ze vroegen zeventien dragers van hoortoestellen om op zeven dagen (in een periode van vier weken) verschillende aspecten van wenselijke signalen en geluiden bij te houden. De deelnemers meldden 1586 luisterervaringen waarbij spraak een rol speelde. Ze gaven aan dat in 1268 gevallen spraak van ergens voor hen kwam, en in 318 gevallen dus niet. Anders gezegd gaven luisteraars dus aan dat 80% van de tijd spraak van voren kwam en 20% van de tijd uit een andere richting. Spraak komt dus vrij vaak niet van voren. De aanname dat mensen kijken naar degene naar wie ze luisteren, is dus maar in 80% van de gevallen correct.

Waarom zijn producenten van hoortoestellen dan zo gefocust op dit idee? Deels omdat het daar vroeger mee begon. We hadden geen keus. Hoortoestellen konden nog niet bepalen uit welke richting spraak kwam. Dat veranderde toen SpeechPro werd geïntroduceerd in hoortoestellen van Unitron. SpeechPro gebruikt binaurale akoestische signaalverwerking om doorlopend te bepalen of spraak van voren, rechts, links of achteren komt. Dit systeem kan heel nauwkeurig vaststellen waar spraak vandaan komt door te combineren wat de microfoons van het hoortoestel opvangen. Deze input wordt gedeeld tussen beide delen van het hoortoestel.

Het kan in een situatie met achtergrondgeluid grote voordelen hebben om te weten waar de gewenste spraak vandaan komt. Het maakt het mogelijk om het doelgebied van de directionele microfoons naar de spraak te richten, weg van storende geluiden. Bovendien kunnen andere richting-afhankelijke aanpassingen worden gedaan voor nog betere prestaties. Neem bijvoorbeeld het microfoonlocatie-effect (MLE) van RIC-toestellen (receiver-in-canal) met microfoons aan de bovenkant van de oorschelp. Dit effect is voor geluid van voren anders dan voor geluid van de achter- of zijkant. Voor de functie die MLE corrigeert, hebben we altijd aangenomen dat het signaal van voren komt, simpelweg omdat we een richting moesten kiezen en dit de meest logische keus was. Als het hoortoestel de spraakrichting kan vaststellen, kunnen we het MLE inmiddels dynamisch aanpassen aan de richting waaruit de spraak op dat moment vandaan komt. Deze aanpassing leidt tot een betere geluidskwaliteit en een natuurlijker perceptie van richting. Hoe effectief de dynamische aanpassingen zijn, hangt af van hoe goed het systeem werkt.

We hebben de University of South Florida gevraagd om ons te helpen evalueren hoe nauwkeurig we het azimut van spraak kunnen detecteren. Voor alle digitale detectie is een goede balans tussen snelheid, zekerheid en rekenkracht belangrijk. Hoe minder geluidsfragmenten nodig zijn om conclusies te trekken over een luisteromgeving, hoe sneller de detectie zal zijn. Daarentegen geeft een groter aantal geluidsfragmenten meer zekerheid dat de detectie correct is. Een hogere snelheid kan daarom tot meer vergissingen leiden. Een lage snelheid zorgt dan weer voor een vertraging waardoor de verwerking niet synchroon loopt met de dynamische luisteromgeving. Idealiter is de verwerking snel genoeg om beslissingen te kunnen nemen over de luisteromgeving van dat moment, maar ook langzaam genoeg om vergissingen te vermijden.

Van groot belang hierbij is de rekenkracht van het toestel dat de geluidsfragmenten verwerkt. Net als bij computers is elke nieuwe chip in onze hoortoestellen weer sneller en krachtiger dan de vorige. We hebben daarom zowel ons recente Tempus-platform als een oudere versie van het North-platform geëvalueerd. Zie afbeeldingen 2a en 2b op de volgende pagina.

Deze twee generaties Unitron-toestellen zijn getest in het Auditory & Speech Sciences Laboratory van de University of South Florida (USF). In een geluidsdichte ruimte werden 24 speakers opgesteld die spraak en lawaai afspeelden vanuit vier azimuts (zie afbeelding 1). Gedurende vier uur registreerden de onderzoekers de detectie met intervallen van 40 seconden. De spraak- en lawaaifragmenten bestonden uit een combinatie van:

  • Vier gesproken passages: man, vrouw en om de beurt man/vrouw
  • Vijf verschillende soorten diffuus achtergrondgeluid
  • Vier SNR’s: –3, 0, 3 en 6 dB
  • Vier azimuts: 0°, 90°, 180° en 270°

Figuur 1. Op willekeurige momenten spraak (man, vrouw en om de beurt man/vrouw) uit een van de speakers met een groen plusteken. Continu een van de vier typen lawaai uit alle vier de speakers met een rood minteken.

De nauwkeurigheid werd berekend als het percentage correcte detecties voor drie starttijden, gemiddeld over een interval van 40 seconden. De volgende starttijden zijn gebruikt:

  • 0 seconden vertraging = ‘Directe meting’, die meteen plaatsvindt wanneer de richting wijzigt
  • 5 seconden vertraging = ‘Middellange vertraging’
  • Het resterende interval na de gemiddelde overschakeltijd = ‘Beste vertraging’ voor elk apparaat
  • North-platform (Q2 Pro) = 17 seconden
  • Tempus-platform (Moxi Fit Pro) = 6,2 seconden

In afbeelding 2a ziet u dat het tot 17 seconden duurde om de ‘Beste vertraging’ te bereiken met de Quantum2 Pro, terwijl dat slechts 6,2 seconden duurde met de Moxi Fit Pro (afbeelding 2b). Dat voor betrouwbare detectie minder tijd nodig was met de Moxi Fit Pro, komt doordat het Tempus-platform meer rekenkracht heeft dan het North-platform.

Figuur 2a en 2b – Detectie nauwkeurigheid van twee generaties Unitron-producten met SpeechPro. De bovenste resultaten in 2a zijn van de Quantum2 Pro (North) en de onderste in 2b van de Moxi Fit Pro (Tempus). Van links naar rechts verloopt de SNR (signaal-ruisverhouding) van heel moeilijk (–3 dB) tot heel makkelijk (+6 dB). De nauwkeurigheid wordt getoond als percentage tussen 0% (0) en 100% (1).

In afbeeldingen 2a en 2b zijn drie trends zichtbaar. Ten eerste is overduidelijk dat de nieuwere Moxi Fit Pro (Tempus) nauwkeuriger detecteert dan de oudere Quantum2 Pro (North). De nauwkeurigheid van de detectie van de Quantum2 Pro liep van bijna 30% bij –3 dB SNR tot bijna 70% bij +6 dB SNR. De nauwkeurigheid van de Moxi Fit Pro liep zelfs van circa 70% bij –3 dB SNR tot bijna 90% bij +6 dB SNR. Het nieuwere Tempus-platform bracht dus een enorme verbetering in de nauwkeurigheid van de detectie. In het SNR-bereik waarin de meeste dragers van een hoortoestel luisteren naar spraak in rumoer (namelijk +3 dB tot +6 dB) was de detectie van de Moxi Fit Pro meer dan 80% nauwkeurig.

Ten tweede had de SNR, los van het grote verschil in prestaties tussen de platformen, invloed op beide typen hoortoestellen. Naarmate de SNR gunstiger werd, dus van links naar rechts in de grafiek, werd de detectie ook nauwkeuriger. Er was een vertragingseffect. Als zowel het platform als de SNR constant gelijk bleven, werden bovendien nauwkeuriger resultaten behaald als het hoortoestel een paar seconden langer de tijd had om de spraakrichting te bepalen. Met andere woorden, als de eerste 5 seconden van de detectiecyclus van 40 seconden buiten beschouwing worden gelaten en alleen van de laatste 35 seconden het gemiddelde wordt genomen, was met beide platforms de detectie nauwkeuriger bij de middellange vertraging dan bij de directe meting. De detectie was zelfs nog nauwkeuriger als werd gewacht tot de beste vertraging. Dit effect was duidelijker in Quantum2 Pro-toestellen. Om de beste vertraging van de Quantum2 Pro te bereiken, moesten de onderzoekers echter de eerste 17 seconden van de opgevangen geluidsfragmenten negeren. De Moxi Fit Pro daarentegen bereikte de beste vertraging al na 6,2 seconden, dus bijna drie keer zo snel.

Ten derde presteerde de Moxi Fit Pro zo veel beter dan de Quantum2 Pro dat de detectie van de directe meting met de Moxi Fit Pro bij –3 dB SNR (het slechtste scenario) even nauwkeurig was als van de meting met de beste vertraging met de Quantum2 Pro bij +6 dB SNR (het beste scenario). Dat is een enorm verschil in prestaties.

We hebben dus de spraakdetectie van onze hoortoestellen verbeterd en veel nauwkeuriger gemaakt. Een hoortoestel dat 80% van de tijd nauwkeurig de spraakrichting detecteert bij een SNR boven nul, klinkt goed. Maar wat houdt het nou precies in?

De nauwkeurigheid van detectie door mensen maakte geen deel uit van dit onderzoek, dus we hebben geen gegevens om onze resultaten mee te vergelijken. Wel kunnen we de vakliteratuur erop naslaan voor informatie over azimutdetectie door slechthorenden. Dan weten we hoe enthousiast we moeten zijn met deze resultaten.

Als we de gegevens van Moxi Fit Pro samenvoegen in één tabel van azimuts per SNR, kunnen we een vergelijking maken met een andere tabel, uit een onderzoek van Keidser et al. (2009).2 Zie tabel 1 hieronder voor de detectiegegevens van de Moxi Fit Pro.

Tabel 1. Percentage correcte detecties voor alle metingen bij elke SNR en voor elke richting. In de kolom Totaal staat het percentage correcte detecties per SNR als gemiddelde van de vier geteste azimuts.

De Moxi Fit Pro was vrijwel geheel nauwkeurig bij spraak van voren, ongeacht het gebruikte niveau van het achtergrondlawaai. De nauwkeurigheid in tabel 1 neemt geleidelijk af. Het totale gemiddelde voor alle vier de geteste richtingen is het hoogst voor de gunstigste SNR: 88,4% (+6 dB). Het gemiddelde is het laagst voor een SNR-niveau van 0 dB. De dip bij 0 dB SNR ten opzichte van –3 dB SNR lijkt te worden veroorzaakt doordat er bij 0 dB SNR meer verwarring is bij spraak van achteren.

Deze resultaten kunnen worden vergeleken met gegevens over verwarring van voren/achteren van Keidser et.al. zoals getoond in
tabel 2.

Tabel 2. Het gemiddelde percentage uit 40 reacties dat voor en achter verkeerd inschatte

Keidser et al. onderzochten met 51 deelnemers hoe vaak voor en achter door elkaar worden gehaald. Zoals in de meeste onderzoeken naar plaatsbepaling bleek dat mensen vooral moeite hadden om te bepalen of het testsignaal van voren of van achteren kwam. De onderzoekers ontdekten dat het veel minder vaak voorkomt dat mensen links en rechts met elkaar verwarren. Verwarring over voor of achter is de meest gemaakte fout bij plaatsbepaling, zelfs bij mensen die normaal horen. Verwarring tussen links en rechts komt veel minder vaak voor, doordat er interauraal grotere verschillen zijn in niveau, tijd, frequentie en fase. Dit komt door de head related transfer function (HRTF) van de ene kant van het hoofd naar de andere. De impact van HRTF is zeer beperkt als de doelsignalen recht van voren of achteren komen. Het is vooral de werking van het buitenoor, met name spectraal, die bijdraagt aan de plaatsbepaling van voor en achter3. Deze werking is maar heel klein in vergelijking met die van de HRTF tussen links en rechts.

Tabel 2, uit Keidser et al. (2009), laat in procenten zien hoe vaak voor en achter door elkaar werd gehaald in 40 tests met 30 mensen die normaal horen (NH) en 21 slechthorenden (SH). Tussen haakjes staat de standaarddeviatie. In dit onderzoek werden twintig luidsprekers in een cirkel geplaatst met intervallen van 20°. Op vijf daarvan werd spraak of lawaai afgespeeld voor de deelnemers. De meest directe manier om de onderzoeksresultaten met mensen te vergelijken met de geteste detectie nauwkeurigheid van de hoortoestellen, is om te kijken in hoeverre er bij de detectie van spraaksignaal voor/achter vergissingen (in %) worden gemaakt. Normaal horende deelnemers scoorden behoorlijk goed: gemiddeld 1% tot 6% incorrecte antwoorden en een standaarddeviatie tussen 1,8% en 8,1% voor alle testsignalen. De groep slechthorenden scoorde zonder toestel veel minder goed. De foutratio’s liepen van 33% tot 38% met een standaarddeviatie tussen 8% en 13,2% voor alle testsignalen.

Als er geen andere geluiden waren, konden deze deelnemers zonder toestel in 67% van de gevallen correct aangeven of spraak van voren of achteren kwam. We kunnen dit afzetten tegen de meest vergelijkbare testomstandigheden voor de detectie door hoortoestellen bij de twee gunstigste SNR’s: +3 dB en +6 dB. Bij +6 dB SNR konden de hoortoestellen in 99,1% van de gevallen de locatie van spraak van voren correct detecteren, en 85,6% voor spraak van achteren. Bij +3 dB SNR waren de resultaten vergelijkbaar, namelijk 100% correct van voren en 82,8% van achteren. Ideaal is deze vergelijking natuurlijk niet, want we vergelijken spraak in een rustige omgeving met spraak in rumoer. Toch kunnen de resultaten als referentiekader dienen om de detectieprestaties van een hoortoestel te vergelijken met hoe goed dragers van hoortoestellen spraak kunnen lokaliseren in de moeilijkste testsituatie (voor/achter). Het is aannemelijk dat de resultaten met hoortoestellen op zijn minst gelijk zijn aan wat een slechthorende detecteert, en waarschijnlijk beter.

We kunnen verschillende conclusies trekken uit de gepresenteerde resultaten. Duidelijk is dat de overstap van het North-platform naar het Tempus-platform de detectiesnelheid en -nauwkeurigheid aanzienlijk vergroot. De snelheid en nauwkeurigheid verbeteren met elke nieuw platform, van North tot Tempus en inmiddels Discover en Discover Next. Het North-platform was tussen de 30% en bijna 70% nauwkeurig in de gunstigste omstandigheden, inclusief een vertraging van 17 seconden voor een grotere nauwkeurigheid. Het Tempus-platform haalde tussen de 70% en bijna 90% nauwkeurigheid met maximaal 6,2 seconden vertraging voor de verwerking. Zelfs bij een directe meting bij –3 dB SNR is de detectie van Tempus met bijna 70% nog vrij nauwkeurig. Tot slot hebben we gezien dat de detectie door Tempus op zijn minst vergelijkbaar is met die door een groep slechthorenden en in sommige gevallen veel beter (voor spraak van voren). Hopelijk laat deze paper zien dat binaurale signaalverwerking hoortoestellen helpt om zelfs in rumoerige omgevingen de locatie van spraak te bepalen.

Ik wil graag dr. Ozmeral en dr. Eddins bedanken voor hun bijdrage. Zij werkten nauw met ons samen om het geluidsparcours te ontwerpen en gegevens te verzamelen in hun lab op de University of South Florida.

Referenties

1Walden, B.E., et al., Predicting Hearing Aid Microphone Preference in Everyday Listening. Journal American Academy of Audiology, 2004. 15: p. 365-396.
2Keidser, G., et al., The effect of frequency-dependent microphone directionality on horizontal localization performance in hearingaid users. International Journal of Audiology, 2009. 48(11): p. 789-803.
3Van Den Bogaert, T., E. Carette, and J. Wouters, Sound localization with and without hearing aids. 2009.

Breid de hoortest uit van uw winkel naar de echte wereld. Uw cliënten kunnen hoortoestellen thuis ervaren, op het werk of waar ze ook naartoe gaan.