Verslag AES-lezing project 188 door Richard van Everdingen (c) 2007
Illustraties: Dr. Age Hoekstra
Foto's: Bob Vos (c) 2007

Dit verslag is in december 2007 gepubliceerd in het vakblad Masterfiles (www.masterfiles.nl)

Dr. Age Hoekstra verklaart de auditieve waarneming in relatie met het luisteren naar muziek

De luisteraars en hun oren
Maandagochtend 8.00 uur. Ik zit in de trein. Tegenover mij neemt een meisje plaats. Ze lacht vriendelijk en is zo te zien op weg naar school. Ik zeg goedemorgen maar ze hoort me niet. Uit haar oren ontsnapt een heftig ritme: housemuziek. Ze draagt oordopjes die verbonden zijn met een rechthoekig kastje. Ik sta versteld van het geluidsniveau dat mij bereikt. Stel dat ik de dopjes zelf in zou hebben... Mijn gedachten gaan naar die tv-reclame over hoortoestellen. Toen ik zo oud was als zij waren dat ook oordopjes verbonden aan een rechthoekig kastje. Ze vindt de muziek kennelijk erg mooi. Maar waarom eigenlijk? Wat maakt muziek voor iemand mooi om naar te luisteren?

Geluid is in onze maatschappij dagelijkse kost. We staan er via de wekkerradio mee op en we gaan er na een avond televisie of ander vermaak ook weer mee naar bed. Een voortdurende stroom aan geluidspatronen bereiken de hersenen. Weten hoe wij horen is bijgevolg van fundamentele betekenis. Het was dan ook niet vreemd dat het aantal belangstellenden voor de lezing in oktober van de Audio Engineering Society (AES) over dit onderwerp de hoeveelheid beschikbare stoelen overtrof. Uitgenodigd was dr. Age Hoekstra, klinisch fysicus - audioloog, die maar liefst dertig jaar werkzaam is geweest bij het Audiologisch Centrum Amersfoort. Mede door het laten horen van diverse, het betoog ondersteunende geluidsfragmenten werd het een boeiende en levendige presentatie.

Dr. Age Hoekstra

Alweer een grote opkomst voor een avond AES

Overleven

Wat onze oren de laatste paar eeuwen allemaal te verwerken krijgen staat in schril contrast met de ontwikkeling van honderdduizenden tot miljoenen jaren daarvoor. Is ons gehoor voor dit moderne industriële en elektronisch verwekte aanbod eigenlijk wel geschikt? Van origine heeft het oor een waarschuwingsfunctie waarbij vooral de prestaties voor plaatsbepaling, onderscheidend vermogen en reconstructie van onvolledige en verstoorde geluiden indrukwekkend te noemen zijn. Het was voor de oerbewoner van het grootste belang om tijdens het jagen in het bos te kunnen bepalen waar de levensgevaarlijke prooi zich bevond, zodat hij - emancipatie was nog niet uitgevonden - niet zelf het onderspit zou delven. Gelukkig is die functie nog steeds goed bruikbaar, al is het tegenwoordig vaker in de vorm van een vanachter aanstormende vrachtauto die je niet ziet, maar als fietser wel doet wachten met linksaf slaan. Overleven is dus nog steeds een belangrijke functie. Er is een onvoorstelbare hoeveelheid rekenkracht voor nodig om de plaatsbepaling zo nauwkeurig te doen. De oren zelf berekenen daarbij helemaal niets maar functioneren juist als opnemer, het horen zelf gebeurt in de hersenen (afbeelding 1).

Afbeelding 1: De connectie van oren naar hersenen

De manier waarop het oor opneemt is wel sterk bepalend voor de eigenschappen van het gehoor als totaal. Reeds op die plek vindt er onderscheid in componenten plaats dat goed van pas komt bij het verdere rekenproces. Geluid bestaat uit variaties in luchtdruk, oftewel luchtverdikkingen en verdunningen. Als een bij elkaar opgetelde brei komt dit bij het trommelvlies aan, dat als gevolg daarvan gaat meebewegen. De eigenlijke opnemer bevindt zich in het slakkenhuis, een spiraalvormige taps toelopende buis van ongeveer 3,5 centimeter lengte waarin zich een vloeistof en het basilair membraan bevindt. De ingang van de opnemer zelf is het ovale venster. Het trommelvlies direct verbonden aan het ovale venster zou niet zo'n beste overdacht tot gevolg hebben, vandaar dat de natuur een soort hefboomconstructie heeft ontwikkeld in de vorm van hamer, aambeeld en stijgbeugel, die uitwijking en kracht optimaal afgestemd omzetten (afbeelding 2).

Afbeelding 2: De hefboom als overbrenger van geluid

Aan de hefboom zijn ook enkele spiertjes gehecht die als rem kunnen werken bij al te harde geluiden. Het functioneert dus niet alleen als transformator, maar ook als automatische versterkingsregelaar. Door de trillingen wordt de vloeistof in beweging gezet. Aan het eind van de buis wordt het drukverschil opgevangen in het meebewegende ronde venster. In het slakkenhuis vindt een uniek proces plaats. Snelle trillingen die hoge geluidsfrequenties vertegenwoordigen, geven een lopende golf met een maximumuitslag aan het begin van de buis (afbeelding 3). Naarmate de frequentie lager wordt, verplaatst die golfslag zich naar achteren. Het hele systeem werkt op die manier als een omzetter van frequentie naar plaats. Haarcellen met daaraan gekoppelde gehoorzenuwen in het orgaan van Corti nemen de positie en sterkte van de golf waar, overeenkomend met toonhoogte en luidheid. De zenuwen sturen die signalen vervolgens als elektrische impulsen naar de hersenen.

Afbeelding 3: Het gehoororgaan werkt als frequentie naar plaats omzetter

Signaalverwerking

Frequentieanalyse blijkt een cruciale functie van het gehoor te zijn. Samengestelde klanken waarvan de tonen harmonisch zijn gerelateerd worden slechts als één toon gehoord: de grondtoon. Voorbeeld hiervan is een grondtoon van 500 Hz en boventonen (harmonischen) van 1000, 1500, 2000, 2500 Hz, enzovoort. Klanken worden door de hersenen geanalyseerd. Zelfs als de grondtoon weg gefilterd wordt, blijft de indruk voor het gehoor hetzelfde. Voor de hersenen is het simpelweg onnatuurlijk dat de grondtoon ontbreekt, dus bij afwezigheid wordt die in het hoorproces gereconstrueerd zoals het zou moeten zijn. De toon wordt in dit geval gehoord op de toonhoogte 500 Hz, maar de klank (timbre) wordt bepaald door de boventonen. De toon is het basiselement van muziek met toonhoogte, luidheid en timbre als kenmerken. Door tonen te combineren ontstaan melodie, ritme en harmonie - de basiskarakteristieken van muziek. Bij samenklinkende tonen is het gehoor zeer kritisch op afwijkingen in de stemming, slechts een verschil van een half procent laat muziek al vals klinken. Daarentegen bepaalt een geringe variatie in toonhoogte (vibrato) juist de muzikale en zweverige klank. Toonladders voor muziekinstrumenten zijn zodanig bepaald dat de boventonen vriendelijke combinaties met elkaar vormen. "Het gaat er om dat sensorische dissonantie zo veel mogelijk vermeden wordt", aldus dr. Hoekstra. Sensorisch betekent in dit verband volgens de menselijke zintuiglijke waarneming. Tonen met een afstand kleiner dan zo'n 15 Hz worden als één zwevende toon gehoord. Wordt de afstand groter, dan ontstaat een ruwe klank die vervelend klinkt. De mate van ruwheid wordt dissonantie genoemd terwijl het tegenovergestelde - het harmonisch samenvallen van (boven)tonen - consonantie heet. De toonladder kan gezien worden als de beperkte verzameling grondtonen waarbij de boventonen zoveel mogelijk consonant zijn. Het gehoor is pas in staat de twee afzonderlijke tonen te scheiden als de afstand groter wordt dan zo'n twintig procent.

Saamhorigheid troef

Zowel voor communicatie als voor het met plezier luisteren naar muziek loopt de herkenning van welke onderdelen bij elkaar horen als rode draad door het signaalverwerkingsproces heen. Als voorbeeld ligt de menselijke stem het meest voor de hand. Hoe is het mogelijk dat we een gesprek kunnen voeren met iemand in een lawaaiige omgeving? Tijdens een feestje praten diverse mensen door elkaar heen en toch kunnen we ons concentreren op één persoon. Dit geheim zit hem in de analyse van de boventonen die de klank bepalen en die juist bij die ene stem horen. Tonen die hiervan afwijken worden beoordeeld als een andere bron of als verstoring. Het gehoor kan signaal en storing verbazingwekkend goed van elkaar onderscheiden en interrupties daarvan door lawaai als het ware aan elkaar vastplakken. Tijdens de presentatie liet dr. Hoekstra hiervan een treffend voorbeeld horen, waarbij een muziekstuk werd onderbroken door pulserende ruis. Hoewel er tijdens die ruis geen enkele muziek in het signaal zat, kon iedereen waarnemen alsof het orkest er dwars doorheen speelde. De hersenen gaan er volgens het verwachtingspatroonprincipe gewoon vanuit dat het niet logisch is de informatie te onderbreken, beschouwen de ruis als storing en interpoleren zelf hetgeen wat weggevallen is. Een mechanisme dat zeer goed van pas komt bij spraakverstaanbaarheid.

Leerproces

Het proces om te herkennen wat bij elkaar hoort wordt aangeduid met de Engelse term Auditory Scene Analysis. Naast de analyse van grondtoon en boventonen wordt daarbij gebruik gemaakt van algemene akoestische regelmatigheden, bijvoorbeeld dat niet-gerelateerde geluiden zelden op exact hetzelfde moment beginnen en eindigen. Bovendien zal een akoestische gebeurtenis alle componenten van het resulterende geluid op dezelfde manier en op hetzelfde moment beïnvloeden. Naast bij de mens aangeboren eigenschappen spelen ook cultuurgerelateerde leerprocessen een rol. Daaruit is het verklaarbaar dat voorkeur voor bepaalde muziek en ritmen mede afhangen van waar men mee opgegroeid is. Nog een belangwekkend kenmerk is de invloed van het geheugen op het hoorproces. De geheugenruimte voor de elementaire inhoud blijkt maar beperkt, grofweg vijf seconden groot. Als ritmes onregelmatig zijn en herhalingselementen in muziek te lang op zich laten wachten, dan is de muziek gewoonweg niet te volgen en haakt de gemiddelde luisteraar af. Elementen in muziek die duiden op logische volgorde, gelijktijdigheid en goed bij elkaar passende klanken vallen daarentegen meer in de smaak. Desondanks klinkt een uitvoering op een perfect tijdschema - zoals een computer die maakt - veelal kunstmatig en mechanisch. Een onverwachte, kleine en speelse afwijking hiervan - zoals een muzikant vanzelf al pleegt te doen - wordt juist als creatief ervaren. Kennelijk wordt perfectie als onnatuurlijk en saai beleefd, een gegeven dat gelukkig voor meer menselijke kenmerken in het dagelijks leven goed van pas komt. Wat de luisteraar hoort is mede afhankelijk van wat men zich kan herinneren van de voorbije gebeurtenissen in de muziek. Modulatie naar een andere toonsoort wordt alleen gehoord als men zich de vorige toonsoort herinnert. Veranderingen in een thema vallen alleen op als men de originele versie herkent. Net als bij het onderscheiden van menselijke stemmen is het voor het volgen van de muziek nodig dat muziekinstrumenten die een verschillende melodische lijn of ritme aangeven, anders klinken. De spreker liet een voorbeeld horen van twee dezelfde slaginstrumenten die elk een eigen ritme speelden. Daarbij ontstond een warboel door vermenging van de ritmische patronen - volgens dr. Hoekstra overigens een essentieel onderdeel van de Oegandese manier van muziek maken. Bij een volgend voorbeeld waarbij hetzelfde werd gespeeld met verschillende instrumenten trad dit effect niet op en konden de ritmes wel van elkaar worden onderscheiden. Net zoals twee identieke stemmen door elkaar onverstaanbaar worden, moet er ook bij muziek verschil te maken zijn bij geluiden die gelijktijdig optreden. Tonen die elkaar dicht naderen fuseren en zijn gewoonweg niet meer te onderscheiden.

Auditief geheugen

De spreker legde uit dat de werking van het geheugen voor muziek te verdelen is in drie processen: het klankherkennende, het korte- en het langetermijngeheugen (afbeelding 4).

Afbeelding 4: Schematische voorstelling van het auditief geheugen

Elk van de drie processen functioneert op een andere tijdschaal. De relatie met muzikale organisatie is als volgt. In het klankherkennende geheugen wordt de binnenkomende informatie gecodeerd en geordend op basis van frequentie, luidheid of klank. Dit proces vindt in slechts enkele milliseconden plaats. Door patroonherkenning worden ze vervolgens gegroepeerd, bijvoorbeeld op basis van vergelijkbaarheid en nabijheid. Die stap is de herkenning als ritmische of melodische eenheden in het korte termijngeheugen. In het lange termijngeheugen worden de secties vervolgens op grotere schaal geordend en vastgelegd, zodat de muzikale vorm herkend kan worden op basis van bij elkaar groeperende patronen (afbeelding 5). Afbeelding 5: De drie processen in het auditief geheugen [auditief geheugen tijdschaal.jpg] Door de muziek op te delen in logische brokjes, wordt het gemakkelijker om het in het geheugen op te slaan. Als voorbeeld nam de heer Hoekstra een getal. Achterelkaar geschreven als 1776149220011984 is dat voor de meeste mensen niet te onthouden. Wordt hetzelfde getal echter geschreven als 1776-1492-2001-1984, dan gaat het een stuk gemakkelijker. Periodieke herhaling en patroonvolgorde is dus belangrijk voor de herkenning en structuur van muziek. Maar als dit alleen maar zo door gaat dan verveelt het juist weer erg snel. De mate van aantrekkelijkheid zit hem dus ook in de afwisseling met andere ritmes en melodieën. Tezamen zijn ze essentieel voor het aanbrengen van hiërarchie in muziek (afbeelding 6). Groepering verbindt de brokjes, waarmee een verwachtingspatroon voor het vervolg wordt gecreëerd.

Afbeelding 6: Groepering van voor het gehoor herkenbare brokjes in de muziek

Datareductie

Overigens hebben verschillende soorten muziek ook zo hun eigen organisatorische patronen. Aangeleerde groeperingmechanismes bestaan uit melodische schema's gevormd door toonladders - die bepalen welke tonen worden gebruikt - en tonaliteit - die bepaalt welke tonen relatief belangrijk zijn en waar de nadruk op ligt. Verder bestaat dit uit de ritmische structuur gevormd door afwisselendheid, puls en tempo. Toonsoort en ritme hebben de essentiële functie om het muziekstuk te verdelen in identificeerbare locaties waaraan referentie mogelijk is. Simpelweg alles onthouden gaat niet. Het is nodig de continue stroom van geluid te kwantiseren en te categoriseren voor de broodnodige datareductie. Te onderscheiden zijn het toonhoogtedomein - de toonsoort fixeert de referentiewaarden voor de duur van een muziekstuk - en het temporele domein - de belangrijke momenten ten opzichte waarvan andere geluiden georganiseerd worden. Zonder die referentiepunten is geen samenspel mogelijk. Het gebruik van toonladders met een beperkt aantal frequentiestappen die met reden juist ongelijk zijn, zorgt steeds voor een raamwerk dat de luisteraar houvast biedt. Recept voor een hit In de moderne housemuziek van het meisje uit de trein zijn de factoren herhaling en ritme zeker terug te vinden, al valt dit genre voor menig ander onder de categorieën simpel, voorspelbaar en niet bepaald creatief. Over verschil van smaak valt nu eenmaal niet te twisten. Maar een componist die de intentie heeft de muziekhit van het jaar te schrijven zou wel gek zijn als hij geen gebruik maakt van de uitgangspunten waarom bepaalde klanken en ritmes bij het grote publiek goed in het gehoor liggen. Anderzijds zijn keuzes van componisten uit het verleden medebepalend geweest voor de structuur en organisatie van de muziek waar tegenwoordig naar geluisterd wordt. Voor een succesvol resultaat lijkt dus een zekere spanning tussen het herkenbare en het onverwachte mee te spelen. Weten waar je aan toe bent en toch af en toe verrast worden door iets moois en iets nieuws, is blijkbaar wat wij willen.

Richard van Everdingen (richard&delta-sigma-audio.nl)


Biografie

Age Hoekstra werd geboren in 1945 en woont in Voorthuizen (Gelderland). Hij studeerde natuurkunde in Groningen om vervolgens vier jaar wetenschappelijk onderzoek te doen naar toonhoogteonderscheidingsvermogen en frequentieanalyse bij zowel normaal- als slechthorenden. Dat boeide hem zodanig dat hij daar zijn beroep van is gaan maken. Vooral het willen helpen van mensen met een auditieve handicap zoals slechthorendheid speelde hierbij een rol. Naast horen in het algemeen is ook zijn liefde voor muziek een belangrijke drijfveer geweest om zich intensief in het vak audiologie te bekwamen. Ook nu hij inmiddels gepensioneerd is weet hij nog van geen ophouden om over dit vak lezingen te geven.


Verslag AES-lezing project 188 - De luisteraars en hun oren v1.31 - Webpublicatie voor de AES