Clicker-training

Bijna iedereen is wel eens naar een dolfinarium geweest of heeft toch minstens een dergelijke show op televisie gezien. Om de paar uur werken de dolfijnen daar een prachtig programma af met hoge sprongen en buitelingen, onderdelen waarbij een groep de sprongen precies tegelijk uitvoert en de dieren leuke grapjes uithalen met de trainer en het publiek. Wat mij altijd opvalt, is het plezier dat er bij de dieren van afstraalt. Hoe werden hen al die oefeningen aangeleerd? Je raadt het al: met clicker-training!

Om te kunnen overleven in de natuur is het voor dieren noodzakelijk om zich aan te passen aan hun steeds veranderende omgeving. Daarom leren dieren van de gevolgen van hun acties. Als een dier iets doet dat wordt gevolgd door iets plezierigs, is de kans groot dat het dat gedrag herhaalt. Andersom zal het dier, als zijn actie wordt gevolgd door iets onplezierigs, dat gedrag minder vaak of zelfs niet meer herhalen. Deze algemene leerregels vormen de basis voor operant conditioneren, een leermodel uit de gedragsleer waarop clicker-training is gebaseerd. Zie ook de artikelen Beloning en Straf, een nuttig middel met veel valkuilen.

De clicker-methode concentreert zich op de op beloning georiënteerde kant, die aangeduid wordt met 'positieve versterking'.

Clicker

Naar boven Naar benedenDe clicker

Karakteristiek voor de clicker-methode is natuurlijk de clicker zelf. Dit apparaatje is een robuuste uitvoering van wat vroeger ook wel een 'kikkertje' werd genoemd en brengt een klikgeluidje voort. Door dit geluidje steeds te laten volgen door een beloning (meestal een voertje, maar andere beloningen zijn ook mogelijk, zelfs wenselijk), wordt het een 'geconditioneerde versterker'. Het dier weet dan dat als hij dat geluidje hoort, hem iets leuks gaat overkomen. Als je nu steeds op het moment dat je hond gaat zitten klikt en vervolgens beloont, leert hij dat gaan zitten leuke gevolgen heeft. Hij associeert het moment van de klik met de beloning, niet het moment dat hij de daadwerkelijke beloning (de 'primaire versterker') krijgt.

Maar waarom dan een geconditioneerde beloner? Het nadeel van het direct toedienen van bijvoorbeeld een voertje is dat je vaak te laat bent met belonen. De meeste beloningen zijn op een afstandje bovendien onbruikbaar. Een clicker geeft enorme voordelen bij het juist 'timen' van je beloning. Dat komt doordat het signaal zo kort en uniek is. Dat is niet alleen voor de hond zeer duidelijk, ook de baas merkt veel beter dan met bijvoorbeeld stembeloning of hij te vroeg of te laat is. Bovendien is het apparaatje op (gehoors)afstand te gebruiken.

Nu is deze methode niet zo strak dat alleen dit geluidmakertje zou mogen worden gebruikt: een andere geluidje, een tongklak of een fluitsignaal (dolfijnen) bijvoorbeeld, of een lichtflits, of een gebaar - er is van alles mogelijk.

Naar boven Naar beneden De clicker zelf heeft de volgende voordelen en eigenschappen:

  • Kort geluid: hiermee is het mogelijk precies een bepaald gedrag te markeren. Denk aan de korte sluitertijd die je op een kamera nodig hebt om actiemomenten scherp op de foto te krijgen. Bij een langer geluid (bijvoorbeeld "goed zo") kan de hond al drie verschillende gedragingen hebben vertoond voordat het geluid is afgelopen. En bij een langere sluitertijd op je kamera, is je foto is bewogen.
  • Uniek geluid: in tegenstelling tot de stem, die we de hele dag gebruiken voor allerlei (voor de hond) onzinnig gebabbel. Hierdoor is een woord voor een hond moeilijker herkenbaar, zelfs als het op een andere toon wordt uitgesproken.
  • Door deze twee eigenschappen ontstaat een duidelijke informatie-overdracht: "DIT gedrag is goed".
  • Het is een brugsignaal: het geluidje legt het verband en overbrugt de tijd tussen het goede gedrag en de eigenlijke beloning.
  • Op afstand te gebruiken. Dit in tegenstelling tot bijvoorbeeld een voertje geven, wat op een meter afstand al onmogelijk goed te timen is.
  • Het markeert het einde van de oefening. Na de klik is de oefening dus afgelopen. Na het voertje kan de hond direct de volgende klik proberen te verdienen.
  • Gemakkelijk te bedienen.
  • Klein en hanteerbaar.

Naar boven Naar beneden Niet alleen voor de hond

Dolfijn Zoals al gezegd, is clicker-training niet alleen geschikt voor honden. Het is al op ontelbare diersoorten met succes toegepast. Onder andere op paarden, ezels, ratten, vissen, fretten, katten, en zelfs op mensen. Bij dolfijnen wordt het inmiddels het langste als standaard-trainingsmethode toegepast, maar dan met fluitjes. Een dolfijn is moeilijk te straffen of te dwingen, hij zwemt gewoon weg. Heb je toch een manier bedacht? Hou hem maar voor je, want een dolfijntrainer lacht u vierkant uit: hij heeft het helemaal niet nodig. En denk nou niet dat dolfijnen veel gemakkelijker te trainen zijn dan honden: volgens trainers die beide diersoorten onder handen hebben gehad, is een hond vele malen makkelijker. Hoe kan het dan toch dat die dieren meerdere keren per dag van die schitterende voorstellingen geven?

Naar boven Naar beneden Shaping

Eén kenmerk van clicker-training is het gebruik van 'shaping'. Dit wil niets anders zeggen dan dat een gedrag in heel kleine stapjes wordt aangeleerd, vaak beginnend bij een gedraging die het dier uit zichzelf al vaak uitvoert. Als het dier het gedrag, dankzij de versterkingen, duidelijk vaker gaat uitvoeren, wordt er vervolgens pas geklikt als het gedrag iets meer op de uiteindelijke oefening lijkt: de eisen worden steeds ietsje opgeschroefd. Ook in de traditionele hondentraining worden oefeningen ook wel in stapjes aangeleerd, maar bij shaping zijn de stapjes véél kleiner. Dat moet ook wel, want het dier moet steeds zelf redelijk gemakkelijk kunnen achterhalen wat de volgende stap inhoudt door te experimenteren. Immers, nergens leer je zo snel en zo grondig van als uit eigen ondervinding. Maar als de leerstappen te groot zijn, lukt dat gewoon niet of slechts heel moeizaam, waardoor de training een enorm frustrerende bezigheid wordt voor trainer èn dier.

Zo zal een niet-getrainde dolfijn nooit spontaan door een hoepel op 3 meter hoogte springen. Zelfs de kans dat hij dat op een halve meter doet, is uiterst gering. Sterker nog, de kans dat een dolfijn ònder water door die hoepel zal zwemmen, is erg klein. Een dolfijntrainer beloont de dolfijn dan ook al als hij richting de hoepel zwemt. Als hij daarvoor op dat moment beloond wordt (fluit+vis), zal hij dat gedrag nog eens herhalen, waarvoor hij dan weer versterkt wordt, waardoor hij het nog vaker zal herhalen. De volgende stapjes zijn simpel: de eisen worden langzaam opgeschroefd, zodat de dolfijn steeds dichter bij de hoepel moet komen om zijn fluit+vis te verdienen. Als hij uiteindelijk door de hoepel zwemt, wordt deze vervolgens steeds hoger gehangen. De dolfijn wordt steeds beloond als hij erdoorheen gaat... en zal tenslotte met gemak door een hoepel op 3 meter hoogte springen.

Naar boven Naar beneden Op papier lijkt dit misschien een zeer langdurige aanpak, maar in de praktijk gaat het, zeker bij een wat ervaren clicker-dier, razendsnel. Karen Pryor, die clicker-training in de Verenigde Staten bekend heeft gemaakt, is het vaker binnen een kwartier gelukt om een dolfijn op deze manier te leren door de hoepel te springen. Ook volgens veel hondentrainers die zowel "gewoon" als met de clicker- methode hebben getraind, gaat het minstens even snel, vaak zelfs veel sneller. En bovendien hebben zijzelf en de hond er veel meer lol in.

Op deze manier zijn heel complexe gedragingen aan te leren. Een praktijkvoorbeeld hiervan is een onhandelbare, zelfs voor mensen gevaarlijke olifant, die geleerd heeft zijn voet rustig door een gat in de muur te steken en die voet daar te houden terwijl het eelt van zijn voeten wordt bijgeschaafd. Doordat het dier niet kon worden benaderd, was het eelt helemaal doorgegroeid. Een leuke bijkomstigheid was dat de olifant als gevolg van deze training heel wat prettiger in de omgang werd, waarschijnlijk door de vertrouwensband die deze trainings methode vaak tussen trainer en dier schept.

Naar boven Naar beneden Eerst het gedrag

Een andere eigenschap van clicker-training is dat niet tegelijk met de oefening een commando wordt aangeleerd. Het dier leert eerst stapje voor stapje het gedrag. Pas als hij de uiteindelijke oefening goed beheerst, wordt een commando toegevoegd.

De reden hiervoor is dat het erg moeilijk is twee dingen tegelijk te leren. Dat heb je zelf vast ook wel eens ervaren. Voor mij was het tijdens dansles vaak onmogelijk om tegelijk het voetenwerk èn de armbewegingen onder de knie te krijgen. Dat lukte me pas als beide bewegingen apart werden geoefend en als het met beide apart goed ging, de oefeningen pas weer werden gekoppeld. Sneller èn minder frustrerend.

Voor de hond is mensentaal iets totaal onbegrijpelijks, waar hij slechts zo nu en dan een bekende klank uit weet te halen. Voor hem is het leren van een commando in de mensentaal dan ook heel moeilijk (daarentegen zijn honden meesters in het oppikken van lichaamstaal), en slecht te combineren met het aanleren van een nieuwe oefening.


Straf wordt bij de clicker-methode niet gebruikt. Althans, heel zelden, alleen in uiterste nood, en dan nog in combinatie met veel beloning van het goede gedrag. De reden daarvoor is niet teerhartigheid, maar het feit dat er meestal een andere oplossing voorhanden is en dat straf bovendien behoorlijk nadelige bijwerkingen heeft, waarvan sommige direct te zien zijn, maar andere pas op de langere termijn aan de oppervlakte komen (zie Straf, een nuttig middel met veel valkuilen).

Naar boven Naar beneden In het algemeen gaat het er bij clicker-training om, dat de hond werkt omdat hij dat wil. Je laat je hond namelijk werken voor iets dat hij graag wil hebben of doen. Je geeft hem een grote kans (± 80%) om te slagen. Als iets hem steeds niet lukt, geen nood: dan maakt je het iets makkelijker voor hem, zodat hij wèl slaagt. Daarna pas vraag je weer iets meer van hem. Door dat grote slagingspercentage krijgt jouw hond veel vertrouwen in zichzelf, in jou als trainer èn in de clicker. Je dwingt hem niet, waardoor hij ook geen weerstand kan krijgen.

Met clicker-training leert de hond door eigen ondervinding, door zelf uit te proberen wat wel en wat geen klik oplevert. Je ziet de hond "denken": "Wat kan ik nog meer doen om die klik te verdienen? Als ik nu zo doe - niet? Zo dan?" Het resultaat is een hond die actief en enthousiast meewerkt aan de training - wat weer een enorme beloning en stimulans voor de baas betekent!


Door al deze positieve aspecten - ontspannen sfeer, zelfvertrouwen, succes - is het zelfs mogelijk dat het leervermogen van de hond in een stroomversnelling komt. Het komt voor dat honden met deze positieve methode tot zelfs 10 keer sneller kunnen leren! Een dergelijke versnelling kan met één bestraffing teniet worden gedaan. Op zich al reden genoeg om uiterst spaarzaam met straf om te gaan.

Sandra Hurkmans

Zie voor meer informatie en links de pagina Trainings-weblinks.
(Oorspronkelijk geschreven voor Kynologenclub Delft e.o.)