Clicker-training
Bijna iedereen is wel eens naar een dolfinarium geweest of heeft toch
minstens een dergelijke show op televisie gezien. Om de paar uur werken
de dolfijnen daar een prachtig programma af met hoge sprongen en buitelingen,
onderdelen waarbij een groep de sprongen precies tegelijk uitvoert en
de dieren leuke grapjes uithalen met de trainer en het publiek. Wat mij
altijd opvalt, is het plezier dat er bij de dieren van afstraalt. Hoe
werden hen al die oefeningen aangeleerd? Je raadt het al: met clicker-training.
Om te kunnen overleven in de natuur is het voor dieren noodzakelijk
om zich aan te passen aan hun steeds veranderende omgeving. Daarom leren
dieren van de gevolgen van hun acties. Als een dier iets doet dat wordt
gevolgd door iets plezierigs, is de kans groot dat het dat gedrag
herhaalt. Andersom zal het dier, als zijn actie wordt gevolgd door iets
onplezierigs, dat gedrag minder vaak of zelfs niet meer herhalen. Deze
algemene leerregels vormen de basis voor operant conditioneren, een leermodel
uit de gedragsleer waarop clicker-training is gebaseerd. Zie ook de artikelen
Positieve versterking en Straf,
een nuttig middel met veel valkuilen.
De clicker-methode concentreert zich op de op beloning georiënteerde
kant, die aangeduid wordt met 'positieve versterking'.
De clicker
Karakteristiek voor de clicker-methode is natuurlijk de clicker zelf.
Dit apparaatje is een robuuste uitvoering van wat vroeger ook wel een
'kikkertje' werd genoemd en brengt een klikgeluidje voort. Door dit geluidje
steeds te laten volgen door een beloning (meestal een voertje, maar andere
beloningen zijn ook mogelijk, zelfs wenselijk), wordt het een 'geconditioneerde
versterker'. Het dier weet dan dat als hij dat geluidje hoort, hem iets
leuks gaat overkomen. Als je nu steeds op het moment dat je hond gaat zitten
klikt en vervolgens beloont, leert hij dat gaan zitten leuke gevolgen
heeft. Hij associeert het moment van de klik met de beloning, niet het
moment dat hij de daadwerkelijke beloning (de 'primaire versterker') krijgt.
Maar waarom dan een geconditioneerde beloner? Het nadeel van het direct
toedienen van bijvoorbeeld een voertje is dat je vaak te laat bent met
belonen. De meeste beloningen zijn op een afstandje bovendien onbruikbaar.
Een clicker geeft enorme voordelen bij het juist 'timen' van je beloning.
Dat komt doordat het signaal zo kort en uniek is. Dat is niet alleen voor
de hond zeer duidelijk, ook de baas merkt veel beter dan met bijvoorbeeld
stembeloning of hij te vroeg of te laat is. Bovendien is het apparaatje
op (gehoors)afstand te gebruiken.
Nu is deze methode niet zo strak dat alleen dit geluidmakertje zou mogen
worden gebruikt: een andere geluidje, een tongklak of een fluitsignaal
(dolfijnen) bijvoorbeeld, of een lichtflits, of een gebaar - er is van
alles mogelijk.
De clicker zelf heeft de volgende voordelen en eigenschappen:
- Kort geluid: hiermee is het mogelijk precies een bepaald gedrag te
markeren. Denk aan de korte sluitertijd die je op een kamera nodig hebt
om actiemomenten scherp op de foto te krijgen. Bij een langer geluid (bijvoorbeeld "goed zo")
kan de hond al drie verschillende gedragingen hebben vertoond voordat
het geluid is afgelopen. En bij een langere sluitertijd op je kamera, is je foto is bewogen.
- Uniek geluid: in tegenstelling tot de stem, die we de hele dag gebruiken
voor allerlei (voor de hond) onzinnig gebabbel. Hierdoor is een woord
voor een hond moeilijker herkenbaar, zelfs als het op een andere toon wordt
uitgesproken.
- Door deze twee eigenschappen ontstaat een duidelijke informatie-overdracht:
"DIT gedrag is goed".
- Het is een brugsignaal: het geluidje legt het verband en overbrugt
de tijd tussen het goede gedrag en de eigenlijke beloning.
- Op afstand te gebruiken. Dit in tegenstelling tot bijvoorbeeld een
voertje geven, wat op een meter afstand al onmogelijk goed te timen
is.
- Het markeert het einde van de oefening. Na de klik is de oefening
dus afgelopen. Na het voertje kan de hond direct de volgende klik proberen
te verdienen.
- Gemakkelijk te bedienen.
- Klein en hanteerbaar.
Niet alleen voor de hond
Zoals al gezegd, is clicker-training niet alleen geschikt voor honden.
Het is al op ontelbare diersoorten met succes toegepast. Onder andere
op paarden, ezels, ratten, vissen, fretten, katten, en zelfs op mensen.
Bij dolfijnen wordt het inmiddels het langste als standaard-trainingsmethode
toegepast, maar dan met fluitjes. Een dolfijn is moeilijk te straffen
of te dwingen, hij zwemt gewoon weg. Heb je toch een manier bedacht? Hou
hem maar voor je, want een dolfijntrainer lacht u vierkant uit: hij heeft
het helemaal niet nodig. En denk nou niet dat dolfijnen veel gemakkelijker
te trainen zijn dan honden: volgens trainers die beide diersoorten onder
handen hebben gehad, is een hond vele malen makkelijker. Hoe kan het dan
toch dat die dieren meerdere keren per dag van die schitterende voorstellingen
geven?
Shaping
Eén kenmerk van clicker-training is het gebruik van 'shaping'.
Dit wil niets anders zeggen dan dat een gedrag in heel kleine stapjes
wordt aangeleerd, vaak beginnend bij een gedraging die het dier uit zichzelf
al vaak uitvoert. Als het dier het gedrag, dankzij de versterkingen, duidelijk
vaker gaat uitvoeren, wordt er vervolgens pas geklikt als het gedrag iets
meer op de uiteindelijke oefening lijkt: de eisen worden steeds ietsje
opgeschroefd. Ook in de traditionele hondentraining worden oefeningen
ook wel in stapjes aangeleerd, maar bij shaping zijn de stapjes véél
kleiner. Dat moet ook wel, want het dier moet steeds zelf redelijk gemakkelijk
kunnen achterhalen wat de volgende stap inhoudt door te experimenteren.
Immers, nergens leer je zo snel en zo grondig van als uit eigen ondervinding.
Maar als de leerstappen te groot zijn, lukt dat gewoon niet of slechts
heel moeizaam, waardoor de training een enorm frustrerende bezigheid wordt
voor trainer èn dier.
Zo zal een niet-getrainde dolfijn nooit spontaan door een hoepel op
3 meter hoogte springen. Zelfs de kans dat hij dat op een halve meter
doet, is uiterst gering. Sterker nog, de kans dat een dolfijn ònder
water door die hoepel zal zwemmen, is erg klein. Een dolfijntrainer beloont
de dolfijn dan ook al als hij richting de hoepel zwemt. Als hij daarvoor
op dat moment beloond wordt (fluit+vis), zal hij dat gedrag nog eens herhalen,
waarvoor hij dan weer versterkt wordt, waardoor hij het nog vaker zal
herhalen. De volgende stapjes zijn simpel: de eisen worden langzaam opgeschroefd,
zodat de dolfijn steeds dichter bij de hoepel moet komen om zijn fluit+vis
te verdienen. Als hij uiteindelijk door de hoepel zwemt, wordt deze vervolgens
steeds hoger gehangen. De dolfijn wordt steeds beloond als hij erdoorheen
gaat... en zal tenslotte met gemak door een hoepel op 3 meter hoogte springen.
Op papier lijkt dit misschien een zeer langdurige aanpak, maar in de
praktijk gaat het, zeker bij een wat ervaren clicker-dier, razendsnel.
Karen Pryor, die clicker-training in de Verenigde Staten bekend heeft
gemaakt, is het vaker binnen een kwartier gelukt om een dolfijn op deze
manier te leren door de hoepel te springen. Ook volgens veel hondentrainers
die zowel "gewoon" als met de clicker- methode hebben getraind,
gaat het minstens even snel, vaak zelfs veel sneller. En bovendien hebben
zijzelf en de hond er veel meer lol in.
Op deze manier zijn heel complexe gedragingen aan te leren.
Een praktijkvoorbeeld hiervan is een onhandelbare, zelfs voor mensen gevaarlijke
olifant, die geleerd heeft zijn voet rustig door een gat in de muur te
steken en die voet daar te houden terwijl het eelt van zijn voeten wordt
bijgeschaafd. Doordat het dier niet kon worden benaderd, was het eelt
helemaal doorgegroeid. Een leuke bijkomstigheid was dat de olifant als
gevolg van deze training heel wat prettiger in de omgang werd, waarschijnlijk
door de vertrouwensband die deze trainings methode vaak tussen trainer
en dier schept.
Eerst het gedrag
Een andere eigenschap van clicker-training is dat niet tegelijk met
de oefening een commando wordt aangeleerd. Het dier leert eerst stapje
voor stapje het gedrag. Pas als hij de uiteindelijke oefening goed beheerst,
wordt een commando toegevoegd.
De reden hiervoor is dat het erg moeilijk is twee dingen tegelijk te
leren. Dat heb je zelf vast ook wel eens ervaren. Voor mij was het tijdens
dansles vaak onmogelijk om tegelijk het voetenwerk èn de armbewegingen
onder de knie te krijgen. Dat lukte me pas als beide bewegingen apart
werden geoefend en als het met beide apart goed ging, de oefeningen
pas weer werden gekoppeld. Sneller èn minder frustrerend.
Voor de hond is mensentaal iets totaal onbegrijpelijks, waar hij slechts
zo nu en dan een bekende klank uit weet te halen. Voor hem is het leren
van een commando in de mensentaal dan ook heel moeilijk (daarentegen zijn
honden meesters in het oppikken van lichaamstaal), en slecht te combineren
met het aanleren van een nieuwe oefening.
Straf wordt bij de clicker-methode niet gebruikt. Althans, heel zelden,
alleen in uiterste nood, en dan nog in combinatie met veel beloning van
het goede gedrag. De reden daarvoor is niet teerhartigheid, maar het feit
dat er meestal een andere oplossing voorhanden is en dat straf bovendien
behoorlijk nadelige bijwerkingen heeft, waarvan sommige direct te zien
zijn, maar andere pas op de langere termijn aan de oppervlakte komen (zie
Straf).
In het algemeen gaat het er bij clicker-training om, dat de hond werkt
omdat hij dat wil. Je laat je hond namelijk werken voor iets dat hij graag
wil hebben of doen. Je geeft hem een grote kans (± 80%) om te slagen.
Als iets hem steeds niet lukt, geen nood: dan maakt je het iets makkelijker
voor hem, zodat hij wèl slaagt. Daarna pas vraag je weer iets meer
van hem. Door dat grote slagingspercentage krijgt jouw hond veel vertrouwen
in zichzelf, in jou als trainer èn in de clicker. Je dwingt hem niet,
waardoor hij ook geen weerstand kan krijgen.
Met clicker-training leert de hond door eigen ondervinding, door zelf
uit te proberen wat wel en wat geen klik oplevert. Je ziet de hond "denken":
"Wat kan ik nog meer doen om die klik te verdienen? Als ik nu zo
doe - niet? Zo dan?" Het resultaat is een hond die actief en enthousiast
meewerkt aan de training - wat weer een enorme beloning en stimulans voor
de baas betekent!
Door al deze positieve aspecten - ontspannen sfeer, zelfvertrouwen, succes
- is het zelfs mogelijk dat het leervermogen van de hond in een stroomversnelling
komt. Het komt voor dat honden met deze positieve methode tot zelfs 10
keer sneller kunnen leren! Een dergelijke versnelling kan met één
bestraffing teniet worden gedaan. Op zich al reden genoeg om uiterst spaarzaam
met straf om te gaan.
Sandra Hurkmans
Zie voor meer informatie en links de pagina Meer
informatie
(Oorspronkelijk geschreven voor Kynologenclub
Delft e.o.)
|