Beloning

Beloningen Als je ervaring hebt met honden trainen, dan gebruik je beloningen waarschijnlijk al jaren in je voordeel: als je hond doet wat jij wilt, beloon je hem, bijvoorbeeld met een koekje of een spelletje, zodat hij dat gedrag zal willen herhalen. Hoe leuker de hond je beloning vindt en hoe beter jij het geven hiervan weet te timen, hoe sneller hij leert te doen wat jij wilt en hoe gretiger hij het zal doen.

Het kan echter zijn dat je deze methodiek daarnaast onbewust verkeerd toepast bij gedrag dat je niet zo prettig vindt. Je duwt je hond bijvoorbeeld steeds weg als hij tegen je opspringt, maar hij komt steeds weer terug. Dan ziet het ernaar uit dat je hond jouw duwen heel erg prettig vindt! Of misschien schreeuw je tegen hem als hij weer eens hardnekkig jankt. Het feit dat het hardnekkig is, wijst erop dat hij jouw geschreeuw belonend vindt! Waarschijnlijk gaat het je hond puur om de aandacht, en of die nu positief of negatief is, maakt hem op dat moment niet uit.

Niets beïnvloedt het gedrag van een hond zo grondig als beloning. Het beter jij dit machtige middel weet toe te passen, hoe meer invloed je hebt op het gedrag van je hond!

Naar boven Naar beneden Beloning bepaalt gedrag

Niets beïnvloedt het gedrag van een hond zo grondig als beloning. Als pup vertoont de hond allerlei gedrag dat soms wel, soms niet wordt beloond. Het belonen gebeurt soms bewust of onbewust door jou of je gezin, maar soms ook 'toevallig' door de omgeving of binnen de hond zelf.

Een voorbeeld van beloning vanuit de omgeving is een omgevallen of omgestoten vuilnisbak, waaruit allerlei lekkers - voor je hond dan - is komen rollen. De hond leert hiermee dat vuilnisbakken zeer interessante voorwerpen zijn, die een nader onderzoek verdienen.

Een hond kan zichzelf echter ook belonen met gedrag als blaffen, piepen of zichzelf continu likken. Hier kan sprake zijn van versterking van het gedrag door uzelf of andere mensen, omdat de hond op die momenten juist aandacht krijgt vanwege zijn gedrag. Het is echter ook mogelijk dat de hond last heeft van zware stress, die hij met dit gedrag probeert te verlichten. Bij dit soort gedrag om stress te verlichten kunnen honden zover gaan dat ze zichzelf verwonden door bijvoorbeeld aan hun eigen poot te knagen (automutilatie).

Dit zijn voorbeelden van 'zelfbelonend gedrag': gedrag waarmee de hond zichzelf beloont.

Gedrag dat niet wordt beloond, verdwijnt vanzelf: het levert je hond namelijk niets op en is dus een verspilling van energie. Na 1 of 2 jaar vertoont je hond dus bijna uitsluitend dàt gedrag dat beloond werd – vanuit de omgeving, danwel bewust of onbewust door de baas.

Naar boven Naar beneden De kracht van beloning

Het is mogelijk dat je hond een bepaald gedrag al herhaalt, terwijl het slechts één keer beloond is.

Ook bij mensen geldt dit. Stel je vindt op een dag in een vuilnisbak een briefje van 100 euro. Wedden dat je nog weken daarna toch minstens even naar de plek gluurt waar je het briefje vond, ook al weet je dat de kans op het opnieuw vinden van zoveel geld op die plek heel klein is?

Het moeilijkst af te leren is gedrag dat zelden wordt beloond, maar waarvoor de beloning, àls deze dan eindelijk bemachtigd wordt, heel groot is. Dat is ook een van de geheimen van de aantrekkingskracht van gokautomaten (zie ook het onderwerp 'variabel belonen' in het artikel Trainingsvoorbeeld). Èn de reden dat veel honden bedelen aan tafel!

Beloning is dus een heel machtig middel, als je het maar in jouw voordeel weet te gebruiken.

Naar boven Naar beneden Wanneer belonen?

Het moment van beloning – 'timing' genoemd – is zeer belangrijk. Je hond moet namelijk een verband kunnen leggen tussen zijn gedrag en de beloning. Als de beloning vóór het gedrag komt, of vijf minuten erna, zal de hond nooit een verband zien. Onderzoek heeft aangetoond dat het beste moment van beloning 4/10 seconde na het vertonen van een gedrag is. Dat is ook logisch, want honden zijn over het algemeen erg actieve dieren. Een paar seconden na het gedrag dat jij wilt belonen, heeft je hond misschien al vijf andere gedragingen vertoond.

Als je bijvoorbeeld bij het aanleren van de zit pas 5 seconden nà het moment waarop je hond ging zitten de beloning toedient, is je hond inmiddels al opgestaan, heeft hij ergens aan gesnuffeld, naar andere honden gekeken en tot slot een bijtje nagejaagd. Je hebt dan dus niet het zitten beloond, maar het najagen van het bijtje!

Het moment van belonen kun je vergelijken met het nemen van een foto: als je een bepaald gedrag wilt fotograferen, druk je niet voor, niet na, maar precies tijdens het gedrag af. 

Je moet je hond zijn beloning dus tijdens of anders direct nà het gewenste gedrag geven als je wilt dat hij zijn gedrag vaker gaat herhalen. Goed timen van je beloning is de enige manier waarop je je hond kunt vertellen wat je van hem wilt, welk gedrag je graag wilt terug zien.

Nu is het niet altijd mogelijk je beloning op precies het goede moment te geven. Een koekje in je zak heb je niet binnen 4/10 seconde uit je zak en in de mond van je trouwe vier­voe­ter. Hetzelfde geldt voor een speeltje.

Terwijl je je lekkers of speeltje pakt, heb je nogal wat handelingen. Je gaat met je hand naar je zak. Je hand glijdt in je zak. Je zoekt het lekkers of speeltje. Je pakt het eruit (en bij een speeltje gaat dat lang niet altijd even makkelijk en snel). Je beweegt je hand richting hond. En je geeft het lekkers/speeltje.

Is je hond al die tijd blijven zitten? Dan heb je geluk. Maar als hij niet is blijven zitten, welk gedrag van je hond ben je dan aan het belonen op het moment dat je hem zijn beloning geeft? Welk gedrag heb je voor je hond "op de foto gezet"? Is dat het zitten? Of is dat het weer overeind komen?

Op den duur leert je hond waarschijnlijk wel om zo lang te blijven zitten dat je hier wèl de tijd voor hebt. Maar je bent nu nog bezig met de allereerste aanleerfase en die kan op deze manier erg lang duren!

De beloning steeds in je hand houden om dit traject te verkorten, werkt voor veel honden als afleiding. Ze willen zo graag de beloning, dat ze niet meer echt nadenken over het gedrag waar ze mee bezig zijn. Terwijl je juist wilt dat ze een bepaald gedrag leren.

Bovendien wordt het voor veel honden een onderdeel van de oefening als je steeds de beloning al te voorschijn haalt voor de oefening. Op het moment dat je dan geen beloning in je hand hebt, snappen ze niet meer wat je van ze vraagt. Het gedrag is nog niet generaliseerd - ietsje meer hierover lees je in Trainingsvoorbeeld onderaan bij de Trefwoorden.

Ook kan het zijn dat een hond het niet genoeg vertrouwt: "Geen beloning in je hand? En wie garandeert mij dan dat ik iets krijg voor het uitvoeren van deze oefening?" (Wees gerust: op den duur leert je hond dat hij niet meer voor iedere oefening iets krijgt, maar in de aanleerfase krijgt de hond wèl voor iedere goede uitvoering van de oefening een beloning.)

Naar boven Naar benedenGeconditioneerde beloning

Om al deze redenen is het erg handig je hond een signaaltje te leren waarmee je hem vertelt: "wat je nù doet is goed en daarvoor krijg je een beloning".

Het signaal kan van alles zijn: een woordje, een bepaald geluid, een lichtflits, enz. Het aanleren gebeurt heel eenvoudig door het signaal steeds binnen 3 tot 5 seconden te laten volgen door een beloning: dat geeft je al heel wat meer tijd om je beloning te pakken! Binnen 5 tot 10 herhalingen heeft je hond dit signaal leren herkennen.

Dit signaal heet officieel een 'geconditioneerde versterker', zeg maar een aangeleerde beloning.

Kort

Voor de meest duidelijke communicatie met je hond moet het signaal liefst kort zijn. We blijven even bij het voorbeeld van de zit. Je hond gaat zitten. Je beloont hem met een langgerekt signaal ("braaaaaf" of "goed zooooooo") en je hond komt tijdens jouw signaal overeind. Wat heeft je hond dan begrepen? Begrijpt hij dat het jou om zijn gedrag aan het begin van het woordje ging, of onthoudt hij juist wat hij deed toen je klaar was met je woordje?

Ook het belang van een kort signaal wordt duidelijker door een vergelijking met fotografie. Stel je wilt een foto nemen van je hond terwijl hij speelt met een andere hond. Als je een lange sluitertijd (de tijd dat de foto belicht wordt) neemt, krijg je een vage foto: hij is bewogen! Als je echter een korte sluitertijd instelt, krijg je een scherpe foto (als je tenminste goed scherp stelt). Als je je moderne camera op 'sportstand' zet, wordt dus automatisch een korte sluitertijd ingesteld.

Duidelijk

Ten slotte is het belangrijk dat jouw signaal duidelijk is voor je hond. Het beste gaat dat met een signaal dat je hond goed zal opvallen omdat hij het niet vaak hoort, zoals bijvoorbeeld de klik van de clicker. Bij dove honden, die de clicker uiteraard niet kunnen horen, wordt wel een kort lichtsignaal met een zaklamp of een flitser gebruikt.

Naar boven Naar beneden Gedrag afleren

Het zal inmiddels duidelijk zijn dat versterking de enige manier is om een hond iets aan te leren. Maar soms wil je een hond juist iets àfleren. Ook daarvoor is positieve versterking geschikt.

Huilende hond Eén manier om je hond iets af te leren, is ervoor te zorgen dat het gedrag niet meer versterkt wordt. Dan sterft het op den duur uit. Dit heet met een mooi woord "extinctie". Als het gedrag in het verleden vaker is beloond, zal het echter enige tijd duren voordat het ophoudt. Sterker nog, het gedrag zal in eerste instantie verhevigen.
Bijvoorbeeld, een hond jankt om aandacht. De baas reageerde soms iets eerder, soms iets later, soms vriendelijk ("wat is er jongen, moet je uit?"), soms boos. Dan reageert de baas een keertje helemaal niet. De hond zal dan in eerste instantie steeds harder gaan janken, omdat dat in het verleden meestal alsnog de gewenste aandacht opleverde. Hij zal dit ook enige tijd volhouden en zelfs gaan blaffen, want de baas reageerde in het verleden ook niet altijd meteen. Maar op een gegeven moment houdt het gedrag toch op, meestal na een laatste, ergste verheviging van zijn ongewenste gedrag. De eerstvolgende keer zal de hond het weer proberen, maar zal hij iets minder lang aanhouden. En zo verder, totdat de hond het tenslotte helemaal opgeeft.
Bij deze methode schuilt een addertje onder het gras. Als de baas namelijk niet volhoudt en toch een keer aandacht schenkt aan het gejank, zal de hond het de volgende keer nòg hardnekkiger volhouden: hij heeft nu namelijk geleerd dat de aanhouder wint! Hierbij is dus heel consequent gedrag en doorzettingsvermogen van de baas vereist.

Als de baas het denkt niet vol te houden, is een goede tip om, op het moment dat de hond begint, dirèct de kamer uit te lopen. Doel van de hond was aandacht, vertrek van de baas betekent einde (mogelijkheid tot) aandacht. Het gedrag van de hond heeft geen succes en stopt.
Deze eerste verheviging van gedrag bij het uitblijven van een versterking die de hond gewend is te krijgen, kunt je ook in je voordeel gebruiken bij het uitbouwen van gewenst gedrag (een oefening) en bij het afbouwen van de beloning. Dit wordt veel toegepast bij clicker-training.

Naar boven Naar beneden

Een andere manier om middels versterking een gedrag af te leren is de afwezigheid van het gedrag te belonen, terwijl je het gedrag zelf negeert. Dit werkt iets sneller dan de vorige methode, omdat je je hond een duidelijk alternatief gedrag biedt, dat direct iets oplevert. Als een hond bijvoorbeeld tegen je opspringt, negeer je hem terwijl hij springt (waardoor dit gedrag "uitsterft"), maar versterk je hem zodra hij vier poten op de grond heeft. Zodra hij dit wat door heeft, versterk je hem geregeld zolang hij vier poten op de grond houdt. Vervolgens bouw je de beloningsfrequentie rustig af.

Een derde veelgebruikte manier is het aanleren van een gedrag dat de hond onmogelijk kan combineren met het ongewenste gedrag. Zo kan je hond niet tegelijkertijd in de mand liggen tijdens het eten en aan tafel zitten bedelen. Een hond kan ook niet tegelijk tegen iemand opspringen en zitten of liggen. Soms vraagt het bedenken van een dergelijk zogeheten 'onverenigbaar gedrag' enige moeite, maar het is vaak een uitstekende manier om ongewenst gedrag af te leren.


Wil je een hond die graag traint en enthousiast werkt? Die altijd vol aandacht voor je is? Wil je een wereldhond die jou een wereldbaas vindt? Achterhaal dan wat jouw hond in welke situaties geweldig vindt, en gebruik dit in je voordeel. Train bewust met veel, liefst uitsluitend, positieve versterking. Want positieve versterking is oneindig veel krachtiger dan de meesten denken. Bovendien is het ook voor jezelf veel leuker om continu te letten op wat je hond allemaal goed doet. Het is weliswaar soms gemakkelijker gezegd dan gedaan en vraagt veel denkwerk. Maar dan gebruiken we juist datgene wat wij als mens wel hebben (als het goed is) en de hond niet: ons verstand!

Sandra Hurkmans

  • In het artikel Ervaringsleren wordt dieper ingegaan op operante conditionering en het gebruik van termen als bekrachtiging, versterking, straf, correctie, positief en negatief in de zin van R+, P+, R- en P-, maar wel aan de hand van  veel voorbeelden, plaatjes en een leuk ezelsbruggetje.
  • In het artikel Straf en correcties wordt ingegaan op de niet onaanzienlijke gevaren die daaraan kleven, evenals het correcte gebruik ervan (niet makkelijk!).

 

(Oorspronkelijk geschreven voor Kynologenclub Delft e.o.)