Keep Pet >> Huisdier >  >> honden >> Opleiding

Inzicht in op beloning gebaseerde hondentraining

De slanke dame van middelbare leeftijd stapte snel over de rubberen mat in het trainingscentrum, haar zwarte Labrador Retriever vrolijk stuiterend naast haar. Ze kwam soepel tot stilstand en Skip ging prompt naast haar zitten, in perfecte hielpositie. "Ja!" dacht ik bij mezelf en kromp ineen toen Carla haar hand uitstak en Skip enthousiast op zijn hoofd klopte. Skip sprong op en deinsde achteruit weg van zijn mens.

'Carla,' zei ik zacht. 'Je hebt hem net gestraft omdat hij rechtop zat.' Carla's gezicht viel. "Verdorie!" riep ze uit. "Waarom kan ik me dat niet herinneren!"

Inzicht in op beloning gebaseerde hondentraining

Wacht even . . . sinds wanneer wordt een hond aaien als straf beschouwd? Sindsdien heeft Skip ons laten weten door zijn hoofd te buigen en weg te lopen van Carla's hand dat hij het niet leuk vond om geaaid te worden. Alle andere Labs die Carla haar hele leven had gehad en getraind, vonden het heerlijk om aangeraakt te worden als beloning. Carla aaide haar hond omdat hij braaf was zonder er zelfs maar bij na te denken - het was een goed geconditioneerde reactie. Helaas, aangezien Skip het niet leuk vond om aangeraakt te worden, strafte ze hem elke keer als ze het hem aandeed, waardoor de kans kleiner werd dat hij die perfecte sit opnieuw zou uitvoeren!

De beslissingen van een hond in het leven, en het daaruit voortvloeiende gedrag, zijn gebaseerd op het feit of een bepaald gedrag iets oplevert dat hij leuk vindt (een beloning) of iets dat hij niet leuk vindt (een straf). Trainen is gewoon een kwestie van doordacht omgaan met beloningen en straffen. . . Maar je moet je hond kennen - je grondig bewust zijn van zijn voorkeuren en antipathieën - en je bewust zijn van je eigen gedrag om 'training' voor je te laten werken.

Beloningen en straffen
In de jaren vijftig ontwikkelde gedragswetenschapper B.F. Skinner een aantal principes die toepasbaar zijn op alle levende wezens met een centraal zenuwstelsel. Hij ontdekte dat dieren waarschijnlijk gedrag herhalen dat voor hen plezierig/belonend is, en waarschijnlijk niet gedrag herhalen dat tot iets onaangenaams leidt (straf). Neutrale prikkels – dingen die er voor het dier niet toe doen – hebben op de een of andere manier geen invloed op het gedrag.

Skinner toonde aan dat mensen deze eenvoudige principes kunnen gebruiken om het gedrag van een dier aan te passen. Beloningen zijn de meest betrouwbare manier om opzettelijk het aangeboden gedrag van een dier te vergroten; omgekeerd, straf vermindert dat gedrag. (Zie 'De vier principes van operante conditionering', hierna aan het einde van het verhaal). We gebruiken deze gedragsprincipes met groot succes in de hondentraining.

Echter, net als bij Skip, varieert de praktische toepassing van "beloningen" en "straffen" van hond tot hond, hoewel de definitie dat niet doet. Een beloning is alles wat een bepaalde hond leuk vindt. Een straf is alles wat een hond niet leuk vindt.

We gebruiken vaak voedseltraktaties als onze beloning tijdens de training, omdat we bijna altijd voedsel kunnen vinden dat een hond hoog genoeg zal waarderen om als een onweerstaanbare beloning te kunnen dienen, maar voedsel is niet de enige beloning die voor ons beschikbaar is. Onthoud dat een beloning alles is wat een hond leuk vindt. Het kan een klopje op het hoofd zijn (maar niet voor honden zoals Skip, die niet graag worden aangeraakt), verbale lof, een spelletje touwtrekken, een achtervolging achter een stok of tennisbal, een wandeling aan de lijn , een autorit, toestemming om op de bank te springen, het signaal om een ​​behendigheidscursus te lopen, de vrijlating van een "wacht" om de tuin in te rennen, toestemming om in het meer te springen, of het signaal om een kudde schapen.

Wanneer de gemiddelde onervaren hondengeleider het woord 'straf' hoort, denkt hij over het algemeen aan openlijke vormen van fysieke straffen, zoals slaan, knijpen of schoppen tegen de hond, of trekken aan de lijn. Ik raad of gebruik geen fysieke straffen, omdat het de geleider in gevaar brengt, de relatie met zijn hond schaadt en het enthousiasme van de hond voor training kan vernietigen. Gelukkig is fysieke straffen niet de enige manier om ongewenst gedrag te elimineren.

Onthoud dat gedragsdeskundigen het woord 'straf' definiëren als alles dat ervoor zorgt dat een dier bepaald gedrag vermindert. Dus in het geval van Skip, het Lab dat er niet van hield om aangeraakt te worden, was een klopje op het hoofd nadat hij een rechte zit had uitgevoerd voldoende om hem te laten stoppen met het uitvoeren van die rechte zit.

"Positieve trainers" - mensen die zich hebben verplicht om te trainen zonder het gebruik van pijn, angst, geweld of intimidatie - gebruiken vaak bepaalde vormen van "straf" (in gedragsmatige zin) om hun trainingsdoelen te bereiken. Wanneer een hond die hunkert naar fysiek contact en aandacht bijvoorbeeld over de trainer springt, zal ze hem de rug toekeren en wegstappen, waardoor zowel haar aandacht (oogcontact en interactie) als de mogelijkheid van fysiek contact met de hond wordt weggenomen. Dit zijn de beloningen die de hond zoekt door op te springen. Wanneer het springgedrag van de hond blijft resulteren in het verlies van iets wat hij zo graag wil, zal hij stoppen met springen - vooral wanneer deze "straf" gepaard gaat met de "beloning" van aandacht, traktaties en aaien voor stil zitten.

Wat eigenlijk een straf of beloning voor een bepaalde hond is, is dus een individuele kwestie; in gedragstermen is context alles.

Onbedoelde training
Training is daarom het opzettelijk gebruik van beloningen en straffen om doelbewust het gedrag van een hond te manipuleren. Wat soms moeilijk te onthouden is, is het feit dat honden de hele tijd leren, of we nu wel of niet opletten. Mensen weten vaak niet waarom hun honden sommige dingen doen die ze doen, of niet doen wat de mensen willen dat ze doen.

Het is eigenlijk vrij eenvoudig. Honden doen wat voor hen werkt; ze doen geen dingen tenzij ze er iets aan hebben.

Honden doen dingen die wij als 'ongepast gedrag' beschouwen, omdat het leuk is, het goed voelt of goed smaakt. Vanuit het perspectief van een hond zijn gedragingen die voor ons onaanvaardbaar zijn, zoals in de vuilnisbak belanden, katten achtervolgen of op de bank slapen, gewoon leuk!

Gefrustreerde eigenaren zeggen vaak tegen hun trainers:"Hij weet dat hij dat niet hoort te doen! Ik straf hem als hij dat doet, maar hij doet het nog steeds. Waarom?" Soms weegt het plezier dat de hond beleeft van het gedrag op tegen de 'straf' van de eigenaar. Een hond die erg opgewonden raakt van de ervaring van het achtervolgen van een kat over het hek van de achtertuin, kan het niet schelen dat er om hem wordt geschreeuwd.

In andere gevallen kan de "straf" de hond zelfs belonen. Een onstuimige Labrador die wordt geschreeuwd, geslagen of zelfs geschopt omdat hij op zijn eigenaar springt, heeft misschien geen idee dat het schreeuwen, slaan en schoppen een straf zou moeten zijn. Voor honden die hunkeren naar aandacht en houden van fysiek contact met mensen, is deze ruwe behandeling gewoon een uitnodiging om een ​​leuk (lonend) spel te spelen.

Ook realiseren hondenbezitters zich misschien niet dat ze een hond vaak ondoordacht straffen omdat hij het juiste doet. Als u dit vaak genoeg doet, "traint" u uw hond onbedoeld om te stoppen met het aanbieden van het gewenste gedrag.

Denk aan de vrouw wiens hond lekker aan het ravotten is met een paar hondenvrienden in het hondenpark. Het is tijd om te vertrekken, dus roept ze haar hond bij zich. Hij laat onmiddellijk zijn speelvrienden achter en rent naar haar toe. "Brave hond!" roept ze uit, trekt zijn riem vast en neemt hem mee uit het park. Naar haar mening was de verbale lof een ruime beloning, en het verlaten van het park heeft geen verband met de terugroepactie. Maar hier is hoe de hond het ziet:"Mama heeft gebeld, ik ben gekomen en het plezier is voorbij. Als ik bij mama kom, gebeurt er iets ergs - het plezier stopt.” De volgende keer dat ze belt terwijl hij met vrienden aan het spelen is, zal hij waarschijnlijk twee keer nadenken of hij wil komen!

Veel mensen hebben veel moeite om hun hond te trainen om betrouwbaar te komen als hij wordt geroepen. Misschien hebben ze niet genoeg aandacht besteed aan wat er meestal met de hond gebeurt nadat hij is gekomen. Er is geen hond Einstein voor nodig om te beseffen dat komen wanneer hij wordt gebeld een slecht idee is als hem onmiddellijk daarna consequent iets "slechts" overkomt - laten we zeggen dat hij in de kelder wordt gepropt of wordt opgesloten voor alle gasten in de keuken, of naar buiten gegooid in de koude regen.

De training kan ook mislukken als de beloning niet waardevol genoeg is om de hond te motiveren om de moeite te nemen om hem te krijgen. Je moet een automatische reactie op de "kom"-cue programmeren met een hoogwaardige beloning in de afwezigheid van verleidelijke afleiding voordat je deze probeert toe te passen in het aangezicht van onstuimige eekhoorns. Er zijn maar weinig honden die een eekhoornjacht verlaten om een ​​stukje droge brokken te komen verdienen! Veel positieve trainers gebruiken een verscheidenheid aan verleidelijke beloningen en mixen ze door elkaar. Dan weet de hond nooit zeker hoe groot de "uitbetaling" voor zijn goede gedrag zal zijn; hij weet gewoon dat het goed zal zijn.

Als je eraan twijfelt dat het een krachtige motivator is om kleine beloningen (zoals verbale lof, een klopje of een stuk droge brokken) te mengen met grotere beloningen (zoals stukjes vers vlees, achter een bal aanjagen of losgelaten worden om vrijuit te rennen), denk aan de gokautomaat. Zolang het een mengsel van geen beloningen, kleine beloningen en slechts af en toe een jackpot uitbetaalt, zullen menselijke gokkers daar blijven zitten en aan de hendel trekken, lang na de tijd dat het logisch is om dit te doen!

Willekeurige versterkingen
Het hebben van een verscheidenheid aan beloningen in uw trainingstoolkit geeft u meer flexibiliteit en stelt u in staat uw hond te trainen zonder dat u altijd een enorme voorraad traktaties op zak heeft. Een goed trainingsprogramma gaat in de richting van variabele bekrachtiging zodra de hond op betrouwbare wijze nieuw gedrag vertoont. In plaats van te klikken en de hond elke keer dat hij het gedrag vertoont iets lekkers te geven, sla je af en toe een klik over en prijs je de hond in plaats daarvan, vraag dan opnieuw om het gedrag en klik op de volgende. Verhoog geleidelijk de variatie en lengte van het versterkingsschema, onthoud dat willekeur belangrijk is.

Als je je hond gewoon steeds harder en harder laat werken voor een klik, zal hij waarschijnlijk stoppen met je. Als je het versterkingsschema varieert, zoals een gokautomaat in Las Vegas, kan hij niet voorspellen wanneer je je vruchten gaat afwerpen. Krijg ik deze keer een klik? Deze keer? Deze keer? Klik! Net zoals mensen door zullen gaan met het invoegen van kwartjes, zal uw hond gedrag met enthousiasme blijven aanbieden, zodat de volgende de jackpot zal winnen.

Om zijn enthousiasme te behouden terwijl je het versterkingsschema geleidelijk verlengt, gebruik je andere beloningen om hem te laten weten dat hij nog steeds op het goede spoor zit. Ik gebruik vaak "Goede hond!" als lof nadat ik heb geklikt en getrakteerd, zodat mijn honden hetzelfde warme, donzige gevoel van het krijgen van een voedselbeloning associëren met de verbale lof. Als ik vervolgens de verbale lof gebruik, zelfs zonder de klik en traktatie, hebben ze nog steeds dezelfde klassiek geconditioneerde reactie van de associatie van lof met eten, en het geeft ze een goed gevoel. Dus:"Goede hond!" wordt zelfs zonder eten een nuttige beloning.

Andere beloningen kunnen meer een onderbreking in het trainingsspel veroorzaken. Als je een speeltje als beloning gebruikt, moet je stoppen en je hond er een tijdje mee laten spelen. Dit kan heel goed werken om hem op de enthousiasmeschaal te versterken, vooral voor een hond die gek is op ballen of ervan houdt om te trekken. Het werkt niet goed als je veel herhalingen van een discreet gedrag achter elkaar wilt doen. Als je de bal elke keer gooit als hij reageert op je "down"-cue, duurt het lang voordat je een half dozijn herhalingen doet. Het werkt goed als beloning voor langdurig gedrag, zoals hiel. Een bal-gekke hond kan leren om met perfecte aandacht te volgen voor lange stukken in afwachting van de bal-achtervolging die aan het einde plaatsvindt.

Timing is de sleutel
Het is belangrijk voor een succesvol trainingsprogramma om te begrijpen wat uw hond wel en niet leuk vindt, en om die beloningen en straffen effectief te gebruiken. Om effectief te zijn, moeten de gevolgen - goed of slecht - worden geleverd in de buurt van het gedrag dat u probeert te beïnvloeden.

Stel dat uw hond tipt over uw keukenvuilnisbak terwijl u weg bent op het werk. Als je hem berispt als je thuiskomt van je werk, uren nadat de huisvuilinval heeft plaatsgevonden, leert het je hond alleen maar dat je soms onvoorspelbaar en gevaarlijk bent als je thuiskomt. Het maakt niet uit hoe "schuldig" hij eruitziet als je hem uitscheldt, hij maakt geen verband tussen jouw gedrag om tegen hem te schreeuwen en zijn gedrag om uren eerder in de vuilnisbak te belanden. Jouw perceptie van zijn ogenschijnlijk door schuld geteisterd geweten, gemanifesteerd in zijn neergelaten hoofd, gebrek aan oogcontact en sluipend langs de plinten, is een foutieve interpretatie van zijn klassieke hondenlichaamstaalpogingen om je woede te bedwingen, wat de oorzaak ook is.

Gedragsdeskundigen zijn het erover eens dat een beloning of straf moet worden gegeven binnen drie seconden, bij voorkeur één seconde of minder, van het gedrag dat u probeert te verhogen of te verlagen. Dit is een vrij korte tijdsperiode en onderstreept de waarde van het gebruik van een clicker of andere beloningsmarkering (of geen beloningsmarkering) om het moment van gewenst (of ongepast) gedrag te markeren. Als je zegt "Oeps!" op het moment dat uw hond opspringt en u zich afwendt, leert u uw hond een niet-beloningsmarkering, die u kunt gebruiken om uw hond te laten weten welk gedrag het goede ding deed verdwijnen (negatieve straf). Als je klikt! of zeg "Ja!" op het moment dat uw hond gaat zitten, zal hij gaan begrijpen dat de sit de beloning heeft verdiend, zelfs als het enkele seconden duurt voordat u de traktatie in zijn mond krijgt, en zelfs als hij opstaat voordat u erin slaagt om de traktatie af te leveren .

Vooruitspoelen
Carla en ik hadden een lange discussie over hoe we de training van Skip konden voortzetten. We hebben twee opties geïdentificeerd. Door desensibilisatie te gebruiken, zouden we Skip kunnen leren dat het een beloning was om Carla op zijn hoofd te aaien, door haar aanraking consequent te combineren met een ongebruikelijke traktatie-beloning, eerst zacht contact te gebruiken en vervolgens in intensiteit te verhogen totdat hij leerde associëren krachtig kloppen met "echt goede dingen." Carla heeft zich ertoe verbonden dit voor de lange termijn te doen, omdat ze echt wilde dat Skip van haar aanraking zou genieten.

We zijn ook begonnen met een kortetermijnaanpak om Carla's gedrag aan te passen, en kwamen overeen om positieve bekrachtiging en negatieve straf met haar te gebruiken. Elke keer dat Skip ging zitten en ze niet naar beneden reikte om hem te aaien, verdiende Carla een beloning, zoals een kwartje, een stuk chocola of een hondenspeeltje. Elke keer dat ze het vergat en naar hem reikte om hem te aaien, stapte ik de trainingsruimte uit zonder een woord te zeggen, voor een periode van 30 seconden tot drie minuten. Het werkte prachtig, en in korte tijd zat Skip gelukkig in perfecte hielpositie toen Carla stopte, zonder bang te zijn gestraft te worden voor zijn goede gedrag.

-Door Pat Miller