Illustrasjonsfoto: En ung versjon av bloggforfatteren som rir inn en unghest i USA. Vær smartere, og bruk hjelm (og kanskje en hjelper på bakken, mer om det i en annen kalenderluke 😅)

«Og så må vi huske på, at ettergift også er belønning for hesten.» Det var sånn forbundet rundet av et ellers faglig godt webinar. Men stemmer dette? Ettergift er absolutt noe hesten søker – men kan vi egentlig kalle det for en belønning?

Hester lærer på mange ulike måter. En av disse måtene, er gjennom å lage koblinger mellom hva den gjør og konsekvensene av dette i ulike situasjoner:

Hvis dette skjer, og jeg gjør dette, så vil dette skje.

Foranledning (F), atferd (A) og konsekvens (K).

I dagligtale sier vi at ettergift er fjerning av press. At presset opphører. Men enda mer konkret så er læringen for hesten i situasjonen at:

Hestens respons sørger for at den kan unnslippe eller unngå noe. Dermed utføres denne atferden oftere i lignende situasjoner senere.

 

Hvis, og bare hvis, atferden utføres oftere i samme situasjon senere, kalles prosedyren forsterkning. Hvis atferden ikke utføres oftere, så er det ikke forsterkning. Da har sannsynligvis ikke en læring skjedd.

Negativ forsterkning

Hvis jeg kjenner press fra sjenklene (F), og jeg går raskere frem (A), så unngår jeg presset fra sjenklene (K).

I læringsteorien kalles dette for negativ forsterkning. Negativ betyr at noe fjernes. Mer konkret betyr det at hestens riktige atferd gjør at hesten kan unngå eller unnslippe noe. Det blir da vår oppgave å trå til med en veltimet ettergift i riktig øyeblikk, sånn at hesten forstår hva slags atferd som sørget for at den unngikk eller unnslapp det den ønsket å unngå eller unnslippe. Det handler altså egentlig ikke så mye om at vi fjerner et press, men om at hestens respons unngår eller får dette presset til å opphøre. Det er en forskjell som ofte overses.

Her er Cooper (2020) sin definisjon av negativ forsterkning (fritt oversatt):

 

«En negativ forsterkningskontingens er en situasjon der forekomsten av en respons fører til opphøring, reduksjon, utsettelse eller unngåelse av en stimulus, noe som resulterer i en økning i fremtidige forekomster av den samme responsen.»

Hvis hestens atferd skal øke i frekvens fordi den kan unngå eller unnslippe noe, er det naturlig å tenke seg at dette noe må være noe hesten ønsker å unngå eller unnslippe, ellers vil ikke læringsprosedyren funke særlig godt.

Det må ikke være smerte. Det må ikke være noe hesten er redd for. Det må ikke være noe ubehagelig i ordets subjektive forstand. Men det må være noe hesten er motivert til å ville unngå eller unnslippe.

Og så kan man kanskje reflektere for seg selv over hva som må til for at ulike individer skal være motivert til å unngå eller unnslippe noe. 🤔

Uansett hvordan vi vrir og vender og forklarer negativ forsterkning, må denne forståelsen ligge til grunn. Hvis jeg rister i tauet for at min hest skal gå bakover, selv om det bare er en ørliten risting, og hesten på grunn av dette går bakover og dermed unnslipper ristingen i tauet, og hesten rygger bakover oftere i disse situasjonene senere, så er læringen for hesten at:

Hvis det ristes i tauet i denne spesifikke situasjonen (F), og jeg rygger (A), unngår jeg ristingen i tauet (K).

Det er effekten av dette, altså om hesten rygger bakover oftere i disse situasjonene senere, som avgjør om det er negativ forsterkning som en læringsprosedyre. Det er ikke min intensjon, eller hva jeg selv anser at jeg driver med. 😅 Hvis det ikke skjer noe økning av rygging når jeg rister i tauet i lik situasjon senere, så er det jo ikke skjedd en forsterkning av atferden, og mest sannsynlig ikke skjedd noen læring/kobling.

Hvis jeg setter meg i bilen og det begynner å pipe fordi jeg ikke setter på meg bilbeltet, og jeg setter på meg bilbeltet oftere av den grunn, sånn at jeg unngår pipelyden, så er det forsterkning fordi jeg gjør denne atferden oftere, og så er det negativ fordi noe fjernes (jeg unngår pipelyden).

Det er ingen belønning for meg å unngå denne pipelyden, men kanskje en lettelse. Akkurat som det ikke er en belønning for hesten å unngå presset fra sjenklene, men en lettelse.

Når atferden er blitt innlært

Senere, når atferden med å gå frem når hesten kjenner press fra sjenklene er godt innlært, behøves ikke presset fra sjenklene på samme måte. Da er «kontrollen» over atferden (gå fortere fram) ofte overført til et mer sofistikert signal for hesten, som du, bevisst eller ubevisst, la til før presset fra sjenklene. Kanskje dette signalet er endringen i kroppen din, en lyd du lager, energien din, «tankene» dine eller tilsvarende små endringer, som gjør at hesten har lært betyr å gå raskere. Når atferden er under kontroll av et sånn signal, så trenger det ikke å være noe hesten forsøker å unngå eller unnslippe lenger, selv om innlæringen har vært gjennom denne prosedyren. Men kanskje må signalet likevel opprettholdes i ny og ne av et mer konkret press fra sjenklene, så hesten blir påminnet hva det er den unngår/unnslipper ved å følge signalet om å gå frem.

Mange rare tolkninger av ordet «negativ»

Ordet negativ for å forklare denne prosedyren bringer med seg like mange subjektive tolkninger som en runde i et kunstgalleri.

Fortsatt er det mange som assosierer dette med trening som må unngås, trening som oppleves negativt, en negativ opplevelse som blir «positiv» når presset fjernes osv. 🤯 Alle sånne forklaringer er egentlig helt irrelevant når ordet negativ står sammen med ordet forsterkning. Da handler det bare om at noe fjernes (unngås/unnslippes) for å øke sannsynligheten for at en atferd skjer oftere. Ordet negativ betyr ikke noe mer enn et matematisk minustegn. Men fordi det brukes i hverdagssammenheng om mye følelsesrelatert, blir det fort forvirrende. Jeg skulle ønske positiv og negativ forsterkning kunne skiftet navn, for eksempel til:

  1. Oppnå-forsterkning: Hestens atferd oppnår noe, som øker forekomst av denne atferden  (positiv forsterkning)
  2. Unngå-forsterkning: Hestens atferd unngå/unnslipper, eller får noe til å opphøre, som øker forekomst av denne atferden (negativ forsterkning)

Da tror jeg det ville vært enklere for mange å se litt mer objektivt på at dette bare er objektive forklaringer rundt hvordan læring skjer gjennom ulike læringsprosedyrer.

Begge disse formene for forsterkning (positiv og negativ) fører til at atferden øker (sannsynligvis skjer oftere i fremtiden); den ene fordi konsekvensen er at hesten oppnår noe, den andre fordi konsekvensen er at hesten unngår eller unnslipper noe.

Negativ forsterkning og etiske refleksjoner

Men – selv om ordet negativ ikke handler om noe emosjonelt når det står sammen med ordet forsterkning, er læringsprosedyren negativ forsterkning noe som bør diskuteres godt av alle som velger å benytte den for trening og læring, enten bevisst, eller ubevisst, i læringssituasjoner for hesten.

Det vi bør diskutere er hva slags stimuli som påføres for at hesten skal være motivert til å ønske å unngå eller unnslippe det, hvordan dette påføres og hvilke følelser hesten opplever i læringssituasjonen.

Negativ forsterkning som læringsprosedyre spenner nemlig så vidt og favner så mye type stimuli og metodikker. I den ene enden av skalaen i negativ forsterkning kan det handle om relativt lite aversive stimuli hesten søker å unngå eller unnslippe, nesten bare små veiledninger for å hjelpe hesten med å forstå, mens i den andre enden av skalaen ligger fysisk påført vold for å øke sannsynligheten for at en atferd skjer oftere, med uheldige ringvirkninger slik som mange sterke følelser for hesten (angst og frykt, for eksempel). Begge deler faller innunder negativ forsterkning hvis det er sannsynlig at atferden skjer oftere i fremtiden.

For ja, dersom man slår en hest for å få den til å hoppe et hinder, og konsekvensen for hesten er at den da unngår å bli slått, og dette øker sannsynligheten for at hesten hopper dette hinderet oftere i fremtiden, så er det fortsatt negativ forsterkning som er læringsprosedyren.

Når negativ forsterkning bevisst benyttes som læringsprosedyre i en situasjon med hesten er det altså en helt vesentlig og viktig diskusjon å løfte fram i lyset hva slags stimuli som påføres for at hesten skal være motivert til å ønske å unngå eller unnslippe dette, hvordan dette påføres og hvilke følelser som følger med denne læringssituasjonen for hesten. Det er noe alle vi som benytter denne læringsprosedyren i trening av hest burde reflektere godt over – og begynne å legge mye bedre merke til.

Men denne diskusjonen har likevel ingenting med ordet negativ å gjøre når ordet negativ står sammen med ordet forsterkning. Henger du med på forskjellen der? 😅🤞

Belønning vs. ettergift

Noen ganger, når jeg skal lære en fersk hesteeier å forstå ettergift, kan jeg bruke ordet «belønning» med gåsetegn. 🙈🤦‍♀️ Snakker om dobbeltmoralskt… 😅 Men når hesteeieren har forstått konseptet litt bedre, reflekterer vi etterhvert rundt hvorfor det kanskje ikke blir helt riktig å kalle dette for en belønning. Da kommer ofte et godt spørsmål fra mange:

«Men hvis ettergift er noe hesten søker, hvorfor kan vi ikke bare kalle det for belønning da, egentlig?»

Fordi ettergift egentlig ikke er noen belønning. I hvert fall ikke hvis man ser nærmere på definisjonen av ordet belønning. Belønning refererer ofte til en form for kompensasjon, anerkjennelse eller gave som gis som følge av en spesifikk handling, prestasjon eller atferd. Belønning i dagligspråket refererer mer til hvilken hensikt en belønning har, fremfor om den har noen effekt på atferden (at atferden øker i frekvens også på lang sikt). Og det er noe eksternt og ønskelig som tilføres situasjonen.

Det er ingenting eksternt og ønskelig som tilføres situasjonen når jeg tar på meg bilbeltet og dermed unnslipper pipelyden. Det er heller ikke noe ekstern og ønskelig som tilføres når hesten går frem og dermed unnslipper presset fra sjenklene.

Det er en lettelse å unnslippe eller unngå disse stimuliene, og det ønsker vi oss, både jeg og hesten – men det er ingen belønning.

Se forbi fancy forklaringer

Det er utfordrende å være hesteeier og sjonglere i alle forskjellige treningsmetodikker som selges. De færreste trenere stripper ned sine tanker og formidler de grunnleggende læringsprosedyrene som ligger bak. Stort sett tåkelegges det og kalles for mye fint. Negativ forsterkning som treningsprosedyre har gjennom årene blitt svært misforstått. Parelli-Horse-Man-Ship for eksempel, et av verdens mest markedsførte treningssystemer for hest-menneske-relasjon (Parelli, 1995), definerer negativ forsterkning på en ukorrekt måte, ifølge McGreevy og McLean (2007).

Gode trenere vet godt hvilke læringsprosedyrer de benytter seg av, enten de opplyser om dette eller ikke. Det er synd når dette tåkelegges, synes jeg, for det gir et inntrykk av at det er noe som må skjules – og det er noe som jeg tror er med på å opprettholde full forvirring hos vanlige hestemennesker, som forsøker å finne ut av hvordan disse læringsprosedyrene skal forstås og kan benyttes.

Noen ganger når man ser på trenere, eller videoer eller er med på kurs, kan det være lurt å se bortenfor alle språklige forklaringer fra treneren. Skru av lyden når du ser ulike treningsvideoer, for eksempel. Se på kroppsspråk hos hest og menneske. Se på atferd. Hesten skjønner ikke disse fancy ordforklaringene uansett. Men den skjønner konsekvenslæring; «hvis dette skjer, og jeg gjør sånn, så skjer dette». Legg merke til dette i samhandling mellom hest og menneske. Det er ganske fascinerende, man kan oppleve å se at læringen skjer på en helt annen måte enn det som verbalt beskrives av treneren. Bare for å forvirre oss ytterligere. 😅

Ord er makt

Spiller det virkelig så stor rolle om man kaller ettergift for belønning eller ikke da? Det er jo tydeligvis noe hesten søker?

Jo, jeg tror det har stor betydning hva du kaller det, hvis du skal trene og lære en hest noe som helst. Det forteller nemlig mye om forståelsen for hvordan du som lærer/trener forstår de prinsippene du benytter deg av for å lære hesten noe, og at du forstår hva konkret det er som skaper læring og hvordan.

Ordene vi bruker former dessuten måten vi ser på det vi gjør. Og vi må passe oss litt for at vi ikke lurer oss selv med denne omformuleringen.

Det kjennes for eksempel mye bedre ut for meg å si:

«Og der gir du hesten en skikkelig belønninng ved gi den god ettergift!» 😶‍🌫️

I stedet for:

«Og der unngikk hesten alt presset du påførte den. Puh!»

Men det er en forvregning av sannheten, for ettergift er jo egentlig ingen belønning. Det tror jeg vi kan bli litt bedre til å huske på alle sammen, enten vi pusler med hestene bak låven eller jobber i store forbund.

❤️

Interessert i å lære mer?

Mange hundetrenere er godt oppdatert på læringsteori både i teori og praksis. En av disse som har mye gratis materiale tilgjengelig på nettsiden sin, er Emma M. Garlant, som driver Hun om Hund. I denne bloggen for eksempel, gir hun en innføring i operant betinging og ulike læringsprosedyrer slik som positiv og negativ forsterkning. Disse prinsippene er like uansett om vi snakker om hunder, hester eller mennesker.

Bakgrunnskilder for innholdet i denne bloggen:

  • Div. pensumlitteratur og forelesninger fra mine pågående videreutdannelser i psykologi med vekt på atferdsanalyse og anvendt læringsteori (OsloMet og NMBU), 2023-2024.
  • Cooper, J. O., Heron, T. E. & L., H. W. (2020). Applied behaviour analysis (3. utg.). Pearson Education.
  • McGreevy, P. D. & McLean, A. N. (2007). Roles of learning theory and ethology in equitation. Journal of Veterinary Behavior, 2(4), 108-118. https://doi.org/10.1016/j.jveb.2007.05.003.

Del:

Boka om hest-menneske-relasjon!

BEVISST er en bok med historier om samspillet mellom hester og mennesker, hestens små signaler og viktigheten av å bli mer bevisst hva vi selv kommuniserer uten ord.

LES MER/BESTILL BOKA HER