– lektion 1
Baglænskædning er et smart værktøj at have til brug for uddannelsen af en konkurrencehund, men det kan også være anvendeligt i hverdagslydigheden. Imidlertid synes mange at det er lidt svært, og noget man har svært ved, er man tilbøjelig til at droppe eller i hvert fald ikke at bruge ret meget. Det kan jo sagtens lade sig gøre at indlære øvelser og få resultater uden. Men jeg vil med denne lille artikelserie prøve at vise dig at det slet ikke er så svært når man først kommer i gang – og at det kan bruges meget mere kreativt end man ofte ser.
Men allerførst tager vi et lille kig på teorien bag baglænskædning. For nogle af vore læsere er det repetition men for andre nyt.
Hvad er en adfærdskæde? Det er en række af adfærd som følger efter hinanden i en fast rækkefølge, og som opretholdes af en forstærker i slutningen af kæden. En hel del øvelser i diverse programmer vi træner, vil være sådanne kæder men ikke alle – nogle ser forskellige ud fra konkurrence til konkurrence, men måske kan dele af dem alligevel være faste.
I en adfærdskæde må hunden altså udføre en række af adfærd før belønningen kommer. Men en færdig etableret adfærdskæde hænger sammen på en ganske særlig måde. Det er nemlig sådan at signaler (hedder diskriminative stimuli på fagsproget) i en kæde har en dobbelt funktion. De fortæller både hvad hunden skal gøre som det næste, men når vi har indlært et signal kun med belønningsbaseret træning, så vil det også komme til at fungere som en betinget forstærker – som et klik. Og det er fordi vores signaler kommer til at virke som et ”grønt lys” til at NU må du udføre den adfærd som fører til den fantastiske boldleg. Så det betyder altså at signaler i kæden både er ”klik” for den adfærd som kom før signalet, og samtidig fortæller hvad der skal komme efter.
En adfærdskæde kan etableres på to måder. Den kan bygges op ved hjælp af baglænskædning eller ved forlænskædning. Når man forlænskæder, lægger man hele tiden et nyt led til før man belønner, således at belønningspunktet hele tiden indtræffer på et nyt sted i kæden, indtil den færdige kæde er etableret. Lad os sige at øvelsen består af 3 led:
- Adfærd 1 > klik og belønning
- Adfærd 1 – adfærd 2 > klik og belønning
- Adfærd 1 – adfærd 2 – adfærd 3 > klik og belønning
- Når man baglænskæder, gør man det modsat:
- Adfærd 3 > klik og beløn
- Adfærd 2 – adfærd 3 > klik og beløn
- Adfærd 1 – adfærd 2 – adfærd 3 > klik og beløn.
Når man begynder at sætte flere adfærd sammen til en kæde, eller bare en vilkårlig række af adfærd (sekvens), skal hunden lære at arbejde i længere tid før belønningen kommer. Vi skal her for alvor til at strække belønningsfrekvensen. Når vi skal lære hunden udholdenhed i at præstere lige godt selvom belønningen lader vente på sig, betaler det sig at tænke lidt over hvordan vi gør det. Vi ønsker for det første at hunden ikke begynder at lave variationer i de adfærd vi sætter sammen, vi ønsker heller ikke at hunden skal miste sin gejst og intensitet, eller modsat: komme med frustrationsudbrud. Så her betaler det sig for de allerfleste at lære hunden dette på en lempelig måde, så den ikke oplever at få en kold tyrker når vi påbegynder det.
Lad os se lidt mere på hvad der sker når vi bruger de to forskellige måder at kæde på.
Når man forlænskæder, udskyder man, som vi ovenfor har set, hele tiden belønningspunktet hver gang man sætter en ny adfærd på. Det vil sige at når hunden forventer at belønningen kommer efter en adfærd (som den plejer at få belønning for), så får den i stedet et nyt signal til at udføre en adfærd mere for at få belønning. Selvom at vi har indlært vore signaler positivt – som et ”klik” – så vil dette klik med efterfølgende adfærd ikke være lige så god en belønning som at få den rigtige belønning. Dette med at signalerne får en dobbelt funktion, vil nemlig ikke have samme kraft før kæden er færdigtrænet og belønningspunktet igen er blevet fast. Så imens du arbejder på kædeprocessen, vil hunden lære at den hele tiden skal gøre endnu mere for at få belønningen. Dette kan være vanskeligt for nogle hunde.
Desuden repeteres første led i kæden flest gange og sidste led færrest gange. Det som repeteres mest, huskes jo som bekendt bedst. Så når hunden arbejder sig igennem kæden, går den fra det den kan bedst, til noget der er blevet repeteret færre gange, og som den derfor kan være mere usikker på. Så hvis vi forestiller os at vi træner på en længere kæde, så vil risikoen for at den laver uønskede variationer på nogle af de sidste led stige. Og vi belønner selvfølgelig ikke en fejl, så hvis det sker, vil vi være nødt til at afbryde øvelsen, og alle de adfærd hunden udførte helt rigtigt forinden, vil så ikke blive belønnet selvom de var gode nok….
Derfor kan det være en rigtig god idé at baglænskæde. Her sker der nemlig noget helt andet. For det første er belønningspunktet hele tiden det samme. Hunden ved hele tiden hvornår den rigtige belønning kommer. Og det betyder at dette med signalernes dobbelte funktion, som ”klik” og signal, etableres helt fra starten af kædeprocessen. Samtidig repeteres sidste led flest gange – så når vi sætter et nyt led på, går hunden hele tiden fra noget den kan mindre godt til noget den husker rigtig godt, og risikoen for at skulle fejlmelde en lang række veludførte adfærd ved slutningen af en kæde, vil blive væsentligt mindre.
Så ikke nok med at sidste led repeteres mange gange – det efterfølges også samtidig af at belønningen indtræffer umiddelbart efter hver eneste repetition. Dette gør at sidste led i kæden får højere værdi og kan dermed forstærke det led som kommer før. For ifølge Premacks princip kan mere sandsynlige adfærd forstærke mindre sandsynlige adfærd. Og hvilke adfærd er mest sandsynlige? Jo, det er adfærd som er belønnet rigtig godt, og som er blevet belønnet fornylig. Og det er præcis hvad der sker i en baglænskædning. Vi får en dominoeffekt af slutbelønningen hele vejen igennem kæden, og derfor bliver det slet ikke lige så vanskeligt for hunden at arbejde i længere tid før den rigtige belønning kommer. Det kommer meget mere til at ligne kontinuerlig forstærkning, som det kaldes, når vi belønner hver eneste adfærd.
Premacks princip handler om at der principielt ikke er forskel på forstærkere (det vi belønner med) og adfærd. Det som man kan GØRE med forstærkeren – altså f.eks. at spise, løbe efter og fange etc. er det som virker som forstærker. Det betyder at en forstærker ikke bare er et fysiologisk behov som kan opfyldes men kan være alt hvad hunden kan lide at gøre. Så noget hunden foretrækker at gøre som f.eks. at spise godbidder, kan forstærke noget andet som f.eks. at lægge sig på tæppet (ikke så sandsynligt som at spise godbidder). Men yndlingstricket kan også forstærke sid eller at blive lukket ud i haven kan forstærke at sidde og vente pænt foran døren uden at kradse på døren.
Alle hunde har en præferenceliste over adfærd som er mere sandsynlige end andre adfærd. Denne påvirkes af vor træning. Hvilke adfærd som er mest sandlige, er:
- Adfærd som totalt set er forstærket virkelig mange gange i løbet af hundens liv
- Adfærd som ofte er forstærket meget godt (høj kvalitet på forstærkningen)
- Adfærd som er blevet forstærket for nylig. En adfærd som du netop har forstærket flere gange efter hinanden, vil næsten ALTID være mere sandsynlig end andre mulige adfærd (selv om deandre adfærd totalt set er blevet forstærket flere gange i hundens liv).
- Samt adfærd hunden foretrækker som primærforstærkere(spisning, leg etc.)
Så vi har altså en mulighed her for at lære hunden udholdenhed på en mere lempelig måde end ved bare at begynde at strække belønningsfrekvensen efter et uforudsigeligt mønster. Det betyder ikke at man ikke skal arbejde med dette også! Men det kan have sine store fordele at bruge baglænskædning til etablering af en øvelse men i særdeleshed også til at lægge øvelser sammen i et program. Dette vil vi komme tilbage til i en senere artikel.
Reference:
Svartdal & Flaten: Læringspsykologi
Paul Chance: Learning and Behavior
Steven R. Lindsay: Applied Dog Behavior and Training. Vol One
Køste & Egtvedt: Lydighetstrening I teori og praksis
Horne & Øyen: Målrettet miljøarbeid, del 1 og 2