Come imparano i cani e gli umani. Tipologie di premi o “rinforzi” per sviluppare l’apprendimento

Come imparano i cani e gli umani. Tipologie di premi o “rinforzi” per sviluppare l’apprendimento

Il concetto di “rinforzo” deriva da una corrente particolare della psicologia chiamata “comportamentismo”, corrente interessata a studiare i processi alla base degli apprendimenti osservando i comportamenti. Alcuni studiosi,  come Skinner per fare un nome, attraverso esperimenti sugli animali, avevano notato che un determinato comportamento tende a ripetersi nel tempo se le conseguenze sono positive per il soggetto, mentre tende ad estinguersi in caso contrario, cioè se le conseguenze sono negative. Ciò che porta, quindi, ad un incremento del comportamento si definisce “rinforzo”. Ciò che porta, invece, a estinguere un comportamento prende il nome di “punizione. In questo articolo ci concentreremo sulle tipologie di rinforzo.

Per semplificare vi propongo qualche esempio di rinforzo facendovi degli esempi sia in ambito dell’apprendimento umano che animale.

Il rinforzo positivo
Il rinforzo positivo consiste nel far seguire una conseguenza positiva a un comportamento messo in atto dal soggetto, sbagliato o giusto che sia.
Se un bambino si è comportato bene o ha preso un bel voto tanto da meritarsi le lodi o un premio da parte dei genitori, questo è un esempio di comportamento giusto a cui segue un rinforzo positivo.

Il rinforzo positivo agisce in modo più efficace se è vissuto come meritato.

Allo stesso modo se parliamo di addestramento animale, quando ad un cane viene data una ricompensa dopo aver fatto qualcosa di notevole, il premio è uno stimolo positivo e il cane viene addestrato usando il “rinforzo positivo”. Si può dunque definirlo come ha fatto Karen Pryor: “qualsiasi cosa che, verificandosi in congiunzione con un atto, tende a far aumentare le probabilità che tale atto si manifesti di nuovo”, o, semplicemente, una reazione positiva a un comportamento.

Che tu stia cercando di insegnare al tuo cane a sedersi o qualsiasi altro comportamento, il rinforzo positivo è uno strumento potente e gradevole. Studi scientifici in materia di apprendimento animale hanno accertato che un’educazione fondata sul rinforzo positivo è più efficace (e divertente) rispetto a quella basata su un tradizionale sistema di punizioni.

rinforzo positivo

Faccio qui un esempio invece di comportamento sbagliato a cui segue un rinforzo positivo.

Se un bambino ogni volta che piange (comportamento) si accorge che la mamma arriva a prenderlo in braccio (rinforzo), tenderà a riproporre tale comportamento per ricercare la sensazione piacevole e appagante del calore materno e per accrescere la sensazione di avere un controllo sull’ambiente esterno. Prendere in braccio un bambino quando piange è, quindi, un rinforzo sul comportamento del pianto in quanto finalizzato a farlo ricomparire.

Un altro esempio eloquente che possiamo riscontrare nella vita di tutti i giorni potrebbe essere il seguente: se il bambino si accorge che iniziando a gridare e a sbattere i pugni (comportamento) la mamma gli dà il gelato o la cosa (rinforzo) che desidera e che inizialmente gli aveva negato, tenderà a riproporre tali comportamenti inadeguati per ottenere ciò che vuole. E’ il caso dei bambini definiti “capricciosi” che sanno come far perdere le staffe ai genitori per ricevere quanto desiderato. Cedere alle richieste pressanti o alle sceneggiate dei bambini dando loro ciò che chiedono insistentemente è, quindi, un rinforzo sul comportamento inadeguato del gridare e dello sbattere i pugni perché è finalizzato a farlo ricomparire.
Gli esempi precedenti mostrano cosa si intende per “rinforzo positivo“. In ciascun caso l’elemento rinforzante è un elemento positivo associato e letteralmente “aggiunto” ad un determinato comportamento che, quindi, verrà riproposto. Nel primo esempio si trattava di attenzione e calore, nel secondo esempio si tratta del gelato o, comunque, dell’oggetto richiesto in malo modo dal bambino.
Sono rinforzi positivi le lodi, oggetti desiderati, giochi, attività piacevoli, il cibo, insomma tutto ciò che piace al soggetto destinatario del rinforzo.

Allo stesso modo quando ci relazioniamo con un animale dobbiamo fare attenzione a cosa inconsapevolmente rinforziamo. Facciamo l’esempio del cane che vive in giardino da solo e che inizia a sviluppare un comportamento di abbaio allo scopo di attirare le attenzioni dei padroni. Essendo il cane un animale “sociale” (ricordiamo che il bisogno di socialità nei cani è un “bisogno primario come il cibo”) sicuramente non vive bene da solo e può manifestare il suo disagio abbaiando in continuazione. Il comportamento che la maggior parte dei proprietari mettono in atto è quello di aprire la finestra o la porta e di rimproverare il cane. Per il cane che abbaia perché si sente solo questo non viene percepito come una punizione o un monito a smettere ma come un rinforzo positivo al suo comportamento di abbaio, anche se lo rimproveriamo. Il cane ha ottenuto ciò che voleva, la presenza dei proprietari. Abbiamo rinforzato così involontariamente il comportamento d’abbaio del cane.

Ecco alcune regole di base su come usare il ”rinforzo positivo”.
Tempismo corretto: il rinforzo positivo è efficace solo se usato esattamente quando si manifesta il comportamento. Un cane che viene addestrato a sedersi deve essere premiato entro 1/3 secondi al massimo da quando ha eseguito il comportamento. Se il premio gli viene dato una volta che si rialza, verrà ricompensato per questo movimento. Una ricompensa è altrettanto tardiva e inefficace quando dici a tua moglie che ieri sera stava benissimo. Un tempismo corretto comunica al cane esattamente cosa piace all’addestratore. Il rinforzo dato troppo presto (per far sì che il cane attui il comportamento) si chiama “corruzione” o “esca”, ed è inefficiente. Fare regali, promesse, complimenti per un comportamento che non si è ancora verificato non rinforza minimamente tale comportamento. Spesso i genitori rinforzano i bambini troppo presto con l’intento di incoraggiarli (“ti compro il gelato se tu fai il bravo”). Invece di fare ciò si potrebbe invece rinforzare i tentativi di “fare il bravo”.

Ricompense corrette per il soggetto: quello che può essere rinforzante per qualcuno può non esserlo per qualcun altro. Di solito i tipi di rinforzi utilizzati con gli animali sono il cibo, le lodi o il gioco. Ci sono dei cani che sono disinteressati al gioco ma sono fortemente motivati dal cibo.
Questa motivazione dipende anche dal valore che io addestratore o proprietario ho fatto acquistare al cibo o al gioco. Se il cane durante la sua giornata ha accesso quando vuole a quel particolare bocconcino che utilizzo per l’addestramento (la stessa cosa vale per il gioco e le lodi o le carezze), si potrà ben capire come quel premio perda di valore e non sarà più percepito come “rinforzo”.

Imprevedibilità del rinforzo (o rinforzo intermittente): le ricompense dovrebbero essere imprevedibili. I terminali di gioco d’azzardo, per esempio, creano una dipendenza usando uno schema imprevedibile di rinforzo. Pur vincendo solo monete o banconote da 10 euro, molte persone vengono efficacemente addestrate dalla macchina affinché continuino a giocare per il brivido di una vincita.
Allo stesso modo se sto addestrando il cane a mettersi nella posizione di “terra”, una volta che il cane ha capito come eseguire la posizione, cioè ha acquisito quella memoria muscolare o il meccanismo del mettersi a terra, posso iniziare a premiare in modo imprevedibile: una volta sì, due volte no, poi nuovamente premio e non premio le 3 volte successive. Il cane in questo modo tende a mantenere il comportamento perchè non sa quando il premio arriverà. La SORPRESA è così interessante per gli animali che tiene alta la MOTIVAZIONE e l’ATTENZIONE. Il rinforzo intermittente o saltuario è efficace solo con comportamenti già appresi e consolidati.

Maggiore entusiasmo: il rinforzo positivo viene prolungato se l’addestrato rimane entusiasta e felice. Che insegni a un bambino a leggere o ad un cane a stare in equilibrio su due zampe, bisogna ricordare che le sessioni di formazione dovrebbero essere frequenti e brevi. Gli obiettivi dovrebbero essere facilmente raggiungibili, in modo da concedere spesso ricompense, bisognerà fermarsi, fare una pausa quando si percepisce dello stress o demotivazione e chiudere sempre in bellezza la sessione di lavoro in modo da lasciare un’impressione positiva che renderà la ripresa del lavoro (il giorno successivo o in un altro momento del giorno) più facile ed entusiasmante.

Persistenza e variabilità dei premi: se si dà una ricompensa ad un cane per essersi seduto e le volte successive in cui propone il comportamento lo si ignora, il comportamento del seduto decadrà e si estinguerà. Per mantenere il comportamento all’inizio lo si deve premiare in modo persistente magari variando la tipologia di premio: una volta lo premio con un biscotto, la seconda con un pezzo di wuerstel, la terza con un gioco che ama molto.
Questo finché il comportamento non sarà stato assimilato abbastanza bene da alzare la posta in gioco.

Una cosa che spesso sia i genitori che i proprietari di cani dimenticano è quella di premiare i comportamenti positivi naturalmente offerti anche al di fuori delle sedute di formazione o addestramento.

E’ importante comprendere che se noi ci focalizziamo sui figli, magari rimproverandoli, solo quando fanno qualcosa di negativo o sbagliato, perché quando sono bravi va bene così, trasmettiamo loro di vederli principalmente in modo negativo. La percezione è che ci accorgiamo di loro solo quando sbagliano. Quindi, se vogliono le nostre attenzioni, poi sanno subito come fare, attuando cioè il comportamento sbagliato.
Ad esempio: Mario sta imparando a leggere, la madre gli è vicina e, quando il bambino legge correttamente, gli dice”bravo” (rinforzo positivo), evitando di far uso di punizioni quando il bambino sbaglia. Il leggere acquista per Mario una valenza positiva; è piacevole leggere perchè per lui è fonte di attenzione da parte della madre. In tal modo, si incrementa la probabilità che il bambino si applichi alla lettura con piacere ed interesse.

Purtroppo, per la mente di un bambino e anche per la mente del cane, la cosa più importante è ottenere l’attenzione e la presenza del proprio genitore o padrone, anche se rabbiosa.

Provate invece a sottolineare il comportamento positivo soprattutto nella quotidianità, dando vostra attenzione, il vostro affetto. Creiamo così dei buoni presupposti per l’ autostima, perché chi apprende riceve informazioni sul fatto che è bravo se vuole, e che notiamo quando si comporta bene e lo riconosciamo. Ciò significa che lui attira la nostra attenzione quando si comporta bene, quando segue le regole e non il contrario. La stessa cosa vale per gli animali.
Per esempio prendiamo un cane che è alquanto irrequieto e movimentato. Invece di sgridarlo o di punirlo ogni volta che si agita, proviamo ad ignorare tale comportamento e a rinforzare in modo positivo tutti i comportamenti di calma che l’animale ci offre spontaneamente durante la giornata. Avremo modificato in modo efficace il suo comportamento.

Proponiamo qui un video esemplificativo di  come funziona il rinforzo con il gioco, il cibo e la voce:

 

Barbara Dimitri
Addestramentodelcane.com

Lascia un commento

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.