H θεωρία της Συντελεστικής Μάθησης στην εκπαίδευση με clicker

admin · 26 Ιανουαρίου 2009

Από το μέλος Noela

H θεωρία της Συντελεστικής Μάθησης στην εκπαίδευση με clicker

Λίγη ιστορία

Οι ρίζες της εκπαίδευσης με clicker (clicker training), βρίσκονται στη μελέτη επιστήμης και τεχνολογίας του B.F. Skinner το 1931. O B. F. Skinner ήταν ο πρώτος που αναγνώρισε και περιέγραψε τις αρχές της θεωρίας τού περί Συντελεστικής Μάθησης (operant conditioning). Αν και ο Skinner ανήκε στους κλασσικούς συμπεριφοριστές, διαφοροποιήθηκε δίνοντας περισσότερο βάρος στη συμπεριφορά απ' ότι στο ερέθισμα. Ο Pavlov με τα γνωστά σκυλιά του, στην Κλασσική Εξαρτημένη Θεωρία (classical conditioning), έδειξε πως η συμπεριφορά εξαρτιόταν από το ερέθισμα. Δηλαδή το ερέθισμα/γεγονός προηγείτο της συμπεριφοράς. Ο Skinner από την άλλη επισήμανε ότι η συμπεριφορά είναι εξαρτώμενη από τις συνέπειες. Το ερέθισμα/γεγονός ακολουθεί τη συμπεριφορά. Αν μια συμπεριφορά μας έχει θετικές συνέπειες, τότε αυτές θα μας ωθήσουν να την επαναλάβουμε.
Οι μορφές της συντελεστικής μάθησης
1. Η θετική ενίσχυση (Positive Reinforcement): Προσθέτουμε κάτι ευχάριστο ώστε ν’ αυξηθεί η πιθανότητα επανάληψης της συμπεριφοράς.
2. Η αρνητική ενίσχυση (Negative Reinforcement): Απομακρύνουμε κάτι δυσάρεστο, ώστε να αυξηθεί η πιθανότητα επανάληψης της συμπεριφοράς.
3. Η θετική (άμεση) τιμωρία (Positive Punishment): Προσθέτουμε κάτι δυσάρεστο ώστε να μειωθεί η πιθανότητα επανάληψης της συμπεριφοράς.
4. Η αρνητική (έμμεση) τιμωρία (Negative Punishment): Απομακρύνουμε κάτι ευχάριστο μετά την εμφάνιση της συμπεριφοράς, ώστε να μειωθεί η πιθανότητα επανάληψής της.
5. Η απόσβεση (Extinction): Παύουμε την επιβράβευση και ενίσχυση μιας συμπεριφοράς ώστε αυτή να εξαλειφθεί.
Στην εκπαίδευση με clicker χρησιμοποιείται ένα μέρος της θεωρίας της Συντελεστικής Μάθησης: η θετική ενίσχυση, και σε μικρότερο βαθμό η αρνητική τιμωρία.
Δύο μαθητές του Skinner, οι Marian Breland Bailey και Keller Breland, ήταν αυτοί που, πάνω από 60 χρόνια πριν, συνειδητοποίησαν τις δυνατότητες που υπήρχαν στην εκπαίδευση ζώων και ανέπτυξαν την ενίσχυση (reinforcement) και διαμόρφωση (shaping) στη σημερινή τους μορφή. Η χρήση της εξαπλώθηκε αρχικά στην εκπαίδευση θαλάσσιων θηλαστικών, αν και οι συγκεκριμένοι εκπαιδευτές χρησιμοποιούν σφυρίχτρα και όχι clicker. Η εκπαίδευση όμως βασίζεται στις ίδιες αρχές που διέπουν σήμερα την εκπαίδευση με clicker. Είναι πρακτικά αδύνατο και άβολο να τιμωρήσεις ένα δελφίνι ή μια φάλαινα που κολυμπάει. Έτσι, οι εκπαιδευτές είχαν ανάγκη ένα εργαλείο που να σημαδεύει την επιθυμητή συμπεριφορά, ακόμα κι όταν η επιβράβευση δεν ήταν άμεση. Τα θαλάσσια θηλαστικά έχουν έντονα ανεπτυγμένη την αίσθηση της ακοής. Εύλογα λοιπόν χρησιμοποιήθηκε τελικά ένα ηχητικό σήμα (σφυρίχτρα) για να σημαδέψει την επιθυμητή συμπεριφορά. Φυσικά, η σφυρίχτρα πρώτα συνδυαζόταν με μια, υπολογίσιμη για το δελφίνι, αμοιβή: ένα ψάρι. Έτσι, όταν το δελφίνι άκουγε τη σφυρίχτρα, σήμαινε γι αυτό δύο πράγματα: ότι κέρδισε το ψάρι του και ότι κατάφερε αυτό που ο εκπαιδευτής του επιδίωκε. Αυτή η μέθοδος ώθησε τα δελφίνια να παίρνουν πρωτοβουλίες, δοκιμάζοντας διάφορα πράγματα, προσπαθώντας να βρουν το επιθυμητό.
Οι Keller Breland, Marian Breland Bailey και Bob Bailey ξεκίνησαν την εταιρεία “Animal Behaviour Enterprises” (ABE) το 1943. Η εταιρεία αυτή εκπαίδευσε πάνω από 140 διαφορετικά είδη και δεκάδες χιλιάδες ζώων, συμπεριλαμβανομένων σκύλων, γάτων, δελφινιών, κορακιών, γλάρων, κουνελιών και κοτόπουλων. Ήταν η πρώτη εταιρεία που χρησιμοποίησε τη θεωρία της Συντελεστικής Μάθησης.
Το 1984 η Karen Pryor εξέδωσε το βιβλίο “Don't Shoot The Dog!”, το οποίο δεν είχε ως θέμα την εκπαίδευση σκύλων αλλά την εφαρμογή των αρχών της θετικής ενίσχυσης στη ζωή και στην αλλαγή συμπεριφοράς. Μέχρι το 1992 όμως, που συναντήθηκαν η Karen Pryor, ο Gary Wilkes, ο Gary Priest και η Ingrid Kang Shallenberger, σε ένα σεμινάριο Συντελεστικής Μάθησης για εκπαιδευτές ζώων, η τεχνολογία δεν είχε διαδοθεί στο ευρύ κοινό. Μετά από αυτή τη συνάντηση, η Karen Pryor και ο Gary Wilkes πραγματοποίησαν το πρώτο σεμινάριο εκπαίδευσης με clicker, “Don’t Shoot the Dog!”, για 250 εκπαιδευτές σκύλων. Έτσι έγινε το ξεκίνημα στις Η.Π.Α. Στη συνέχεια, η μέθοδος διαδόθηκε στον κόσμο λόγω της πιο ήπιας και ανθρωπιστικής προσέγγισης.

Τι είναι το clicker
Στην ουσία, το clicker είναι το γνωστό, παλιό παιχνιδάκι - το “βατραχάκι”. Είναι ένα μεταλλικό έλασμα μέσα σε μια πλαστική θήκη που κάνει ένα διπλό ήχο. Το σημαντικό δεν είναι το τι ακριβώς είναι, αλλά το τι κάνει και τι αντιπροσωπεύει. Είναι κάτι παραπάνω από δευτερεύοντας ενισχυτής (conditioned reinforcer) ή υποκατάστατο φαγητού. Είναι ένα ερέθισμα που γεφυρώνει το κενό ανάμεσα σε μια συμπεριφορά και στην επιβράβευση γι’ αυτήν και όχι μόνο. Με αυτό το εργαλείο, σημαδεύουμε ένα γεγονός, σαν να το φωτογραφίζαμε. Όπως θα αποτυπώναμε με το κλικ μιας φωτογραφικής μηχανής μια σκηνή, έτσι την σημαδεύουμε με το κλικ του clicker.

Γιατί να χρησιμοποιήσω clicker
Τι διαφορά έχει από το να πω στο σκυλί μου “μπράβο”;
Η φωνή του εκπαιδευτή, ο τόνος, η ένταση, η προφορά, η έμφαση, μπορεί να αλλάξει από τη μια στιγμή στην άλλη. Έτσι, η εκπαίδευση καθυστερείται, καθώς το σκυλί δε μπορεί εύκολα να αναγνωρίσει τις ομοιότητες όταν η ίδια λέξη προφέρεται με διάφορους τρόπους ή, ακόμα χειρότερα, χρησιμοποιούνται διάφορες λέξεις. Ούτε μπορεί να κρίνει αν είναι σημαντικές οι διαφορές (καΛό σκυλί ή καΚό σκυλί).
Σε αντίθεση με τη φωνή μας, το clicker παράγει έναν μοναδικό ήχο ο οποίος δεν έχει ακουστεί στον παρελθόν - κι έτσι δεν προϋπάρχουν συσχετισμοί. Το σινιάλο είναι σταθερό κι έχει τη δυνατότητα να δίνεται με μεγάλη ακρίβεια και, γιατί όχι, και από απόσταση.
Το σκυλί γρήγορα μαθαίνει ότι οι συμπεριφορές που προκαλούν το κλικ, επιβραβεύονται. Μαθαίνει ακόμα ότι ο ήχος του clicker εξασφαλίζει την ύπαρξη ενισχυτών κι έτσι η πιθανότητα επανάληψης της συμπεριφοράς μεγαλώνει. Το σκυλί καταλαβαίνει ότι το παιχνίδι της εκπαίδευσης έχει ξεκινήσει και αυξάνεται η αυτοπεποίθησή του. Είναι πολύ πιο ωραίο να εκπαιδεύεις ένα πρόθυμο και συνεργάσιμο σκύλο.

admin · 26 Ιανουαρίου 2009

Η εκπαίδευση σκύλων σήμερα
Πριν την εκπαίδευση με clicker, τα ζώα εκπαιδεύονταν κυρίως με ένα συνδυασμό θετικής και αρνητικής ενίσχυσης.
Δηλαδή τα ζώα αν εκτελούσαν σωστά μια συμπεριφορά, ανταμείβονταν με φαΐ, έπαινο, θετική ενίσχυση (positive reinforcement) ή με την απουσία τιμωρίας, αρνητική ενίσχυση (negative reinforcement). Στην αντίθετη περίπτωση, ακολουθούσε -συχνά επίπονη- τιμωρία (positive punishment).
Κατά τη διάρκεια του δευτέρου παγκοσμίου πολέμου, η μέθοδος της τιμωρίας θεωρήθηκε ως η γρηγορότερη για τις ανάγκες εκπαίδευσης ζώων. Στη μεταπολεμική περίοδο, αυτές οι μέθοδοι μεταφέρθηκαν στο ευρύτερο κοινό.
Έτσι όμως ούτε ο σκύλος, ούτε ο εκπαιδευτής περνάνε καλά.
Σύμφωνα με την Karen Pryor, με τη θετική ενίσχυση, ο σκύλος γίνεται πρόθυμος, προσεκτικός, ακριβής, συνεργάσιμος και ικανός για απίθανες εκτελέσεις.

Η εκπαίδευση με clicker διαφέρει από την παραδοσιακή εκπαίδευση.
Χρησιμοποιούνται πρωτεύοντες ενισχυτές ή οτιδήποτε αρέσει στα σκυλιά και τα καθιστά πρόθυμα να δουλέψουν για την αμοιβή τους. Δηλαδή φαΐ, παιχνίδια, έπαινος, προσοχή και επαφή (χάδι, ξύσιμο). Γενικά χρησιμοποιείται ποικιλία επιβραβεύσεων.
Δεν χρησιμοποιείται τιμωρία όπως βία, σπρέι, πνίχτες ή άλλα πράγματα που τα σκυλιά θα προσπαθήσουν να αποφύγουν, για να επιτευχθεί η επιθυμητή συμπεριφορά.
Αποφεύγεται κάθε μορφή τιμωρίας, είτε θετική είτε αρνητική, ως εργαλείο εκμάθησης. Αποφεύγεται η αρνητική ενίσχυση ως εκπαιδευτική μέθοδος.
Τα μαθήματα είναι σύντομα, χωρίς μακριές επαναλήψεις. Όταν υπάρχει πρόοδος και επιτυχία, προχωράμε.

Χρήση του clicker
Για να είμαστε έτοιμοι να χρησιμοποιήσουμε το clicker, θα πρέπει πρώτα να το έχουμε οπλίσει. Δηλαδή θα πρέπει το σκυλί να κάνει τον συσχετισμό ότι το “κλικ” ακολουθείται από κάτι καλό.
Στη συνέχεια, κλικάρουμε τις επιθυμητές συμπεριφορές που είτε συμβαίνουν τυχαία (π.χ. κάθισμα), είτε ελκύουμε το σκυλί να τις κάνει (π.χ. κρατάμε ένα μεζεδάκι πάνω από το κεφάλι του ώστε να κάτσει).
Αρχικά ενισχύουμε κάθε μικρό βήμα που προσεγγίζει την επιθυμητή συμπεριφορά μέχρι να καταλήξουμε σε αυτή (shaping).
Κατά την εκμάθηση μιας νέας συμπεριφοράς, χρησιμοποιούμε ένα πρόγραμμα συνεχούς ενίσχυσης. Δηλαδή επιβραβεύουμε κάθε εκτέλεση μιας επιθυμητής συμπεριφοράς.
Έπειτα, αυξάνουμε τις απαιτήσεις μας και επιβραβεύουμε τις σωστότερες ή τις ταχύτερες εκτελέσεις.
Από τη στιγμή που ο σκύλος εκτελεί σωστά την εντολή κάθε φορά, αρχίζουμε να χρησιμοποιούμε α) ένα πρόγραμμα μεταβλητής αναλογίας ή β) ένα πρόγραμμα μεταβλητού διαστήματος. Δηλαδή επιβραβεύουμε το σκύλο μετά από έναν τυχαίο αριθμό εκτελέσεων ή διατηρούμε ένα μεταβαλλόμενο χρονικό διάστημα μεταξύ δύο ενισχύσεων. Έτσι, ενδυναμώνουμε κάποιες συμπεριφορές και γίνονται ανθεκτικότερες στην απόσβεση.
Για να χτίσουμε μια πολύπλοκη συμπεριφορά, τη σπάμε σε απλούστερα τμήματα. Η αλληλουχία των επιμέρους τμημάτων δημιουργεί την τελική συμπεριφορά (chaining).
Μια συμπεριφορά που έχει διδαχθεί με clicker δε θα αλλάξει αν δεν επέμβουμε. Όταν η επιθυμητή συμπεριφορά έχει διδαχθεί κι έχει προστεθεί σε αυτή μια λέξη ή ένα σινιάλο, το clicker δε χρειάζεται πλέον.
Πλεονεκτήματα
Προσφέρει χρονική ακρίβεια στην υπόδειξη μιας σωστής συμπεριφοράς.
Είναι πιο διασκεδαστικός τρόπος από το να φωνάζεις, να χτυπάς ή να τιμωρείς με άλλους τρόπους το σκυλί σου.
Είναι και για το σκυλί διασκεδαστικό, μαθαίνει να αγαπάει και να επιζητεί την εκπαίδευση και δε στρεσάρεται.
Μπορεί να χρησιμοποιηθεί για την εκμάθηση μιας απλής συμπεριφοράς έως και στην επίλυση προβληματικών συμπεριφορών.
Ακόμα και σκυλιά που έχουν εκπαιδευτεί με κλασσικές μεθόδους, μεταλλάσσονται από απρόθυμα και πεισματάρικα σε ενθουσιασμένα και δημιουργικά, ειδικά σε εκμάθηση νέων συμπεριφορών.
Βοηθάει να χτιστεί ένας δυνατός δεσμός μεταξύ ιδιοκτήτη και σκύλου, βασισμένος στη συνεργασία και τον αμοιβαίο σεβασμό.
Είναι θετική, ήπια και μη βίαιη μέθοδος, βασισμένη στο κίνητρο.
Έτσι, τα σκυλιά δεν γίνονται επιθετικά προς τον χειριστή τους.
Είναι βασισμένη σε αποδεδειγμένη επιστημονική μέθοδο η οποία έχει αποτελέσματα.
Είναι κατάλληλη για σκυλιά κάθε ηλικίας και ράτσας.
Είναι κατάλληλη για νεαρά κουτάβια.
Είναι κατάλληλη για μεγαλόσωμα σκυλιά.
Δεν απαιτεί μυϊκή δύναμη.
Επικεντρώνεται στο ποια είναι η σωστή συμπεριφορά και όχι στο ποια είναι η λάθος.
Έτσι, δίνει αυτοπεποίθηση στα σκυλιά.
Συγχωρεί λάθη και του χειριστή αλλά και του σκύλου.
Ακόμα και κουφά σκυλιά μπορούν να εκπαιδευτούν, αντικαθιστώντας το clicker με ένα μικρό φακό, όπως γίνεται στα χρυσόψαρα.
Δίνει στα σκυλιά ελευθερία και αυτοπεποίθηση να σκεφτούν και να πειραματιστούν. Οι ικανότητές τους ενθαρρύνονται και αμείβονται αντί να καταπιέζονται με βίαιες διορθώσεις.

Μειονεκτήματα
Χρειάζεται πολύ καλός συγχρονισμός. Το κλικ πρέπει να σημαδεύει επακριβώς τη συμπεριφορά που θέλουμε. Ελάχιστα πιο πριν ή πιο μετά, αμείβει και ενισχύει την οποιαδήποτε συμπεριφορά συμβαίνει εκείνη τη στιγμή. Το πρόβλημα λύνεται με εξάσκηση.
Για κάποια σκυλιά, ο ήχος μπορεί να είναι τρομακτικός. Κι αυτό το πρόβλημα όμως λύνεται, χρησιμοποιώντας το clicker μέσα σε ένα πανάκι, ή κάποια λιγότερο θορυβώδη clicker που κυκλοφορούν στο εμπόριο, ακόμα κι ένα στυλό.
Αν υπάρχει ασυνέπεια στα κριτήρια θα απομακρυνθεί το σκυλί από την επιθυμητή συμπεριφορά αντί να την πλησιάσει, και θα μπερδευτεί.
Συνοψίζοντας
Όταν εκπαιδεύουμε με clicker, δεν την στήνουμε στο σκύλο να κάνει λάθος αλλά δημιουργούμε συνθήκες όπου θα πράξει σωστά από μόνος του. Ενθαρρύνουμε το σκυλί να πάρει πρωτοβουλίες. Τα μαθήματα που έχουμε πάρει μόνοι μας τα θυμόμαστε για όλη μας τη ζωή. Οι συμβουλές που μάς έχουν δοθεί όμως, συχνά ξεχνιούνται γρήγορα. Όταν μια συμπεριφορά ακολουθείται από επιβράβευση, αυξάνεται η πιθανότητα να επαναληφθεί στο μέλλον.

Αναζήτηση

H θεωρία της Συντελεστικής Μάθησης στην εκπαίδευση με clicker

admin

Administrator

admin

Administrator

Πρόσφατες δημοσιεύσεις

Στατιστικά Forum

Share this page