Από το μέλος Noela
H θεωρία της Συντελεστικής Μάθησης στην εκπαίδευση με clicker
Λίγη ιστορία
Οι ρίζες της εκπαίδευσης με clicker (clicker training), βρίσκονται στη μελέτη επιστήμης και τεχνολογίας του B.F. Skinner το 1931. O B. F. Skinner ήταν ο πρώτος που αναγνώρισε και περιέγραψε τις αρχές της θεωρίας τού περί Συντελεστικής Μάθησης (operant conditioning). Αν και ο Skinner ανήκε στους κλασσικούς συμπεριφοριστές, διαφοροποιήθηκε δίνοντας περισσότερο βάρος στη συμπεριφορά απ' ότι στο ερέθισμα. Ο Pavlov με τα γνωστά σκυλιά του, στην Κλασσική Εξαρτημένη Θεωρία (classical conditioning), έδειξε πως η συμπεριφορά εξαρτιόταν από το ερέθισμα. Δηλαδή το ερέθισμα/γεγονός προηγείτο της συμπεριφοράς. Ο Skinner από την άλλη επισήμανε ότι η συμπεριφορά είναι εξαρτώμενη από τις συνέπειες. Το ερέθισμα/γεγονός ακολουθεί τη συμπεριφορά. Αν μια συμπεριφορά μας έχει θετικές συνέπειες, τότε αυτές θα μας ωθήσουν να την επαναλάβουμε.
Οι μορφές της συντελεστικής μάθησης
1. Η θετική ενίσχυση (Positive Reinforcement): Προσθέτουμε κάτι ευχάριστο ώστε ν’ αυξηθεί η πιθανότητα επανάληψης της συμπεριφοράς.
2. Η αρνητική ενίσχυση (Negative Reinforcement): Απομακρύνουμε κάτι δυσάρεστο, ώστε να αυξηθεί η πιθανότητα επανάληψης της συμπεριφοράς.
3. Η θετική (άμεση) τιμωρία (Positive Punishment): Προσθέτουμε κάτι δυσάρεστο ώστε να μειωθεί η πιθανότητα επανάληψης της συμπεριφοράς.
4. Η αρνητική (έμμεση) τιμωρία (Negative Punishment): Απομακρύνουμε κάτι ευχάριστο μετά την εμφάνιση της συμπεριφοράς, ώστε να μειωθεί η πιθανότητα επανάληψής της.
5. Η απόσβεση (Extinction): Παύουμε την επιβράβευση και ενίσχυση μιας συμπεριφοράς ώστε αυτή να εξαλειφθεί.
Στην εκπαίδευση με clicker χρησιμοποιείται ένα μέρος της θεωρίας της Συντελεστικής Μάθησης: η θετική ενίσχυση, και σε μικρότερο βαθμό η αρνητική τιμωρία.
Δύο μαθητές του Skinner, οι Marian Breland Bailey και Keller Breland, ήταν αυτοί που, πάνω από 60 χρόνια πριν, συνειδητοποίησαν τις δυνατότητες που υπήρχαν στην εκπαίδευση ζώων και ανέπτυξαν την ενίσχυση (reinforcement) και διαμόρφωση (shaping) στη σημερινή τους μορφή. Η χρήση της εξαπλώθηκε αρχικά στην εκπαίδευση θαλάσσιων θηλαστικών, αν και οι συγκεκριμένοι εκπαιδευτές χρησιμοποιούν σφυρίχτρα και όχι clicker. Η εκπαίδευση όμως βασίζεται στις ίδιες αρχές που διέπουν σήμερα την εκπαίδευση με clicker. Είναι πρακτικά αδύνατο και άβολο να τιμωρήσεις ένα δελφίνι ή μια φάλαινα που κολυμπάει. Έτσι, οι εκπαιδευτές είχαν ανάγκη ένα εργαλείο που να σημαδεύει την επιθυμητή συμπεριφορά, ακόμα κι όταν η επιβράβευση δεν ήταν άμεση. Τα θαλάσσια θηλαστικά έχουν έντονα ανεπτυγμένη την αίσθηση της ακοής. Εύλογα λοιπόν χρησιμοποιήθηκε τελικά ένα ηχητικό σήμα (σφυρίχτρα) για να σημαδέψει την επιθυμητή συμπεριφορά. Φυσικά, η σφυρίχτρα πρώτα συνδυαζόταν με μια, υπολογίσιμη για το δελφίνι, αμοιβή: ένα ψάρι. Έτσι, όταν το δελφίνι άκουγε τη σφυρίχτρα, σήμαινε γι αυτό δύο πράγματα: ότι κέρδισε το ψάρι του και ότι κατάφερε αυτό που ο εκπαιδευτής του επιδίωκε. Αυτή η μέθοδος ώθησε τα δελφίνια να παίρνουν πρωτοβουλίες, δοκιμάζοντας διάφορα πράγματα, προσπαθώντας να βρουν το επιθυμητό.
Οι Keller Breland, Marian Breland Bailey και Bob Bailey ξεκίνησαν την εταιρεία “Animal Behaviour Enterprises” (ABE) το 1943. Η εταιρεία αυτή εκπαίδευσε πάνω από 140 διαφορετικά είδη και δεκάδες χιλιάδες ζώων, συμπεριλαμβανομένων σκύλων, γάτων, δελφινιών, κορακιών, γλάρων, κουνελιών και κοτόπουλων. Ήταν η πρώτη εταιρεία που χρησιμοποίησε τη θεωρία της Συντελεστικής Μάθησης.
Το 1984 η Karen Pryor εξέδωσε το βιβλίο “Don't Shoot The Dog!”, το οποίο δεν είχε ως θέμα την εκπαίδευση σκύλων αλλά την εφαρμογή των αρχών της θετικής ενίσχυσης στη ζωή και στην αλλαγή συμπεριφοράς. Μέχρι το 1992 όμως, που συναντήθηκαν η Karen Pryor, ο Gary Wilkes, ο Gary Priest και η Ingrid Kang Shallenberger, σε ένα σεμινάριο Συντελεστικής Μάθησης για εκπαιδευτές ζώων, η τεχνολογία δεν είχε διαδοθεί στο ευρύ κοινό. Μετά από αυτή τη συνάντηση, η Karen Pryor και ο Gary Wilkes πραγματοποίησαν το πρώτο σεμινάριο εκπαίδευσης με clicker, “Don’t Shoot the Dog!”, για 250 εκπαιδευτές σκύλων. Έτσι έγινε το ξεκίνημα στις Η.Π.Α. Στη συνέχεια, η μέθοδος διαδόθηκε στον κόσμο λόγω της πιο ήπιας και ανθρωπιστικής προσέγγισης.
Τι είναι το clicker
Στην ουσία, το clicker είναι το γνωστό, παλιό παιχνιδάκι - το “βατραχάκι”. Είναι ένα μεταλλικό έλασμα μέσα σε μια πλαστική θήκη που κάνει ένα διπλό ήχο. Το σημαντικό δεν είναι το τι ακριβώς είναι, αλλά το τι κάνει και τι αντιπροσωπεύει. Είναι κάτι παραπάνω από δευτερεύοντας ενισχυτής (conditioned reinforcer) ή υποκατάστατο φαγητού. Είναι ένα ερέθισμα που γεφυρώνει το κενό ανάμεσα σε μια συμπεριφορά και στην επιβράβευση γι’ αυτήν και όχι μόνο. Με αυτό το εργαλείο, σημαδεύουμε ένα γεγονός, σαν να το φωτογραφίζαμε. Όπως θα αποτυπώναμε με το κλικ μιας φωτογραφικής μηχανής μια σκηνή, έτσι την σημαδεύουμε με το κλικ του clicker.
Γιατί να χρησιμοποιήσω clicker
Τι διαφορά έχει από το να πω στο σκυλί μου “μπράβο”;
Η φωνή του εκπαιδευτή, ο τόνος, η ένταση, η προφορά, η έμφαση, μπορεί να αλλάξει από τη μια στιγμή στην άλλη. Έτσι, η εκπαίδευση καθυστερείται, καθώς το σκυλί δε μπορεί εύκολα να αναγνωρίσει τις ομοιότητες όταν η ίδια λέξη προφέρεται με διάφορους τρόπους ή, ακόμα χειρότερα, χρησιμοποιούνται διάφορες λέξεις. Ούτε μπορεί να κρίνει αν είναι σημαντικές οι διαφορές (καΛό σκυλί ή καΚό σκυλί).
Σε αντίθεση με τη φωνή μας, το clicker παράγει έναν μοναδικό ήχο ο οποίος δεν έχει ακουστεί στον παρελθόν - κι έτσι δεν προϋπάρχουν συσχετισμοί. Το σινιάλο είναι σταθερό κι έχει τη δυνατότητα να δίνεται με μεγάλη ακρίβεια και, γιατί όχι, και από απόσταση.
Το σκυλί γρήγορα μαθαίνει ότι οι συμπεριφορές που προκαλούν το κλικ, επιβραβεύονται. Μαθαίνει ακόμα ότι ο ήχος του clicker εξασφαλίζει την ύπαρξη ενισχυτών κι έτσι η πιθανότητα επανάληψης της συμπεριφοράς μεγαλώνει. Το σκυλί καταλαβαίνει ότι το παιχνίδι της εκπαίδευσης έχει ξεκινήσει και αυξάνεται η αυτοπεποίθησή του. Είναι πολύ πιο ωραίο να εκπαιδεύεις ένα πρόθυμο και συνεργάσιμο σκύλο.
H θεωρία της Συντελεστικής Μάθησης στην εκπαίδευση με clicker
Λίγη ιστορία
Οι ρίζες της εκπαίδευσης με clicker (clicker training), βρίσκονται στη μελέτη επιστήμης και τεχνολογίας του B.F. Skinner το 1931. O B. F. Skinner ήταν ο πρώτος που αναγνώρισε και περιέγραψε τις αρχές της θεωρίας τού περί Συντελεστικής Μάθησης (operant conditioning). Αν και ο Skinner ανήκε στους κλασσικούς συμπεριφοριστές, διαφοροποιήθηκε δίνοντας περισσότερο βάρος στη συμπεριφορά απ' ότι στο ερέθισμα. Ο Pavlov με τα γνωστά σκυλιά του, στην Κλασσική Εξαρτημένη Θεωρία (classical conditioning), έδειξε πως η συμπεριφορά εξαρτιόταν από το ερέθισμα. Δηλαδή το ερέθισμα/γεγονός προηγείτο της συμπεριφοράς. Ο Skinner από την άλλη επισήμανε ότι η συμπεριφορά είναι εξαρτώμενη από τις συνέπειες. Το ερέθισμα/γεγονός ακολουθεί τη συμπεριφορά. Αν μια συμπεριφορά μας έχει θετικές συνέπειες, τότε αυτές θα μας ωθήσουν να την επαναλάβουμε.
Οι μορφές της συντελεστικής μάθησης
1. Η θετική ενίσχυση (Positive Reinforcement): Προσθέτουμε κάτι ευχάριστο ώστε ν’ αυξηθεί η πιθανότητα επανάληψης της συμπεριφοράς.
2. Η αρνητική ενίσχυση (Negative Reinforcement): Απομακρύνουμε κάτι δυσάρεστο, ώστε να αυξηθεί η πιθανότητα επανάληψης της συμπεριφοράς.
3. Η θετική (άμεση) τιμωρία (Positive Punishment): Προσθέτουμε κάτι δυσάρεστο ώστε να μειωθεί η πιθανότητα επανάληψης της συμπεριφοράς.
4. Η αρνητική (έμμεση) τιμωρία (Negative Punishment): Απομακρύνουμε κάτι ευχάριστο μετά την εμφάνιση της συμπεριφοράς, ώστε να μειωθεί η πιθανότητα επανάληψής της.
5. Η απόσβεση (Extinction): Παύουμε την επιβράβευση και ενίσχυση μιας συμπεριφοράς ώστε αυτή να εξαλειφθεί.
Στην εκπαίδευση με clicker χρησιμοποιείται ένα μέρος της θεωρίας της Συντελεστικής Μάθησης: η θετική ενίσχυση, και σε μικρότερο βαθμό η αρνητική τιμωρία.
Δύο μαθητές του Skinner, οι Marian Breland Bailey και Keller Breland, ήταν αυτοί που, πάνω από 60 χρόνια πριν, συνειδητοποίησαν τις δυνατότητες που υπήρχαν στην εκπαίδευση ζώων και ανέπτυξαν την ενίσχυση (reinforcement) και διαμόρφωση (shaping) στη σημερινή τους μορφή. Η χρήση της εξαπλώθηκε αρχικά στην εκπαίδευση θαλάσσιων θηλαστικών, αν και οι συγκεκριμένοι εκπαιδευτές χρησιμοποιούν σφυρίχτρα και όχι clicker. Η εκπαίδευση όμως βασίζεται στις ίδιες αρχές που διέπουν σήμερα την εκπαίδευση με clicker. Είναι πρακτικά αδύνατο και άβολο να τιμωρήσεις ένα δελφίνι ή μια φάλαινα που κολυμπάει. Έτσι, οι εκπαιδευτές είχαν ανάγκη ένα εργαλείο που να σημαδεύει την επιθυμητή συμπεριφορά, ακόμα κι όταν η επιβράβευση δεν ήταν άμεση. Τα θαλάσσια θηλαστικά έχουν έντονα ανεπτυγμένη την αίσθηση της ακοής. Εύλογα λοιπόν χρησιμοποιήθηκε τελικά ένα ηχητικό σήμα (σφυρίχτρα) για να σημαδέψει την επιθυμητή συμπεριφορά. Φυσικά, η σφυρίχτρα πρώτα συνδυαζόταν με μια, υπολογίσιμη για το δελφίνι, αμοιβή: ένα ψάρι. Έτσι, όταν το δελφίνι άκουγε τη σφυρίχτρα, σήμαινε γι αυτό δύο πράγματα: ότι κέρδισε το ψάρι του και ότι κατάφερε αυτό που ο εκπαιδευτής του επιδίωκε. Αυτή η μέθοδος ώθησε τα δελφίνια να παίρνουν πρωτοβουλίες, δοκιμάζοντας διάφορα πράγματα, προσπαθώντας να βρουν το επιθυμητό.
Οι Keller Breland, Marian Breland Bailey και Bob Bailey ξεκίνησαν την εταιρεία “Animal Behaviour Enterprises” (ABE) το 1943. Η εταιρεία αυτή εκπαίδευσε πάνω από 140 διαφορετικά είδη και δεκάδες χιλιάδες ζώων, συμπεριλαμβανομένων σκύλων, γάτων, δελφινιών, κορακιών, γλάρων, κουνελιών και κοτόπουλων. Ήταν η πρώτη εταιρεία που χρησιμοποίησε τη θεωρία της Συντελεστικής Μάθησης.
Το 1984 η Karen Pryor εξέδωσε το βιβλίο “Don't Shoot The Dog!”, το οποίο δεν είχε ως θέμα την εκπαίδευση σκύλων αλλά την εφαρμογή των αρχών της θετικής ενίσχυσης στη ζωή και στην αλλαγή συμπεριφοράς. Μέχρι το 1992 όμως, που συναντήθηκαν η Karen Pryor, ο Gary Wilkes, ο Gary Priest και η Ingrid Kang Shallenberger, σε ένα σεμινάριο Συντελεστικής Μάθησης για εκπαιδευτές ζώων, η τεχνολογία δεν είχε διαδοθεί στο ευρύ κοινό. Μετά από αυτή τη συνάντηση, η Karen Pryor και ο Gary Wilkes πραγματοποίησαν το πρώτο σεμινάριο εκπαίδευσης με clicker, “Don’t Shoot the Dog!”, για 250 εκπαιδευτές σκύλων. Έτσι έγινε το ξεκίνημα στις Η.Π.Α. Στη συνέχεια, η μέθοδος διαδόθηκε στον κόσμο λόγω της πιο ήπιας και ανθρωπιστικής προσέγγισης.
Τι είναι το clicker
Στην ουσία, το clicker είναι το γνωστό, παλιό παιχνιδάκι - το “βατραχάκι”. Είναι ένα μεταλλικό έλασμα μέσα σε μια πλαστική θήκη που κάνει ένα διπλό ήχο. Το σημαντικό δεν είναι το τι ακριβώς είναι, αλλά το τι κάνει και τι αντιπροσωπεύει. Είναι κάτι παραπάνω από δευτερεύοντας ενισχυτής (conditioned reinforcer) ή υποκατάστατο φαγητού. Είναι ένα ερέθισμα που γεφυρώνει το κενό ανάμεσα σε μια συμπεριφορά και στην επιβράβευση γι’ αυτήν και όχι μόνο. Με αυτό το εργαλείο, σημαδεύουμε ένα γεγονός, σαν να το φωτογραφίζαμε. Όπως θα αποτυπώναμε με το κλικ μιας φωτογραφικής μηχανής μια σκηνή, έτσι την σημαδεύουμε με το κλικ του clicker.
Γιατί να χρησιμοποιήσω clicker
Τι διαφορά έχει από το να πω στο σκυλί μου “μπράβο”;
Η φωνή του εκπαιδευτή, ο τόνος, η ένταση, η προφορά, η έμφαση, μπορεί να αλλάξει από τη μια στιγμή στην άλλη. Έτσι, η εκπαίδευση καθυστερείται, καθώς το σκυλί δε μπορεί εύκολα να αναγνωρίσει τις ομοιότητες όταν η ίδια λέξη προφέρεται με διάφορους τρόπους ή, ακόμα χειρότερα, χρησιμοποιούνται διάφορες λέξεις. Ούτε μπορεί να κρίνει αν είναι σημαντικές οι διαφορές (καΛό σκυλί ή καΚό σκυλί).
Σε αντίθεση με τη φωνή μας, το clicker παράγει έναν μοναδικό ήχο ο οποίος δεν έχει ακουστεί στον παρελθόν - κι έτσι δεν προϋπάρχουν συσχετισμοί. Το σινιάλο είναι σταθερό κι έχει τη δυνατότητα να δίνεται με μεγάλη ακρίβεια και, γιατί όχι, και από απόσταση.
Το σκυλί γρήγορα μαθαίνει ότι οι συμπεριφορές που προκαλούν το κλικ, επιβραβεύονται. Μαθαίνει ακόμα ότι ο ήχος του clicker εξασφαλίζει την ύπαρξη ενισχυτών κι έτσι η πιθανότητα επανάληψης της συμπεριφοράς μεγαλώνει. Το σκυλί καταλαβαίνει ότι το παιχνίδι της εκπαίδευσης έχει ξεκινήσει και αυξάνεται η αυτοπεποίθησή του. Είναι πολύ πιο ωραίο να εκπαιδεύεις ένα πρόθυμο και συνεργάσιμο σκύλο.