Оперантно кондициониране: дефиниция, подкрепление и наказание
Оперантното обуславяне е форма на учене, при която поведението на индивида се променя въз основа на последствията от това поведение. То описва процес, при който човекът или животното осъзнава, че действията му имат резултати и започва да повтаря или да избягва определени действия в зависимост от тези резултати.
Последствията от поведението обикновено могат да бъдат трите основни вида:
- Подсилване (подкрепление): събитие, което увеличава вероятността поведението да се повтори. Може да бъде положително (добавяне на нещо приятно) или отрицателно (премахване на нещо неприятно).
- Наказание: събитие, което намалява вероятността поведението да се повтори. И тук има два вида — когато се добавя неприятен стимул и когато се отнема приятен стимул.
- Изчезване (extinction): когато поведение не води до никакви последици и постепенно спада по честота, защото вече не е полезно за индивида.
Четири основни контекста в оперантното обуславяне
В оперантното обуславяне термините "положителен" и "отрицателен" не означават "добър" или "лош", а дали нещо се добавя или се премахва след дадено поведение:
- Положително подкрепление — следствие, при което се добавя награда и поведението се усилва. В експеримента с кутията на Скинър наградата беше под формата на храна, когато плъхът натисне лост.
- Негативно подкрепление — настъпва, когато се премахне неприятен стимул; това също увеличава вероятността поведението да се повтори (например търсене на начин да се спре силен шум или болка).
- Положително наказание — добавят се неприятни последици с цел да се намали поведението (примери: силен шум, електрошок при опити с животни или пошляпване (дете) — макар че употребата на физическо наказание при хора поставя сериозни етични и практически въпроси).
- Негативно наказание — отнемане на приятен стимул, за да се намали поведението (напр. отнемане на играчка от дете след нежелано поведение).
Как работи на практика
Оперантното обуславяне включва наблюдение на това кои последствия поддържат или променят поведението и умишлено използване на тези последствия. Някои важни понятия и техники, свързани с оперантното обуславяне, са:
- Шейпинг (формоване) — награждаване на стъпки, приближаващи се към желаното поведение, за да се изгради сложно действие стъпка по стъпка.
- Графици на подсилване — кога и колко често се дава подкрепление. Например:
- непрекъснато подсилване (винаги след едно поведение) — бързо научаване, но и бързо изчезване при спиране на наградите;
- частично (интермитентно) подсилване — фиксирани и вариабилни съотношения или интервали (fixed ratio, variable ratio, fixed interval, variable interval) — води до по-устойчиво поведение и по-бавна изчезване;
- Генерализация и дискриминация — поведението може да се прояви в сходни ситуации (генерализация) или да бъде ограничено до специфични стимули (дискриминация).
- Контрол и самоконтрол — чрез подсилване и наказание можем да изграждаме механизми за насърчаване на полезни навици и ограничаване на вредни.
Приложения и ограничения
Оперантното обуславяне има широко приложение: в обучение и образование (мотивиране и управление на класно поведение), в дрессировка на животни, в поведенческа терапия (например при работата с фобии или зависимости), в дизайна на наградни системи и интерфейси и др. Важно е обаче да се има предвид:
- Етичните проблеми при използване на наказание — често ефективността е временна и може да причини нежелани странични ефекти (страх, агресия, скрити форми на избягване).
- Подсилването трябва да е подходящо за индивида — една и съща "награда" не работи за всички.
- Комбинацията от подкрепление, последователност и ясно комуникирани очаквания е най-ефективна за дълготрайна промяна на поведението.
Идеята за оперантното обуславяне е открита първоначално от Едуард Торндайк и по-късно подробно анализирана от Б. Ф. Скинър.
Оперантното обуславяне се различава от класическото обуславяне на Павлов: първото се занимава предимно с доброволни, целенасочени промени в поведението чрез последствия (подкрепления и наказания), докато второто тренира автоматични рефлекси или асоциации между стимули и рефлексни отговори (рефлекс).
Закон за ефекта на Торндайк
Оперантното обуславяне, понякога наричано инструментално учене, е изследвано за първи път от Едуард Л. Торндайк (1874-1949). Той наблюдава поведението на котки, които се опитват да избягат от домашно направени кутии с пъзели. Когато за първи път били поставени в кутиите, котките се нуждаели от много време, за да избягат. С натрупването на опит успешните отговори се появявали по-често, което позволявало на котките да избягат за по-малко време. В своя закон за ефекта Торндайк изказва теорията, че поведенията, последвани от удовлетворяващи последствия, са склонни да се повтарят, а тези, които водят до неприятни последствия, е по-малко вероятно да бъдат повторени. Накратко, някои последици засилват поведението, а други го отслабват. Чрез тази процедура Торндайк създава първите известни криви на учене.
Б.Ф. Скинър (1904-1990) разработва по-подробен анализ на оперантното обуславяне. Скинър изобретява камерата за оперантно обуславяне, която му позволява да измерва скоростта на реакция като основна зависима променлива. Той е използвал запис на натискания на лоста или натискания на клавишите.
Принципи на оперантното обуславяне:
- Дискриминация, обобщение и значение на контекста.
- Ученето се осъществява в контекст.
- По-голямата част от поведението е под контрола на стимулите: определена реакция се проявява само при наличието на подходящ стимул.
- Контролът на стимулите е ефективен дори ако стимулът няма никакво значение за респондента.
- Екстинкция: оперантното поведение изчезва, когато подкреплението спре.
- Подсилванията се появяват само когато е направена правилната реакция, а може и да не се появят. Поведението не отслабва и не угасва поради тази причина.
- Резултатите зависят отчасти от това колко често се получава подсилване.
- График на подсилване: времето на подсилване е от решаващо значение.
- График с фиксирани интервали: подсилващите вещества се представят на фиксирани периоди от време, при условие че е направена съответната реакция.
- График с променлив интервал: поведението се подсилва въз основа на средното време, изминало от последното подсилване. Графици за съотношение: основават се на съотношението между реакциите и подкрепленията.
- График с фиксиран интервал: подкреплението се предоставя след определен брой отговори. Специалният случай на предоставяне на подсилване след всеки отговор се нарича непрекъснато подсилване.
- График с променлив интервал: подсилването на доставката се основава на определен среден брой отговори.
Въпроси и отговори
Въпрос: Какво е оперантно обуславяне?
О: Оперативното обуславяне е форма на учене, при която индивидът променя поведението си поради последствията (резултатите) от поведението.
В: Кои са четирите контекста на оперантното обуславяне?
О: Четирите контекста на оперантното обуславяне са положително подсилване, отрицателно подсилване, положително наказание и отрицателно наказание.
В: Как действа положителното подсилване?
О.: Положителното подсилване се случва, когато има награда за дадена форма на поведение, която ще увеличи честотата на проявление на поведението.
В: Как действа отрицателното подсилване?
О: Негативното подсилване се случва, когато се премахне отблъскващ стимул, което ще увеличи честотата на поява на поведението.
В: Как действа положителното наказание?
О: Положителното наказание се прилага, когато се добави стимул, в резултат на което поведението се появява по-рядко.
В: Как действа отрицателното наказание? О: Негативното наказание се прилага, когато се отнема стимул, в резултат на което поведението се появява по-рядко.
Въпрос: Кой пръв открива оперантното обуславяне?
О: Едуард Торндайк пръв открива оперантното обуславяне, а по-късно то е анализирано от Б.Ф. Скинър.