Режими підкріплення поведінки

режими підкріплення поведінки У концепції оперантного обумовлення режими підкріплення - важливий компонент процесу навчання. Те, як часто ми зміцнюємо поведінку, може надати величезний вплив на стійкість і швидкість реакції в подальшому.

Режим підкріплення - по суті, правило, що визначає, коли і як поведінка повинна підкріплюватися. У деяких випадках поведінка отримує підкріплення щоразу, коли відбувається, іноді - через певні проміжки часу.

Мета підкріплення - збільшити ймовірність того, що це поведінка повториться в майбутньому. Залежно від ситуації може бути використано як позитивне, так і негативне.

В реальних умовах поведінка навряд чи можливо підкріплювати кожен раз. У ситуації, коли ви навмисно намагаєтеся навчити / натренувати / видресирувати когось, ви можете вибрати конкретний режим. Вчені вже визначили, що деякі режими найкраще підходить для певних цілей і завдань.

Існує два типи режимів підкріплення:

безперервне підкріплення (Бажане поведінку підкріплюється кожен раз, коли демонструється).
Як правило, цей режим найкраще використовувати на початкових етапах навчання, оскільки він допомагає створити сильну зв`язок між поведінкою і реакцією. Потім багато хто переходить до часткового підкріплення.
часткове підкріплення (Потрібна реакція підкріплюється лише періодично). Поведінка купується повільніше, зате після припинення підкріплення ще довгий час залишається актуальним.

Вчені виділяють чотири режими часткового підкріплення.

Режим підкріплення з фіксованою пропорцією

При цьому режимі поведінку підкріплюється тільки після певного числа реакцій. Цей графік забезпечує високу і стійку швидкість реагування з відносно коротким періодом «відпочинку» між реакціями. Це спосіб добре застосовувати при навчанні нової поведінки або для підтримання потрібної продуктивності. Наприклад, якщо робочим на заводі платити гроші за кожну партію продукції, а не за відпрацьований час, вони будуть менш схильні до частих перерв.

Режим підкріплення зі змінною пропорцією

При цьому режимі підкріплення відбувається після випадкового числа реакцій. Цей режим дозволяє домогтися постійності і високій швидкості реагування.

Приклад з реального життя - ігрові автомати. Гравці ніколи не знають, скільки ігор їм потрібно зіграти, щоб виграти. Все, що вони знають - це те, що хтось в них виграє. Саме тому, навіть, програвши всі гроші, вони з небажанням йдуть від автоматів. Залежність ігроманів настільки стійка, що без допомоги фахівців іноді її побороти неможливо.

Режим підкріплення з фіксованим інтервалом

При фіксованому інтервалі підкріплення воно пред`являється через певний час після першої реакції. Це досить поширений режим - на практиці так реалізуються виплати винагород працівникам в більшості організацій. Однак, з точки зору підкріплює, це не найефективніший режим - реакції посилюються і частішають до кінця цього періоду, а відразу після підкріплення їх частота і швидкість різко падають.

Режим підкріплення із змінним інтервалом

Даний режим передбачає пред`явлення підкріплення через невизначений проміжок часу після першої реакції. Так ми перевіряємо пошту - багато разів за день, випадковим чином вибираючи для цього час (хоча і маємо можливість дізнатися відразу про те, що потрібне лист прийшов).

Ще прикладом можуть стати несподівані перевірки начальства: бос може в будь-який час вийти зі свого кабінету, щоб піти перевірити своїх підлеглих - і в цей момент вам краще бути на місці і робити щось корисне. Мотивує, чи не так?

Вибираємо режим підкріплення

Необхідність підкріпити поведінку зазвичай залежить від ряду факторів. У випадках, коли ви спеціально намагаєтесь навчити нової поведінки, варто вибрати безперервне підкріплення. Того, як поведінка перестане бути новим, можна буде перейти до часткового підкріплення.

Втім, на практиці підкріплення після кожної реакції може бути складним, оскільки часто вимагає багато уваги і ресурсів. Режими часткового підкріплення не тільки забезпечують більш стійке поведінку, але і знижують ризик того, що об`єкт «пересититься» і перестане дорожити підкріпленням. Якщо підкріплення більше не влаштовує об`єкт, він може перестати демонструвати бажану поведінку. Уявіть, наприклад, що ви намагаєтеся навчити собаку сидіти. Якщо ви використовуєте в якості нагороди їжу, собака може припинити виконувати команду, як тільки насититься. У таких випадках більш ефективною виявляється похвала.

Увага, тільки СЬОГОДНІ!

Різне