행동이론 _ 조작적 조건화. 스키너 상자 Thorndike 실험

행동주의 _ 조작적 조건형성의 의의

스키너의 고전적 조건화 이론의 확장, 원하는 효과나 결과를 도출하기 위한 도구적 반응에 대해 학습.

환경 자극에 능동적으로 반응하는 행동인 조작적 행동을 설명합니다.

Pavlov의 고전적 조건화에서 우리는 행동이 발생한 후의 발달과 결과에 관심이 있습니다.

강화와 처벌은 행동의 결과에 대한 보상이 있을 때 행동이 재현되기 쉽고 보상이 없을 때 행동이 재현되기 어렵다는 이론으로 강화와 처벌의 역할을 강조한다.

스키너의 행동주의는 20세기 초 미국의 사회문화적 맥락에 따라 크게 성장했다.

Thorndike에 의해 시작되었고 Skinner에 의해 체계화되었습니다.

행동주의 _ 조작적 조건화의 핵심 개념

목표행동을 가능한 한 작은 단위로 나누어 각각의 행동이 적절하게 수행되었을 때 강화를 주고 결과적으로 목표행동이 이루어지도록 하는 것이다.

1. 보강:

행동이 미래에 발생할 확률 또는 응답이 다시 발생할 빈도를 높입니다.

긍정적 강화 – 긍정적인 자극을 제시함으로써 도구적 반응(행동)의 빈도를 증가시킵니다.

(ex. 음식, 좋은 성적, 칭찬 등)

부적 강화 – 부적 자극을 철회함으로써 도구적 반응(행동)의 빈도를 증가시킵니다.

(ex. 시계 알람, 보충 수업 또는 청소 면제 등)

2. 처벌:

반응이 다시 발생할 확률을 줄이기 위해.

긍정적인 처벌 – 불쾌한 자극을 제시하여 목표 행동의 빈도를 줄입니다.

(예: 잘못하면 벌을 받는다.)

부정적인 처벌 – 긍정적인 자극을 철회하여 목표 행동의 빈도를 줄입니다.

(ex. 치우지 않으면 게임을 할 수 없습니다.)

3. 강화제의 종류

1차 강화:

기본적으로 버프 효과로 생존에 필요한 것

2차 강화제:

긍정적이거나 부정적인 결과와 연관되도록 경험을 통해 학습된 자극.

4. 보강계획(강화일정)

강화 계획은 강화가 제공되는 시간 간격과 반응 횟수를 결정합니다. 연속 강화와 간헐적 강화가 있다.

지속적인 강화:

강화는 반응의 횟수나 기간에 관계없이 반응이 일어날 때마다 주어진다.

간헐적 강화 _ 고정 간격 일정:

일정한 간격으로 보강을 합니다. 반응률은 강화 시간이 가까워질수록 증가하지만 강화 후에는 감소하는 경향이 있습니다.

(ex. 주급, 월급, 정기시험 등)

간헐적 강화 _ 가변 간격 일정:

강화가 주어지는 시간 간격에는 변화가 있습니다.

강화 시간의 간격은 다양하지만 보편적으로 알려진 간격이 있습니다. 느리고 중간 정도의 반응을 나타내지만 강화 후에도 지속됩니다.

(ex. 무작위 시험, 지필 시험 등)

간헐적 강화 _ 고정 비율 일정:

강화제는 일정 수의 반응이 발생한 후에 제공됩니다. 반응속도는 빠른데 지속력이 좀 떨어집니다.

(ex. 쿠폰모집 등)

간헐적 강화 _ 가변 비율(variable ratio) 계획 : 반응 행동에 가변 비율을 적용하여 강화가 언제 몇 번 시행되는지 알 수 없습니다.

가장 강하고 지속적인 반응을 유지할 수 있으며 처음에는 강화율을 낮추었다가 차츰 늘려가는 것이 효과적이다.

(ex. 도박, 복권 등)

행동주의 _ 스키너 연구, 스키너 상자 쥐 실험

스키너 상자는 동물의 행동을 연구하는 데 사용되는 실험 장치입니다.

조작적 조건화와 고전적 조건화를 모두 연구하는 데 사용됩니다.

Edward Thorndike가 만든 퍼즐 상자의 변형입니다.

소리나 빛과 같은 특정 자극에 반응하여 실험동물이 특정 행동(레버나 레버를 누르는 것)을 학습하는 실험입니다.

동물이 올바른 행동을 취하면 음식과 같은 보상이 나옵니다.

스키너 상자에는 조건 반응이나 동작을 감지할 수 있는 레버와 같은 제어 장치가 하나 이상 포함되어 있으며 이러한 반응에 대한 음식 공급기와 누적 반응 기록기로 구성된 간단한 구성이 있습니다.

같은 방식으로 비둘기를 비롯한 조류를 이용한 실험도 있다.

행동주의 _ Thorndike의 고양이 실험에서 효과의 법칙

레버를 누르면 문이 열리는 상자 안의 배고픈 고양이가 레버를 누르면 상자의 문을 열고 고양이에게 먹이를 주는 실험.

조건 반응은 레버 누르기이고 보상(강화)은 음식입니다.

이런 행동을 반복할수록 고양이는 불필요한 행동을 줄이고 단시간에 탈출하게 됩니다.

고양이의 학습 과정에서 반응이 어느 시점에서 통찰력을 통해 학습되는 것이 아니라 반응이 점차 굳어지고 부적절한 반응이 점차 억제됩니다. 어떤 경로가 뇌에서 서서히 형성되고 있습니다.

Thorndike는 문제 상자 학습을 ‘시행착오를 통한 학습’이라고 불렀습니다.

효과의 법칙은 반응의 결과가 긍정적일 때 그 반응이 다음에 유사한 상황에서 발생할 가능성이 있다고 말합니다.

1930년대 이후에는 만족스러운 결과만이 유대강도에 영향을 미치고 불편한 자극은 영향을 미치지 않는다는 이론으로 수정되었다.

행동주의 _ 스키너 이론의 의의와 한계

스키너는 인간의 행동이 환경적 자극에 의해 동기가 부여되고 행동의 결과에 의해 결정된다고 보았다.

이를 Antecedents, Begaviors, Consequences의 약어로 ‘ABC Paradigm of Behavior’라고도 합니다.

강의계획서 등을 통해 학습여건을 체계화하였습니다.

강화는 부작용이 큰 처벌보다 바람직한 행동을 증가시키는 가장 좋은 방법이라는 주장이 제기되었습니다.

정신분석 이론에 대한 반작용으로 인간의 내적 동기는 탐구되거나 설명되지 않았다.

입력과 출력만 필요하고 프로세스에 주의를 기울이지 않는 블랙박스 가설입니다.