조작자 컨디셔닝 정의, 특성 및 예



조작자 컨디셔닝 o도구 적 조절은 행동이 결과로 제어되는 학습 유형입니다.

강화 행동이 더 많은 경우에 나타나는 경향이있는 반면, 처벌되는 행동은 소멸된다는 생각에 근거합니다.

오퍼 렌트 컨디셔닝과 클래식 컨디셔닝의 차이점은 무엇입니까? operant conditioning에서, 자발적인 반응은 보강자에 의해 뒤 따른다. 이런 식으로, 자발적인 응답 (예 : 시험 공부)이 미래에 발생할 가능성이 더 큽니다. 대조적으로, 고전적 조절에서 자극은 자동적으로 비자발적 반응을 활성화시킨다.

Operant Conditioning은 양성 및 음성 강화를 사용하여 행동을 수정하려고 시도하는 과정으로 설명 할 수 있습니다. operant conditioning을 통해 개인은 특정한 행동과 결과 사이의 연관성을 만듭니다. 예 :

  • 부모님은 사탕이나 다른 상을 가진 아이에게 좋은 성적을 보상합니다..
  • 교사는 침착하고 교육받은 학생들에게 보상합니다. 학생들은 이와 같이 행동함으로써 더 많은 포인트를 받게된다는 것을 깨닫습니다..
  • 레버를 누를 때마다 음식이 동물에게 주어집니다..

B.F. 스키너 (Skinner, 1938)는 조작자 컨디셔닝이라는 용어를 만들었다. Skinner는 동작을 따라갈 수있는 세 가지 유형의 응답 또는 피연산자를 확인했습니다.

  • 중립 연산자: 반복되는 행동의 가능성을 증가 시키거나 감소시키지 않는 환경으로부터의 반응.
  • 강화 인: 행동의 반복 가능성을 증가시키는 환경으로부터의 반응. Reinforcers는 긍정적이거나 부정적 일 수 있습니다..
  • 처벌: 반복적 인 행동의 가능성을 줄이는 환경으로부터의 반응. 처벌이 행동을 약화시킵니다..

Operant Conditioning의 선구자들

Thorndike는이 조절가 단순한 답과 보강 이상의 의미를 갖는 것을 처음으로 인식했습니다. 대답은 세 가지 사건을 고려하여 특정 자극이있을 때 주어집니다 : 자극, 반응 및 반응 또는 강화제의 결과.

이 구조는 Thorndike가 효과 법칙을 수립하는 데 도움이되었던 자극과 반응 사이의 연관성과 같은 다양한 연결 고리의 개발을 용이하게합니다. 이를 통해 결과를 강화하는 응답은 자극이 다시 나타날 때 발생 확률이 더 높다는 것을 확인했습니다..

반대로, 부정적인 결과가 뒤따른 응답은 자극이 다시 나타날 때 발생 가능성이 낮습니다. 효과의 법칙은 Thorndike가 지명 한 바와 같이 조종 조절 또는기구 적 조절의 선례입니다..

그러나 행동 심리학자 인 스키너 (Skinner)의 경우 컨디셔닝은 이전에 얻은 결과에 따라 행동을 강화하는 것이 었습니다.

이 줄에는 두 가지 형태의 컨디셔닝이 있습니다.

  • 클래식 또는 파블로 피아노 (Pavlovian) : 조건부 자극에 의해 제어되는 반응 인 조건없는 자극과 조건부 자극의 연관성을 기반으로합니다..
  • 조작원 조절 : 결과 또는 증강 자극은 특정 행동을 유발합니다. Skinner는 그 행동에 긍정적 인 강화제가 뒤따른다면 미래에 그러한 행동이 발생할 가능성을 높일 것이라고 설명합니다. 반대로 응답에 보강자가 뒤 따르지 않거나 보강자가 부정적이라면 장래에 그러한 행동을 발행 할 확률은 낮아질 것입니다.

Operant Conditioning의 기본 개념

보강

응답의 발행 즉 미래에 발생할 확률이 큰지 작은 지 여부는 응답의 책임입니다. 일단 반응이 발생하면 이것은 강화되고 일관된 자극이다..

주어진 보강제가 반응과 관련하여 제시 될 때까지 그 보강제가 그 행동에 영향을 미치는지를 알 수 없으며 보강제의 결과로서 행동이 변화한다는 것이 확인됩니다.

보강에는 양수와 음수의 두 가지 유형이 있습니다. 두 가지 모두 미래의 상황에서 대응이 발표 될 확률을 높이는 것과 같은 목적을 가지고 있습니다. 또한 Skinner의 보강은 관찰 가능하고 측정 가능한 행동을 통해 정의됩니다.

긍정적 인 보강

긍정적 인 보강은 개인이 보람을 얻는다는 결과를 제공하여 행동을 강화시킵니다..

네거티브 강화

불쾌한 강화제를 제거하면 행동을 강화할 수 있습니다. 이것은 동물이나 사람에게 "보람있는"부작용을 제거하기 때문에 음성 강화라고합니다. 부정적 보강은 불쾌한 경험을 멈추거나 제거하기 때문에 행동을 강화합니다..

1 차 강화제

사전 조절의 역사를 필요로하지 않는 모든 기본적인 강화제가 그러한 기능을 수행합니다. 몇 가지 예가 물, 음식 및성에 해당됩니다..

보조 보강 장치

이차 강화제는 무조건 자극과의 연관성 덕분에 이전 컨디셔닝의 역사를 근거로한다면. 몇 가지 예는 돈과 자격이 될 것입니다..

3 학기의 비상 사태

그것은 operant conditioning의 기본 모델이며 세 가지 구성 요소로 구성됩니다 : 차별적 자극, 반응 및 강화 자극..

차별적 인 자극은 강화제가 이용 가능함을 피험자에게 알려주는 것으로서, 그가 특정 행동을 수행하면 상기 강화제를 얻을 수 있음을 나타냅니다. 대조적으로, 우리는 델타 자극 또는 그 행동이 어떠한 유형의 보강제도 얻지 못하게한다는 것을 나타내는 자극을 가지고 있습니다.

그 대답은 피험자가 수행 할 행동이며, 그 실행은 강화 자극을 유도하거나받지 않을 것입니다.

위에서 언급 한 바와 같이 보강 자극은 그 출현으로 인해 응답을 발행 할 확률이 미래에 증가하거나 감소 할 것이기 때문에 행동의 배출에 대한 원인이됩니다.

Operant Conditioning에 대해 알려진 개념

처벌

처벌은 또한 피험자의 행동에 미치는 영향으로 측정됩니다. 반면에 보강과는 달리 의도 된 것은 특정 행동의 감소 또는 억제입니다.

처벌은 나중 상황에서 행동을 취할 가능성을 줄입니다. 그러나 처벌의 위협이 감소하면 행동이 다시 나타날 수 있기 때문에 응답을 없앨 수는 없습니다..

처벌에는 긍정적 인 처벌과 부정적 처벌이라는 두 가지 유형이나 절차가 있습니다..

긍정적 인 처벌

이것은 특정 행동을 수행 한 후에 혐오스러운 자극을 제시하는 것을 포함합니다. 그것은 주제에 의해 주어진 반응에 부수적으로 주어진다..

부정적인 처벌

그것은 특정 행동의 결과로 자극을 제거하는 것으로 구성됩니다. 즉, 특정 행동을 수행 한 후에 긍정적 인 자극을 철회하는 것으로 구성됩니다.

멸종

멸종 위기에서 강화제가 더 이상 나타나지 않아 응답이 중지됩니다. 이 과정은 성취 될 것으로 예상되는 대응 강화제를 제공하지 못하고 시간이 지남에 따라 그 행동이 유지되도록하는 것에 기초합니다..

반응이 사라지면, 차별적 자극은 멸종 자극이됩니다. 이 과정을 잊어 버리는 것과 혼동해서는 안됩니다. 이것은 일정 시간 내에 행동이 강제되지 않을 때 주어집니다..

일반화

특정 상황이나 자극에 대한 응답으로 반응이 조절되어 다른 자극이나 유사한 상황보다 먼저 나타날 수 있습니다..

차별

이 과정은 일반화의 과정과 반대이며 자극과 문맥에 따라 다르게 반응한다..

보강 프로그램

Skinner는 지속적인 보강 프로그램 및 간헐적 보강 프로그램을 포함하여 여러 가지 보강 프로그램을 설치했습니다..

지속적인 보강 프로그램

그것들은 제시 될 때마다 반응의 끊임없는 강화에 기초한다. 즉, 피험자가 원하는 행동을 실행할 때마다, 그는 또는 긍정적 인 자극을 얻을 것이다..

간헐적 인 보강 프로그램

대조적으로, 여기에서는 원하는 행동을 수행 할 때 피험자가 보강자가 항상 얻는 것은 아닙니다. 이것들은 주어진 응답의 수 또는 응답 사이의 시간의 간격에 기초하여 정의되며, 서로 다른 절차를 야기합니다.

고정 비율 프로그램

이 프로그램에서 보강자는 피험자가 고정 된 응답을 생성 할 때 제공됩니다. 예를 들어, 비율 10의 프로그램에서, 자극이 제시 될 때 사람은 10 개의 반응을 한 후에 강화제를 얻습니다.

다양한 이유의 프로그램

이것은 이전과 동일하게 구성되지만,이 경우 보강자를 얻기 위해 피험자가 제공해야하는 응답의 수는 가변적입니다.

강화제는 계속해서 피험자가 방출하는 반응의 수에 따라 달라 지지만 가변적 인 이유가있어 피험자가 보강제를 얻을 때 예측할 수 없게됩니다.

고정 간격 프로그램

간격 프로그램에서 강화제를 얻는 것은 피험자가주는 응답의 수에 의존하지 않지만 경과 된 시간에 따라 결정됩니다. 결과적으로 일정 시간이 경과 한 후 첫 번째 응답이 강화됩니다.

고정 간격 프로그램에서 강화제와 강화제 사이의 시간은 항상 동일합니다.

가변 간격 프로그램

이 프로그램에서 강화제는 각 강화제가받는 시간이 다르긴하지만 잠시 후에 얻어집니다.

행동 변화

연속 근사 또는 쉐이핑

몰딩은 행동의 성형 또는 연속 근사의 차동 보강을 통한 행동 변화로 구성됩니다.

구체적인 행동을 형성하기 위해 일련의 단계가 뒤 따른다. 우선, 우리는 당신이 도달하기를 원하는 것을 아는 모양을 갖추기위한 초기 행동을 확인합니다.

그런 다음 사용할 수있는 보강재를 구분하고 마지막 단계에 도달 할 때까지 단계별 또는 단계별로 분리하여 각 단계를 강화하거나 최종 단계로 나아갑니다..

이 역동적 인 절차를 통해 행동과 결과 모두가 변화됩니다. 이러한 의미에서, 객관적인 행동을 향한 연속적인 접근은 강화된다..

그러나 그것이 수행되기 위해서는 목표에 도달 할 때까지 점차적으로 행동을 강화하기 위해 피험자가 이미 수행 한 이전 행동에서 시작해야합니다..

사슬

그것으로 새로운 행동이 단순한 단계 나 순서로 분해되어 각 단계에서 주어진 각각의 반응을 강화시켜 주체의 행동 레퍼토리에서보다 복잡한 반응을 수립하도록 유도한다.

긴 체인의 응답은 조건부 강화제를 사용하여 형성 될 수 있으며, 기능 단위를 채택하면 특정 기술의 습득과 정의로 이어집니다.

참고 문헌

  1. Operant conditioning. wikipedia.org에서 가져온
  2. Operant conditioning. e-torredebabel.com에서 가져옴.
  3. biblio3.url에서 회복.
  4. 효과의 법칙. wikipedia.org에서 가져온.
  5. 멸종 wikipedio.org에서 가져온.
  6. Domjan, M. 학습과 행동의 원리. Paraninfo. 5 판.