You are on page 1of 26

Aprendizaje y Conducta. Tema 5.

Condicionamiento Instrumental: Fundamentos

Condicionamiento Instrumental: Condicionamiento Instrumental: Fundamentos Fundamentos

Domjan, captulo 5.

Condicionamiento clsico:

Estmulo Estmulo

Conducta Conducta

Conducta instrumental

Condicionamiento instrumental:

Conducta Conducta

Consecuencia Consecuencia

Conducta Conducta

La conducta produce la consecuencia. Pero la consecuencia afecta a la conducta posterior.

Fernando Blanco; 2007

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Clever Hans

2x3=...

Thorndike: las cajas-problema

-Aprendizaje por ensayo y error. -Latencias progresivamente ms cortas: el animal aprende.

Conducta: Conducta: tirar de la cuerda tirar de la cuerda

Consecuencia: Consecuencia: la puerta se abre la puerta se abre

Repetir Repetir la conducta la conducta

Asociacin Respuesta-Estmulo

Fernando Blanco; 2007

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Thorndike: las cajas-problema

Ley del Efecto (Thorndike): -Una conducta aparece en presencia de un estmulo (por ejemplo, la caja problema en s), y es seguida de una consecuencia satisfactoria (salir de la caja). -Se fortalece la asociacin entre ese estmulo y esa conducta (asociacin E-R). Por eso se repite la conducta. CUIDADO: la asociacin es entre la conducta y el estmulo que est presente al producirla.

Ensayo Discreto vs. Operante Libre

Ensayo discreto: Ej: Cajas-problema, Laberintos. Slo se da una respuesta instrumental en cada ensayo.

Fernando Blanco; 2007

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Ensayo Discreto vs. Operante Libre

Ensayo discreto: Ej: Cajas-problema, Laberintos. El experimentador decide cundo puede responder el animal.

Medimos la LATENCIA: tiempo que tarda en abandonar la caja de salida (en el laberinto) o en dar la respuesta correcta (caja-problema). Medimos la VELOCIDAD DE LA CARRERA (en el laberinto).

Ensayo Discreto vs. Operante Libre Operante Libre (Skinner): Ej: presin de palanca en la caja de Skinner. El animal decide cundo responde, y puede hacerlo una y otra vez. Unidad de respuesta = operante. Capa operante produce un efecto en el ambiente, que hace que la respuesta aparezca con ms o con menos frecuencia en el futuro.

Fernando Blanco; 2007

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La caja de Skinner

NOTA: NO es este Skinner

La otra caja de Skinner Sueo: sociedad perfeccionada gracias a la ciencia de la conducta. Aplicacin radical del conductismo. ...y mucha malinterpretacin por parte de la prensa).

Fernando Blanco; 2007

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Ensayo Discreto vs. Operante Libre Operante Libre (Skinner): Medimos la tasa de ocurrencia de la respuesta operante. Ej: 8 pulsaciones de la palanca por minuto. Cuanto ms probable es la conducta, mayor tasa de respuesta. Segn la ley del efecto, una conducta seguida de una consecuencia positiva aumenta su tasa de ocurrencia.

Ensayo Discreto vs. Operante Libre Definiendo el reforzador: Reforzador = Todo aquel estmulo que: 1. Aparezca como consecuencia de una conducta. 2. Provoque que esa conducta se haga ms frecuente en el futuro. Problemas: Definicin circular. No puedo predecir si un estmulo ser un reforzador.

Fernando Blanco; 2007

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Ensayo Discreto vs. Operante Libre

La conducta operante puede no aparecer en el repertorio original del animal. Entonces: Moldeamiento: Reforzamiento de conductas cada vez ms parecidas a la conducta meta. Cada conducta reforzada se hace ms probable. Se trabaja por fases.

Moldeamiento:

Escojo siempre la conducta ms parecida a la meta para ser reforzada. Al reforzar una conducta, la hago ms probable.

Conducta meta

Primer set de conductas

Segundo set de conductas

Tercer set de conductas

Fernando Blanco; 2007

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Moldeamiento:
Lo mejor para entender el moldeamiento es HACERLO (Sniffy).
Gracias al Gracias al moldeamiento, moldeamiento, podemos ensear a podemos ensear a Sniffy a pulsar una Sniffy a pulsar una palanca para obtener palanca para obtener comida. comida. Gracias al Gracias al moldeamiento, yo puedo moldeamiento, yo puedo ensear al investigador a ensear al investigador a que me d comida por que me d comida por pulsar una palanca. pulsar una palanca.

Moldeamiento:

Palomas jugando al ping-pong gracias al moldeamiento.

Fernando Blanco; 2007

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva Negativa

Apetitiva Reforzamiento Positivo

Entrenamiento De Omisin Reforzamiento Negativo: Escape, Evitacin

Aversiva

Castigo

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva Negativa

Apetitiva Reforzamiento Positivo


Conducta Consecuencia apetitiva. Hace que la conducta se haga ms frecuente (ms tasa de respuesta). Ej: Premios

Aversiva

Fernando Blanco; 2007

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva Negativa

Apetitiva

Conducta Consecuencia aversiva. Hace que la conducta se haga menos frecuente (suprime conductas).

Aversiva

Castigo

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva Negativa

Apetitiva

Entrenamiento De Omisin
Aversiva
Conducta NO Consecuencia apetitiva. Hace que la conducta se haga menos frecuente (menos tasa de respuesta). Ej: Castigado sin postre!

Fernando Blanco; 2007

10

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva Negativa

Apetitiva

Conducta NO Consecuencia aversiva. Hace que la conducta se haga ms frecuente (ms tasa de respuesta). Ej: Hacer caso a un no que llora porque no te deja dormir.
Con este ltimo siempre metemos la pata. Recordemos que aumenta la tasa de respuesta, igual que el refuerzo positivo.

Aversiva

Reforzamiento Negativo: Escape, Evitacin

Procedimientos de condicionamiento instrumental

Escape / Evitacin
Escape Estimulacin aversiva

Conducta Estimulacin aversiva La estimulacin aversiva se detiene si se da la conducta

Fernando Blanco; 2007

11

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

Procedimientos de condicionamiento instrumental

Escape / Evitacin
Evitacin Conducta

Estimulacin aversiva La estimulacin aversiva no se inicia si se da la conducta

La respuesta instrumental Normalmente: El reforzamiento produce conductas estereotipadas, reduce la variabilidad de la conducta.
Conductas variadas Reforzamiento Conductas estereotipadas

Pero tambin es posible reforzar la variabilidad. Con lo que aumentamos la variabilidad de la conducta mediante reforzamiento. (Ej: Slo recompenso al animal cuando lleva a cabo un patrn de respuestas novedoso).

Fernando Blanco; 2007

12

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental Pertinencia. Por su naturaleza, hay estmulos que se asocian mejor con otros. En el condicionamiento clsico:

Mal condicionamiento

EC: SABOR

EI: DESCARGA

La respuesta instrumental Pertinencia. Por su naturaleza, hay estmulos que se asocian mejor con otros. En el condicionamiento clsico:

Buen condicionamiento

EC: SABOR

EI: Enfermedad

Fernando Blanco; 2007

13

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental Pertinencia. Por su naturaleza, hay estmulos que se asocian mejor con otros. Tambin en el condicionamiento instrumental. Debe haber cierta correspondencia entre la respuesta y el reforzador. Pero recordemos: El reforzador se define por su efecto sobre la conducta (decamos que era una definicin circular). No sabemos seguro si un estmulo servir como reforzador de una conducta en concreto.

La respuesta instrumental Pertinencia. Sujeto: Pez macho. Respuesta: Gesto de morder. Reforzador: Aparicin de otro pez macho.

Respuesta: morder

Reforzador: macho

Fernando Blanco; 2007

14

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental Pertinencia. Sujeto: Pez macho. Respuesta: Gesto de morder. Reforzador: Aparicin de un pez hembra. No hay buen condicionamiento

Respuesta: morder

Reforzador: hembra

La respuesta instrumental Pertinencia. Morder: conducta agresiva. La practican los machos con otros machos. Cuando el reforzador es un macho: el condicionamiento es bueno. La respuesta morder tiene que ver con el reforzador.

Estoy que echo Estoy que echo chispas. Dnde est chispas. Dnde est mi rival? Que me lo mi rival? Que me lo como! como!

Fernando Blanco; 2007

15

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental Pertinencia. Cuando el reforzador es una hembra: El gesto de morder no es una respuesta adecuada para ser reforzada con acceso a una hembra. Por otro lado: Si la conducta que quiero reforzar es el baile de cortejo, entonces sucede justo al revs (mejor que el reforzador sea el acceso a una hembra). Ha de haber cierta relacin entre la respuesta y el reforzador.

La respuesta instrumental Pertinencia.


Aqu lo vemos: El acceso a una hembra es el reforzador adecuado para la conducta del baile de cortejo.

Respuesta: cortejo

Reforzador: hembra
Estudias o Estudias o trabajas, liiinda? trabajas, liiinda?

Fernando Blanco; 2007

16

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental
Cmo predigo si una conducta es apropiada para reforzarla con un reforzador en concreto? Una ayuda son los Sistemas de conducta (ver captulo 4).

Cuando tiene hambre, se activa el sistema de conducta de alimentacin (buscar comida). Estas conductas (olfatear, excavar...) forman parte del sistema de alimentacin y en esta condicin de privacin se hacen ms frecuentes.

Conductas del animal en su estado natural: 20% Erguirse 20% Limpiarse 20% Rascarse 20% Excavar 20% Olfatear

Conductas del animal con hambre (privado de comida): 30% Erguirse Las conductas 2% Limpiarse del sistema de 3% Rascarse alimentacin se 30% Excavar refuerzan mejor 35% Olfatear con comida.

El reforzador instrumental Cantidad y calidad del reforzador: Afecta a la cantidad e intensidad de la respuesta. Reforzador cuantioso y de calidad e intensa. Respuesta frecuente

Qu pasa si la cantidad o la calidad del reforzador varan a lo largo del experimento? Lo predice el modelo de Rescorla & Wagner. Cambios en el reforzador = ms sorpresa (positiva o negativa).

Fernando Blanco; 2007

17

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

El reforzador instrumental

Trabajo

Trabajo ms

Comparo lo que tena antes con lo que tengo ahora

Trabajo

Trabajo menos

El reforzador instrumental

Trabajo

Trabajo ms

El contraste es importante. Trabajo MUCHO ms

Trabajo

Fernando Blanco; 2007

18

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

El reforzador instrumental

Contraste positivo: Recompensa mala Recompensa regular Contraste negativo: Recompensa muy buena Ej: nio rico.

++RC.

Recompensa buena

--rc.

Estoy acostumbrado a tenerlo todo Richie Rich

La relacin respuesta - reforzador instrumental

Contigidad temporal: El reforzador sigue inmediatamente a la respuesta. Contingencia: El reforzador sigue a la respuesta y slo a la respuesta. Entonces podemos decir que tienen una relacin causal. La respuesta es la causa del reforzador. Puede haber contigidad sin contingencia y contingencia sin contigidad.

Fernando Blanco; 2007

19

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental

Contigidad temporal: El condicionamiento es mejor si la demora es corta (mucha contigidad). Explicacin: el animal no sabe qu conducta ha sido reforzada. Reforzamiento no contiguo: R1 Tiempo R2 R3 R4 Reforzador

La relacin respuesta - reforzador instrumental

Contigidad temporal: El condicionamiento es mejor si la demora es corta (mucha contigidad). Explicacin: el animal no sabe qu conducta ha sido reforzada. Reforzamiento contiguo: R1 Tiempo Reforzador R1

Fernando Blanco; 2007

20

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental

Contigidad temporal: A veces no es posible presentar el reforzador inmediatamente despus de la conducta. Maneras de resolver esa situacin: 1- Usar un reforzador condicionado o secundario.

La relacin respuesta - reforzador instrumental (Es el mismo estmulo que har de reforzador)

EC

EI

EI R1 EC

En vez del reforzador, presento el EC que estaba asociado con el reforzador.

Tiempo Ahora s hay contigidad

Fernando Blanco; 2007

21

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental

Contigidad temporal: A veces no es posible presentar el reforzador inmediatamente despus de la conducta. Maneras de resolver esa situacin: 1- Usar un reforzador condicionado o secundario. 2- Marcado. Un estmulo aparece tras las respuestas correctas (que son las que se reforzarn) y tras las incorrectas. As el animal sabe qu conducta es la que se va a reforzar (marca la respuesta que es importante de cara a obtener el reforzador).

La relacin respuesta - reforzador instrumental

Contingencia respuesta-reforzador: La entrega del reforzador depende de la ejecucin de la respuesta. No hay reforzador si no hay respuesta. Es tan importante como la contigidad. Mejor que estn las dos.

Fernando Blanco; 2007

22

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental

Supersticin (Skinner) Experimento: Entrega de comida independiente de la conducta (cada 15 segundos). No hay contingencia, por tanto, entre conducta y reforzador. Resultado: Aparecen conductas extraas en las palomas. Las palomas se comportan como si estas conductas controlaran la administracin del reforzador.

La relacin respuesta - reforzador instrumental Supersticin (Skinner)

R1

R2

Reforzador

R3

R4 R2 R2

Tiempo

Reforzamiento Reforzamiento accidental o accidental o adventicio. adventicio.

La conducta previa al La conducta previa al reforzador NO tiene reforzador NO tiene contingencia con el contingencia con el reforzador, pero s tiene reforzador, pero s tiene contigidad,por puro azar. contigidad, por puro azar.

Esa conducta que por Esa conducta que por azar ha sido contigua al azar ha sido contigua al reforzador se hace ms reforzador se hace ms frecuente en el futuro. frecuente en el futuro.

Al ser ms frecuente, es Al ser ms frecuente, es ms probable que ms probable que vuelva a ser reforzada vuelva a ser reforzada accidentalmente. accidentalmente.

Fernando Blanco; 2007

23

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental Supesticin (Skinner)


Este mecanismo puede explicar las supersticiones humanas.

La relacin respuesta - reforzador instrumental Indefensin aprendida (Seligman)


Ingredientes para hacer un experimento de indefensin aprendida:

Pared baja
Gato (No hace falta que sea un gato espacial)*

Lado seguro

Es por tanto un procedimiento de Escape.

*Nota: el experimento original usaba perros

Descargas

Fernando Blanco; 2007

24

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental Indefensin aprendida (Seligman)


En la segunda fase, hacemos un cambio en la jaula experimental:

Pared inaccesible

Al subir la altura de la pared que separa los dos lados, el pobre gato queda confinado en el lado de las descargas.

La relacin respuesta - reforzador instrumental Indefensin aprendida (Seligman)


Por ltimo, volvemos a poner la pared a la altura inicial:

Ya no quiero saltar, esto no tiene remedio! La vida es injusta.

Pared baja de nuevo

El gato ni siquiera intenta saltar: INDEFENSIN APRENDIDA

Fernando Blanco; 2007

25

Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental Indefensin aprendida (Seligman) La exposicin a estimulacin aversiva incontrolable ha producido inactividad (como no puedo controlar lo que me pasa, no tiene sentido intentar cambiarlo). La indefensin aprendida se relaciona con la depresin. Puede ser debido a un dficit atencional. Tiene, por lo tanto, 3 tipos de consecuencias: motoras (inactividad), cognitivas (distorsiones cognitivas, falta de atencin), y emocionales (depresin).

Hasta aqu llegamos, Muchas gracias!

Diapositivas de Fernando Blanco, 2007


Pgina web: http://www.labpsico.com/pers/blanco/FernandoBlanco.htm

Fernando Blanco; 2007

26

You might also like