You are on page 1of 39

Condicionamiento instrumental:

mecanismos motivacionales
LA ESTRUCTURA ASOCIATIVA
DEL CONDICIONAMIENTO
INSTRUMENTAL

Edward Thorndike fue el primero en


reconocer que el condicionamiento
instrumental involucra más que sólo una
respuesta y un reforzador. La respuesta
instrumental ocurre en el contexto de
estímulos ambientales específicos.
Estructura asociativa del
condicionamiento
instrumental
Para el análisis del condicionamiento
instrumental existen tres eventos a
considerar: contexto estímulo (E), la
respuesta instrumental (R) y
consecuencia de la respuesta (C) o
reforzador.

De ahí Skinner describe el


condicionamiento instrumental como
una contingencia de 3 términos.
La asociación E-R y la ley del
efecto

La estructura básica de un
procedimiento de condicionamiento
instrumental permite el desarrollo
de varios tipos distintos de
asociaciones. La primera de las
cuales fue planteada por Thorndike
como una asociación entre los
estímulos del contexto (E) y la
respuesta instrumental (R): la
asociación E-R. Thorndike
consideraba que la asociación E-R
era la clave para el aprendizaje
instrumental y fundamental para su
Ley del efecto
La asociación entre E y R y
la ley del efecto.

Violencia intrafamiliar y consumo de


drogas.

Expectativa de la recompensa y la
asociación E-C.
Condicionamiento Pavloviano.
Expectativa de la recompensa
y la asociación E-C.
La idea de que la expectativa de la
recompensa puede motivar la
conducta instrumental no fue
seriamente considerada sino hasta
40 años después del planteamiento
de la ley del efecto. ¿Cómo
podríamos captar la idea de que los
sujetos aprenden a esperar el
reforzador en el curso del
condicionamiento instrumental? Se
llega a esperar que suceda algo
importante cuando se encuentra un
estímulo que señala al evento
importante o que le permite predecir
que el evento ocurrirá.
El condicionamiento Pavloviano es el
proceso básico del aprendizaje de
señales. De ahí que una forma de
mirar la expectativa de la
recompensa es considerando la
forma en que los procesos
Pavloviano participan en el
aprendizaje instrumental.
Una de las primeras y más
influyentes explicaciones del papel
del condicionamiento clásico en la
conducta instrumental fue ofrecida
por Clark Hull (1930, 1931) y más
tarde perfeccionada por Kenneth
Spence (1956). Su propuesta era
que la respuesta instrumental se
incrementa en el curso del
condicionamiento instrumental por
dos razones:
primera, la presencia de E llega a
provocar directamente la respuesta
instrumental por medio de la
asociación E-R de Thorndike;
segunda, la respuesta instrumental
también llega a realizarse como
reacción a una asociación E-C que
crea la expectativa de la
recompensa. La forma precisa con
la cual la asociación E-C llega a
motivar la conducta instrumental ha
sido tema de muchos debates e
investigaciones experimentales.
Una formulación de particular
influencia fue la teoría de dos
procesos de Rescorla y Solomon
(1967).
La teoría de dos procesos.

La teoría de dos procesos supone


que existen dos tipos distintos de
aprendizaje: el condicionamiento
Pavloviano y el instrumental, un
planteamiento que nada tiene de
radical. En la teoría se supone
además que esos dos procesos de
aprendizaje están relacionados de
una forma especial
En particular, en el curso del
condicionamiento instrumental, los
estímulos en cuya presencia se
refuerza la respuesta instrumental
se asocian con la consecuencia de la
respuesta (C) por medio del
condicionamiento Pavloviano, y esto
resulta en una asociación E-C.
Rescorla y Solomon creyeron que la
asociación E-C activa un estado
emocional positivo o negativo,
dependiendo de si el reforzador es
un estímulo apetitivo o aversivo
(comida o una descarga).
Interacciones de la
respuesta en la
transferencia pavloviana
instrumental

Los estímulos condicionados clásicamente


no sólo provocan estados emocionales,
sino también respuestas manifiestas. En
consecuencia, un estímulo condicionado
clásicamente puede influir en la conducta
instrumental por medio de dichas
respuestas.
¿Estados emocionales
condicionados o expectativas
específicas de recompensa?
La teoría de los dos procesos asume
que el condicionamiento clásico
media en la conducta instrumental
por medio del condicionamiento de
emociones positivas o negativas,
dependiendo de la valencia
emocional del reforzador. Sin
embargo, en el curso del
condicionamiento instrumental y
clásico los animales no sólo
adquieren emociones categóricas,
positivas o negativas, sino también
expectativas específicas de
recompensa (Peterson y Trapold,
1980).
Relaciones R-C y E(R-C)
en el condicionamiento
instrumental.
Hasta ahora hemos considerado dos
asociaciones diferentes que pueden
motivar la conducta instrumental, la
asociación E-R de Thorndike y la
asociación E-C, que activa la
expectativa de una recompensa
específica o un estado emocional,
Sin embargo, por algunas razones,
sería raro explicar toda la
motivación de la conducta
instrumental en términos de esas
dos únicas asociaciones.
Primero, advierta que ni la
asociación E-R ni la asociación E-C
involucran una conexión directa la
respuesta (R) y el reforzador o
consecuencia (C), lo cual resulta
contraínstuitivo.

La intuición sugiere que la conducta


instrumental implica asociación: Nos
peinamos esperando que eso mejore
nuestra apariencia; vamos al cine
esperamos que la película resulte
entretenida, y abrimos el
refrigerador a do que eso nos
permitirá obtener algo que comer.
Otra característica de la estructura
del condicionamiento instrumental,
asumida por la teoría de los dos
procesos, es que se supone que el
estímulo (E) se asocia directamente
con la consecuencia (C) por el
supuesto de que el emparejamiento
de E con C es suficiente para que
ocurra el condicionamiento clásico.
No obstante, como vimos en el
capítulo 4, los emparejamientos EC-
EI no son suficientes para el
desarrollo de asociaciones
pavlovianas. El EC también debe
brindar información acerca del El, o
relacionarse con é) de alguna
manera.
Evidencia de asociaciones R-C

Varios investigadores han sugerido


que el condicionamiento
instrumental da lugar al aprendizaje
de asociaciones entre respuesta y
consecuencia (Bolles, 1972b; Mac-
kintosh y Dickinson, 1979), una
posibilidad que ha recibido el apoyo
de varias fuentes de evidencia. Una
técnica común involucra la
devaluación del reforzador posterior
al condicionamiento para ver si eso
disminuye la respuesta
instrumental.
Esta estrategia es análoga a la
estrategia de devaluación del El
en los estudios del
condicionamiento Pavloviano
(capítulo 4). En el
condicionamiento Pavloviano se
utiliza la devaluación del El para
determinar si la respuesta condi-
cionada es mediada por una
asociación EC-EI. Si la
devaluación del El, posterior al
condicionamiento, interrumpe la
RC, puede concluirse que la
respuesta condicionada fue
mediada por la asociación EC-EI.
De manera correspondiente, la devalua-
ción del reforzador se ha empleado para
determinar si una respuesta
instrumental es mediada por la
asociación entre la respuesta y su
reforzador resultante.

La respuesta en cualquier dirección era


reforzada de acuerdo a un programa de
reforzamiento de intervalo variable de
un minuto. Durante las sesiones de
entrenamiento siempre se dispuso de
dos alternativas de respuesta. La única
diferencia era que las respuestas en
una dirección eran reforzadas con
bolitas de comida y las respuestas en la
dirección contraria siempre fueron
reforzadas con un sorbo de una
solución dulce (sucrosa).
Uno de los reforzadores (las bolitas
de comida o la solución dulce) se
presentaba periódicamente en la
cámara experimental y era seguido
por una inyección de cloruro de litio
con el objeto de condicionar una
aversión a ese reforzador. Después
que se condicionó la aversión al
reforzador seleccionado, se reinstaló
la vara vertical y las ratas fueron
sometidas a una prueba en la que
tenían la libertad de empujar la vara a
la izquierda o a la derecha, pero no se
presentaba comida ni sucrosa
Los resultados de la prueba se
muestran en la figura 7.4. El hallazgo
importante fue que era menos
probable que las ratas emitieran la
respuesta cuyo reforzador se había
vuelto aversivo por los
emparejamientos con el cloruro de
litio.
Los estudios sobre la devaluación del
reforzador se realizan de forma si a
los procedimientos usados por Colwill
y Rescorla (1986). Una fase inicial
condicionamiento instrumental es
seguida por una fase en que se
devalúa reforzador emparejándolo
con enfermedad o saciando al sujeto
de forma tal no quiera comer.
No obstante, hay otro paso
importante en el proceso, el sujeto
tiene que experimentar el nuevo
valor del reforzador. Es decir, debe
por qué tan mala se tornó la comida
después que fue emparejada con la
enferme» o qué tan desagradable se
vuelve una vez que el sujeto ya no
tiene Esto se conoce como
aprendizaje de incentivo. La
conducta instrumental sólo se
reducirá si el sujeto ha tenido la
oportunidad de aprender cuál es el
nuevo de incentivo del reforzador.
Los resultados presentados en la
figura 7.4 tampoco pueden
explicarse por medio de
asociaciones E-R, las cuales no
incluyen al reforzador. Por lo tanto,
la devaluación del reforzador no
puede alterar la conducta mediada
por una asociación E-R.

La conducta instrumental se vuelve


habitual e insensible a la
devaluación del reforzador si una
sola respuesta instrumental es
seguida por la misma consecuencia
a lo largo de un periodo prolongado
de entrenamiento.
Relaciones jerárquicas E(R-C)

La evidencia mencionada arriba


demuestra con claridad que los
organismos aprenden a asociar una
respuesta instrumental con su
consecuencia. Sin embargo, las
asociaciones R-C no pueden actuar
por sí solas para producir conducta
instrumental. Como señalaron
Mackintosh y Dickinson (1979), el
hecho de que la respuesta
instrumental activa una expectativa
del reforzador no es suficiente para
saber qué ocasionó la respuesta en
primer lugar. la respuesta
Se requiere un factor adicional para
activar la asociación R-C. Una
posibilidad es que la asociación R-C
sea activada por los estímulos (E)
que están presentes cuando se
refuerza la respuesta
Skinner (1938) sugirió hace muchos
años que en el condicionamiento
instrumental E, R y C están
conectados por medio de una
relación condicional E (R-C). Esta
sugerencia fue seguida con energía
al final del siglo XX. Se han
desarrollado diversas líneas de
evidencia, directa e indirecta, que
señalan al aprendizaje de relaciones
E(R-C) en el condicionamiento
instrumental.
La mayor parte de esos estudios han
implicado procedimientos complejos
de entrenamiento discriminativo que
escapan al alcance del presente
análisis.
REGULACIÓN CONDUCTUAL

Los análisis de la regulación


conductual se basan en una visión
del mundo radicalmente distinta. En
lugar de considerar al
condicionamiento instrumental en
términos del reforzamiento de una
respuesta en presencia de ciertos
estímulos, la regulación conductual
se enfoca en la manera en que los
procedimientos de condicionamiento
instrumental ponen limitaciones a
las actividades de un organismo y
ocasionan la redistribución de dichas
actividades.
Antecedentes de la
regulación conductual
En un inicio se consideraba que los
reforzadores eran tipos especiales
de estímulos. Por ejemplo,
Thorndike describía a un reforzador
como un estímulo que produce un
estado satisfactorio de cosas. Se
hicieron varias propuestas acerca de
las características especiales que
debe tener un estímulo para
funcionar como reforzador.
Teoría de la respuesta consumatoria
El primer desafío para la idea de que
los reforzadores son estímulos se
originó en Fred Sheffield y sus
colaboradores, quienes plantearon
la teoría de la respuesta
consumatoria. Varios reforzadores,
como la comida y el agua, provocan
respuestas incondicionadas típicas
de la especie, como masticar,
lamer y tragar. La teoría de la
respuesta consumatoria atribuye el
reforzamiento a esas conductas
típicas de la especie. Afirma que las
respuestas consumatorias típicas de
la especie (comer, beber, etcétera)
son en sí mismas la característica
esencial de los reforzadores.
La teoría de la respuesta
consumatoria constituyó una
innovación radical, pues cambió la
búsqueda de los reforzadores de
tipos especiales de estímulos a tipos
especiales de respuestas. Se
asumió que las respuestas
reforzantes eran especiales debido a
que implicaban la consumación o
completamiento de una secuencia
conductual instintiva.
El principio de Premack
Principio que supone que el
reforzamiento depende de qué tan
probable sea que el organismo
realice la respuesta reforzante por
arriba de la respuesta instrumental
antes de que se introduzca un
procedimiento de condicionamiento
instrumental. Entre mayor sea la
probabilidad diferencial de las
respuestas reforzante e
instrumental durante las condiciones
de línea base, mayor será el efecto
de reforzamiento de ofrecer la
oportunidad de participar en la
respuesta reforzante después de la
realización de la respuesta
instrumental.
Premack señalaba que las
respuestas involucradas con los
reforzadores de uso común implican
actividades que es muy probable
que realicen los animales. En un
experimento con reforzamiento
alimenticio, por lo general se priva
de comida a los participantes que,
en consecuencia, se muestran muy
propensos a participar en la
conducta alimenticia. En contraste,
las respuestas instrumentales suelen
ser actividades de baja probabilidad.
El principio de Premack puede
exponerse formalmente de la
siguiente manera: Dadas dos
respuestas de probabilidad distinta,
A y B, la oportunidad para realizar
la respuesta de alta probabilidad (A)
después de la respuesta de baja
probabilidad (B) tendrá como
resultado el reforzamiento de la
respuesta B. (B " A refuerza B.) La
oportunidad para realizar la
respuesta de baja probabilidad (B)
después de la respuesta de mayor
probabilidad (A) no resultará en el
reforzamiento de la respuesta A. (A
" B no refuerza A.)
Aplicaciones del principio de
Premack
El principio de Premack ha tenido
un gran impacto en el diseño de los
procedimientos de reforzamiento
utilizados para ayudar a diversas
poblaciones clínicas. En una
aplicación inicial, Mitchell y
Stoffelmayr (1973) estudiaron a
dos pacientes hospitalizados con
esquizofrenia crónica que
rechazaban todos los reforzadores
tangibles que se les ofrecían
(dulces, cigarrillos, fruta,
panecillos).
Los otros pacientes del pabellón
participaban en un proyecto de
trabajo que implicaba retirar el
alambre de cobre fuertemente
enroscado en las bobinas
Regulación conductual y el
punto de éxtasis conductual

Las teorías de la regulación


conductual suponen que existen
mecanismos análogos en relación
con la conducta. Dentro del marco
de la regulación conductual, se
supone que los organismos tienen
una distribución preferida u óptima
de actividades que se esfuerzan por
mantenerlas ante los desafíos o
interrupciones.
Las teorías de la regulación
conductual se enfocan en la medida
en que una contingencia
instrumental, entre respuesta y
reforzador, interrumpe la
estabilidad conductual y obliga al
individuo a alejarse de la
distribución de actividades óptima o
preferida.
El punto de éxtasis conductual
La teoría de la regulación conductual
supone que si los organismos tienen la
libertad para distribuir sus respuestas
entre las alternativas de que disponen,
lo harán de una forma que les resulte
más cómoda u óptima. Esta
distribución de las respuestas define el
punto de éxtasis conductual. La
distribución particular de actividades
que constituye el punto de éxtasis
variará de una situación a otra. Por
ejemplo, si resulta muy difícil hacer
girar la rueda de actividad o si se
somete al participante a una severa
privación de agua, se observará un
cambio en las probabilidades de correr
y de beber.

You might also like