Apuntes Aprendizaje y Condicionamiento

EXTINCIN
La extincin implica omitir la consecuencia que sigue a la respuesta.

Produce una disminucin de la respuesta pero no la elimina totalmente. Si el
animal recibe un intervalo de descanso tras la extincin, se produce una
recuperacin espontnea de la respuesta. La respuesta slo parece eliminarse
como consecuencia de la extincin, pero es todava dominante entre las
respuestas del repertorio conductual del sujeto.
En ocasiones, el comienza de la extincin da lugar a un aumento temporal pero
acusado de la tasa de respuesta (explosin de la extincin). Dicha explosin
refleja la frustracin al no recibir recompensa.
Un factor que influye en el grado de recuperacin espontnea mostrada por el
sujeto es la semejanza entre el entrenamiento y las condiciones de la prueba.
Los procedimientos que favorecen las semejanzas entre la adquisicin y la
prueba de recuperacin espontnea, al tiempo que maximizan las diferencias
entre la fase de extincin y la prueba, tienden a incrementar la recuperacin
espontnea.
Una forma de demostrar el reforzamiento secundario es la tcnica de la
extincin. La presentacin de un reforzador condicionado durante la fase de
extincin mantiene la conducta respecto a la cual es contingente la clave.
-
Los sujetos que reciben el reforzador secundario tras la respuesta

criterio muestran un nivel de respuesta ms sostenido durante la
extincin que los sujetos en los que no se da esta circunstancia.
Los reforzadores secundarios mantienen la conducta durante la
adquisicin en condiciones que, de lo contrario, produciran un dficit
en la conducta: Una demora en la recompensa provoca una
disminucin de la tasa de respuesta; sin embargo, si se administra
una clave breve durante la demora, no se observa reduccin de
respuesta porque el reforzador secundario acta como recompensa.
INDEFENSIN APRENDIDA
El condicionamiento instrumental depende de la contingencia entre respuesta y
consecuencia reforzante. No obstante, cuando la respuesta y la recompensa
son independientes entre s, tambin se produce aprendizaje: los sujetos
aprenden que su conducta es independiente de la recompensa. Este
aprendizaje tiene efectos perturbadores en el aprendizaje futuro.
Indefensin aprendida: el aprendizaje futuro se retarda si el animal recibe
previamente consecuencias incontrolables.
1
Ejemplos de indefensin aprendida:

-
Transferencia aversiva-aversiva.- Seligman y Maier realizaron un

experimentos de 2 fases con tres grupos de perros.
Fase 1:
- Grupo escape: reciben descargas no sealadas pero pueden
parar las descargas pulsando un panel.
- Grupo acoplado: reciben descargas no sealadas y no pueden
parar las descargas.
- Grupo sin descarga: no reciben tratamiento durante esta fase.
Fase 2:
- Los tres grupos se colocan en una caja lanzadera y se les
ensea una reaccin normal de escape-evitacin.
Resultados:
- El grupo acoplado mostr una perturbacin en el aprendizaje de
la nueva reaccin de escape-evitacin. Esta dificultad para aprender
puede deberse a la incapacidad para controlar la descarga en la fase
1. Este dficit constituye la indefensin aprendida.
Transferencia apetitiva-apetitiva.- En el condicionamiento apetitivo

tambin se observa una transferencia negativa en la prueba de
aprendizaje (fase 2) tras presentaciones de comida incontrolables en
la fase 1: pereza aprendida.
Transferencia motivacional cruzada.- Algunos autores han sugerido

que el perjuicio del aprendizaje no se debe a la transferencia de una
expectativa, sino al hecho de que el animal experimenta un cambio
de actividad general como consecuencia de una descarga
incontrolable (cuanta ms inactividad muestra el sujeto en la fase 1,
independientemente del tto recibido durante esa fase, ms disminuye
la actividad en la fase de prueba).
Sin embargo, hay razones para creer que ocurre algo ms que un
simple cambio de actividad:
- Los estudios muestran una transferencia negativa entre las
situaciones apetitivas y aversivas que conllevan tipos distintos de
tareas de respuesta.
- Estrategia de administrar a los sujetos presentaciones de comida
no contingentes y observar si tienen una mayor dificultad para
2
aprender una tarea aversiva. En varios estudios se ha mostrado una

transferencia negativa.
- La descarga inescapable afecta a la conducta en una situacin
de aprendizaje apetitivo y la indefensin se manifiesta no slo a
travs de un dficit en aprender que la conducta controla la
administracin de la recompensa (demostracin convencional de la
indefensin), sino tambin mediante la potenciacin del hecho de
aprender que la conducta y la recompensa son independientes.
Principios de indefensin aprendida:

-
Inmunizacin.- Los reforzadores incontrolables no impiden el

aprendizaje posterior si los sujetos experimentan recompensas
controlables antes de la fase de indefensin. Los efectos de la
inmunizacin se producen incluso cuando la respuesta durante la
fase de inmunizacin difiere de la respuesta en la fase de prueba.
Maestra aprendida.- Experimentar un control sobre la administracin
de los reforzadores no slo produce el efecto de inmunizacin, sino
que hace que los animales sean inusualmente persistentes ante una
descarga incontrolable.
Reversibilidad.- La indefensin aprendida puede invertirse forzando
al sujeto a responder durante la sesin de aprendizaje.
Teoras de la indefensin aprendida:

-
Hiptesis de la indefensin aprendida.- Cuando las consecuencias

son independientes de la conducta del animal, el sujeto desarrolla un
estado de indefensin que se manifiesta: prdida de motivacin con
disminucin de la ejecucin y ms pasividad y expectativa
generalizada de que su conducta seguir siendo independiente de
las consecuencias reforzantes (causa del futuro dficit del
aprendizaje).
Hay estudios que muestran que no es la falta de control la causa de
la indefensin sino la incapacidad para predecir el EI. Hallazgos:
- Recibir una descarga inescapable y predecible (sealada)
perjudica el aprendizaje futuro en un grado menor que recibir una
descarga no sealada.
- La presentacin de estmulos de retroalimentacin tras finalizar
una descarga inescapable elimina el dficit de la indefensin.
Hiptesis de la ansiedad.- Esta hiptesis explica varios hechos:

- La ansiedad resulta ms fuerte tras las descargas elctricas
inescapables que despus de las descargas susceptibles de
escape.
- La retroalimentacin reduce la ansiedad. Un estmulo de
retroalimentacin atena el miedo crnico.
- La ansiedad mediada por el olor desencadena un dficit de
aprendizaje.
- El fenmeno de la indefensin no puede explicarse
completamente en trminos de una presencia continua de
ansiedad. Aunque la ansiedad est presente en los animales con
descarga inescapable en condiciones normales, por s misma no
es necesaria para producir el dficit de aprendizaje.
Teora del procesamiento cognitivo.- Los sujetos que reciben

descargas inescapables cambian el modo en que procesan la
informacin posteriormente. Los animales indefensos aprenden con
menor eficacia, independientemente de su estado de ansiedad. Los
animales indefensos tienen mayor falta de atencin.
PAUSA POST-REFORZAMIENTO
Perodo que sigue a la administracin de la recompensa durante el cual el
sujeto deja de responder. Se produce en especial con programas IF.
IMPRONTA
Proceso de aprendizaje especfico de fase por el que muchas especies,
especialmente las aves, desarrollan apegos filiales y aprenden a identificarse
con una especie.
En un principio, se pensaba que la impronta era irreversible y que podra
originarse slo durante un perodo crtico de tiempo. Aunque sigue
considerndose la impronta como un proceso de aprendizaje sensible respecto
a una fase determinada, la investigacin ha cuestionado la nocin de que se
limita a un perodo crtico, as, los ejemplares mayores han de recibir una
mayor exposicin al estmulo de impronta pero sta s se produce. Por otro
lado, se ha deducido que es tambin reversible y con una exposicin lo
suficientemente larga a un segundo objeto de impronta, los sujetos cambian su
apego a favor de un nuevo estmulo.
4
Caractersticas crticas de los estmulos de impronta:

-
Se produce impronta con objetos inanimados, no obstante, los

congneres vivos son ms reforzantes que los objetos inanimados.
Tanto el movimiento del objeto de impronta como del sujeto son
factores crticos.
Sonido que emite el objeto de la impronta. Aunque muchas cras de
patos parecen tener una preferencia innata por la llamada materna, la
exposicin a sus propias vocalizaciones resultan crticas para la
impronta. Una respuesta a la llamada especfica de la especie del
pato depende de la experiencia auditiva del pato durante el desarrollo
embrionario, y de haber escuchado sus propias vocalizaciones antes
de ser expuesto a la llamada materna. Aunque las cras de patos
siguen a los objetos en movimiento, la llamada materna asegura que
se producir la respuesta filial. La llamada materna sigue
aumentando la preferencia por el estmulo an despus de haberse
producido el proceso de impronta.
Teoras de la impronta:
-
Impronta basada en el aprendizaje perceptivo.- La mera exposicin

al estmulo de impronta crea familiaridad y preferencia. A medida que
el objeto de la impronta resulta ms familiar, los objetos nuevos
tienden a provocar reacciones de miedo.
Teora del condicionamiento de la impronta. Afirmaciones:
- Las aves jvenes estn preparadas de forma innata para
responder a cierta clase de estimulacin (objetos en movimiento).
- Las aves jvenes desarrollan miedo a los objetos nuevos a
medida que crecen.
- La conducta constituye una solucin de dos tendencias
competidoras suscitadas por el estmulo de impronta: tendencia
filial o de aproximacin y la reaccin de miedo.
Algunos tericos no estn de acuerdo con esta teora ya que:
- Especies de aves independientes desde el nacimiento identifican a
sus congneres basndose en llamadas tpicas de la especie y no
por condicionamiento.
- No se produce extincin tras exposiciones reiteradas.
- Los pjaros reciben la impronta de claves ambientales u objetos
estticos; sin embargo la teora indica que los sujetos muestran
preferencia por objetos en movimiento de forma innata o por

refuerzo.
PRINCIPIO DE PREMACK
Supuestos:
-
El patrn de actividad global de un sujeto puede analizarse en

funcin de sus actividades constituyentes.
El porcentaje de tiempo que el sujeto dedica a una actividad dada
refleja la probabilidad de esa actividad y, en consecuencia, el grado
de preferencia de la actividad. La preferencia no depende del nmero
o tipo de actividades, sino de la tasa de ejecucin de la actividad en
relacin a las actividades disponibles. Los valores porcentuales
reflejan la preferencia relativa de la actividad.
Relacin de reforzamiento.- Una actividad preferible refuerza la

ejecucin de una respuesta menos preferente si el acceso a la
actividad preferida se hace contingente respecto a la ejecucin de la
actividad menos preferida. Ej: comer (actividad preferente) refuerza el
presionar la palanca (actividad menos preferente) si el acceso del
sujeto a la comida es contingente en relacin a la ejecucin de la
respuesta de la palanca.
Todo lo que se necesita para predecir si un estmulo ser reforzante
es estimar su preferencia relativa. De este modo, se resuelve el
problema de la circularidad en la definicin del reforzador. Puede
identificarse de antemano una actividad reforzante determinando si
su probabilidad es lo suficientemente alta en relacin con la
probabilidad de las actividades alternativas.
Este principio se ve cuestionado por la hiptesis de la privacin de respuesta

de Allison (teora de la regulacin conductual).
TEORAS MECANICISTAS (E-R) DEL APRENDIZAJE

Teora neoconductista de Hull
Sistema hipottico-deductivo porque incluye postulados y teoremas formales.
La teora es mecanicista en el sentido de que propone el uso de variables
intermedias (hacen referencia a estados o caractersticas de los animales que
median la conducta).
6
Postulado IV: reduccin del impulso

La necesidad es un estado biolgico que ocasiona conductas no
aprendidas encaminadas a reducir esa necesidad.
El impulso es un estado psicolgico que corresponde al desequilibrio
biolgico.
El reforzamiento implica la reduccin del impulso.
Siempre que un sujeto experimenta cierta secuencia estmulorespuesta seguida de una reduccin de su estado de impulso,
aumenta el hbito que consiste en la tendencia a efectuar esa
respuesta en presencia de ese estmulo. Cuanto mayor es el nmero
de ensayos reforzados, mayor es el hbito del animal.
Postulado VII: potencial de reaccin

El hbito se traduce en ejecucin manifiesta slo cuando se motiva al
sujeto. As, la ejecucin se produce cuando el impulso y el hbito se
hallan presentes.
El efecto conjunto de la fuerza del hbito y el nivel de impulso en la
ejecucin se midi en funcin de la resistencia a la extincin.
El impulso (horas de privacin de comida) y el hbito (nmero de
reforzamientos) afectan de forma conjunta a la ejecucin pero
afectan de forma distinta a la conducta. As, la relacin entre el
impulso y la ejecucin es lineal: el nmero de respuestas durante la
extincin aumenta de forma proporcional a las horas de privacin; en
el hbito, el efecto no es lineal: la resistencia a la extincin aumenta
en funcin del nmero de reforzamientos, pero el aumento resulta
proporcionalmente decreciente.
La relacin entre el impulso y el hbito es multiplicativa.
Postulados VIII-IX: inhibicin reactiva y condicionada

La inhibicin reactiva es la fatiga acumulada como consecuencia de
la respuesta. Disminuye el potencial excitatorio y es aversiva.
La inhibicin condicionada se basa en la reduccin de la inhibicin
reactiva. A medida que el sujeto se fatiga (experimenta inhibicin
reactiva), tiene cada vez mayor motivacin para dejar de actuar
porque el estado de inhibicin reactiva es aversivo; la suspensin de
la propia ejecucin se refuerza porque disipa la inhibicin reactiva
aversiva.
La inhibicin reactiva y condicionada se combinan con el impulso y el
hbito para producir la ejecucin.
Crticas:
- Fallos en la concepcin molecular de la conducta segn la cual
la conducta de un animal se explica en funcin de movimientos
musculares.
- Los conceptos psicolgicos en los que se basaban los trminos
matemticos estaban sujetos a verificacin directa y eran, por
tanto, susceptibles de refutacin.
- Muchas conductas se aprenden an cuando no se halle
implicado ningn impulso o reduccin de la necesidad.
- Teora neo-hulliana.- Hull influy en amsel en su trabajo sobre el
efecto del reforzamiento parcial. As segn ambas teoras:
frustracin = inhibicin reactiva.
TEORAS COGNITIVAS (R-E) DEL APRENDIZAJE

Nocin de que los sujetos estn orientados hacia metas y que desarrollan
representaciones mentales de su conducta.
Conductismo cognitivo de Tolman

Utiliz trminos como propsito y cognicin, sosteniendo que el objetivo de la
conducta era alcanzar una ltima meta.
-
Expectativas y reforzamiento.- Los animales obtienen un

conocimiento general del entorno y desarrollan expectativas sobre las
consecuencias de su conducta. El reforzamiento no es necesario
para el aprendizaje, slo para la ejecucin.
El experimento del aprendizaje latente indica que los animales no
necesitan el reforzamiento para desarrollar un mapa cognitivo de su
entorno. La recompensa es innecesaria para el aprendizaje; slo se
requiere para estimular una ejecucin eficaz.
Mapas cognitivos.- Segn Tolman, las ratas desarrollan expectativas
sobre las consecuencias de su conducta y desarrollan mapas
cognitivos de su entorno. Por otro lado, Hull sugiere que las ratas se
limitan a efectuar una serie de movimientos musculares.
Los estudios dicen que las ratas desarrollan un mapa cognitivo de su
entorno.
Crticas:
- La conducta no siempre parece estar orientada a metas.
8
- El concepto de propsito es problemtico porque implica que el

sujeto tiene cierta nocin interna y auto-conocimiento respecto a
la meta de su conducta.
- No especifica qu conductas efectuar el animal.
-
Las asociaciones en el aprendizaje instrumental.- Los animales

desarrollan representaciones mentales de su propia conducta.
El condicionamiento instrumental se ve ahora bajo la misma luz que
el condicionamiento pavloviano. Los sujetos procesan la informacin
no slo respecto a los estmulos (cond. Pavloviano), sino tambin
respecto a su propia conducta (cond. Instrumental). Los animales
desarrollan representaciones de metas y las asocian con
representaciones de su propia conducta.
Asociaciones entre cada uno de los elementos del aprendizaje
instrumental: el estmulo discriminativo (disponen la oportunidad para
la recompensa indicando cuando se encuentra disponible el
reforzamiento, hasta que se efecta la respuesta) se asocia con la
respuesta (E-R) y con la consecuencia (E-C); la respuesta se asocia
con la consecuencia (R-C).
- Asociaciones R-C.- Estudiadas por Rescorla. Deducciones:
- Cuando los sujetos desarrollan una asociacin R-C, sta
no se ve afectada si la respuesta va seguida de una
consecuencia distinta.
- La asociacin R-C sigue desarrollndose durante el curso
de un tratamiento prolongado.
- La asociacin R-C persiste a pesar de la admon de ttos
que causan interferencia (la extincin hace que disminuya
la respuesta pero la asociacin R-C original permanece
intacta).
TEORAS DE LA REGULACIN CONDUCTUAL

Se centran exclusivamente en las condiciones que regulan la conducta, sin
especular sobre los mecanismos o asociaciones internas.
Anlisis conductual de Skinner
En lugar de basarse en estados internos para explicar la conducta, se centra en
el concepto de contingencia de reforzamiento. Efectos de la contingencia de
reforzamiento:
9
Selecciona la conducta.- Las conductas que no anteceden a una

recompensa, o que van seguidas de castigos, ven disminuida su
probabilidad.
Mantener la conducta.- El fortalecimiento de la respuesta mediante el
reforzamiento se llama ley emprica del efecto. Esta ley no es una
explicacin de la conducta, sino una descripcin del hecho de que las
conductas que van seguidas por reforzadores aumentan su
probabilidad.
Hiptesis de la privacin de respuesta de Allison

Cuestiona la afirmacin del principio de Premack (Una actividad preferible
refuerza la ejecucin de una respuesta menos preferente si el acceso a la
actividad preferida se hace contingente respecto a la ejecucin de la actividad
menos preferida). Para Allison, el cambio previsible en la tasa de una conducta
instrumental no se produce debido a una consecuencia especial llamada
reforzador, sino porque se priva al sujeto de la actividad respecto a la cual la
conducta instrumental es contingente.
La combinacin de las dos actividades preferidas por el sujeto es su punto de
deleite.
Se prefiere esta formulacin al principio de Premack porque la relacin de
reforzamiento se basa en limitar la actividad ms probable respecto al punto de
bienestar.
Si las limitaciones de un programa de reforzamiento restringen el acceso a una
conducta particular, los sujetos efectan otras conductas por encima de su tasa
de lnea base preferida para intentar realizar esa actividad restringida con una
tasa lo ms cercana posible al punto de deleite.
Economa conductual
-
Principios econmicos.- Los organismos tienen necesidades

esenciales, las cuales producen la demanda de los bienes que
satisfacen esas necesidades. Para satisfacer esas necesidades, los
animales pagan un precio o coste.
Las leyes de la oferta y la demanda indican que a medida que
aumenta el coste de un bien, la demanda de ese bien disminuye. En
el estudio del aprendizaje y la conducta animal, puede establecerse
una funcin de demanda de este tipo mediante un programa de RF.
La demanda de un reforzador vara no slo con su coste, sino
tambin en la medida en que ese bien constituye una necesidad
esencial. Con artculos no esenciales, la demanda es elstica: la
demanda disminuye mucho con los aumentos de precio. Cuando la
10
demanda se mantiene bastante estable en una gama amplia de

precios, la demanda es inelstica (artculos esenciales).
La demanda tambin es influida por la sustitucin. Los individuos
pueden sustituir un bien por otro cuando el coste aumenta.
La demanda puede expresarse como una eleccin entre dos bienes
distintos. La eleccin entre dos objetos puede expresarse mediante
una curva de indiferencia, que incluye una serie de puntos, que
representan una combinacin valiosa de productos. Los axiomas de
la demanda sostienen que aunque la persona sea indiferente
respecto a dos puntos a los largo de la curva, prefiere situarse en la
curva ms externa, porque ah es donde tiene el mayor valor total de
bienes.
La curva de indiferencia que de hecho mantiene un individuo es
determinada por el presupuesto de ste.
-
Planes de conducta ptima.- Los animales maximizan las funciones

coste-beneficio mediante la conducta adaptativa. Actuar por debajo
del punto ptimo es poner en peligro el xito en el afrontamiento de
las exigencias ambientales. Segn la teora de la optimizacin,
diversos planes de conducta reflejan una decisin inconsciente de
maximizar el beneficio respecto a los costes.
Para seleccionar la parcela adecuada deben probar en varias
parcelas para determinar cul es la mejor, y alimentarse
exclusivamente en la que resulte ms provechosa.
El momento en el que el sujeto debe abandonar la parcela depende
de: la tasa de ingestin de energa dentro de la parcela, el tiempo
necesario para trasladarse de una parcela a otra, y el tiempo
requerido para encontrar una presa. El tiempo ptimo para dejar la
parcela es cuando la energa total disponible por unidad de tiempo se
halla en su valor mximo.
Los animales son sensibles a las tasas de ingestin de comida en la
parcela, en relacin a futuras parcelas, pero esta comparacin se
produce con ciertos lmites temporales (horizontes temporales).
Un animal debe seleccionar lo que come teniendo en cuenta sus
costes y beneficios. La estrategia de un animal no debera consistir
en atrapar a la presa ms grande, sino la presa ms provechosa (la
que produce mayor cantidad de energa por unidad de tiempo).
Cuando la amenaza de un predador es baja, el sujeto invierte ms
tiempo en la bsqueda de comida que cuando la amenaza es
elevada.
11
TIPOS DE CONDICIONAMIENTO INSTRUMENTAL

En el cond instrumental, la contingencia comporta una conducta y un resultado;
en el cond clsico, la contingencia comporta dos estmulos.
Condicionamiento de recompensa
Una respuesta produce un resultado deseable. Cuando se da esta relacin
respuesta-consecuencia de forma consistente, la probabilidad de la respuesta
aumenta.
-
Magnitud del reforzador

La velocidad de carrera (proporcin de mejora del aprendizaje) est
directamente relacionada con la magnitud de la recompensa.
La magnitud de la recompensa administrada en una caja de Skinner
puede no afectar a algunas medidas de aprendizaje (tasa de
respuesta, latencia para iniciar la presin de la palanca o tiempo
invertido para recoger el alimento del comedero), pero s afecta a la
persistencia del animal. Los animales persisten ms tiempo con un
incentivo mayor (efecto motivacional de la recompensa), pero no
aprenden mejor la tarea.
El cambio en la tasa de conducta en funcin de la magnitud de la
recompensa puede ser un subproducto del cambio en la distribucin
de los valores de TER (tiempo entre respuestas).
En experimentos de economa cerrada (los sujetos obtienen toda la
comida del da en la cmara experimental), la tasa de respuesta est
inversamente relacionada con la magnitud de la recompensa. Este
resultado contradice la nocin convencional de que cuanto mayor es
el reforzador, ms fuerte es la respuesta.
Entrenamiento de omisin
El resultado que sigue a la respuesta es la ausencia de un EI apetitivo. El
efecto del entrenamiento de omisin es contrario al de recompensa: la
supresin de la respuesta.
El entrenamiento de omisin se asemeja a la extincin en que ambos
procedimientos dan lugar a la disminucin de la ejecucin. La extincin suprime
la conducta criterio con mayor eficacia que el entrenamiento de omisin, pero si
se refuerza una respuesta alternativa especfica (contracondicionamiento), el
adiestramiento de omisin suprime la respuesta criterio con mayor rapidez que
la extincin. Este efecto se produce an cuando la conducta alternativa difiere
mucho de la respuesta original.
12
Castigo
El castigo ocurre cuando la respuesta instrumental va seguida de un resultado
aversivo.
Cuando se administra un estmulo aversivo a continuacin de una respuesta,
las claves ambientales circundantes se vuelven aversivas. La supresin es
provocada directamente por el castigo contingente e, indirectamente, por el EC
provocador de miedo. Sin embargo, la contingencia entre la respuesta y la
consecuencia aversiva es el factor ms importante.
Un efecto del castigo es que las conductas alternativas, suelen aumentar en
frecuencia durante el mismo. Cuando se suprime mediante un castigo la
conducta con mayor prioridad en la jerarqua motivacional, aumenta la
siguiente conducta con mayor fuerza.
-
Magnitud del reforzador.- Cuanto mayor es la intensidad del castigo,

ms se suprime la respuesta.
Escape y evitacin
Implica la terminacin o no ocurrencia de un EI aversivo.
-
Escape.- El EI aparece y desaparece una vez que el animal realiza la

respuesta apropiada.
Evitacin.- Se coloca una rata en una caja de dos compartimentos y
se presenta un estmulo discriminativo que indica cundo procede
responder. Si el animal salta de un lado de la caja al otro, se omite la
descarga. Si el animal no consigue responder durante la
presentacin del estmulo discriminativo, se administra la descarga y
el animal ha de interrumpirla entonces (escape).
La evitacin se diferencia del entrenamiento de recompensa en:
- La evitacin implica terminar o impedir un EI aversivo en lugar de la
presentacin de una consecuencia apetitiva.
- En la evitacin, los animales tienen una cantidad de tiempo limitada
(durante la presentacin del estmulo discriminativo), para ejecutar la
respuesta.
La evitacin, al igual que el adiestramiento de recompensa, produce
el reforzamiento de la conducta en cuestin.
Evitacin de Sidman.- El sujeto pospone la descarga presionando
una palanca. No emplea estmulo discriminativo, el animal prev la
descarga siguiente slo por la separacin temporal entre las
descargas en vez de por una seal externa.
13
Evitacin pasiva.- El animal recibe el estmulo aversivo en un lugar

especfico del aparato, lo que hace que el animal escape de la
descarga corriendo hacia el lado seguro de la caja.
-
Magnitud del reforzador:

Los estudios muestran que cuanto ms fuerte es el EI, mayor es la
mejora en la ejecucin del escape. Una ejecucin ms rpida en los
ensayos de escape tiene menos que ver con un mejor aprendizaje,
que con una motivacin ms fuerte.
Varios estudios han mostrado que la conducta de evitacin de
presin de la palanca est directamente relacionada con la intensidad
de la descarga.
La intensidad de la descarga afecta tambin al aprendizaje de
evitacin pasiva, pero slo cuando se trata de las reacciones
naturales del animal.
La evitacin de la caja lanzadera est inversamente relacionada con
la intensidad de la descarga. Cuanto mayor es la intensidad del EI,
peor resulta la ejecucin de la evitacin.
REFORZADOR
Inmediatez de la recompensa
-
Entrenamiento de recompensa.- Los estudios muestran que el

aprendizaje es posible con demoras breves, pero no con demoras
ms largas.
Aunque la demora del reforzamiento retarda de forma acusada el
aprendizaje, recibir una clave externa durante el perodo de demora
suprime este dficit. Adems, las claves que ocupan un porcentaje
mayor del intervalo de demora facilitan la ejecucin ms que las
claves que ocurren al principio del intervalo. Las claves externas
mejoran la ejecucin por:
- La clave externa funciona como un reforzador en s misma
porque va seguida y se asocia con el reforzador.
- Hiptesis del marcado.- Un acontecimieto inesperado y saliente
(luz o tono) inmediatamente posterior a una respuesta de
eleccin, da lugar a un mejor repaso y recuerdo de la respuesta
de eleccin. Al reforzarse posteriormente, los sujetos muestran
mayor capacidad para asociar su eleccin correcta anterior con la
recompensa de la comida.
14
Condicionamiento aversivo.- La demora afecta al cond aversivo del

mismo modo que al aprendizaje de recompensa.
Las claves externas que intervienen en la respuesta y la recompensa
facilitan el cond aversivo.
El castigo es menos eficaz cuando se demora.
Ejecucin y aprendizaje
La recompensa motiva la ejecucin, pero no modifica el grado de aprendizaje
del animal sobre la relacin respuesta-consecuencia.
-
Contraste de incentivo.- cambio de la respuesta tras un cambio en los

parmetros de sta.
- Contraste negativo.- Tras reducir la recompensa, disminuye la
respuesta.
- Contraste positivo.- Tras aumentar la recompensa, aumenta la
respuesta.
Los contrastes positivo y negativo indican que la conducta no est
controlada slo por las condiciones presentes del momento. La
ejecucin resulta afectada tambin por condiciones de recompensa
anteriores.
LA RESPUESTA
Las caractersticas de la respuesta son importantes y algunas respuestas se
asocian con los reforzadores ms fcilmente que otras. No todas las
respuestas son condicionables en la misma medida, an utilizando el
reforzador adecuado.
-
Breland y Breland: conducta inadecuada (los cerdos recurrieron a

sus patrones instintivos de conducta alimentaria, en vez de realizar la
respuesta)
Entrenamiento de recompensa.- Los patrones de respuesta que son
relevantes para, y ejecutados antes de la comida, son susceptibles a
los efectos de la recompensa de la comida que los que no lo son.
Condicionamiento aversivo.- El castigo suprime la conducta, pero los
patrones de accin afectados difieren de aquellos afectados por la
recompensa de la comida.
Teora de los efectos de recompensas y castigos.- La evidencia
indica que no lograr condicionar una respuesta dada puede deberse
a factores de ejecucin o a un fallo en el aprendizaje asociativo. No
15
obstante, la facilidad de condicionamiento refleja que la conducta

resulta apropiada al estado de motivacin del sujeto (ej: comida si
est hambriento).
GENERALIZACIN Y DISCRIMINACIN
Generalizacin: responder del mismo modo a dos estmulos distintos debido a
sus similitudes.
Discriminacin: responder de forma distinta a dos estmulos basndonos en
sus diferencias aparentes.
Control por el estmulo: algunas dimensiones del estmulos son relevantes (y
producen la conducta) y otras no. Una prueba de generalizacin revela cundo
una dimensin da lugar a la conducta y otra no.
GENERALIZACIN
Gradientes de generalizacin
Relacin sistemtica entre la fuerza de la respuesta a los estmulos
generalizados y la similitud de estos estmulos con el EC o Ed original.
La generalizacin se produce con estmulos excitatorios e inhibitorios. Tipos:
-
Estmulos excitatorios: experimento con palomas de Guttman y

Kalish. El mximo nivel de respuesta se produce con el Ed
originalmente entrenado. Sin embargo, los estmulos generalizados
producen tambin la conducta de picoteo, y la magnitud de respuesta
resulta ser una funcin directa de la similitud entre los estmulos de
entrenamiento y prueba.
Estmulos inhibitorios: se han demostrado gradientes en el caso de
la inhibicin generalizada. La tcnica de sumacin consiste en
entrenar tanto un E+ como un E-, y presentar despus el E+ junto a
claves similares al E-. Cuanto ms se asemeje un estmulo al Eoriginal, ms se reduce la excitacin producida por el E+.
Interacciones excitatorio-inhibitorias: el desplazamiento del mximo
(Spence). En el entrenamiento inicial se realiza la discriminacin
entre una clave E- y otra E+; se evala despus la generalizacin en
la fase de prueba, observndose entonces el efecto del
desplazamiento del mximo. Se define como un alejamiento del
mximo del gradiente excitatorio respecto al E+ original, en direccin
opuesta a la del E-. El grado de desplazamiento es una funcin de la
diferencia entre las claves E+ y E-; cuanto ms prximos se hallen el
E- del E+, mayor es el desplazamiento del mximo.
16
Ejemplo:
Se refuerza por responder a un estmulo 0 (E+), pero no se refuerza
por responder al estmulo -2 (E-). Restando a cada valor del
gradiente excitatorio los valores del gradiente inhibitorio obtenemos el
gradiente combinado o neto (2), estando el mximo del gradiente
combinado o neto desplazado respecto al valor del E+, en el lado
contrario al del valor E-.
-------- -2 ----------------------- 0 ---------------------------- 2 --------------EE+
mximo del gradiente
combinado (desplazamiento)
Teoras de la generalizacin
- Generalizacin como proceso primario
- Pavlov.- Cuando se activa un rea cerebral mediante un estmulo, la
actividad elctrica se extiende a otras reas cercanas del cerebro,
excitando tambin los centros neurolgicos de otros estmulos.
- Hull.- El cerebro registra varios valores del estmulo cuando percibe
una clave y no un nico valor.
- Generalizacin como fallo de diferenciacin
Esta teora fue propuesta por Lashley y Wade y sostiene que la generalizacin
es una consecuencia de la incapacidad del sujeto para diferenciar los
estmulos. Afirmaciones:
-
Los sujetos se confunden durante la prueba de generalizacin:

cuanto ms se parece el estmulo al original, mayor es la confusin y
mayor generalizacin.
El sujeto aprende sobre la dimensin en la que se produce la
generalizacin.
Teoras:
-
Hiptesis inversa: la generalizacin consiste en un fallo de

discriminacin.
Factores atencionales: el entrenamiento de discriminacin previo
afecta a la generalizacin, disminuyndola.
Respalda la teora de Lashley-Wade porque indica que la tendencia a
generalizar se debe a la incapacidad del sujeto de discriminar, la cual
es una funcin de la falta de atencin del sujeto hacia la dimensin
relevante del estmulo.
17
- Modelos de procesamiento de la informacin de la generalizacin

-
Modelo de Blough.- Similar al modelo de Rescorla y Wagner del

cond. pavloviano.
Descripcin cuantitativa de cmo se desarrollan las reacciones
excitatorias e inhibitorias generalizadas.
La presentacin de un reforzador modifica la probabilidad de
respuesta en presencia del EC de entrenamiento y de otros EC
generalizados que tienen elementos en comn con el EC de
entrenamiento.
Supone que dos estmulos pueden tener elementos en comn
dependiendo de su semejanza. El factor de generalizacin aumenta
con la semejanza fsica entre los estmulos. Por tanto, conocer la
similitud nos permite predecir la variacin de la fuerza de un
elemento en cualquier ensayo dado.
Modelo de Pearce.- Supone que los animales poseen un almacn

breve de memoria (buffer) que contiene el patrn de estimulacin
experimentado en su momento por el sujeto.
El entorno del estmulo (EC y elementos del aparato) se representan
como un conjunto de elementos en la memoria. La generalizacin se
produce cuando los elementos condicionados previamente son
activados por el estmulo generalizado. La magnitud de la respuesta
generalizada viene determinada por la proporcin de elementos
comunes tanto a las claves original como generalizada.
Un estmulo generalizado activa elementos contenidos en la
memoria; cuanto mayor es la semejanza entre el EC y el E
generalizado, ms elementos comunes se activan y mayor es la
excitacin generalizada.
- Generalizacin como respuesta relacional

Segn este enfoque, la respuesta generalizada no se basa en las diferencias
fsicas absolutas entre estmulos, sino en sus diferencias relativas.
-
Efecto de tendencia central

Modelo del efecto del nivel de adaptacin de Thomas.- Explica el
efecto de tendencia central al afirmar que los sujetos que
experimentan estmulos generalizados inferiores al valor del E+,
adquieren una representacin subjetiva del valor medio de los
estmulos que se halla tambin por debajo del valor del E+; y al
18
contrario con los estmulos que se encuentran por encima del valor
del E+.
La generalizacin es un proceso relacional en el que los sujetos
juzgan el valor de los estmulos generalizados, no basndose en la
diferencia fsica absoluta con el E+, sino en funcin de la
representacin subjetiva media de todos los estmulos
experimentados.
-
Desplazamiento del mximo revisado

En la teora de Spence se vea que los sujetos debas mostrar un
desplazamiento del mximo de respuesta respecto al E+ en direccin
contraria a la clave E-.
El modelo del nivel de adaptacin predice que el mximo de
respuesta se alejara del E+, pero hacia el E-. Esto se debe a que los
sujetos experimentan estmulos generalizados que son ms intensos
que el E+ de entrenamiento inicial, de forma que su representacin
subjetiva del valor medio de todos los estmulos y su mximo de
respuesta, debera ser superior al E+ y no inferior.
Factores que afectan al gradiente de generalizacin

Gradiente de generalizacin pronunciado=poca generalizacin
Gradiente de generalizacin plano=mucha generalizacin
-
Grado de entrenamiento.- Cuanto ms extenso es el entrenamiento,

menor generalizacin.
Esto respalda la teora de Lahley-Wade: a medida que los sujetos se
familiarizan con la dimensin en la que difieren los estmulos, la
discriminacin es mayor y menor la generalizacin.
Intervalo entrenamiento-prueba.- Cuanto ms tiempo pasa entre el
entrenamiento y la prueba, mayor generalizacin.
Esto indica que los detalles de un estmulo se olvidan con el tiempo.
Contexto.- Aunque el transcurso del tiempo hace ms plano el
gradiente (ms generalizacin), un cambio en el contexto general
disminuye la generalizacin.
Entrenamiento de discriminacin previo.- Cuando un sujeto recibe un
entrenamiento de discriminacin previo, el gradiente es ms
pronunciado (menos generalizacin).
Respalda la teora de Lashley-Wade: para discriminar entre dos
estmulos, un sujeto debe aprender las dimensiones relevantes del
estmulo; al hacerlo el sujeto confunde menos el estmulo y muestra
menos generalizacin.
19
DISCRIMINACIN
Una vez que los E+ y E- han adquirido un control sobre la conducta del sujeto,
se llaman Estmulos discriminativos.
El E+ no seala que se vaya a suministrar el reforzamiento automticamente.
Ms bien, el E+ indica que la ejecucin de la respuesta instrumental va a ser
reforzada.
Tipos de discriminacin
El entrenamiento de discriminacin supone la presentacin de reforzamiento
tras la respuesta a un E+, pero la omisin de reforzamiento tras la respuesta a
un E-.
-
Simultnea.- El E+ y E- se presentan al mismo tiempo. Si el sujeto

percibe diferencia entre los mismos deber responder al E+.
Sucesiva.- El E+ y E- se presentan sucesivamente. La medida de la
discriminacin depende de que se responda de forma distinta (ej: en
la discriminacin respuesta/no respuesta, el sujeto debe ejecutar una
conducta ante la presencia de la clave y no ejecutarla en su
ausencia). Es ms difcil que el simultneo.
Condicional.- Un sujeto realiza la R1 en presencia del E1, pero una
R2 en presencia del E2. Es decir, la respuesta correcta est
condicionada al estmulo que se presente.
Es esencialmente lo mismo que la inhibicin condicionada y la
modulacin en el cond. pavloviano.
Teoras de la discriminacin
-
Hull y Spence.- Supuestos:

- El reforzamiento da lugar a excitacin condicionada al E+
- La ausencia de reforzamiento produce inhibicin condicionada al E- La excitacin y la inhibicin se generalizan a otros estmulos; estas
tendencias contradictorias se suman algebraicamente para cualquier
estmulo dado.
Teora atencional de la discriminacin.- El aprendizaje consta de dos

procesos diferenciados:
- La propia atencin resulta afectada cuando se refuerza al sujeto.
Los rasgos salientes de los estmulos llaman la atencin del sujeto y
20
se condicionan con mayor facilidad. Si el animal presta atencin a un

rasgo concreto del estmulo y es reforzada su respuesta, la atencin
aumenta su fuerza hacia ese rasgo, disminuyendo la atencin hacia
rasgos menos salientes.
- Adquisicin de una respuesta al asociarse la respuesta con el
analizador (rasgo que llama la atencin al sujeto).
Medida de la respuesta de atencin en el mtodo de igualacin a

la muestra.
Cuando se presenta a la paloma un estmulo simple (tecla roja) es
capaz de diferenciarlo de otro en una presentacin posterior
(diferencia la tecla roja de la naranja).
Cuando se presenta un estmulo compuesto (tecla roja-rayas
horizontales), la atencin se divide al fijarse en una de las
dimensiones, por lo que la ejecucin de la igualacin empeora.
Factores que afectan a la discriminacin

-
Dificultad del problema.- La discriminacin es ms rpida cuando los

estmulos E+ y E- se distinguen con facilidad.
Discriminacin previa.- La experiencia previa con un problema de
discriminacin influye en cmo un sujeto aprende un segundo
problema. El efecto de fcil a difcil se refiere a que la experiencia
con un problema de discriminacin fcil, favorece las habilidades
generales de resolucin de problemas que ayudan al organismo a
solucionar un problema difcil posteriormente.
Informacin del estmulo.- El valor informativo de un Ed (prediccin
de correlacin con recompensa) afecta al aprendizaje de
discriminacin.
Efecto de la consecuencia diferencial.- Se consigue responder de
forma distinta a un E1 y un E2 efectuando una R1 y una R2 con
mayor facilidad, cuando la R1 produce una C1 y la R2 da lugar a una
C2; es decir, cuando las consecuencias son diferentes en relacin a
la respuesta dada.
Fenmenos de discriminacin
-
Efecto del sobreaprendizaje en la inversin

Disposiciones de aprendizaje.- La discriminacin de nuevos objetos
mejora si se administra de antemano un entrenamiento de
21
discriminacin con otros estmulos. La exposicin a muchos

problemas de discriminacin distintos produce un aumento de la
capacidad para aprender nuevos problemas.
Transferencia despus de la discriminacin.- Es ms fcil aprender
una segunda discriminacin cuando el problema inicial implica la
misma dimensin des estmulo que cuando comporta una nueva
dimensin. Es decir, se produce facilitacin cuando hay cambio
intradimensional, pero no con el cambio extradimensional. Explicado
por la teora de la atencin.
Aprendizaje del rasgo
El entrenamiento de Discriminacin sin error

Terrace desarroll un nuevo procedimiento discriminativo en el que los sujetos
dan muy pocas o ninguna respuestas durante el E- (esas respuestas seran
"errores").
Ej.: E+ = Luz roja, E- = Luz verde.
En el procedimiento de discriminacin sin error de Terrace, el E+ se presenta
con la misma intensidad y duracin en cada ensayo de E+ a lo largo del
entrenamiento. Sin embargo, esto no ocurre con el E-; el E- se presenta tan
brevemente y a tan baja intensidad que los sujetos no responden a l. La
duracin y la intensidad del E- se incrementan gradualmente en los sucesivos
ensayos con el E- conforme avanza el entrenamiento discriminativo. Si esos
aumentos graduales son lo suficientemente pequeos, los sujetos pueden no
responder al E-. As pues, el procedimiento permite que la discriminacin se
aprenda sin errores.
Terrace hall que, despus del entrenamiento de discriminacin sin error, el Eno inhibe activamente las respuestas ni produce intentos de agresin, escape o
evitacin, y no se produce el efecto de desplazamiento del mximo.
REFORZAMIENTO CONDICIONADO
Un reforzador secundario es un estmulo inocuo que adquiere las propiedades
de un reforzador primario al emparejarse de forma consistente con el
reforzamiento primario. Es un EC pavloviano (que ha sido emparejado con un
EI apetitivo o con la terminacin de un EI aversivo), que sirve como reforzador
en un contexto de aprendizaje instrumental. Posteriormente, la clave
secundaria por si misma refuerza la conducta.
22
Un reforzador secundario:
- Mantiene conductas que han sido ya aprendidas:
- Mantenimiento de la respuesta
Los sujetos que reciben el reforzador secundario tras la respuesta
criterio muestran un nivel de respuesta ms sostenido durante la
extincin.
Una demora en la recompensa provoca una disminucin de la tasa de
respuesta. Sin embargo, si se administra una clave breve durante la
demora, no se observa reduccin porque el reforzador secundario acta
como una recompensa.
- Encadenamiento
- Aumenta la frecuencia de conductas nuevas:
- Adquisicin
- Afecta a la tasa de aprendizaje, aumentndolo.
Teoras del reforzamiento secundario

-
Adquisicin de la fuerza.- Un reforzador secundario adquiere fuerza

mediante su asociacin con la recompensa, es decir, mediante
condicionamiento pavloviano.
La fuerza del reforzamiento secundario es una funcin directa de la
magnitud e inmediatez del EI.
El reforzamiento secundario es fuerte cuando el EC se empareja con
el EI, pero no existe prcticamente cuando se presenta de forma
aleatoria respecto a la comida.
Funcin de la clave.- El estmulo secundario acta como un Ed. En
una prueba de reforzamiento secundario, la conducta se mantiene en
un nivel relativamente alto porque cada presentacin de la clave
desencadena una respuesta adicional.
La contingencia respuesta-clave es ms crtica para los efectos
observados en estudios de reforzamiento condicionado que la
relacin clave-respuesta.
23
CONDUCTA DE ELECCIN
LEY DE LA IGUALACIN
La ley de igualacin es un enunciado matemtico que describe la relacin entre
la tasa de respuesta y la tasa de recompensa: los animales equiparan su tasa
de respuesta con la tasa a la que se refuerza su accin.
Parmetros
-
Frecuencia de reforzamiento.- Cuando se presenta a un animal la

eleccin entre dos programas que difieren en cuanto a la frecuencia
del reforzamiento, no slo responde al mejor de los dos, sino que
distribuye sus respuestas de tal modo que el nmero relativo de
respuestas se equipara al nmero relativo de reforzadores para ese
programa.
Magnitud del reforzador.- La tasa relativa de respuesta se iguala con
la magnitud relativa del reforzador. Los animales, no responden slo
en el programa que produce la mayor recompensa, sino que
distribuyen sus respuesta en ambas opciones de modo que algunas
de estas respuestas se efectan en la opcin menos deseable.
Inmediatez.- Cuando se presentan dos programas de IV y cada uno
produce la misma magnitud de recompensa demorada, los sujetos
responden ms al programa que ofrece la recompensa ms
inmediata; pero tambin responden la opcin menos favorable parte
del tiempo.
La ley de igualacin concierne al valor cuantitativo del reforzador (parmetros).

Sin embargo, la igualacin se produce tambin cuando los reforzadores difieren
cualitativamente (comida/descargas en centros del placer).
Condicionamiento aversivo
La frmula de igualacin tambin atae a situaciones con consecuencias
aversivas.
Los efectos supresores del castigo reducen los efectos excitatorios de la
recompensa. El valor de reforzamiento neto de un programa es igual al valor de
la recompensa menos el valor del castigo.
Herrnstein ha ampliado la ley para incluir no slo la proporcin de las
respuestas efectuadas en un programa en relacin a otro, sino tambin la tasa
de respuesta en un solo programa respecto a no responder en absoluto.
24
Autocontrol
Un sujeto ajusta la tasa de respuesta a la tasa del efecto combinado de la
magnitud y la inmediatez.
Factores que hacen que los sujetos ejerzan mayor autocontrol de lo que indica
la ley (Los sujetos prefieren aquellas alternativas que impliquen una menor
demora mayor inmediatez- en la liberacin del Er+):
-
Los estmulos administrados durante el intervalo de demora justo

antes de la administracin de la recompensa, disminuyen los efectos
perjudiciales de la demora.
Los humanos adultos muestran mayor autocontrol porque desarrollan
reglas relativas a los requisitos para obtener recompensas.
El que un animal muestre impulsividad o autocontrol depende, en
parte, de las actividades que realice durante el intervalo de demora.
El autocontrol puede mantenerse omitiendo la demora al principio
pero aumentndola despus de forma gradual durante el
entrenamiento.
La experiencia del sujeto afecta al grado de autocontrol.
La impulsividad se evita cuando los sujetos se comprometen con la
recompensa grande demorada antes del punto de eleccin.
Problemas de la ley
-
La ley predice que se realizar la misma eleccin siempre que se

mantengan los valores relativos de los parmetros; el valor absoluto
no debera importar.
Sin embargo, la proporcin de respuestas dedicadas a la mejor
opcin disminuye a medida que aumentan los valores absolutos de la
recompensa, a pesar de que la proporcin permanece constante.
Los sujetos no igualan la tasa relativa de respuesta con la tasa de
reforzamiento cuando se les ofrece la posibilidad de elegir entre dos
programas de RV; en lugar de ello, responden al mejor.
No siempre predice la conducta de eleccin de forma precisa. Los
sujetos suelen cometer tres errores:
- Sesgos.- se muestran cuando el sujeto tiene una especial
preferencia por una de las elecciones. Si existen sesgos, las
respuestas no estarn controladas por los parmetros de la
recompensa.
- Sobreigualacin.- tasa de respuesta superior para el mejor de los
programas respecto a lo que predice la ley.
25
Se produce cuando resulta costoso (el tiempo fuera impuesto por

cambiar de programa es relativamente largo) cambiar al lado de
menor preferencia.
- Infraigualacin o igualacin por defecto.- el sujeto responde menos
en el programa ms ventajoso.
Baum desarroll la ley general de la igualacin, que incluye trminos
matemticos adicionales que corrigen los sesgos, la sobreigualacin e
infraigualacin.
Teoras de la igualacin
-
Maximizacin.- La igualacin se produce porque los sujetos intentan

maximizar la tasa de reforzamiento.
Los sujetos igualan en programas IV porque maximiza la
recompensa, pero no en programas RV porque cambiar entre
programas no produce ningn efecto sobre la tasa de recompensa.
Mejora.- Los sujetos pasan de una eleccin a otras porque la
probabilidad de reforzamiento vara con el tiempo en los programas
de intervalo. Los sujetos estn intentando mejorar continuamente sus
posibilidades de recibir recompensa pasando a la otra eleccin.
REFORZAMIENTO PARCIAL
Se define como un aumento de la resistencia a la extincin que se produce
cuando los animales reciben reforzamiento intermitente.
Factores que afectan a la persistencia
-
Magnitud de la recompensa
Reforzamiento continuo: recompensa grande=menos resistencia a la
extincin.
Reforzamiento intermitente: recompensa grande=ms resistencia
26
Nmero de ensayos de entrenamiento

Reforzamiento continuo: ms ensayos=menos resistencia
Reforzamiento intermitente: ms ensayos=ms resistencia
Patrones de recompensa durante la adquisicin
Una secuencia alterna de recompensa y no recompensa durante la
adquisicin, produce menos resistencia a la extincin que un patrn
aleatorio de ensayos de recompensa y no recompensa, an
utilizando el mismo nmero de recompensas.
Cuando primero va el refuerzo continuo y luego el refuerzo
intermitente la resistencia a la extincin es mayor que si se aplican
los ensayos de refuerzo intermitente primero y luego el refuerzo
continuo.
Teoras del efecto de reforzamiento parcial

-
Frustracin de Amsel
En reforzamiento continuo: Los sujetos desarrollan la expectativa de
recompensa durante la adquisicin. Durante la extincin, cuando no
se administra recompensa experimentan frustracin que vigoriza la
conducta y perturba la respuesta instrumental en curso.
Cuando la recompensa es grande experimentan ms frustracin ya
que es mayor la discrepancia entre la expectativa del sujeto y la no
recompensa (+ frustracin: + perturbacin: + extincin); lo mismo
sucede con mayor nmero de ensayos de entrenamiento (+ ensayos:
+ expectativa: + frustracin: + extincin).
En reforzamiento parcial: El estmulo resultante de la reaccin de
frustracin (efecto emocional) se condiciona clsicamente, actuando
como un Ed de la respuesta instrumental. Durante la extincin, los
estmulos de frustracin condicionados durante la adquisicin siguen
evocando la conducta, por lo que la resistencia es fuerte.
Hiptesis secuencial.- Los animales tienen recuerdos (no
necesariamente de naturaleza emocional) de las consecuencias de
responder en ensayos previos.
Los post-efectos de la recompensa y no recompensa, se convierten
en estmulos discriminativos que provocan la conducta en el siguiente
ensayo. (ver libro 328)
27
DEFENSA DE LOS PREDADORES Y APRENDIZAJE DE EVITACIN

Bolles.- Las conductas de evitacin son reacciones defensivas innatas y
especficas de una especie; son reacciones de defensa especficas de la
especie (RDEE).
Cada especie posee una jerarqua de RDEE. Cuando se enfrenta a una
amenaza, el animal efecta primero su RDEE preferida.
La evitacin mediante la presin de una palanca no es la reaccin natural de la
rata ante claves aversivas como una descarga elctrica, de modo que la
respuesta no se aprende o slo se aprende tras una experiencia de
entrenamiento muy prolongado. (Crawford y Masterson dan argumento en
contra).
Conducta de evitacin
-
Evitacin activa.- en presencia de un depredador, cuando las

contingencias impiden la huida, las ratas se inmovilizan. Cuando las
condiciones permiten la huida, las ratas eligen esta forma de reaccin
defensiva condicionada.
Crawford y Masterson.- Los datos indican que el acceso a un rea
segura, se permita o no al sujeto correr hacia ella por s mismo,
refuerza intensamente la presin de la palanca. La presin de la
palanca se adquiere fcilmente como una reaccin de evitacin,
siempre que sea congruente con la estrategia de defensa natural de
la rata (huida), y que se refuerce adecuadamente ofreciendo al sujeto
acceso a un rea segura.
Evitacin pasiva.- Resultados similares a los anteriores. Las tareas

de evitacin compatibles con la RDEE de un sujeto se aprenden con
mayor facilidad que aquellas que no lo son.
Reacciones defensivas
-
Enterramiento.- La reaccin inicial ante la descarga era huir, pero si

el estmulo amenazador se encontraba todava all, se ponan en
prctica otras conductas defensivas, incluyendo el enterramiento.
Agresin.- El ataque constituye una estrategia defensiva pero slo en

ciertas circunstancias. En ratas macho, los ataques son idnticos ya
sea el objeto otra rata o un gato depredador. Las ratas hembra usan
la agresin como una forma de ataque preventivo dirigido a proteger
a los cachorros y agreden al gato depredador, pero no a otra rata.
28
La huida es la estrategia defensiva preferida, seguida de la

inmovilizacin. Si no se consigue frenar la amenaza, pasan al ataque.
ENFOQUE DE LOS SISTEMAS DE CONDUCTA
Un principio del condicionamiento instrumental es que el reforzamiento produce
el aprendizaje y da lugar a la ejecucin. Esta concepcin constituye una teora
causal, ya que el reforzamiento se considera la causa o explicacin de la
conducta.
Segn el enfoque de los sistemas de conducta, las respuestas y los estmulos
parecen ser arbitrarios para el experimentador, pero no para el sujeto. Las
conductas del sujeto, y sus reacciones perceptivas ante los estmulos, se
encuentran preorganizadas en unidades funcionales.
Componentes de los sistemas de conducta
-
Sistema.- identifica una serie de unidades perceptivas y conductuales

motoras que contribuyen a una funcin particular de forma integrada.
Subsistema.- Estrategias globales coherentes que contribuyen al
funcionamiento general de un sistema de conducta.
Modo.- Sustrato motivacional relacionado con la organizacin
secuencial y temporal de patrones de accin con respecto a los
estmulos finales del sistema.
Mdulo.- Predisposicin a responder a estmulos especficos con
componentes de respuesta particulares.
Las modificaciones de los sistemas conductuales producidas como
consecuencia de los procedimientos de aprendizaje pavloviano o
instrumental se producen entre y dentro de los mdulos.
Patrn de accin.- Unidad ms bsica de salida. Movimientos
especficos y reacciones motoras ejecutados de forma estereotipada.
Conductas componentes de los mdulos o secuencias conductuales.
Conductas inadecuadas
Las conductas inadecuadas plantean un problema a la teora del reforzamiento
porque los animales efectan las reacciones de alimentacin especficas de la
especie en lugar de las conductas criterio para las que se proporciona el
reforzamiento. El enfoque de los sistemas de conducta proporciona una
explicacin coherente de la conducta inadecuada: sta se produce porque el
sistema de alimentacin natural del sujeto es activado por los estmulos.
No se precisa la recompensa para que se produzca la conducta inadecuada.
Sin embargo, las contingencias con el reforzamiento afectan a la conducta
inadecuada, as, una contingencia que demora la entrega de comida no
suprime la conducta inadecuada, pero si la entrega de comida se produce
29
durante la conducta inadecuada, los animales tienden a interrumpirla y recoger

la comida.
Recorrido de laberintos
La accin de correr hasta el final del laberinto no est regida por la
consecuencia instrumental porque los animales se desplazan por corredores
an cuando no se proporciona ninguna recompensa. La conducta de correr se
asemeja a patrones de accin caractersticos de animales que viven en
madrigueras.
Moldeamiento
Las conductas efectuadas por una rata durante el procedimiento de
moldeamiento reflejan reacciones apetitivas elicitadas, especficas de la
especie, que forman parte del sistema de alimentacin general.
El moldeamiento es similar al automoldeamiento, en el sentido de que la
entrega de comida activa automticamente partes del sistema de alimentacin.
Conductas defensivas
Teora RDEE del aprendizaje de evitacin.- Los organismos estn dotados
genticamente de conductas apropiadas para hacer frente a depredadores y
otras amenazas aversivas.
Enfoque de los sistemas de conducta.- Las conductas efectuadas en
situaciones amenazantes implican secuencias conductuales que son
provocadas por el estmulos ambiental relevante.
Fenmeno del dficit de la descarga inmediata.- La estrategia defensiva de la
rata posee tres modos:
- Pre-encuentro.- El animal es colocado en una situacin
potencialmente amenazante.
Alteracin del patrn alimentario.
- Post-encuentro.- El animal se encuentra con la amenaza y tiene que
afrontarla.
Inmovilizacin.
- Prximo a la lucha.- Cuando existe un contacto sensorial directo con
el predador o amenaza.
Desplazarse lejos del depredador y salto/ataque o agresin.
La secuencia de conducta natural de la rata, depende de los estmulos
ambientales encontrados por el animal.
30

Apuntes Aprendizaje y Condicionamiento

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apuntes Aprendizaje y Condicionamiento

Uploaded by

Copyright:

Available Formats

EXTINCIN

La extincin implica omitir la consecuencia que sigue a la respuesta.

Los sujetos que reciben el reforzador secundario tras la respuesta

Ejemplos de indefensin aprendida:

Transferencia aversiva-aversiva.- Seligman y Maier realizaron un

Transferencia apetitiva-apetitiva.- En el condicionamiento apetitivo

Transferencia motivacional cruzada.- Algunos autores han sugerido

aprender una tarea aversiva. En varios estudios se ha mostrado una

Principios de indefensin aprendida:

Inmunizacin.- Los reforzadores incontrolables no impiden el

Teoras de la indefensin aprendida:

Hiptesis de la indefensin aprendida.- Cuando las consecuencias

Hiptesis de la ansiedad.- Esta hiptesis explica varios hechos:

Teora del procesamiento cognitivo.- Los sujetos que reciben

Caractersticas crticas de los estmulos de impronta:

Se produce impronta con objetos inanimados, no obstante, los

Impronta basada en el aprendizaje perceptivo.- La mera exposicin

preferencia por objetos en movimiento de forma innata o por

El patrn de actividad global de un sujeto puede analizarse en

Relacin de reforzamiento.- Una actividad preferible refuerza la

Este principio se ve cuestionado por la hiptesis de la privacin de respuesta

TEORAS MECANICISTAS (E-R) DEL APRENDIZAJE

Postulado IV: reduccin del impulso

Postulado VII: potencial de reaccin

Postulados VIII-IX: inhibicin reactiva y condicionada

TEORAS COGNITIVAS (R-E) DEL APRENDIZAJE

Conductismo cognitivo de Tolman

Expectativas y reforzamiento.- Los animales obtienen un

- El concepto de propsito es problemtico porque implica que el

Las asociaciones en el aprendizaje instrumental.- Los animales

TEORAS DE LA REGULACIN CONDUCTUAL

Selecciona la conducta.- Las conductas que no anteceden a una

Hiptesis de la privacin de respuesta de Allison

Principios econmicos.- Los organismos tienen necesidades

demanda se mantiene bastante estable en una gama amplia de

Planes de conducta ptima.- Los animales maximizan las funciones

TIPOS DE CONDICIONAMIENTO INSTRUMENTAL

Magnitud del reforzador

Magnitud del reforzador.- Cuanto mayor es la intensidad del castigo,

Escape.- El EI aparece y desaparece una vez que el animal realiza la

Evitacin pasiva.- El animal recibe el estmulo aversivo en un lugar

Magnitud del reforzador:

Entrenamiento de recompensa.- Los estudios muestran que el

Condicionamiento aversivo.- La demora afecta al cond aversivo del

Contraste de incentivo.- cambio de la respuesta tras un cambio en los

Breland y Breland: conducta inadecuada (los cerdos recurrieron a

obstante, la facilidad de condicionamiento refleja que la conducta

Estmulos excitatorios: experimento con palomas de Guttman y

Los sujetos se confunden durante la prueba de generalizacin:

Hiptesis inversa: la generalizacin consiste en un fallo de

- Modelos de procesamiento de la informacin de la generalizacin

Modelo de Blough.- Similar al modelo de Rescorla y Wagner del

Modelo de Pearce.- Supone que los animales poseen un almacn

- Generalizacin como respuesta relacional

Efecto de tendencia central

Desplazamiento del mximo revisado

Factores que afectan al gradiente de generalizacin

Grado de entrenamiento.- Cuanto ms extenso es el entrenamiento,

Simultnea.- El E+ y E- se presentan al mismo tiempo. Si el sujeto

Hull y Spence.- Supuestos:

Teora atencional de la discriminacin.- El aprendizaje consta de dos

se condicionan con mayor facilidad. Si el animal presta atencin a un

Medida de la respuesta de atencin en el mtodo de igualacin a

Factores que afectan a la discriminacin