2201und1art2ato1995 PDF

MÓDULO 2201- LA INVESTIGACIÓN CIENTÍFICA EN LA PSICOLOGÍA 1
CONCEPTOS BÁSICOS ...................................................... 2

Introducción ................................................................2
La inferencia causal como objeto .................................2
UNIDAD I. Dos teorías de la causación........................................................................ 2
Dos tradiciones de la investigación experimental ...................................... 3
Condiciones para el establecimiento de hipótesis causales........................ 4
EL MÉTODO CIENTÍFICO La validez de la inferencia causal............................................................... 4
El papel de la aleatorización ........................................5
Las variables en el esquema de Kish .......................................................... 5
La variable de asignación........................................................................... 6
Ventajas y desventajas de la aleatorización ............................................... 7
El problema del confundido..........................................8
¿Qué es el confundido?............................................................................... 8
El efecto del confundido............................................................................ 10
Sensibilidad y validez de la investigación ..................11
Lectura 2 La tipología de la validez de Campbell y colaboradores 1) La tipología de
1963 .......................................................................................................... 12
Ato, G. M. (1995) Conceptos Básicos. En: M. T., La tipología de 1963 .........................................................................................12
La tipología de 1979 .........................................................................................13
Anguera, J., Arnau, G. M., Ato, A. R., Tipologías de la validez alternativas.................................................................13
Martínez, Ll. J., Pascual, y S. G Vallejo. Hacia un esquema práctico de la validez ................................................. 15
Validez Interna .................................................................................................16
Métodos de Investigación en Validez De Constructo......................................................................................16
Psicología. España: Síntesis Psicología. Validez Externa ................................................................................................17
Cap. 2. pp 45-72
Para profundizar en este tipo de contenidos consulte la obra:

Anguera, M., Arnau, J., Ato, G., Martínez, A., Pascual, Ll. y Vallejo. S.(1995)
Métodos de Investigación en Psicología. España: Síntesis Psicología.
UNIDAD I EL MÉTODO CIENTÍFICO
permiten caracterizar apropiadamente la naturaleza de la metodología

cuasi-experimental. Son:
a) La inferencia causal como objeto.
CONCEPTOS BÁSICOS
b) El papel de la aleatorización.
c) El problema del confundido.
Introducción Consideramos a continuación detenidamente estos tres aspectos.
La metodología cuasi-experimental incorpora un conjunto de técnicas La inferencia causal como objeto
de diseño y análisis estadístico para afrontar situaciones donde no es
posible o no es ético aplicar la metodología experimental, o donde los Dos teorías de la causación
estrictos requisitos del método experimental no se satisfacen. Interesa
por tanto a un amplio rango de disciplinas de carácter aplicado, cuyo Desde la perspectiva de la denominada teoría de la manipulabilidad,
contexto de investigación cae lejos del laboratorio y del ambiente también conocida como teoría de la actividad (Mackie, 1974; Cook,
controlado donde la experimentación suele aplicarse. Disciplinas tales Campbell y Peracchio, 1990; Cook y Shadish, 1994), la causación
como la psicología, la educación, las ciencias políticas y económicas, la implica manipular deliberadamente algún agente que se encuentra bajo
epidemiología y algunas disciplinas jurídicas, entre otras, son control y observar inmediatamente después si se produce un cambio en
potenciales consumidoras de métodos cuasi-experimentales. Sin el fenómeno como consecuencia de tal manipulación. El vehículo
embargo, el caldo de cultivo donde se ha prosperado hacia la situación metodológico más apropiado es el experimento, cuyo objeto es describir
de que goza hoy la metodología cuasi-experimental ha sido la (y probar, en última instancia) si el cambio es función de la manipulación,
evaluación de programas de intervención social. pero no explicar cómo o porqué ocurrió.
Fueron Campbell y Stanley quienes introdujeron el término cuasi- En contraposición a esta concepción simplista, muchos filósofos de la
experimento en un prestigioso trabajo de 1963 y, más tarde, ampliaron ciencia aspiran hoy, por el contrario, a identificar relaciones causa-efecto
en un difundido texto publicado 1979 por Cook y Campbell. El objeto que que son invariablemente ciertas porque todas las contingencias de las
inicialmente persiguieron fue proponer diseños de investigación (junto que depende una relación se conocen perfectamente; una perspectiva
con sus técnicas de análisis estadístico asociadas), potencialmente denominada teoría esencialista (Mackie, 1974; Cook, Campbell y
utilizables en contextos aplicados, donde la experimentación clásica no Peracchio, 1990; Cook y Shadish, 1994). La prioridad de esta teoría se
era aplicable, y que permitieran establecer inferencias causales válidas. centra más en la explicación causal que en la descripción o la prueba del
Conviene no obstante precisar que los términos cuasiexperimento y agente causal, en determinar por qué se produjo una conexión causal (y
cuasiexperimentación no son universalmente aceptados. Esta por ende, su perfecta predicción) más que en inferir que causa y efecto
terminología es común dentro del vasto cuerpo de disciplinas que se relacionan.
constituyen las ciencias sociales y se asocia con la escuela de Campbell La simplicidad de la teoría de la actividad, que supone un mundo real
y colaboradores. En ciencias de la salud, particularmente en caracterizado por la existencia de efectos principales que los
epidemiología, suele emplearse en su lugar estudio comparativo experimentos tratan de identificar, contrasta con el inalcanzable
(Anderson et al., 1980) como una derivación de lo experimental, conocimiento determinista de la teoría esencialista. Por esta razón,
mientras que en otros contextos se emplean denominaciones más actualmente se conciben las relaciones causales en un contexto definido
generales tales como estudio observacional (por ejemplo, Cochran, por complejos constructos teóricos de tratamiento, de respuesta, de
1983) o investigación controlada (Kish, 1975, 1987). Nos adherimos población, de contexto y de período histórico. Los investigadores suelen
aquí, en lo que a terminología se refiere, a la escuela de Campbell y medir indicadores específicos de tales constructos teóricos y utilizan
colaboradores. después un experimento para probar si un resultado particular depende
Hay tres aspectos esenciales que, desde nuestro punto de vista, de la interacción estadística del tratamiento con los indicadores

utilizados. Los denominados estudios metaanalíticos se encargan aplicada entre otros por E. L. Thorndike, H. Ebbinghaus e I. P. Pavlov
después de sintetizar los resultados principales, identificando la mayoría durante el primer cuarto del siglo en psicología experimental y, tras
de las contingencias causales predicadas por la teoría esencialista y complejas transformaciones, se practica hoy entre los seguidores de la
permitiendo la generalización de las relaciones causa-efecto. Un corriente skinneriana del “Análisis Experimental de la Conducta"
tratamiento profundo de los estudios metaanalíticos se aborda en una (Johnston y Pennypacker, 1980). El objetivo esencial de esta concepción
compilación de Cook y otros (1992) y en una obra enciclópedica es estudiar la conducta individual de uno (o de unos pocos) organismos,
recientemente editada por Cooper y Hedges (1994). usualmente bajo un rígido control experimental basado en las técnicas
de eliminación y constancia de variables extrañas, con el objetivo de
Dos tradiciones de la investigación experimental encontrar relaciones funcionales estables entre la conducta y las
variables que la determinan.
Por otra parte, no existe una concepción monolítica de la El enfoque metodológico científico-natural tuvo su punto álgido a
investigación experimen tal. Dos diferentes tradiciones de investigación finales del siglo XIX y principios del XX; reducido inicialmente a los
experimental conviven actualmente en la práctica científica moderna, a confines del laboratorio y a la investigación básica, pasó después a
saber: fundirse con la investigación desarrollada en contextos aplicados durante
a) Por un lado, existe un tipo clásico de experimentación, más la década de los 60 y con la ulteriormente refinado, durante las décadas
característico de las ciencias físicas y naturales y basado en la siguientes, originando un peculiar tipo de metodología experimental
variabilidad intraindividual, donde algún tipo de intervención discreta llamada metodología de caso único. Los aspectos cruciales de este
se aplica en el contexto del laboratorio sobre muestras idealmente modo de proceder se abordan en otro lugar en este mismo texto (véase
"puras" de materiales, con la finalidad de establecer predicciones Capítulo 6).
numéricas precisas. El marco del laboratorio permite a los La segunda tradición experimental, de antecedentes menos remotos
investigadores un control óptimo de las condiciones físicas y el y vinculada con la investigación en ciencias sociales y el estudio de las
aislamiento de materiales y variables dentro de cámaras protectoras, diferencias individuales, se convirtió hacia mediados de siglo en la forma
tubos de ensayo esterilizados, etc. Este tipo de tradición experimental, más común de investigación comportamental al mismo tiempo que el
que Cook y Campbell (1986, p. 141) denominan tradición del control y enfoque científico-natural caía en descrédito. En psicología y disciplinas
aislamiento experimental, es el que se impuso en ciencias naturales afines el control experimental óptimo de las infinitas variables extrañas
durante los siglos XVII y XVIII. practicado por el enfoque experimental tomado de las ciencias físicas
b)Por otro lado, existe otro tipo más reciente de experimentación, resultaba en ocasiones imposible de obtener y, cuando se lograba, la
más característico de las ciencias sociales y basado en la variabilidad conducta resultante aparecía trivial e irrelevante, en particular cuando el
interindividual, consistente en sustituir el control y aislamiento estudio de la conducta se realizaba en marcos naturales, lejos del
experimental por el control estadístico obtenido fundamentalmente laboratorio. Como consecuencia del desarrollo del razonamiento
mediante procedimientos de asignación aleatoria de múltiples estadístico moderno, de la mano de sir R. Fisher, J. Neyman, E. S.
muestras a las condiciones experimentales. Este enfoque fue, en gran Pearson y A. Wald, la tradición del control estadístico desarrolló el
medida, elaborado en el contexto de la investigación agrícola por experimento aleatorio, basado en la comparación de grupos compuestos
Fisher y colaboradores (Fisher, 1935) e importado después a la de unidades de respuesta asignadas al azar y tratados diferentemente.
psicología y disciplinas afines, aunque existen interesantes Esta idea se convirtió en el enfoque normativo de la investigación ex-
antecedentes de esta tradición (por ejemplo, McCall, 1923). Cook y perimental para las ciencias sociales. (Véase Capítulos 3 y 5.)
Campbell (1986, p. 142) lo denominan tradición del control estadístico. La metodología cuasi-experimental se desarrolló precisamente en el
Curiosamente, ambas concepciones de la experimentación se seno de esta tradición. Partiendo del experimento aleatorio como el
practican actualmente en las ciencias del comportamiento (Ato, 1991). marco ideal para el establecimiento de relaciones causa-efecto,
La primera concepción fue adoptada por G. T. Fechner y W. Wundt, propusieron alternativas al experimento aleatorio conservando todas las

propiedades de aquél, excepto la que justifica tal metodología: la asig- saber:

nación aleatoria de sujetos a tratamientos. a) Cuestionar si efectivamente X como variable manipulada
está causalmente relacionada con Y como variable medida.
Condiciones para el establecimiento de hipótesis causales Esta es una cuestión de validez interna (Campbell y Stanley,
1966). Es posible encontrar terceras variables (también
Puesto que persigue el mismo ideal, la metodología cuasi- llamadas variables extrañas perturbadoras o, para completar el
experimental no renuncia por tanto al objetivo final del experimento, el binomio X-Y, variables Z) que pueden explicar el cambio
establecimiento de relaciones causa-efecto. Sin embargo, si tal objetivo producido en Y. La existencia de terceras variables es común
es fácil de cumplir en el caso experimental, en el cuasi-experimental es, en metodología cuasi-experimental.
en ocasiones, muy difícil de alcanzar. b) Cuestionar si las operaciones utilizadas en la
En el marco de la teoría de la manipulabilidad, deben cumplirse investigación (comúnmente llamadas indicadores en la
varias condiciones para concluir que dos variables se relacionan literatura psicosociológica) son representativas de los
causalmente y que la dirección de la causación procede desde X constructos teóricos que se supone representan. Esta es una
(supuesta causa o tratamiento) a Y (supuesto efecto o resultado). Kenny cuestión de validez externa (Campbell y Stanley, 1966).
(1979, págs. 2-4) cita las siguientes: Muchas de las controversias actuales de las Ciencias Sociales
1) En primer lugar, la causa X debe preceder en el tiempo al se centran precisamente en esta cuestión. Este problema
efecto Y. Esta condición se cumple siempre que los investigadores afecta por igual a experimentos y cuasiexperimentos.
sepan cuándo se administró el tratamiento y registren los resultados
inmediatamente después de su administración. Sin embargo, cuando La validez de la inferencia causal
se trata con sistemas dinámicos, en ocasiones puede aparecer cierto
grado de ambigüedad en la dirección de la influencia causal, no La historia de la metodología cuasi-experimental es inseparable del
sabiendo si es X lo que produce Y o es Y lo que produce X. desarrollo de una teoría de la validez de la inferencia causal. Gran parte
2) En segundo lugar, causa y efecto tienen que covariar. La de esta historia se debe al trabajo de Campbell y colaboradores
existencia de covariación se decide en cualquier caso utilizando (Campbell, 1957; Campbell y Stanley, 1966; Cook y Campbell, 1979;
alguna prueba estadística a un nivel de probabilidad arbitrariamente Campbell, 1986; Cook, Campbell y Peracchio, 1990), aunque es también
seleccionado. La cuestión fundamental aquí se centra en determinar importante la aportación de Cronbach (1982) y otros (véase Mark, 1986).
si los resultados debidos al tratamiento (llamados efectos de tra- El análisis se originó como consecuencia de la baja calidad de la
tamiento) son de suficiente magnitud para ser detectados por la inferencia causal y la escasa generalizabilidad de los hallazgos
prueba estadística aplicada. Dos tipos de errores que pueden afectar encontrados en la investigación social aplicada. La teoría de la validez
a la conclusión estadística pueden cometerse en esta situación: de la inferencia causal no es sino un conjunto de conceptos ideados con
a) Concluir que existen efectos de tratamiento cuando de la intención de promover inferencias causales más consistentes.
hecho no existen (error tipo I). Este es el error que el La conceptualización original (Campbell y Stanley, 1966) distinguía
investigador decide cometer al fijar α, la probabilidad de un entre la validez para el establecimiento de relaciones causa-efecto en un
error tipo I. contexto particular (validez interna) y la validez para la generalización de
b) Concluir que no existen efectos de tratamiento cuando tales relaciones a otros contextos (validez externa). Más adelante, se
de hecho existen (error tipo 11). incorporaron dos nuevos tipos de validez (Cook y Campbell, 1976,
3) En tercer lugar, no debe haber explicaciones alternativas del 1979), uno de los cuales trataba cuestiones relativas al empleo de
efecto diferentes de la causa aducida. Esta es precisamente la pruebas estadísticas para llegar a una conclusión particular (validez de
condición más difícil de cumplir en la metodología experimental. Hay la conclusión estadística) y el otro consideraba aspectos relativos a la
dos cuestiones asociadas con el término "explicación alternativa", a generalización desde los indicadores causa y efecto específicamente

empleados en la investigación a sus correspondientes constructos de b) Las Variables No Controladas constituyen el resto de
referencia (validez de constructo). variables extrañas. A su vez pueden distinguirse dos grandes
Por su parte, Cronbach (1982) elaboró el modelo T-R-U-C-O, que tipos:
tratamos más adelante, como la estructuración de un conjunto de i) Las Variables Aleatorizadas (clase III) son
aspectos involucrados en una investigación: Tratamiento, Respuesta, variables extrañas no controladas que se tratan como
Unidades, Contexto y Ocasión, aunque éste último no fue inicialmente errores aleatorios. La aleatorización puede ser considerada
propuesto por este autor. En cualquier caso, este esquema puede ser desde otra perspectiva como una forma de control
también potencialmente utilizado para valorar la calidad de la inferencia experimental, pero diferente del utilizado para variables de
causal obtenida en una investigación. la clase II.
Gran parte de los debates actuales se centran en las virtudes de uno ii) Las Variables Perturbadoras (clase IV) son
u otro tipo de conceptualización (Campbell, 1986; Mark, 1986; Cook y variables extrañas no controladas que pueden relacionarse
Shadish, 1994). Pero una teoría de la validez, con los matices que se con las variables explicativas produciendo en ocasiones
quieran introducir, puede en la práctica aplicarse con provecho para una situación denominada confundido.
juzgarla calidad de la investigación en muchas disciplinas aplicadas En general, un diseño de investigación es tanto más eficiente cuantas
(Wortman, 1983, 1994; Ato, 1991; Ato y Rabadán, 1991). más variables de la clase IV sea capaz el investigador de trasladar a la
clase II. La función de las pruebas estadísticas consiste en distinguir el
El papel de la aleatorización efecto sistemático de las variables de la clase I de los efectos aleatorios
de las variables de la clase III dentro de niveles de probabilidad
Las variables en el esquema de Kish especificados.
El objeto de la aleatorización en una investigación experimental es el
En el esquema propuesto por Kish (1975; 1987) se distingue entre traslado de todas las variables de la clase IV ala clase III. En un
dos grandes tipos de variables, a saber: experimento ideal, no existen variables de la clase IV; algunas variables
1) Las variables que son el fundamento de la relación perturbadoras han sido trasladadas a la clase II (mediante control
causa-efecto objeto de investigación son las Variables Explicativas experimental o estadístico) y la gran mayoría son variables de la clase
(clase I). Las que actúan como supuestas causas son las variables III. Pero lo deseable es que se inviertan los términos, puesto que al
independientes o variables de tratamiento (predictores) y las que se colocar variables perturbadoras en la clase II se evitan los efectos
toman como efectos son las variables dependientes o variables de perjudiciales que tendrían de encontrarse entre las variables de la clase
respuesta (criterios). III. Además, la separación de variables de la clase I de la clase III
2) Todas las variables ajenas a las que conforman la mediante aleatorización de todas las variables extrañas de la clase III
relación causal son Variables Extrañas. Puede distinguirse a su vez supone la independencia entre ambos grupos de variables y las pruebas
dos grupos de variables extrañas: estadísticas contrastan los efectos de las variables aleatorizadas contra
a) Las Variables Controladas (clase II) constituyen un grupo las variables explicativas.
selecto de variables extrañas que pueden ser adecuadamente Pero en una investigación cuasi-experimental, la incorporación de
controladas por medio del diseño de investigación. El control una (o más) variable/s perturbadora/s como variables de la clase II es un
puede ejercerse mediante técnicas de selección (control objeto en sí mismo, debido a que no existe aleatorización y por tanto no
experimental), mediante técnicas de estimación (control es posible trasladar ninguna variable extraña de la clase IV a la clase III.
estadístico) o por ambas. En cualquier caso, tales En tal caso, las variables perturbadoras pueden presentarse con
procedimientos se utilizan con el objeto de reducir los errores facilidad en situación de confundido. Las pruebas estadísticas contrastan
aleatorios de las variables de la clase lE o los efectos de sesgo en este caso los efectos de las variables explicativas de la clase I contra
de las variables de la clase IV. las variables aleatorizadas de la clase III (si existen) confundidas con los

efectos desconocidos de las variables de la clase IV. Más adelante otro grupo de niños, también desventajados, que no recibirá el programa
volveremos sobre ello. (GC).
Un problema inicial concierne al modo como los niños se asignan a
La variable de asignación una de las dos condiciones. El objetivo esencial reside en asegurar que
los niños obtengan puntuaciones similares en desarrollo cognitivo antes
El diseño experimental típico posee dos características distintivas de comenzar la administración del programa. La única forma de
esenciales: garantizar este objetivo es acometer el proceso de asignación de niños a
a) El control/manipulación activa de (al menos) una variable una u otra condición sobre la base de alguna variable no relacionada con
independiente. la medida obtenida en el test.
b) El uso de una regla de asignación aleatoria para asignar sujetos La razón de ser del diseño experimental es precisamente que la
a los niveles de la variable independiente. variable de asignación no correlaciona, dentro de límites probabilísticos,
Mientras que, tal y como lo entendemos aquí, el diseño observacional con ninguna otra variable, es decir, es una variable cuyos valores se han
y el diseño de encuesta no cumple ninguna de estas dos características, generado aleatoriamente. En el contexto del ejemplo, para conseguir
el diseño cuasi-experimental cumple con la primera, pero no con la este objetivo, se precisa decidir que cada niño reciba el programa o no lo
segunda. Por el contrario, el diseño experimental con las dos. reciba sobre bases estrictamente aleatorias. La regla de asignación de
A este aspecto, Judd y Kenny (1981, cap. 2) han distinguido entre sujetos a uno de los dos grupos se dice entonces conocida y aleatoria y
tres procedimientos para asignar sujetos a tratamientos. La variable (real su propósito es la equivalencia inicial entre GE y GC.
o ficticia) que produce el reparto de los sujetos entre los tratamientos es Nótese que, si GE y GC son inicialmente equivalentes, en ausencia
la variable de asignación y su regla de correspondencia es la regla de de efectos debidos al programa, es esperable que alcancen al final del
asignación. Partiendo del caso más simple, donde sólo hay dos grupos, mismo puntuaciones iguales o muy similares. Resulta útil imaginar la
un grupo experimental (GE) que recibe un tratamiento y un grupo de variable de asignación como una variable con dos valores (1 para el GE
control (GC) que no lo recibe, la asignación puede ser: y 0 para el GC) que se generan de forma estrictamente aleatoria. Así,
1) Aleatoria. Una vez seleccionada una muestra de cierta población, por ejemplo, la tabla siguiente presenta las puntuaciones en desarrollo
todos los sujetos de la muestra son asignados al azar a uno de los cognitivo (DC) de 100 sujetos que se asignan a grupos siguiendo una
dos grupos (GE y GC). En esta situación puede afirmarse sobre regla aleatoria donde es notorio que la asignación a grupos es
bases probabilísticas que los grupos son iguales antes de iniciar la independiente de la puntuación obtenida por el sujeto en desarrollo
administración del tratamiento en un abundante conjunto de cognitivo (DC).
variables (denominadas variables aleatorizadas en el esquema de Sujeto DC Grupo V. Asignación
Kish). 1 41 GC 0
2 62 GE 1
2) No aleatoria pero conocida. Los sujetos se asignan a uno de los dos 3 39 GE 1
grupos (GE o GC) en función de la puntuación obtenida en un 4 43 GC 0
pretest de la misma medida utilizada para evaluar el impacto del 5 46 GE 1
tratamiento. … … … …
96 49 GC 0
3) No aleatoria ni conocida. No se conoce exactamente sobre qué 97 60 GE 1
variable/s se constituyen los grupos GE y GC. 98 54 GC 0
Explicaremos estos conceptos en el marco de un ejemplo. 99 45 GC 0
Supongamos que un investigador se interesa por evaluar el impacto de 100 57 GC 0
un programa de educación compensatoria sobre el desarrollo cognitivo En general, en contextos sociales y educativos, la aplicación de una
de los niños medido con una conocida prueba. Para ello, decide trabajar regla de asignación aleatoria tropezará con el rechazo de los padres y
con un grupo de niños desventajados que recibirá el programa (GE) y profesores. Una solución quizás más aceptable, aunque algo desviada

del propósito de la investigación, consistiría en administrar en el contexto variable de asignación de forma indirecta, utilizando medidas pretest
de una consulta psicológica escolar el test de desarrollo cognitivo para ajustar las diferencias en el postest.
administrar el programa al subconjunto de niños que obtuvieran
puntuaciones por debajo de una puntuación de corte predeterminada y Ventajas y desventajas de la aleatorización
no administrarlo al subconjunto que obtuvieran puntuaciones por encima
de tal puntuación de corte. Al término del periodo de tratamiento, los La principal virtud de la aleatorización es que, con alta probabilidad,
individuos participantes volverían a ser evaluados con el mismo los dos grupos 4o-básico serán inicialmente similares en la variable
instrumento a fin de determinar el impacto del programa. En este caso, la dependiente. La única diferencia sistemática existente entre ambos es
regla de asignación no es aleatoria, aunque sí es conocida puesto que la que uno (el GE) recibe el tratamiento, intervención o programa de interés
administración del tratamiento depende del resultado inicial obtenido en mientras que el otro (el GC) no recibe el tratamiento. Por tanto, en
el test de desarrollo cognitivo. La variable de asignación en este caso ausencia de efectos de tratamiento, la distribución de la variable
de
hace los grupos deliberadamente no equivalentes, pero las diferencias pendiente será similar en ambos grupos.
son susceptibles de ajuste estadístico en el postest. Así, suponiendo una Anderson et al (1980, págs. 32-35) han destacado las siguientes
puntuación de corte de 46 puntos, la asignación a grupos de la tabla propiedades de la aleatorización:
anterior consistiría en asignar a sujetos al GE si obtienen puntuaciones 1) La aleatorización generalmente implica una distribución
iguales o superiores a 46 y al GC si obtienen puntuaciones inferiores, y similar de las características de sujeto en cada grupo y por tanto
entonces la situación queda como sigue: facilita la inferencia causal. Si el número de sujetos es grande, es
V. improbable que los grupos difieran con respecto a alguna
Sujeto DC Grupo
Asignación característica que pueda afectar al resultado bajo estudio.
1 41 GC 0 2) La aleatorización elimina los sesgos de selección. Si una
2 62 GE 1 muestra seleccionada de una población se asigna a grupos
3 39 GC 0 mediante una regla de asignación aleatoria, no existe ninguna
4 43 GC 0 posibilidad de que los sesgos o preferencias iniciales de los in-
5 46 GE 1 vestigadores sobre la naturaleza de los sujetos a quienes se
… … … … administrará el tratamiento, intervención o programa puedan influir
96 49 GE 1 en los resultados.
97 60 GE 1 Aunque la aleatorización tiende a equilibrar los dos grupos con
98 54 GE 1 respecto a potenciales variables perturbadoras, no excluye
99 45 GC 0 absolutamente la posibilidad de que ambos grupos no queden
100 57 GE 1 equibrados en una o más características individuales. Esta
posibilidad es tanto menor cuando mayor es el tamaño de los
En muchas ocasiones se presentan situaciones en las que la regla de grupos.
asignación no es aleatoria ni se basa en una variable conocida. En 3) La aleatorización proporciona una base para la
nuestro caso, por ejemplo, si se deseara aplicar el programa de inferencia estadística. El proceso de aleatorización permite asignar
educación compensatoria en el marco de un aula especial ya constituida probabilidades a diferencias observadas en la variable dependiente
(GE) y comparar con otra aula especial también existente (GC). El bajo la hipótesis (nula) de que el tratamiento, intervención o
problema que se plantea entonces es saber sobre qué influencia/s se ha programa no ejerce efecto alguno y practicar en consecuencia las
podido generar la variable de asignación. Es extremadamente difícil correspondientes pruebas de significación.
igualar GE y GC sobre la base de la variable de asignación, porque es Con todo, existen varias razones que aconsejan el empleo de
desconocida. En tales casos es conveniente intentar igualar sobre la técnicas de control diferentes ala aleatorización en ciertos casos.

Anderson et al. (1980, págs. 36-7) destacan las siguientes:
a) Los estudios no aleatorizados son a veces el único Estado del conductor

Uso del Tasa de
medio ético de realizar investigación. En efecto, cuando la
cinturón mortalidad
naturaleza del tratamiento es potencialmente dañina, no resulta ético Muerto Vivo Total
utilizar una regla de asignación aleatoria. Por ejemplo, en
investigación biomédica, para evaluar el efecto de una nueva droga.
En otras ocasiones, los supuestos efectos benéficos de un programa Sí 6 54 60 6/60 = 0.100
(por ejemplo, programas de educación compensatoria) hacen No 9 31 40 9/40 = 0.225
aconsejable que se administre a todos los posibles sujetos
receptores.
b) Los estudios no aleatorizados son usualmente más Total 15 85 100 15/10 = 0.150
baratos. Los estudios no aleatorizados requieren una planificación y
control mucho menos extensivo que los estudios aleatorizados y por
ello son particularmente atractivos en las primeras etapas de un La tasa de mortalidad TM para quienes conducían con cinturón fue:
problema de investigación. TM(Sí) = 6/60 = 0.100, mientras que para quienes lo hacían sin cinturón
c) Los estudios no aleatorizados se aproximan en mayor fue: TM(No) = 9/40 = 0.225. En consecuencia, estos resultados
medida a situaciones cotidianas. En la medida en que la indicaban que es 2.25 veces más probable un accidente de
aleatorización difere de los mecanismos de selección natural, las consecuencias fatales cuando se conduce sin cinturón de seguridad que
condiciones de un estudio aleatorizado pueden ser completamente cuando se conduce con él.
diferentes de aquéllas en las que el tratamiento debe ser Esta interpretación presenta serias deficiencias. Desde un punto de
ordinariamente aplicado. vista lógico, la variable “uso del cinturón" no puede entenderse como una
auténtica variable causal, es decir resulta absurdo pensar que la causa
El problema del confundido de la muerte sea precisamente llevar o no cinturón de seguridad, aunque
ciertamente parece, a la vista de los datos empíricos, que puede
¿Qué es el confundido? coadyuvar al resultado final. Afortunadamente, el investigador también
registró la velocidad (estimada) del vehículo en el momento del
Poco tiempo antes de aprobar la legislación vigente acerca de la accidente, y particularmente si era o no superior a 100 Km/h., una
obligatoriedad en el uso del cinturón de seguridad, un investigador X velocidad con la que cualquier vehículo resultaba ya difícil de controlar
intentaba determinar si la tasa de mortalidad (TM) de los conductores en el punto negro objeto de evaluación. Un análisis secundario de los
involucrados en accidentes de automóvil es función de la utilización del datos del Cuadro 2.1, incorporando la variable "Velocidad del vehículo",
cinturón de seguridad. Para ello eligió una "zona de alto riesgo", un se exhibe en el Cuadro 2.2.
punto negro que exhibía una limitación de velocidad de 60 Km/h, y Estos resultados conducen a una interpretación muy diferente. La TM
registró los 100 primeros accidentes que tuvieron lugar en dicha zona, para quienes circulaban a menos de 100 Km/h en el momento del
observando el estado físico del conductor para determinar si se había accidente fue muy baja para quienes llevaban cinturón: TM(Sí I < 100) =
producido la muerte (instantánea o demorada) o si por el contrario el 2/55 = 0.036, y para quienes no lo llevaban: TM(No I < 100) = 1/30 =
conductor resultó vivo del accidente. Los resultados se muestran en el 0.033. Aunque existe una notable similaridad entre ambas tasas de
Cuadro 2.1. mortalidad, en realidad resultan prácticamente insignificantes. Por el
contrario, para quienes circulaban a más de 100 Km/h, la TM fue muy
CUADRO 2.1. Estado del conductor y uso de cinturón. alta tanto para quienes llevaban cinturón: TM(Sí I > 100) = 4/5 = 0.800,

como para quienes no lo llevaban: TM(No I > 100) = 8/10= 0.800, una una tercera (la "Velocidad del vehículo"): (X2MH = 0.003; P = 0.958, lo que
tasa más de 20 veces superior a la anterior. conduce a admitir la hipótesis nula de no relación entre ambas variables,
y por tanto, la supuesta relación encontrada en el Cuadro 2.1 entre el
CUADRO 2.2. Cuadro 2.1 en función de la velocidad del vehículo. uso del cinturón y el estado del conductor se disipa tras controlar la
velocidad del vehículo en el momento del accidente (Cuadro 2.2).
La razón que justifica la relación espuria encontrada entre el uso del
Velocidad Uso del Estado del conductor Tasa de cinturón y el estado final del conductor accidentado se debe
del vehículo cinturón mortalidad seguramente a que la probabilidad de utilizar el cinturón de seguridad es
Muerto Vivo Total
mayor entre conductores precavidos, que suelen respetar las señales de
Sí 2 53 55 2/55 = 0.036 tráfico y conducir con prudencia, que entre conductores arriesgados, que
<100 Km/h No 1 29 30 1/30 = 0.033 pasan por alto las señales de tráfico y conducen con grave riesgo de sus
vidas. Las probabilidades respectivas son, para quienes conducían a
Total 3 82 85 3/85 = 0.035 menos de 100 Km/h, 55/85 = 0.647 y para quien conducían a más de
Si 4 1 5 4/5 = 0.800 100 Km/h., 5/15=.333, aproximadamente la mitad.
No 8 2 10 8/10 = 0.800 Compárense, para matizar en mayor medida estos conceptos, los
>100 Km/h datos del Cuadro 2.2 con los del Cuadro 2.3. Observe ahora que,
Total 12 3 15 12/15 = 0.800 dependiendo de los niveles de la variable “Velocidad del vehículo", las
tasas de mortalidad obtenidas usando o no el cinturón de seguridad son
netamente diferentes. Circulando a menosde 100 Km/h, no hay
Como probablemente habrá ya sospechado, estos datos son diferencias entre las tasas de mortalidad: TM (Si |< 100) = 4/44 = 0.091 y
hipotéticos. Se inspiran en un ejemplo similar desarrollado por Anderson TM (No | < 100) = 3/33 = 0.091, mientras que circulando a más de 100
y otros (1980, p. 2-3). Su objetivo no es en absoluto impugnar la Km/h, difieren por un factor de 6.85: TM(Sí |> 100) = 2/16 = .125 y
indiscutible utilidad del cinturón de seguridad, sino ilustrar de una forma TM(No/ > 100) = 6/7 = 0.857.
intuitiva y didáctica el importante problema interpretativo que supone la
exclusión de una variable importante. La variable "Velocidad del CUADRO 2.3. Cuadro 2.2 reformulado con nuevos datos empíricos.
vehículo" es, en este contexto, una tercera variable o variable de
confundido porque enmascara o confunde el efecto que la variable que Tasa
actúa como independiente ("Uso del cinturón") posee sobre la de- Velocidad Uso del Estado del conductor
de
pendiente ("Estado físico final del conductor"). del vehículo cinturón Muerto Vivo Total
mortalidad
Nótese que, para cada uno de los niveles de la variable "Velocidad Sí 4 40 44 4/44 = 0.091
del vehículo", el uso o no del cinturón de seguridad no tiene ningún No 3 30 33 3/33 = 0.091
efecto sobre las tasas de mortalidad y por tanto puede afirmarse que el <100 Km/h
"Uso del cinturón" es una variable irrelevante. Su relación con el "Estado Total 7 70 77 7/77 = 0.091
físico del conductor" después del accidente se denomina espuria porque
se difumina como tal relación (o sea, pasa a ser cero) después de tomar Si 2 14 16 2/16=0.125
en cuenta los niveles de la variable "Velocidad del vehículo". >100 Km/h No 6 1 7 6/7 = 0.857
Esta relación espuria puede comprobarse empíricamente con el Total 8 15 23 8/23 = 0.348
estadístico de Mantel-Haenszel (1959; véase Fleiss, 1981), que prueba
la relación funcional entre dos variables categóricas binarias (en el
ejemplo, el "Uso del cinturón" y el "Estado del conductor") controlando Esta situación sugiere, contrariamente al caso anterior, que el uso del
cinturón no es una variable irrelevante, y por tanto no es espuria, puesto

que la relación se mantiene después de tomar en cuenta la variable de tercera variable, y la relación es espuria, lo cual demuestra que la
confundido. Aplicando la prueba de Mantel- Haenszel (χ2MH = 4.650; P = variable independiente es una variable irrelevante y que no existe
0.031, rechazamos la hipótesis nula de no relación funcional entre el uso un vínculo causal con la variable dependiente. En esta situación
del cinturón y el estado físico del conductor controlando la velocidad del se dice que la tercera variable es una auténtica variable de
vehículo. Nótese además las escasas diferencias encontradas en las confundido.
probabilidades respectivas de utilizar el cinturón de seguridad entre b) En el Cuadro 2.3, la relación entre variable independiente y
conductores que conducían a menos de 100 Km/h. (una probabilidad de variable dependiente se mantiene cuando se toma en cuenta la
44/77 = 0.571) y los que lo hacían a más de 100 Km/h. (una probabilidad tercera variable, pero la relación es diferente en función del nivel
de 16/23 = 0.696). Pero lo más importante en este caso es comprobar de aquélla. En este caso se dice que la tercera variable es una
que las tasas de mortalidad de los que llevan o no cinturón es la misma variable moderadora.
para los que conducían a menos de 100 Km/h. (TM de 0.091 en ambos
casos) y netamente diferentes para los que conducían a más de 100 El efecto del confundido
Km/h, una situación que induce a sospechar la existencia de interacción
entre del "Uso del cinturón" y la "Velocidad del vehículo". En esta Veamos otro ejemplo. Un investigador X desea saber si un programa
situación, se dice que la velocidad del vehículo es una variable de adiestramiento cognitivo produce diferencias en riqueza de
moderadora de la relación funcional existente entre el uso del cinturón y "Vocabulario" en niños de primer ciclo de primaria. Para ello utiliza dos
el estado físico del conductor tras el accidente. grupos de niños, uno de los cuales (GE) fue tratado con el programa
En resumen, la distorsión que una tercera variable produce sobre la mientras que el otro (GC) no siguió ningún programa específico de
relación funcional existente entre dos variables explicativas es enriquecimiento. La asignación a los grupos fue establecida por la
subsidiaria del cumplimiento de dos condiciones básicas: administración del colegio donde tuvo lugar la experiencia, y utilizó como
GE alumnos voluntarios de primer ciclo y como GC sujetos tomados de
1) La tercera variable muestra una alta relación con la las mismas aulas.
variable de respuesta. Esta condición se cumple en ambos casos. Resultó que las distribuciones de "Edad" de ambos grupos eran
En el Cuadro 2.2, tomando los totales de fila correspondientes (3, netamente diferentes y presentaban un promedio mayor en el GE que en
82, 12 y 3) se rechaza la hipótesis nula de independencia (X21 = el GC. En concreto, los promedios de edad (enmeses) fueron, para el
58.478; P = 0.000) y en el Cuadro 2.3, con los totales de fila grupo experimental, XGE = 80.410 y para el grupo de control, XGC =
respectivos (7, 70, 8 y 15) también se rechaza (X21¡ = 9.168; P = 69.820.
0.002). Los resultados finales del programa se exhiben en la Figura 2.1. Las
2) La tercera variable se relaciona funcionalmente con la pendientes de regresión para los grupos experimental (GE) y control
variable independiente. Esta condición se cumple en el Cuadro 2.2, (GC) fueron, respectivamente:
ya que tomando los totales de fila correspondientes (55, 30, 5, 10) y YGE = bo E + b,XcE = -24.770 + 1.994XGE
aplicando una prueba al uso obtenemos una asociación YGC = b0GC + b1XGC = -90.057 + 2.042XGC
estadísticamente significativa (X21 = 5.229; P = 0.022) entre la
velocidad del vehículo y el uso del cinturón. Pero no se cumple en el
Cuadro 2.3, ya que aplicando una prueba de asociación sobre los
totales de fila correspondientes (44, 33, 16 y 7) obtenemos que
ambas variables son independientes (X21 = 1.139; P = 0.286).
a) En el Cuadro 2.2, la relación entre variable independiente y

variable dependiente se difumina cuando se toma en cuenta una

entonces δ = YGE -YGC = 135.568 - 52.515 = 83.053 y la estimación

del efecto de tratamiento (83.053) no coincide con el efecto de
tratamiento real encontrado (65.287). La diferencia es, precisamente,
una medida del sesgo de estimación,
YGE- YGC = (BoGE + B1XGE) – (B0GC + B1XGC)

= (BoGE + B1XGC) + b1 (XGE - XGC)
= Efecto de tratamiento + Efecto de sesgo
La Figura 2.2 resume gráficamente este resultado.
EDAD (en meses)
Figura 2.1. Pendientes de regresión para GE y GC.
La pendiente b1, que suponemos estadísticamente diferente de cero,

es prácticamente similar en las dos ecuaciones, como se observa en la
figura, pero las intercepciones b0GE y b0GC son diferentes (nótese que X
se representa desde el valor 50).
En este caso, la variable "Edad" cumple las condiciones que
señalamos anteriormente para identificar una variable de confundido. En
primer lugar, la riqueza de vocabulario mejora con el aumento en edad
(primera condición, que se comprueba si β > 0 y en segundo lugar, los
grupos GE y GC tienen distribuciones de edad con medias diferentes
(segunda condición, como puede observarse en la Figura 2.1). Si Figura 2.2. Descomposición del efecto de tratamiento en presencia de
asumimos además que edad y programa de adiestramiento son los sesgo.
únicos factores que afectan al enriquecimiento de vocabulario, o lo que
es lo mismo, que ambas variables se miden sin error, es posible Nótese que el sesgo de estimación sería cero si las distribuciones de
determinar el efecto de tratamiento real mediante la distancia vertical edad de ambos grupos fueran exactamente iguales, pues en tal caso los
entre las intercepciones, o sea, δ = b0GE - b0GC = -24.77 - (-90.057) = promedios de edad para GE y GC coincidirían en una misma vertical y d
65.287. seria igual a S. Sólo en este caso es posible obtener una estimación
Cuando la variable dependiente es numérica, en el caso de dos válida del efecto de tratamiento. Esta situación se representa en la
grupos el efecto del tratamiento puede estimarse fácilmente calculando Figura 23. En la medida en que ambas distribuciones de edad discrepen,
la diferencia en los promedios de los grupos: d = YGE - YGC y en tanto mayor será el sesgo de estimación correspondiente.
consonancia con las ecuaciones anteriores:
YGE = b0GE + b1 XGE = -24.770 + 1.994 XGE = -24.770 + (1.994) (80.410) Sensibilidad y validez de la investigación
= 135.568
YGC = b0GC + b1XGC = -90.057 + 2.042 XGC = -90.057 + (2.042) Toda investigación comienza con una hipótesis causal, que plantea
(69.820) = 52.515 una relación causal entre un Tratamiento (supuesta causa) y una

Respuesta (supuesto efecto) para alguna población o Universo en algún ajenas al tratamiento) y generalizable (puede extrapolarse a otras
Contexto físico y en una Ocasión temporal localizada. Los elementos de situaciones diferentes).
este argumento se resumen en el acrónimo T-R-U-C-O. Dos ejemplos:
Ambas cuestiones se enraizan en el concepto general de validez. El
primer aspecto corresponde a lo que, siguiendo a Lipsey (1990) y Saxe y
Fine (1981), denominaremos aquí sensibilidad de la investigación,
definida como la probabilidad de que un efecto, si está realmente
presente, pueda ser detectado. Esta es una cuestión objetiva abordable
estadísticamente. El segundo aspecto corresponde a lo que usualmente
se conoce por validez de la investigación, y se refiere a la verosimilitud
de que lo que se detecta sea, de hecho, el efecto (teórico) por el que el
investigador se ha interesado. Esta es una cuestión eminentemente
subjetiva que no es empíricamente abordable.
La distinción se fundamenta además en los conceptos de sesgo y
error. Cuando se estima un efecto de tratamiento, la subestimación o
sobreestimación de la magnitud del efecto es un sesgo e indica que se
ha producido algún tipo de confundido. Sin embargo, puede suceder que
EDAD (en meses)
el efecto de tratamiento se haya estimado sin sesgo pero que ocurra
Figura 2.3. Descomposición del efecto de tratamiento en ausencia de algún error al concluirse que el tratamiento es significativo, cuando de
sesgo. hecho no lo es (error tipo I) o al concluir que el tratamiento no es
significativo cuando en realidad sí lo es (error tipo II).
a) El programa "J" de enriquecimiento cognitivo mejora las Esta situación se produce porque tal conclusión se adopta en base al
habilidades lingüísticas de niños de baja extracción social. resultado de una prueba estadística, que en términos muy generales
b) La campaña publicitaria "K" sobre el peligro del tabaco puede definirse como una razón entre un efecto de tratamiento
es efectiva para reducir el hábito en personas de alto nivel educativo (componente sistemático), en el numerador, contra otras fuentes de
que viven en grandes ciudades. variación no sistemáticas, ajenas al tratamiento (componente aleatorio),
en el denominador. Un equilibrio inadecuado entre ambos componentes
Cuando se diseña una investigación, los constructos tratamiento o puede producir conclusiones inapropiadas.
causa (el programa "J" y la campaña publicitaria "K" en el ejemplo) y
respuesta o efecto (habilidades lingüísticas y reducción del hábito) tienen La tipología de la validez de Campbell y colaboradores 1) La tipología de 1963
que ser traducidos en operaciones susceptibles de manipulación y/o
medida. Este proceso se denomina operacionalización. Una vez La tipología de 1963
finalizade la investigación debe calcularse un efecto de tratamiento,
definido como la influencia del tratamiento sobre el resultado, y a Como se apuntó más arriba, fue en un trabajo de Campbell y Stanley
continuación plantearse dos cuestiones esenciales: (1966), posteriormente publicado de forma monográfica (1966), donde
por primera vez se plantea una tipología de la validez de la investigación,
a) En primer lugar, si el efecto de tratamiento puede ser que distinguía entre:
detectable mediante una prueba estadística al uso. a) La validez interna, que se refiere al grado de confianza
b) En segundo lugar, si el efecto de tratamiento es con que puede inferirse si una relación causa-efecto entre dos (o
representativo y estable (no han intervenido en el mismo causas más) variables es o no interpretable en el sentido apuntado por el

investigador. conclusión estadística.

b) La validez externa que concierne al grado de confianza o b) Suponiendo que tal relación exista, ¿es la variable de
credibilidad con que puede concluirse si una relación causa-efecto tratamiento la que causa el resultado o efecto o por el contrario éste
encontrada entre dos (o más) variables es o no representativa, o se habría obtenido en ausencia de aquélla?: Validez interna.
sea, puede ser generalizada a otros contextos diferentes a aquél c) Suponiendo que la relación es presumiblemente causal y
utilizado por el investigador. se ha obtenido con indicadores de constructos causa y efecto
arbitrariamente elegidos, ¿cuáles son los constructos causa y efecto
Para cada tipo de validez, Campbell y Stanley presentaron y particulares involucrados en la relación estudiada? ¿Qué relación
discutieron una lista de posibles amenazas contra la validez; es decir, de mantienen con los indicadores utilizados? ¿Hasta qué punto puede
hipótesis rivales verosímiles, que potencialmente podrían explicar los generalizarse de indicador a su constructo?: Validez de constructo.
resultados. Como expresaron sus autores: "ambos criterios son sin duda d) Y similarmente, dada una relación supuestamente causal
importantes, aunque con frecuencia se contrapongan, en el sentido de obtenida con indicadores de los constructos de población de
que ciertos aspectos que favorecen a alguno de ellos perjudica (de individuos (indicador: muestra de sujetos), contexto de investigación
alguna forma) al otro. Si bien la validez interna es el sine qua non y a la (indicador: lugar físico donde se realiza la investigación) y momento
cuestión de la validez externa, como a la de la inferencia inductiva, temporal, ¿hasta qué punto puede generalizarse desde los in-
nunca se puede responder plenamente, es obvio que nuestro ideal lo dicadores a sus constructos respectivos?: Validez externa.
constituye la selección de diseños ricos en una y otra validez" (Campbell
y Stanley, 1966/1973, págs. 16-17). La validez interna incluía un total de La lista original de amenazas contra los cuatro tipos de validez se
8 amenazas; la validez externa, sólo 4. presenta en el Cuadro 2.4.
La tipología de 1979 Tipologías de la validez alternativas
La aparición de ciertas ambigüedades interpretativas llevaron a sus Pese a que la conceptualización de Campbell y colaboradores ha
autores a ensayar más tarde una nueva conceptualización, desarrollada pasado a pertenecer al acerbo metodológico de las ciencias sociales,
a partir de la anterior, que se publicó primero en un manual sobre abundan otras tipologías alternativas. Por ejemplo, Cronbach (1982),
psicología industrial (Dunnette, 1976) y luego en una monografía sobre Krathwohl (1985) y Trochim (1986). Un exhaustivo análisis de Mark
cuasi-experimentación (Cook y Campbell, 1979). (1986) destaca que todas ellas tienen en común la descripción de las
La nueva conceptualización de la validez amplió la dicotomía relaciones causa-efecto cuyos cinco elementos esenciales pueden
interna/externa incorporando dos nuevos tipos de validez (validez de la resumirse con un argumento que refleja el acrónimo T-R-U-C-O:
conclusión estadística y validez de constructo), amplió la lista de
amenazas hasta un total de 33 y proporcionó una definición algo más El tratamiento (T) produce un respuesta (R) con las unidades (U)
explícita de validez: "Utilizamos los conceptos de validez e invalidez para dentro del contexto (C) y en la ocasión (O).
hacer referencia a la mejor aproximación disponible a la verdad o
falsedad de las proposiciones" (Cook y Campbell, 1979, pág. 37).
La justificación y jerarquización de esta tipología, según afirman sus
autores, se fundamenta en la correspondencia con la práctica cotidiana
del investigador, quien se plantea los pasos siguientes durante el
proceso de investigación:
a) ¿Existe una relación funcional establecida entre la
variable de tratamiento y la variable de respuesta?: Validez de la

Cronbach (1982), quien distingue tres niveles de generalización para

CUADRO 2.4. Amenazas contra la validez: Cook y Campbell (1979). cada uno de los elementos involucrados en la relación, a saber:
— Un primer nivel de indicador, etiquetado con letras
minúsculas, que representa la particular operacionalización de
Baja potencia estadística.
Violación de los supuestos de las pruebas estadísticas. tratamiento (t), respuesta (r), unidad (u), contexto (c) y ocasión (o).
Validez de
Violación del error tipo I. Este último es un elemento no contemplado por Cronbach pero que
la
conclusión
Fiabilidad de la medición de la respuesta. incluimos aquí con propósitos pedagógicos comparativos.
Fiabilidad de la administración de los tratamientos. — Un segundo nivel de constructo real, etiquetado con
estadística
Irrelevancias aleatorias del contexto de investigación.
Heterogeneidad aleatoria de las unidades de respuesta. letras mayúsculas, que representa los constructos causa (T), efecto
(R), población (U), contexto (C) y ocasión (0) involucrados en la
investigación.
Historia. — Un tercer nivel de constructo extrapolado, etiquetado con
Maduración. letras mayúsculas con asterisco, que representa un nivel superior de
Administración de pruebas.
Instrumentación.
generalización a los constructos causa (*T), efecto (*R), población
Regresión estadística. (*U), contexto (*C) y ocasión (*O).
Selección.
Validez Mortalidad selectiva.
interna La Figura 2.4 (modificada de Cook, Campbell y Peracchio, 1990, pág.
Interacciones con selección.
Ambigüedad en la dirección de la relación causa-efecto.
496) representa las ideas fundamentales del esquema de Cronbach. Las
Difusión e imitación de tratamientos. líneas continuas representan aquí la generalización de indicador a
Igualación compensatoria de tratamientos. constructo real; las discontinuas, la generalización de indicador a
Rivalidad compensatoria de los sujetos. constructo extrapolado.
Desmoralización de los sujetos.
Explicación preoperacional inadecuada.

Sesgos derivados del uso de una operación única.
Sesgos derivados del uso de un solo método.
Adivinación de hipótesis.
Validez de Recelo de evaluación.
constructo Expectativas del experimentador.
Confusión de constructos y niveles de constructo.
Interacción de tratamientos intrasujeto.
Interacción de administración de pruebas y tratamiento.
Generalidad restringida entre constructos.
Figura 2.4. Notación del concepto de validez según Cronbach (1982).
En el argumento TRUCO, la correspondencia entre los elementos

Interacción selección-tratamiento (validez de población).
Validez
Interacción contexto-tratamiento (validez ecológica).
básicos del proceso de investigación y la tipología de Campbell y
externa
Interacción historia-tratamiento (validez histórica). colaboradores es clara: los elementos (T) y (R) conciernen
respectivamente a la validez de constructo de causas y efectos, los
elementos (U), (C) y (O) corresponden a los aspectos fundamentales de
la validez externa (validez de población, validez ecológica y validez
Quizá la más interesante de todas ellas sea la formulada por
histórica, respectivamente) mientras que la validez interna está emplear para valorar la consistencia de la relación funcional
representada en la flecha unidireccional existente entre (t) y (r). (sensibilidad).
Nótese la importancia crucial que se atribuye aquí al nivel de Subsisten sin embargo algunas ambigüedades en la lista de
generalización, y por ende el papel que ocupa la teoría en la amenazas propuesta por Cook y Campbell en 1979, y que en parte han
generalización de resultados. Para cada elemento, con excepción de la sido subsanadas en una presentación más reciente (Cook, Campbell y
flecha, existe un nivel de generalización que parte de un elemento Peracchio, 1990).
concreto hasta alcanzar un nivel de generalización óptimo. Así, el Dada una investigación determinada, la evaluación de cada uno de
elemento (u) se refiere a una muestra particular de unidades de los elementos de la lista de amenazas contra la validez no tiene otro
respuesta empleada en una investigación, pongamos por caso, niños objeto que contribuir a que el investigador (o posteriormente, el
desfavorecidos de barrios pobres de colegios de Madrid capital. La evaluador o consumidor de la investigación) descarte todas las fuentes
generalización a una población superior concierne a la validez de verosímiles de sesgo que pueden arruinar su investigación, y en el caso
población y supone la existencia de un nivel de generalización cuya de no asegurar tal descarte, utilizar los procedimientos necesarios para
delimitación y alcance corresponde definir al investigador, que puede que no sean verosímiles las fuentes de sesgo sospechosas.
quedarse a un nivel ligeramente superior, por ejemplo colegios de Sin embargo, para que el esquema resulte atractivo, se precisa una
barrios pobres de la comunidad autónoma de Madrid, o un nivel muy definición sencilla y comprensible de las 33 amenazas que se contienen
superior, por ejemplo colegios de barrios pobres de colegios españoles. en el Cuadro 2.4, utilizando una clasificación más pragmática de las
Lo mismo cabe aplicar al resto de los elementos presentes en el mismas, e incorporando la conceptualización de Cronbach (1982). La
argumento. que proponemos aquí se fundamenta en definiciones más recientes de
Una situación peculiar se presenta en la conexión entre tratamiento y las amenazas (Cook, Campbell y Peracchio, 1990; Ato y Navalón, 1993)
resultado, conexión "única" en lo que concierne al resultado pero y su inserción en una estructura arbórea que facilita en mayor medida su
"exclusiva" en lo relativo al tratamiento (puesto que es posible considerar lectura y recuerdo. Presentamos para cada una de las fuentes una breve
tratamientos alternativos que hayan producido el mismo resultado). Por explicación de su significado. Un análisis más detenido de cada una de
lo tanto, el problema que se plantea aquí es el nivel de exclusividad del las amenarac puede consultarse originalmente en Cook y Campbell
tratamiento (t) para producir el resultado (r). Este es esencialmente el (1976; 1979) y, más recientemente, en Cook, Campbell y Peracchio
concepto de validez interna. (1990). En castellano, puede también consultarse Ato y Rabadán (1991)
Y finalmente, no aparece en el argumento ningún elemento que se y Ato (1991, cap. 6). El resumen de todas las fuentes se encuentra en el
corresponda con la validez de la conclusión estadística. Efectivamente, Cuadro 2.5.
este tipo de validez plantea esencialmente una cuestión objetiva (¿cuál CUADRO 2.5. Amenazas contra la validez: reconceptualización.
es el efecto del tratamiento observado?), y por ello se considera hoy más "Validez Asociados 1. Historia
bien como una cuestión de sensibilidad y no de validez, como interna al tiempo 2. Maduración
apuntamos anteriormente.
Sesgos en
comparaciones Asociados a 3. Administración de pruebas
Hacia un esquema práctico de la validez intrasujeto la medición 4. Instrumentación
El esquema de la validez de Campbell y colaboradores se ha Asociados a 5. Mortalidad diferencial

mostrado eficaz (Ato y Rabadán, 1991) para evaluar investigaciones la selección 6. Regresión estadística
originales con la finalidad de obtener una valoración subjetiva tanto del
nivel de exclusividad en la explicación del efecto (validez interna) como
del nivel de generalidad de los elementos de la investigación (validez ex-
terna y validez de constructo). Adicionalmente, también se puede

(hambre, fatiga) o a largo plazo (envejecimiento).

7. Selección
Sesgos en b) Asociados a la medición
8. Interacciones con selección
comparaciones 3. Administración de pruebas: efectos de administrar una
9. Ambigüedad de la dirección causa-
intersujetos
efecto prueba sobre las puntuaciones obtenidas en una administración
posterior.
4. Instrumentación: cambios en la calibración de un
10. Explicación preoperacional inadecuada
Sesgos de
instrumento de medida (humano o mecánico).
11. Empleo de una operacionalización
operacionalización de única c) Asociados a la selección
los constructos T y R 12. Empleo de un método único de 5. Mortalidad diferencial: reducción del tamaño y/o
Validez operacionalización naturaleza original de los grupos durante el proceso de medición.
de
Constructo 6. Regresión estadística: tendencia hacia la centralidad
producida en grupos con unidades directa o indirectamente
Sesgos de 13. Efectos reactivos situacionales
reactividad 14. Adivinación de hipótesis
seleccionadas sobre la base de sus puntuaciones extremas.
de las unidades 15. Artefactos de sujeto
de respuesta 16. Artefactos de experimentador —Sesgos producidos con comparaciones de grupo (intersujetos)
Representan un conjunto de sesgos apropiados a situaciones
donde se comparan al menos dos grupos de individuos
Sesgos de 17. Interacción selección-tratamiento
Validez
generalización de los 18. Interacción contexto-tratamiento (comparaciones intersujetos) una vez que el tratamiento ha sido
externa administrado.
constructos U, C y 0 19. Interacción historia-tratamiento
7. Selección: efectos producidos por la no equivalencia
inicial de los grupos (tratamiento y control) objeto de
20. Interacción admistración pruebas-
Sesgos de tratamiento
comparación.
Validez
generalización 21. Interacción instrumentación- 8. Interacciones con selección: interacción de la selección
externa
menores tratamiento con otras fuentes de sesgo anteriormente mencionadas
22. Interacción tratamientos intrasujeto produciendo efectos espurios. Las más comunes son la
selección-maduración, que ocurre cuando grupos no
Validez Interna
equivalentes maduran a diferente ritmo, y la selección-historia,
que se presenta cuando grupos inicialmente no equivalentes
— Sesgos producidos con comparaciones intrasujeto (pre-post): experimentan historias locales diferentes.
Representan un conjunto de sesgos que aparecen en situaciones 9. Ambigüedad de la dirección causa-efecto: efecto
en que se comparan al menos dos medidas de los mismos sujetos producido cuando la precedencia temporal de la causa no es
en un plazo de tiempo durante el cual tiene lugar la administración clara. Suele aparecer en diseños no experimentales (diseño
del tratamiento (comparaciones intrasujeto). Hemos dividido tales correlacional por ejemplo).
sesgos en tres grandes clases, según se relacionen con el paso del
Validez De Constructo
tiempo, el proceso de medición o el proceso de selección-
— Sesgos de operacionalización de constructos (T) y (R)
asignación.
Representan sesgos que reflejan una inadecuada operacionalización
a) Asociados al tiempo
de los indicadores, o bien porque los indicadores definidos no captan
1. Historia: eventos específicos que ocurren al mismo
todas las dimensiones que teóricamente incorpora un constructo (sub-
tiempo que el tratamiento.
representación) o bien porque los indicadores incluyen aspectos que no
2. Maduración: procesos internos que operan a corto
son relevantes para el constructo (irrelevancias sobreañadidas al 15. Artefactos de sujeto: los sujetos desempeñan durante la
constructo). En última instancia, se trata también de un problema de investigación papeles específicos que desvirtúan
generalización de los indicadores de tratamiento y respuesta (t,r) a los considerablemente su conducta espontánea y natural (Weber y
constructos correspondientes (T, R). Cook,1972).
10. Explicación preoperacional inadecuada: análisis teórico 16. Artefactos de experimentador: los investigadores se
minucioso de la naturaleza y los componentes del constructo esfuerzan por conseguir que el sujeto obtenga las
para derivar operaciones y métodos de operacionalización que puntuaciones que confirmen su/s hipótesis (Rosenthal y
conducirán a su definición. Rosnow, 1969).
11. Empleo de una operacionalización única: sesgo que
ocurre cuando se define una única operacionalización de un Validez Externa
constructo, ya que la utilización de una sola operación no suele
captar el constructo en su globalidad y obtiene indicadores con —Sesgos de generalización de los constructos (U), (C) y (0).
irrelevancias. Son un conjunto de sesgos relativos a los constructos de Unidades
12. Empleo de un método único de operacionalización: de respuesta, Contexto y Ocasión temporal y que dificultan una
sesgo que ocurre cuando se emplea un solo método de generalización apropiada de los mismos. Puesto que tal generalización
operacionalización, ya que la utilización de un método de presupone que diferentes niveles del contracto presenten la misma
operacionalización único produce indicadores que pauta para cada uno de los diferentes niveles del tratamiento, el
subrepresentan los constructos y contienen irrelevancias. concepto de generalización se convierte en una cuestión de interacción
constructo-tratamiento.
—Sesgos de reactividad de las unidades de respuesta 17. Interacción selección-tratamiento: se conoce también por
Son un conjunto de sesgos que aparecen cuando los sujetos (o las validez de Población. Se refiere ala generalización de (u) a (U).
unidades de respuesta de la investigación) se comportan de forma 18. Interacción contexto-tratamiento: corresponde a la
reactiva, presentando conductas artificiales que se desvían de su denominada validez ecológica. Se refiere a la generalización de
comportamiento natural. La consecuencia fundamental que producen es (c) a (C).
una desnaturalización de los indicadores de tratamiento y respuesta, que 19. Interacción historia-tratamiento: también conocido como
se desvían de sus constructos de referencia correspondientes y por ello validez histórica. Se refiere a la generalización de (o) a (0).
son también en última instancia un problema de generalización. Otros sesgos menores de generalización
13. Efectos reactivos situacionales: incorporan amenazas Incorporan sesgos de generalización relativos a otros
que generan cambios en el comportamiento de los sujetos y se constructos menores, diferentes de los clásicos constructos de
producen en situaciones sociales comparativas. Son la difusión historia, contexto y unidad de respuesta.
o imitación de tratamientos, la igualación compensatoria de 20. Interacción administración de pruebas-tratamiento:
tratamientos, la rivalidad compensatoria y la desmoralización generalización del resultado a otras condiciones de
de los sujetos que reciben los tratamientos menos deseables. administración de prueba diferentes a la utilizada.
14. Adivinación de hipótesis: los sujetos se esfuerzan 21. Interacción instrumentación-tratamiento: generalización
siempre por saber cómo el/los investigador/es desea/n que se del resultado a otras condiciones de instrumentación diferentes
comporten, o sea, por conocer la hipótesis que el investigador a la utilizada.
desea comprobar. En ocasiones en que la hipótesis es sencilla 22. Interacción de tratamientos intrasujeto: generalización
de deducir, pueden generarse comportamientos reactivos. El del resultado de la situación en que los sujetos reciben más de
ejemplo más conocido es el efecto Hawthorne (Roethlisberger un tratamiento a la situación (hipotética) en que sólo reciban
y Dickson, 1939). uno.


2201und1art2ato1995 PDF

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

2201und1art2ato1995 PDF

Uploaded by

Copyright:

Available Formats

MÓDULO 2201- LA INVESTIGACIÓN CIENTÍFICA EN LA PSICOLOGÍA 1

CONCEPTOS BÁSICOS ...................................................... 2

Para profundizar en este tipo de contenidos consulte la obra:

permiten caracterizar apropiadamente la naturaleza de la metodología

Para profundizar en este tipo de contenidos consulte la obra:

Para profundizar en este tipo de contenidos consulte la obra:

propiedades de aquél, excepto la que justifica tal metodología: la asig- saber:

Para profundizar en este tipo de contenidos consulte la obra:

Para profundizar en este tipo de contenidos consulte la obra:

Para profundizar en este tipo de contenidos consulte la obra:

Para profundizar en este tipo de contenidos consulte la obra:

Anderson et al. (1980, págs. 36-7) destacan las siguientes:

a) Los estudios no aleatorizados son a veces el único Estado del conductor

Para profundizar en este tipo de contenidos consulte la obra:

Para profundizar en este tipo de contenidos consulte la obra:

a) En el Cuadro 2.2, la relación entre variable independiente y

Para profundizar en este tipo de contenidos consulte la obra:

entonces δ = YGE -YGC = 135.568 - 52.515 = 83.053 y la estimación

YGE- YGC = (BoGE + B1XGE) – (B0GC + B1XGC)

La Figura 2.2 resume gráficamente este resultado.

EDAD (en meses)

Figura 2.1. Pendientes de regresión para GE y GC.

La pendiente b1, que suponemos estadísticamente diferente de cero,

Para profundizar en este tipo de contenidos consulte la obra:

Para profundizar en este tipo de contenidos consulte la obra:

investigador. conclusión estadística.

La tipología de 1979 Tipologías de la validez alternativas

Para profundizar en este tipo de contenidos consulte la obra:

Cronbach (1982), quien distingue tres niveles de generalización para

Explicación preoperacional inadecuada.

En el argumento TRUCO, la correspondencia entre los elementos

El esquema de la validez de Campbell y colaboradores se ha Asociados a 5. Mortalidad diferencial

Para profundizar en este tipo de contenidos consulte la obra:

(hambre, fatiga) o a largo plazo (envejecimiento).

Para profundizar en este tipo de contenidos consulte la obra:

You might also like