You are on page 1of 101

UNIVERSIDAD AUTNOMA DE DURANGO

CAMPUS LAGUNA

MAESTRA EN PSICOTERAPIA
Y PSICOLOGA CLNICAA

TERCER SEMESTRE

COMPILACIN DE LECTURAS COMPLEMENTARIAS


PARA EL

SEMINARIO DE TESIS III

MTRO. JOS JESS ALVARADO CABRAL

Gmez Palacio, Dgo., octubre de 2007


UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

TABLA DE CONTENIDO

No
Texto
.
Creswell, J. W. (2003). Preface. In Research Design:
Qualitative, Quantitative, and Mixed Methods Approaches
1 (2nd. ed.) (pp. xix-xxv). Thousand Oaks, California, U.S.A.: 3
Sage Publications.

Creswell, J. W. (2003). Qualitative Procedures. In Research


Design: Qualitative, Quantitative, and Mixed Methods
2 Approaches (2nd. ed.) (Chapter 10, pp. 179-207). Thousand 8
Oaks, California, U.S.A.: Sage Publications.

Creswell, J. W. (1998). Qualitative Inquiry and Research


Design. Choosing Five Traditions. Thousand Oaks, USA:
3 28
SAGE Publications.

Campbell, D. & Stanley, J. (1973). Diseos experimentales y


4 cuasiexperimentales en la investigacin social. 40
Buenos Aires: Amorrortu.

2
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

1. PREFACIO

Creswell, J. W. (2003). Preface. In Research Design: Qualitative, Quantitative, and Mixed Methods
Approaches (2nd. ed.) (pp. xix-xxv). Thousand Oaks, California, U.S.A.: Sage Publications.

Este libro presenta un marco, un proceso y enfoques para disear investigacin cualitativa,
cuantitativa y con mtodos mixtos en las ciencias sociales y las humanidades. El inters
incrementado en el uso de la investigacin cualitativa, la emergencia de enfoques de mtodos
mixtos y la continuidad en el uso de las formas tradicionales de diseos cuantitativos han creado la
necesidad de realizar en este libro una comparacin de los tres planteamientos de indagacin. Esta
comparacin inicia con la consideracin preliminar de concepciones de conocimiento para los tres
enfoques, una revisin de la literatura y reflexiones acerca de la importancia de la escritura y la
tica en la indagacin. Este libro presenta los elementos clave del proceso de investigacin: escribir
una introduccin; establecer un propsito para el estudio; identificar las preguntas e hiptesis de
investigacin; usar la teora para definir, delimitar y exponer la significancia del estudio; y anticipar
los mtodos y procedimientos para la obtencin y anlisis de datos. En cada fase de este proceso, se
lleva al lector a travs de los enfoques cualitativo, cuantitativo y de mtodos mixtos.

Auditorio

Este libro fue preparado para estudiantes y profesores de posgrado que buscan apoyo en la
preparacin de un plan o proyecto para un artculo de revista especializada, una disertacin o una
tesis. En un nivel ms amplio, el libro puede se til como libro de referencia y como un texto para
cursos de posgrado. Para aprovechar mejor las caractersticas de diseo en este libro, el lector
necesita una familiaridad bsica con la investigacin cualitativa y cuantitativa; sin embargo, se
explicarn los trminos y se recomendarn estrategias para quienes necesiten apoyo introductorio en
el proceso de diseo. Este libro tambin pretende llegar a una audiencia amplia en las ciencias
sociales y las humanidades. Los comentarios de los lectores a la primera edicin de este libro
indican que los usuarios individuales procedan de varios campos y disciplinas. Espero que los
investigadores en campos como el mercado, la administracin, la justicia social, la psicologa, la
sociologa, la educacin, la enfermera, las ciencias de la salud, los estudios urbanos, la
investigacin de la familia y otras reas encontrar til esta edicin.

Formato

En cada captulo, comparto ejemplos diseados extrados de varias disciplinas. Estos ejemplos son
tomados de libros, artculos de revista, proyectos de disertacin y disertaciones. Aunque mi
principal especializacin es en educacin, los ejemplos intentan incluir las ciencias sociales y las
humanidades. Estos ejemplos reflejan tpicos en justicia social y ejemplos de estudios con
individuos marginados en nuestra sociedad, as como muestras y poblaciones tradicionales
estudiadas por los investigadores sociales. Se incluye el pluralismo metodolgico en la
investigacin actual, y la discusin incorpora ideas filosficas alternativas, diversos modos de
indagacin y varios procedimientos.

Este libro no es un texto detallado del mtodo; ms bien, destaco las caractersticas esenciales del
diseo de investigacin. La cobertura de estrategias de investigacin se limita a las formas usadas
frecuentemente: experimentos y encuestas en la investigacin cuantitativa; fenomenologa,
etnografa, teora fundamentada, estudios de caso e investigacin narrativa en la investigacin
cualitativa; y diseos concurrentes, secuenciales y transformadores en la investigacin con mtodos

3
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

mixtos. Aunque los estudiantes estn preparando un proyecto de disertacin, deben encontrar til
este libro, las condiciones relacionadas con las polticas de presentacin y negociacin de un
estudio con los comits de posgrado se presentan de manera ms completa en otros textos.

En coincidencia con los acuerdos de escritura de expertos, he tratado de eliminar cualquier palabra
o ejemplo que exprese una orientacin sexista o tnica. Los ejemplos fueron seleccionados para
proporcionar un amplio rango de orientaciones culturales y de gnero. El favoritismo tampoco est
presente en el uso que hago de las discusiones cualitativas y cuantitativas. El lector encontrar que a
veces inicio con ejemplos cualitativos y otras veces con ejemplos cuantitativos. Los lectores deben
observar que en los ejemplos citados en este libro se hacen muchas referencias a otros escritos. Slo
se citar aqu la referencia al trabajo que uso como ejemplo, no la lista completa de referencias
incluidas dentro de algn ejemplo particular.

Como en la primera edicin, he mantenido caractersticas para mejorar la legibilidad y comprensin


del material. Estas caractersticas son: vietas para enfatizar los puntos clave, puntos numerados
para aclarar las fases de un proceso, pasajes ms largos con anotaciones para proporcionar al lector
ideas clave de la investigacin que se incorporan en los pasajes, y palabras destacadas para ayudar a
los investigadores a construir su vocabulario de los enfoques cuantitativo, cualitativo y de mtodos
mixtos. Al final de cada captulo hay ejercicios de escritura para practicar los principios aprendidos
en el captulo, as como listas de lecturas adicionales, integradas por referencias de otros textos que
proporcionarn una comprensin ms completa del material cubierto.

En esta segunda edicin del libro, se han aadido nuevas caractersticas en respuesta a los
desarrollos en investigacin y la realimentacin de los lectores:
Se han agregado los mtodos mixtos a los enfoques cuantitativo y cualitativo. En cada
captulo discuto el proceso de diseo de un proyecto o plan con mtodos mixtos, adems de
presentar los otros dos enfoques.
El captulo de escritura, que se encuentra al final del libro en la primera edicin, ha sido
ubicado en el tercer captulo de este libro. De hecho, antes de escribir un proyecto, los
autores necesitan considerar las caractersticas bsicas de la escritura.
La tica tambin ha sido incluida de manera ms sustantiva. En el tercer captulo dedico
una seccin completa a los aspectos ticos que pueden presentarse en los diseos
cuantitativos, cualitativos y con mtodos mixtos. Los aspectos ticos deben ser previstos
apropiadamente al inicio de un proyecto.
Se han presentado varias iniciativas nuevas desde que escrib la primera edicin de este
libro. El captulo sobre procedimientos cualitativos, el captulo 10, refleja mucho del nuevo
pensamiento sobre este tpico, incluyendo los desarrollos en los enfoques de apoyo,
participativos y emancipatorios para investigar, que ahora han llegado a ser centrales en la
mayora de la indagacin cualitativa.
Asimismo, la investigacin con mtodos mixtos se ha expandido y ha llegado a constituir
en s misma un enfoque de indagacin desde que escrib la primera edicin. El captulo
titulado en la primera edicin Combinacin de la investigacin cualitativa y cuantitativa
se llama apropiadamente Procedimientos con mtodos mixtos, y he reescrito
completamente este captulo para reflejar los aportes que han emergido durante la ltima
dcada.
En cada captulo, he aadido referencias actualizadas dentro del captulo as como nuevas
referencias de lectura adicional para que el lector pueda combinar algo de lectura clsica
con nuevos trabajos.

4
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Al discutir las preguntas e hiptesis de investigacin, he proporcionado ms ejemplos y


clarificado las instrucciones para las diferentes formas de escritura. Se agregaron ejemplos
especficos para los enfoques cualitativo, cuantitativo y de mtodos mixtos.

BOSQUEJO DE LOS CAPTULOS

Este libro se divide en dos partes. La parte I consiste en pasos que los investigadores necesitan
considerar antes de desarrollar sus proyectos o planes para investigar. La parte II discute los pasos
reales al elaborar un proyecto y plan. A continuacin se presenta una breve sntesis de cada captulo.

Parte I: Consideraciones preliminares

Esta parte del libro discute la preparacin para el proceso de diseo. Contiene de los captulos 1 a 3.

Captulo 1: Un marco para disear

En este captulo, discuto la importancia de tener un marco para disear la investigacin. Este marco
involucra de manera conjunta las discusiones que se han hecho acerca de la concepcin de
conocimiento, una estrategia de indagacin y mtodos especficos. Tres enfoques resultan de esta
interconexin: cualitativo, cuantitativo y de mtodos mixtos. Este captulo ayudar a un
investigador a identificar los tres enfoques y seleccionar cul enfoque usar para un estudio
particular.

Captulo 2: Revisin de literatura

Revisar la literatura acerca de un tpico es otra fase preliminar para el diseo propuesto. Este
captulo identifica estrategias especficas que sern tiles al buscar y revisar las fuentes disponibles
para disear un estudio.

Captulo 3: Estrategias de escritura y consideraciones ticas

Antes de iniciar el proceso del diseo propuesto, tambin son necesarios el desarrollo de un sentido
de estructura general del escrito y la anticipacin de consideraciones ticas que pueden presentarse
durante la investigacin. Este captulo proporciona esbozos para las propuestas cuantitativas,
cualitativas y con mtodos mixtos, y considera aspectos ticos que a menudo se presentan durante
los estudios.

Parte II: Disear la investigacin

Esta parte del libro describe las fases en el proceso de investigacin. Contiene los captulos
restantes del libro, del 4 al 11.

Captulo 4: La introduccin

Es importante introducir con propiedad un estudio de investigacin. Esto requiere identificar el


problema o tpico de investigacin, enmarcando este problema dentro de la literatura existente,
sealando deficiencias en la literatura, y dirigiendo el estudio para una audiencia. Este captulo
proporciona un mtodo sistemtico para disear una introduccin experta a un proyecto o estudio.

Captulo 5: La declaracin del propsito

5
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Al inicio de los proyectos de investigacin, los autores mencionan el propsito central o intencin
de su estudio. Este paso constituye la declaracin ms importante en el proyecto completo. En este
captulo, el lector aprender cmo escribir esta declaracin para los estudios cuantitativos,
cualitativos y con mtodos mixtos, y aprender una gua til en el proceso de escritura.

Captulo 6: Preguntas e hiptesis de investigacin

Las preguntas e hiptesis planteadas por el investigador sirven para acotar y enfocar el propsito del
estudio. Como otro indicador notable en un proyecto, el conjunto de preguntas e hiptesis de
investigacin necesita ser escrito cuidadosamente. En este captulo, el lector aprender cmo
escribir preguntas de investigacin cualitativa y preguntas e hiptesis de investigacin cuantitativa,
as como el empleo de ambas formas en la escritura de preguntas e hiptesis en mtodos mixtos.
Numerosos ejemplos sirven para ejemplificar estos procesos.

Captulo 7: El uso de la teora

Las teoras sirven para diferentes propsitos en las tres formas de indagacin. En la investigacin
cuantitativa, proporcionan una explicacin propuesta para la relacin entre las variables que estn
siendo examinadas por el investigador. En la investigacin cualitativa, a menudo pueden ser tiles
como una lente para la indagacin o se generan durante el estudio. En los estudios con mtodos
mixtos, los investigadores las emplean de varias maneras, incluyendo las que estn asociadas con
los enfoques cuantitativo y cualitativo. Este captulo proporciona una visin general de cmo podra
usarse la teora en los tres enfoques para investigar y cita ejemplos especficos para clarificar estos
usos.

Captulo 8: Definiciones, limitaciones y significancia

Todos los investigadores establecen ciertas restricciones o lmites en torno a los estudios que
desarrollarn. Estos lmites definen los trminos usados en el estudio, delimitan el alcance de la
indagacin, limitan las prcticas utilizadas y fijan la significancia del estudio propuesto para
diferentes audiencias. Este captulo ayuda al lector a disear cada una de estas secciones para un
proyecto o plan.

Captulo 9: Mtodos cuantitativos

Los mtodos cuantitativos involucran los procesos de obtencin, anlisis, interpretacin y escritura
de los resultados de un estudio. Existen mtodos especficos tanto en la encuesta como en la
investigacin experimental que relacionan la identificacin de una muestra y poblacin, la
especificacin de la estrategia de indagacin, la obtencin y anlisis de datos, la presentacin de
resultados, la construccin de una interpretacin y la escritura de la investigacin de una manera
compatible con una encuesta o estudio experimental. En este captulo, el lector aprender los
procedimientos especficos para disear una encuesta o mtodos experimentales.

Captulo 10: Procedimientos cualitativos

Los enfoques cualitativos para obtener datos y analizar datos, y escribir el reporte difieren de los
enfoques cuantitativos tradicionales. Los procedimientos cualitativos dan cuenta del uso de
determinado muestreo, la obtencin de datos abiertos-cerrados, el anlisis de textos o imgenes, la
presentacin de la informacin en figuras y tablas y la interpretacin personal de los hallazgos. Este
captulo presenta las fases al disear procedimientos cualitativos e ilustra estos procedimientos con

6
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

ejemplos de la fenomenologa, teora fundamentada, etnografa, estudios de caso e investigacin


narrativa.

Captulo 11: Procedimientos en mtodos mixtos

Los procedimientos en mtodos mixtos utilizan aspectos tanto de los mtodos cuantitativos como de
los procedimientos cualitativos. Al disear estos procedimientos, los investigadores necesitan
expresar la intencin de investigar con mtodos mixtos y sus aplicaciones en las ciencias sociales y
las humanidades. Los procedimientos involucran la identificacin de estrategias de indagacin de
los mtodos de tipo mixto, los enfoques de obtencin y anlisis de datos, el rol del investigador y la
estructura general que gua el estudio propuesto. Este captulo proporcionar al lector una visin
general de la investigacin con mtodos mixtos como se practica actualmente y mostrar las fases
consideradas al disear un procedimiento en mtodos mixtos para un estudio propuesto.

Disear un estudio es un proceso difcil que requiere tiempo. Este libro no har necesariamente ms
fcil el proceso, pero debe proporcionar habilidades especficas tiles en el proceso, el
conocimiento acerca de las fases involucradas en el proceso y una gua prctica para crear y escribir
investigacin profesional. Antes de exponer los pasos del proceso, recomiendo que quienes
desarrollen los proyectos piensen acerca de su enfoque para investigar, realicen una revisin de
literatura sobre sus tpicos, desarrollen un esbozo de los aspectos a incluir en su propuesta de
diseo, y anticipen consideraciones ticas potenciales que pueden presentarse en la investigacin.
La parte I presenta estos tpicos.

7
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

2. PROCEDIMIENTOS DE LA INVESTIGACIN CUALITATIVA

Creswell, J. W. (2003). Qualitative Procedures. In Research Design: Qualitative, Quantitative, and


Mixed Methods Approaches (2nd. ed.) (Chapter 10, pp. 179-207). Thousand Oaks,
California, U.S.A.: Sage Publications.

Captulo 10
Procedimientos de la investigacin cualitativa

Los procedimientos de la investigacin cualitativa se establecen en contraparte de los mtodos de


investigacin cuantitativa. La investigacin cualitativa se vale de diferentes supuestos del
conocimiento, estrategias de indagacin y mtodos de obtencin y anlisis de datos. Aunque los
procesos son similares, los procedimientos cualitativos cuentan con datos de informacin escrita y
de imgenes, tienen pasos particulares en el anlisis de estos datos y recurren a diversas estrategias
de indagacin.
De hecho, las estrategias de indagacin seleccionadas en un proyecto de investigacin
cualitativa, tendrn una fuerte influencia en los procedimientos. stos ltimos, aun sin contemplar
todava las posibles estrategias, nunca sern uniformes. Revisando el panorama de la investigacin
cualitativa, ste nos muestra una serie de perspectivas que van desde el pensamiento posmoderno
(Denzin & Lincoln, 2000), perspectivas ideolgicas (Lather, 1991) o posturas filosficas
(Schwandt, 2000), hasta lineamientos de procesamiento sistemtico (Creswell, 1998; Strauss &
Corbin, 1998). Todas las perspectivas rivalizan por ubicarse como ncleo de este modelo, que se
sigue desarrollando y extendiendo, llamado investigacin cualitativa.
Este captulo tratar de ubicar un punto medio que proporcione procedimientos generales y
utilice ejemplos de manera amplia para ilustrar las variaciones en las estrategias. Esta revisin
aprovecha las ideas de diversos autores acerca del diseo de un proyecto cualitativo (e.g., revisar
Berg, 2001; Marshall & Rossman, 1999; Maxwell, 1996; Rossman & Rallis, 1998). Los temas en la
seccin de procedimientos de un proyecto son: caractersticas de la investigacin cualitativa,
estrategia de indagacin, el papel del investigador, las fases en la obtencin y anlisis de datos, las
estrategias de validacin, la precisin de los resultados y la estructura del informe. La tabla 10.1
muestra un listado de cuestionamientos para el diseo de los procedimientos cualitativos.

8
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Tabla 10.1 Listado de preguntas para el diseo de procedimientos para la investigacin


cualitativa
Estn mencionadas las caractersticas bsicas de los estudios cualitativos?
Est mencionada la estrategia especfica de indagacin que se usar?, estn
mencionados los antecedentes, o la definicin, y las posibles aplicaciones de la
estrategia?
Podr tener el lector un panorama claro del rol del investigador en el estudio
(experiencias pasadas, conexiones personales al sitio y las personas objetos de la
investigacin, pasos para acceder a estos sitios y cuestiones ticas delicadas?
Est identificada una estrategia de muestreo de sitios e individuos?
Estn mencionadas las formas especficas de obtencin de datos y proporcionada
una base para su utilizacin?
Estn mencionados los procedimientos de registro de informacin (como protocolos)
durante el proceso de obtencin de datos?
Estn identificados los pasos para el anlisis de datos?
Existe evidencia de que el investigador ha organizado los datos para su anlisis?
El investigador ha revisado los datos de una manera general para obtener sentido
global del cmulo de informacin?
Se ha implementado la codificacin de datos?
Se ha desarrollado la codificacin de datos para armar una descripcin o identificar
temas?
Estn interrelacionados los temas para mostrar un alto grado de anlisis y
abstraccin?
Estn mencionadas las formas en que los datos sern representados como tablas,
grficos y figuras-?
Han sido especificadas las bases para la interpretacin de datos (experiencias
personales, la literatura sobre el tema, preguntas, agenda de actividades)?
El investigador ha mencionado los resultados del estudio? (Se ha desarrollado una
teora? Se ha provisto un panorama complejo de temas?)
Se han citado mltiples estrategias para la validacin de resultados?

Caractersticas de la investigacin cualitativa


Por muchos aos, el autor de un proyecto tena que discutir las caractersticas de la investigacin
adems de convencer al profesorado y a las audiencias de la legitimidad de dichas caractersticas.
Actualmente, parece que hay cierto consenso sobre lo que constituye la investigacin cualitativa y
tal vez esta discusin ya no es necesaria (Flinders & Mills [1993], podran no estar de acuerdo en
este aspecto). As, mis sugerencias sobre esta seccin de un proyecto son:
Revisar las necesidades de los receptores potenciales de la propuesta. Decidir si los receptores
tienen suficiente conocimiento acerca de las caractersticas de la investigacin cualitativa para
ver si esta seccin realmente es necesaria.

9
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Si hay alguna duda acerca del conocimiento de los receptores, presentar las caractersticas
bsicas de la investigacin cualitativa, con la posibilidad y propuesta de discutir un artculo
publicado de una investigacin (o un estudio) para usarlo como ejemplo e ilustrar las
caractersticas.
Se podran enumerar diversos listados de caractersticas (e.g., Bogdan &Biklen, 1992; Eisner,
1991; Marshal & Rossman, 1999), pero en este caso se han preferido las caractersticas
sugeridas por Rossman y Rallis (1998) porque logran conjuntar las perspectivas tradicionales y
las ms recientes, vindicatorias, participativas y auto-reflexivas perspectivas de la investigacin
cualitativa. Basadas en las ideas de Rossman y Rallis (1998) se recomiendan las siguientes
caractersticas:
La investigacin cualitativa se presenta en un escenario natural. El investigador a
menudo va a la ubicacin del participante para desde ah realizar la investigacin, esto
permite al investigador abordar un nivel detallado sobre el participante o el escenario y
as poder estar profundamente involucrado en las experiencias reales de los
participantes.
La investigacin cualitativa utiliza mltiples mtodos que son interactivos y
humansticos. Los mtodos de obtencin de datos son de maduracin y de manera
gradual van involucrando de forma ms activa en la investigacin a los participantes y a
su propia sensibilidad. Los investigadores buscan que los participantes se comprometan
en la obtencin de datos y tratan de entablar acuerdos y obtener su credibilidad; no
alteran el escenario ms de lo necesario para los trminos de la investigacin. Adems,
los actuales mtodos de obtencin de datos, basados tradicionalmente en observaciones,
entrevistas y documentos de apertura-cierre, ahora incluyen una amplia variedad de
materiales como sonidos, correos electrnicos, lbumes de recortes, y otras formas
emergentes (ver el apartado de obtencin de datos ms adelante en este mismo
captulo). La obtencin de datos involucra datos de registros escritos y de imgenes (o
fotografas).
La investigacin cualitativa es emergente ms que estrechamente prefigurada. Diversos
aspectos surgen a la hora de realizar una investigacin cualitativa, las preguntas de
investigacin pueden cambiar o ser refinadas segn el investigador vaya clarificndose
qu preguntar y a quin preguntarle. El proceso de obtencin de datos puede cambiar
as como las puertas se van abriendo y cerrando para este proceso, y el investigador va
reconociendo los mejores lugares en los cuales se puede encontrar mayor aprendizaje
sobre el principal fenmeno de inters. La teora o la configuracin general de
comprensin surgir tal y como sta inicie estableciendo los cdigos iniciales,
diseados dentro de temas amplios e incorporados en una teora en proceso o una
interpretacin abierta. Estos aspectos de un modelo de investigacin en desarrollo
hacen difcil prefigurar una investigacin cualitativa estrecha a la propuesta o al estado
inicial de la investigacin.
La investigacin cualitativa es bsicamente interpretativa. Esto significa que el
investigador hace una interpretacin de los datos que incluye el diseo de una
descripcin de un individuo (participante) o un escenario, analizando los datos por
temas o categoras, y finalmente, emitiendo desde su postura particular y terica, una
interpretacin o esbozo de conclusiones, estableciendo los aprendizajes adquiridos y
ofreciendo ms preguntas a ser posteriormente contestadas (Wolcott, 1994). Esto
tambin significa que el investigador filtrar los datos a travs de su visin personal
situada en un particular momento sociopoltico e histrico. Nadie puede eludir la
interpretacin personal que acarrea el anlisis de datos cualitativos.
El investigador cualitativo observa los fenmenos sociales de una manera holstica.
Esto explica el porqu la investigacin cualitativa aparece como una visin amplia,

10
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

panormica, en lugar de como un microanlisis. Entre ms complejo, interactivo y


documentado el informe de investigacin, mejor podr ser el estudio cualitativo. Los
modelos visuales de las muchas facetas del proceso o del fenmeno central, ayudarn a
construir este anlisis holstico (ver, para ejemplo, Creswell & Brown, 1992).
De forma sistemtica. el investigador cualitativo se ve reflejado en quien est
involucrado en la investigacin, es sensible a su biografa y a cmo sta va dando
forma al estudio. Esta introspeccin y conocimiento de prejuicios, valores e intereses (o
reflexin) tipifica actualmente la investigacin cualitativa. El yo-personal se vuelve
inseparable del yo-investigador. Esto conlleva tambin honestidad y apertura para la
investigacin, entendiendo que toda investigacin esta cargada de valores (Mertens,
2003). Dentro de este procedimiento, la exposicin sobre la reflexin personal surgir
en la seccin del rol del investigador (ver la discusin de este tema ms adelante en
este mismo captulo), en el eplogo (ver Asmussen & Creswell, 1995) o inmerso a lo
largo de la propuesta o del estudio.
El investigador cualitativo usa razonamiento complejo multifactico, reiterativo y
simultneo. Aunque el razonamiento es ampliamente inductivo, los procesos inductivos
y deductivos estn integrados en este tipo de investigacin. El proceso de juicio
tambin es reiterativo, con constante ida y vuelta de los datos recolectados y analizados
a la reformulacin del problema. Adems de lo anterior, continan las actividades
simultneas de obtencin, anlisis de datos y redaccin.
El investigador cualitativo adopta y usa una o ms estrategias de indagacin como gua
para los procedimientos de su estudio cualitativo. Para nuevos investigadores es
suficiente usar slo una estrategia y buscar en libros de procedimientos para guiarse en
cmo disear una propuesta y conducir los procedimientos de la estrategia.

Estrategias de indagacin
Ms all de estas caractersticas generales hay ms estrategias especficas de indagacin. Estas
estrategias se focalizan en la obtencin, anlisis y redaccin de datos, pero ellas provienen de otras
disciplinas y van fluyendo por todo el proceso de investigacin (e.g., tipos de problemas,
controversias ticas de importancia) (Creswell, 1998). Existen muchas estrategias, tal como los 28
enfoques identificados por Tesch (1990), los 19 tipos en el rbol de Wolcott (2001), y las 5
tradiciones de indagacin de Creswell (1998). Como fue expuesto en el captulo 1, se recomienda
que los investigadores cualitativos escojan entre las cinco posibilidades que incluyen la narrativa, la
fenomenolgica, la etnogrfica, el estudio de caso y la teora fundamental. Sin contar con la base
de autoridad para imponerlas, se ha visto que stas se han usado de manera frecuente en la
actualidad y representan una focalizacin que abarca desde lo ms estrecho hasta lo general. Por
ejemplo, los investigadores podran estudiar individuos (narrativa, fenomenolgica); explorar
procesos, actividades o sucesos (estudio de caso, teora fundamental); o aprender acerca de la
amplia conducta de contacto de cultura de individuos o grupos (etnogrfica).
En la redaccin de los procedimientos para una propuesta cualitativa, son recomendadas las
tareas listadas a continuacin:
Identificar la estrategia especfica de indagacin que ser usada.
Proporcionar algunos antecedentes sobre la estrategia, como: la disciplina en que se
origina, sus aplicaciones y una breve definicin de sta (ver Captulo 1 para ver cmo se
procedi con las cinco estrategias de indagacin propuestas).
Discutir por qu esta es una estrategia apropiada para usarse en el estudio propuesto.
Identificar cmo el uso de la estrategia ir construyendo los tipos de preguntas (ver Morse,
1994, para preguntas que se relacionan con las estrategias), la forma de obtencin de datos,
los pasos para el anlisis de datos y la redaccin final.

11
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

El rol del investigador


Como se mencion en el listado de caractersticas, la investigacin cualitativa es interpretativa, con
el investigador generalmente envuelto en una intensa y prolongada experiencia junto a los
participantes. Esto lleva a una serie de cuestiones estratgicas, ticas y personales dentro del
proceso de investigacin cualitativa (Locke et al., 2000). Con esto en mente, los investigadores
explcitamente aceptan sus prejuicios, valores e intereses personales acerca de los temas y los
procesos de sus investigaciones. Ganar acceso al lugar de investigacin y los problemas ticos que
podran surgir son tambin elementos del rol del investigador.
Incluir informacin acerca de pasadas experiencias que provean antecedentes a travs de
los cuales los lectores puedan entender mejor el tema, el escenario o los participantes.
Comentar sobre las conexiones entre el investigador, los participantes y los sitios de
investigacin. La investigacin de patio trasero (Glesne & Pshkin, 1992) involucra el
estudio de la propia organizacin del investigador, o de amigos, o del escenario inmediato
de su trabajo. Esto a menudo conduce a compromisos en la habilidad del investigador para
revelar informacin y provoca que surjan fuertes dificultades. Aunque la obtencin de
datos pueda ser fcil y conveniente, son clsicos los problemas de reporte de datos que son
parciales, incompletos o transigentes. Si estudiar el patio trasero es indispensable, se
deben emplear mltiples estrategias de validacin (como se discutir ms adelante) para
crear confianza de parte del lector hacia la validez de los resultados.
Indicar los pasos que se tomaron para obtener permiso del Institutional Review Board (ver
captulo 1) para proteger los derechos de los individuos participantes. Incluir, como
apndice, la carta de aprobacin de la IRB y discutir el proceso que se experiment en la
obtencin del permiso.
Discutir los pasos que fueron tomados para ganar acceso al escenario y para obtener
permiso para estudiar a los informantes o a la situacin (Marshall & Rossman, 1999). Es
importante obtener acceso para investigar o a los archivos buscando la aprobacin del
personal de vigilancia. Un resumen de la propuesta podra necesitar ser diseado para
someterse a la revisin por parte de algn personal de vigilancia. Bogdan y Biklen
(1992) realizan algunas sugerencias que podran dirigirse como una propuesta:
Por qu fue elegido ese sitio para el estudio?
Qu actividades podran llevarse a cabo en ese sitio durante el desarrollo de la
investigacin?
La investigacin podra alterar el orden regular del sitio de investigacin?
Cmo sern reportados los resultados?
Qu podr obtener el personal de vigilancia de esta investigacin?
Comentar acerca de las disputas ticas que puedan surgir (ver captulo 1 de este libro y
Berg, 2001). Para cada disputa que surja, discutir cmo podra manejarla el investigador.
Por ejemplo, cuando se estudia un tema complicado, es necesario cambiar los nombres de
las personas, lugares y actividades; en esta situacin, el proceso para cambiar informacin
requerir su exposicin en la propuesta.

Procedimientos para la obtencin de datos


Las observaciones acerca del rol del investigador establecieron el escenario para la discusin de los
factores inherentes a la obtencin de datos. Los pasos para la obtencin de datos incluyen el
establecimiento de lmites para el estudio, obtencin de informacin por medio de observaciones y
entrevistas desestructuradas (o semi-estructuradas), documentos y materiales visuales, as como
estableciendo un protocolo para el registro de informacin.

Identificar los sitios o individuos seleccionados de manera intencionada para el estudio


propuesto. La idea atrs de la investigacin cualitativa es que intencionadamente se

12
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

seleccionen participantes o sitios (o documentos o material visual) que sern la mejor


ayuda para que el investigador comprenda el problema y la pregunta de investigacin. Esto
implica que no necesariamente habr muestreo al azar o seleccin de un nmero grande de
participantes y sitios, como generalmente encontramos en la investigacin cuantitativa.
Una discusin acerca de los participantes y los sitios incluye cuatro aspectos identificados
por Miles y Huberman (1994): el escenario (donde la investigacin tendr lugar), los
actores (quienes sern observados o entrevistados), los eventos (qu hacen los actores
observados o entrevistados) y el proceso (la evolucin natural de los eventos emprendidos
por los actores dentro del escenario).
Adems, indicar el tipo o tipos de datos que sern recolectados. En muchos estudios
cualitativos los investigadores recolectan mltiples formas de datos y gastan un tiempo
considerable en el escenario natural reuniendo informacin. Los procedimientos de
obtencin en la investigacin cualitativa implican cuatro tipos bsicos, como se muestra en
la tabla 10.2.
1. Observaciones, en las cuales el investigador toma notas de campo sobre las conductas y
actividades de los individuos en el sitio de la investigacin. En estas notas de campo, el
investigador registra, en una forma desestructurada o semi-estructurada (usando algunas
preguntas prioritarias que el investigador desea que sean contestadas), las actividades
en el sitio de la investigacin. El observador puede tambin variar su forma de
participacin: desde la no-participacin hasta la completa participacin.
2. En entrevistas, el investigador conduce entrevistas cara a cara con los participantes,
entrevistas por telfono o entrevistas focalizadas en grupos de seis a ocho entrevistados
en cada grupo. Estas entrevistas consisten en pocas preguntas desestructuradas,
generalmente de apertura-cierre, que se proponen para extraer puntos de vista y
opiniones de los participantes.
3. Durante el proceso de investigacin, el investigador puede recolectar documentos. Estos
pueden ser documentos pblicos (e.g., peridicos, minutas de reuniones, reportes
oficiales) o documentos privados (e.g., escritos personales y diarios, cartas, correos
electrnicos).
4. Una categora final de los datos de ndole cualitativo consiste en material audiovisual.
Estos datos pueden tener forma de fotografas, objetos de arte, videocasetes o cualquier
grabacin de audio.
5. En una discusin sobre las formas de obtencin de datos, se debe ser especfico en
cuanto a los tipos, incluyendo argumentos sobre las ventajas y desventajas de cada uno
de los tipos de obtencin, como se discute en la tabla 10.2.

Tabla 10. 2 Tipos de obtencin de datos, opciones, ventajas y desventajas


Tipos de obtencin de Opciones dentro de los Ventajas del tipo de Desventajas del tipo de
datos tipos obtencin obtencin
Observaciones Participante total: el El investigador tiene El investigador
investigador oculta una experiencia de podra verse como
su rol primera mano con un intruso
Observador como los participantes Pudiera ser
participante: el rol de El investigador atestiguada
observador es puede hacer registro informacin
secundario al rol de de la informacin confidencial que el
participante segn sta se va investigador no
Observador total: el presentando podra utilizar

13
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Tabla 10. 2 Tipos de obtencin de datos, opciones, ventajas y desventajas


Tipos de obtencin de Opciones dentro de los Ventajas del tipo de Desventajas del tipo de
datos tipos obtencin obtencin
investigador observa Aspectos El investigador
sin participar excepcionales podra no tener
pueden irse notando buena tcnica para la
durante la observacin y
observacin atencin
til para explorar Ciertos participantes
temas que pudieran (e.g., nios) podran
ser incmodos para tener problemas
discutir con los particulares con el
participantes aumento de
compenetracin
Entrevistas Cara a cara: uno con til cuando el Provee informacin
uno, entrevista en participante no puede indirecta filtrada a
persona ser observado travs de las visiones
Telefnica: el directamente de entrevistado/
investigador Los participantes entrevistador
entrevista por pueden proveer un Provee informacin
telfono historial en un lugar
Grupal: el El investigador designado ms que
investigador obtiene control en un escenario
entrevista a un grupo sobre la lnea de los natural
de participantes cuestionamientos La presencia del
investigador podra
provocar respuestas
prejuiciosas
La gente no es igual,
clara, ni perceptiva
Documentos Documentos Imposibilita al Puede protegerse la
pblicos como investigador para informacin no
minutas de reuniones obtener los usos y disponible para el
y peridicos modos del habla del pblico o de acceso
Documentos participante privado.
privados como Puede estar Requiere que el
diarios, agendas y disponible al tiempo investigador realice
cartas conveniente para el una bsqueda
Discusiones por investigador una externa en esfuerzo
correo electrnico fuente discreta de de localizar
informacin documentos
Como evidencia Requiere la
escrita, sta ahorra al trascripcin o el
investigador el escaneo en equipo de
tiempo y esfuerzo de cmputo
la trascripcin Los materiales
pueden estar
incompletos
Los documentos
podras no ser

14
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Tabla 10. 2 Tipos de obtencin de datos, opciones, ventajas y desventajas


Tipos de obtencin de Opciones dentro de los Ventajas del tipo de Desventajas del tipo de
datos tipos obtencin obtencin
autnticos o exactos
Materiales Fotografas Puede ser una forma Podra ser difcil de
audiovisuales Videocasetes discreta de obtencin interpretar
Objetos de arte de datos Podra no ser
Software informtico Ofrece la accesible pblica o
Pelculas oportunidad para los privadamente
participantes de La presencia de un
directamente observador (e.g.,
compartir su fotgrafo) podra
realidad interrumpir y afectar
Creativo en cuanto a las respuestas
que captura la
atencin visual
Nota: Esta tabla incluye informacin tomada de Merriam (1998), Bogdan and Biklen (1992) y
Creswell (2002).

Incluir tipos de obtencin de datos que vayan ms all de las observaciones y entrevistas
tpicas. Estas formas inusuales crean inters en el lector hacia la propuesta y pueden
capturar informacin muy til que con las observaciones y las entrevistas podra perderse.
Para ejemplo analizar el compendio de tipos de datos en la tabla 10.3 que puede ser usado
para ampliar la imaginacin acerca de las posibilidades, as puede ser con la obtencin de
sonidos o sabores, o usando tems de acercamiento emotivo para evocar comentarios
durante una entrevista.

Procedimientos de registro de datos


Antes de acceder al campo, los investigadores cualitativos planean sus acercamientos al registro de
los datos. La propuesta debe identificar qu datos registrar el investigador y la manera en que stos
sern registrados.
Usar un protocolo de observacin para el registro de los datos. Los investigadores a
menudo se lan en mltiples observaciones durante el desarrollo de un estudio cualitativo y
usan un protocolo o forma para el registro de informacin. Este protocolo de observacin
puede ser una sola pgina con una lnea horizontal a la mitad para separar las notas
descriptivas (descripcin de los participantes, reconstruccin del dilogo, descripcin
fsica del escenario, relacin de los sucesos principales o las actividades) de las notas
reflexivas (pensamientos de investigador

15
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Tabla 10.3 Listado de enfoques de la obtencin de datos en investigacin cualitativa


Reunin de notas de observacin conduciendo la observacin como participante
Reunin de notas de observacin conduciendo la observacin como observador
Conduccin de una entrevista desestructurada, de apertura-cierre y con toma de notas
durante la misma
Se lleva un diario durante la investigacin
Se tiene a un participante llevando un diario durante la investigacin
Escaneo de informes de los peridicos
Obtencin de cartas personales de los participantes
Anlisis de documentos pblicos (e.g., memorndums oficiales, minutas, registros,
material archivado)
Anlisis de biografas y autobiografas
Se cuenta con participantes que escriben su autobiografa
El investigador puede escribir su autobiografa
Se cuenta con participantes que toman fotografas o grabaciones en video (i.e.,
evocacin fotogrfica)
Examen de evidencias de rastros fsicos (e.g., huellas en la nieve)
Grabacin en video de situaciones sociales o grupales/individuales
Anlisis de fotografas y grabaciones en video
Obtencin de sonidos (e.g., sonidos musicales, risa de un nio, el claxon de los autos)
Obtencin de correos electrnicos o mensajes electrnicos
Examen de posesiones u objetos rituales personales para evocar recuerdos durante
una entrevista
Obtencin de aromas, sabores o sensaciones del tacto

NOTA: Adaptado de Creswell (1998) y Creswell (2002).

como especulaciones, sentimientos, problemas, ideas, presentimientos, impresiones y


prejuicios) (Bogdan & Biklen, 1992, p. 121). Tambin debe estar escrita la informacin
demogrfica acerca del tiempo, lugar y fecha del escenario donde la observacin tiene
lugar.
Usar un protocolo de entrevista para registrar informacin durante una entrevista del tipo
cualitativo. Este protocolo incluye los siguientes componentes: encabezado, instrucciones
para el entrevistador (palabras iniciales), las preguntas de investigacin claves, formas de
ir siguiendo las preguntas claves, mensajes de transicin para los entrevistadores, espacio
para el registro de comentarios del entrevistador y espacio en el cual el investigador
registre notas reflexivas.
Los investigadores registran investigacin de las entrevistas usando notas manuscritas,
grabacin en casetes o en video. Durante la entrevista, el investigador debe tomar notas en

16
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

prevencin de que el equipo de registro falle. Es importante anticipar esto en la planeacin,


sea que se use o no la trascripcin de estas notas.
El registro de documentos y materiales visuales puede estar basado en la estructura que el
investigador usa para tomar notas. Generalmente, las notas reflejan informacin acerca del
documento o de otro material, tanto como las ideas clave en los documentos. Para los
documentos es de mucha ayuda notar si la informacin representa material primario (i.e.,
informacin directa de las personas o la situacin en que se basa el estudio) o material
secundario (i.e., informacin de segunda mano, escrita por otros, sobre las personas o la
situacin).

Anlisis de datos e interpretacin


La discusin del plan para el anlisis de datos podra tener diversos componentes. El proceso de
anlisis de datos implica que los datos cobren sentido. Esto abarca preparar los datos para su
anlisis, conducir diferentes tipos de anlisis, movindose cada vez ms profundo dentro de la
comprensin de los datos, la representacin de stos y la interpretacin del significado amplio de
los mismos. Diversos procesos genricos podran ser establecidos en la propuesta que transmita un
sentido global de las actividades de anlisis de datos, tal y como se muestra en el siguiente
panorama desde la propia perspectiva del autor de este texto y la de Rossman y Rallis (1998):
Es un proceso en desarrollo que involucra reflexin continua acerca de los datos, respuesta
a cuestionamientos analticos y la toma de apuntes a travs del estudio. Esto no est
formalmente separado de las otras actividades en el proceso, tal como la misma obtencin
de datos o la formulacin de preguntas de investigacin.
Incluye el uso de datos de apertura-cierre, en su mayor parte. Esto requiere que se
respondan preguntas generales y el diseo de un anlisis de la informacin suministrada
por los participantes.
Los investigadores necesitan adaptar el anlisis de datos ms all de los acercamientos
genricos para los tipos especficos de estrategias de investigacin cualitativa (ver adems
Creswell, 1998). La teora fundamental, por ejemplo, tiene pasos sistemticos (Strauss &
Corbin, 1990, 1998). Estos implican generar categoras de informacin (codificacin
abierta), seleccionando una de las categoras y colocndola en un modelo terico
(codificacin axial), y explicando, despus, una relacin de las interconexiones de estas
categoras (codificacin selectiva). El estudio de caso y la investigacin etnogrfica
implican una descripcin detallada del escenario o de los individuos, seguida del anlisis
de los datos por temas o caractersticas (ver Stake, 1995; Wolcott, 1994). La investigacin
fenomenolgica utiliza el anlisis de declaraciones significativas, la generacin de
unidades de significado y el desarrollo de una descripcin esencial (Moustakas, 1994).
La investigacin narrativa emplea la restauracin de las historias de los participantes
usando mecanismos estructurales tales como trama, escenario, acciones, clmax y
desenlace (Clandinin & Connelly, 2000). Como lo ilustran los ejemplos, los procesos y los
trminos difieren de una estrategia analtica a otra.

A pesar de estas diferencias analticas que dependen del diseo utilizado, los investigadores
cualitativos a menudo transmiten un proceso general de anlisis de datos dentro de una propuesta.
Una situacin ideal sera mezclar los pasos generales con los pasos especficos del diseo de la
investigacin. Los pasos generales implican los siguientes:

Paso 1: Organizar y preparar los datos para el anlisis. Esto abarca trascripcin de entrevistas y
de notas de campo, escaneo de material o clasificacin y organizacin de los datos en
diferentes tipos segn las fuentes de informacin.
Paso 2: Lectura a travs de todos los datos. Un primer paso general es comprender un
sentido general de la informacin y reflexionar sobre el significado global. Qu ideas en general

17
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

est diciendo el participante? Cul es el tono de las ideas? Cul es la impresin general de la
complejidad global, credibilidad y uso de la informacin? Algunas veces los investigadores escriben
notas en los mrgenes o comienzan a registrar ideas generales acerca de los datos en esta parte de la
investigacin.
Paso 3: Empezar el anlisis detallado con un proceso de codificacin. La codificacin es la
organizacin del material en piezas antes de otorgarle significado a esas piezas
(Rossman & Rallis, 1998, p. 171). Esto implica tomar los datos de texto o imgenes,
cortando las oraciones (o prrafos) o imgenes en categoras, e identificar estas
categoras con un trmino, la mayora de las veces es un trmino basado en el
lenguaje usado por el participante (llamado un trmino in vivo).

Antes de llegar al paso 4, se deben considerar algunos comentarios que proporcionen gua
detallada sobre el proceso de codificacin. Tesch (1990, pp. 142-145) seala un anlisis til del
proceso en ocho pasos:
1. Obtener un sentido del todo. Leer la totalidad de la trascripciones cuidadosamente. Quiz
apuntando algunas ideas as como vayan surgiendo.
2. Escoger un documento (i.e., una entrevista) el ms interesante, el ms corto, el primero
encima del montn. Ir a travs de l preguntndose De qu se trata esto?. No pensar
acerca de la sustancia de la informacin, sino de su significado subyacente. Escribir algunas
ideas en el margen.
3. Cuando se haya completado esta tarea para los diversos informantes, hacer una lista de
todos los temas. Agrupar los temas similares y formar stos en columnas que debern ser
ordenados como temas mayores, temas nicos o perifricos.
4. Tomar entonces esta lista y regresar a los datos. Abreviar los temas a cdigos y escribir los
cdigos a un lado de los segmentos correspondientes del texto. Intentar este esquema
organizativo preliminar para revisar si emergen nuevas categoras o cdigos.
5. Encontrar las palabras ms descriptivas para los temas y volverlos categoras. Buscar las
formas de reducir la lista de categoras, agrupando temas que se relacionen con otros.
Podran trazarse lneas entre las categoras para hacer evidentes las interrelaciones.
6. Tomar una decisin final sobre la abreviacin de cada categora y alfabetizar estos cdigos.
7. Congregar el material de datos perteneciente a cada categora en un solo sitio y realizar un
anlisis preliminar.
8. Si es necesario, re-codificar los datos existentes.
Estos ocho pasos comprometen al investigador a un proceso sistemtico de anlisis de
datos. Existen variaciones en este proceso. Por ejemplo, algunos investigadores lo han encontrado
til para codificar en diferentes categoras en transcripciones o segmentos de texto y colocarlos en
tarjetas de notas.
Se sugiere a los investigadores analizar los datos a partir del material que pueda producir
cdigos y dirijan los temas segn los lectores esperan ubicarlos, cdigos que sean sorpresivos y
cdigos que sealen una perspectiva terica ms amplia en la investigacin. Bogdan y Biklen
(1992, pp. 166-172) sealan un listado particular de posibles tipos de cdigos:
Cdigos de escenario y contexto
Perspectivas mantenidas por los sujetos
Maneras de pensar de los sujetos sobre la gente y los objetos
Cdigos de procesos
Cdigos de actividades
Cdigos de estrategias
Cdigos de relaciones y estructura social
Esquemas de codificacin preasignada

18
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Un apunte ms acerca de la codificacin: el proceso puede ser mejorado con el uso de


programas de software cualitativos. Estos programas tienen distribucin amplia (ver
www.sagepub.com para productos de software) y son tiles cuando la base de datos es grande (e.g.,
ms de 500 pginas de trascripcin) y cuando el investigador desea localizar rpidamente citas
tiles y mltiples perspectivas en una categora o tema. Como cualquier programa de software, los
programas de software para investigacin cualitativa requieren tiempo y habilidad para aprender a
emplearlos efectivamente, aunque los manuales para el aprendizaje tienen tambin distribucin
amplia (e.g., Weitzman & Miles, 1995).

Paso 4: Usar el proceso de codificacin para generar una descripcin del escenario o las
personas as como para las categoras o temas para el anlisis. La descripcin involucra una
rendicin detallada de informacin acerca de las personas, lugares o eventos en un escenario. Los
investigadores pueden crear cdigos para esta descripcin. Este anlisis es til en el diseo de
descripciones detalladas para estudios de caso, proyectos de investigaciones etnogrficas y
narrativas. Luego, usar la codificacin para crear un nmero pequeo de temas o categoras, quiz
de cinco a siete categoras para una investigacin. Estos temas son los nicos que aparecern como
resultados mayores en estudios cualitativos y son ubicados bajo encabezados separados en la
seccin de resultados de los estudios. Ellos debern desplegar mltiple perspectivas de los
individuos y tendrn el soporte de citas diversas y evidencia especfica.
Ms all de la identificacin de temas durante el proceso de codificacin,
los investigadores pueden hacer mucho con ellos para construir estratos adicionales de anlisis
complejo. Por ejemplo, los investigadores interconectan temas dentro de un argumento (como en el
modelo narrativo) o los desarrollan dentro de un modelo terico (como en la teora fundamental).
Los temas son analizados para caso individual y a travs de diferentes casos (como en los estudios
de caso) o formados dentro de una descripcin (como en la fenomenolgica). Los estudios
cualitativos sofisticados van ms all de la descripcin e identificacin del tema, y dentro de
conexiones temticas complejas.

Paso 5: Anticipe cmo la descripcin y los temas sern representados en el informe final de
la investigacin. La prctica ms habitual es utilizar un pasaje narrativo para transmitir los
resultados del anlisis. ste podra ser una exposicin que mencione una cronologa de los eventos,
la exposicin detallada de diversos temas (complementada con sub-temas, ilustraciones especficas,
mltiple perspectivas de los individuos y citas), o una exposicin con temas interconectados.
Muchos investigadores tambin utilizan apoyos visuales, figuras o tablas como anexos a la
discusin. Ellos presentan un modelo de proceso (como en la teora fundamental), anticipan un
panorama del sitio especfico de investigacin (como en la investigacin etnogrfica), o transmiten
informacin descriptiva sobre cada uno de los participantes en una tabla (como en los estudios de
caso o las investigaciones etnogrficas).

Paso 6: Un paso final en el anlisis de datos implica hacer una interpretacin o significacin
de los datos. Qu se aprendi de las lecciones captura la esencia de esta idea (Lincoln & Guba,
1985). Estas lecciones podran ser la interpretacin personal del investigador, reclinada en el
entendimiento individual que el investigador trae al estudio desde su propia cultura, historia y
experiencia. Esto podra tambin ser un significado derivado de una comparacin de los resultados
con la informacin recogida desde la literatura o teoras existentes. En este sentido, los autores
sugieren que los resultados confirman informacin pasada o divergen de ella. Esto tambin puede
sugerir nuevas preguntas que necesitan ser resueltas preguntas erigidas a travs de los datos y
anlisis que el investigador no previ con anticipacin en el estudio. Una manera en que los
investigadores pueden concluir un estudio, menciona Wolcott (1994), es emitir nuevos
cuestionamientos. El acercamiento con cuestionamientos es tambin utilizado en defensa y enfoque
participativo de la investigacin cualitativa. Ms all, cuando los investigadores usan una visin

19
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

terica, ellos pueden formular interpretaciones que invoquen agendas de accin hacia la reforma o
cambio. De esta manera, la interpretacin en la investigacin cualitativa puede tomar muchas
formas, ser adaptada segn diferentes tipos de diseos y ser flexible para transmitir significados
personales, basados en la investigacin, y de accin.

Validacin de la certeza de los resultados


Aunque la validacin de resultados se presenta a lo largo de cada uno de los pasos del
proceso de la investigacin, en la siguiente exposicin se hace una distincin de sta para resaltar su
importancia. Los diseadores de la propuesta necesitan dar a conocer los pasos que tomarn en sus
estudios para ir revisando la certeza y credibilidad de sus resultados.
La validacin no implica las mismas connotaciones que en la investigacin
cuantitativa, tampoco est cercana a la fiabilidad (examen a la estabilidad o consistencia de la
respuestas, como se discuti en el captulo 9) o uniformacin (la validacin externa para la
aplicacin de los resultados a nuevos escenarios, personas, muestras cualitativas, como tambin fue
discutido en el captulo 9). De una forma limitada, en la investigacin cualitativa se puede usar la
fiabilidad para verificar modelos consistentes del desarrollo del tema entre diversos investigadores
de un mismo equipo. Ellos pueden tambin uniformar algunas facetas del anlisis mltiple de casos
(Yin, 1989) con las de otros casos. Sin embargo, la fiabilidad y la uniformacin tienen una
importancia menor en la investigacin cualitativa.
La validacin, por otra parte, es vista como una fortaleza de la investigacin
cualitativa y es utilizada para determinar si los resultados son certeros desde el punto de vista del
investigador, el participante o los lectores de un informe de investigacin (Creswell & Miller,
2000). Abundan trminos en la literatura de investigacin cualitativa que hablan sobre esta idea,
trminos como: fidedignidad, autenticidad y credibilidad (Creswell & Miller, 2000), y es un
tema ampliamente debatido (Lincoln & Guba, 2000).
Una perspectiva sobre el procedimiento que se recomienda para las propuestas de
investigacin es identificar y discutir una o ms estrategias disponibles para verificar la validez de
los resultados. A continuacin se enumeran ocho estrategias bsicas, organizadas desde aquellas
ms frecuentemente usadas y fciles de implementar hasta aquellas que son ocasionalmente usadas
y difciles de implementar:
Triangular diferentes fuentes de informacin de datos, examinando evidencias de las
fuentes y usndolas para construir una justificacin coherente para los temas.
Usar verificacin de los miembros para determinar la validez de los resultados de la
investigacin, tomando el reporte final, las descripciones especficas o los temas para
regresarlos a los participantes y determinar si stos sienten que estn correctos.
Usar una rica y espesa descripcin para transmitir los resultados. Esto podr trasladar a los
lectores al mismo escenario y darle a la discusin un carcter de experiencias compartidas.
Clarificar los prejuicios que el investigador le acarrea al estudio. Esta auto-reflexin crea y
abre una redaccin honesta que pueda tener buen impacto en los lectores.
Presentar tambin informacin negativa o discrepante que vaya en contra de los temas. La
vida real est compuesta por diferentes perspectivas que no siempre coinciden, si se discute
la informacin contrapuesta entonces podr acrecentarse la credibilidad del informe para el
lector.
Gastar tiempo amplio en el campo. De esta forma, el investigador desarrolla un
entendimiento ms profundo del fenmeno de estudio y puede transmitir detalles acerca del
sitio y las personas que prestan credibilidad al informe.
Utilizar interrogatorio de colegas para mejorar la certeza del informe. Este proceso implica
localizar una persona del mismo campo y preparacin que revise y plantee
cuestionamientos acerca del estudio cualitativo, para que el informe pueda tener resonancia
con otras personas distintas al investigador.

20
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Acudir a un auditor externo para revisar el proyecto entero. Distinto a un colega


interrogador, el auditor es nuevo en la investigacin y el proyecto, y puede proporcionar
asesora a ste en el proceso de investigacin o en la conclusin del estudio. Su papel es
similar al del auditor fiscal y existen preguntas especficas que los auditores podran
contestar (Lincoln & Guba, 1985).

La redaccin de la investigacin cualitativa


Una planeacin para los procedimientos de la investigacin cualitativa debera concluir con
algunos comentarios sobre la redaccin que surgir a partir del anlisis de datos. Numerosas
variedades de narraciones existen y algunos ejemplos de publicaciones escolares pueden ilustrar
algunos modelos. En la planeacin para un estudio se deben considerar las sugerencias sobre
diversos puntos de la redaccin.
Primero, indicar el formato que ser usado en la redaccin. ste podra contener un
objetivo del informe, experiencias del campo de trabajo (Van Maanen, 1988), una cronologa, un
modelo del proceso, un historial extenso, un anlisis por casos o de entrecruce de casos, o una
descripcin fsica detallada (Creswell, 1998).
A un nivel especfico, las convenciones podran ser:
Variar el uso de citas cortas y largas insertas en el texto.
Transcribir las conversaciones en los diferentes estilos de lenguaje para reflejar la
sensibilidad cultural.
Presentar la informacin textual en forma tabular (e.g., matrices)
Usar el modo de hablar de los participantes
Insertar acotaciones con interpretaciones del autor
Utilizar mrgenes u otras indicaciones de formato para resaltar las citas de los
participantes
Usar el narrador en primera persona gramtica singular o plural para la redaccin
Usar metforas (ver, por ejemplo, Richardson, 1990, quien discute algunas de estas
formas)
Usar el enfoque de redaccin generalmente utilizado dentro de las estrategias de
investigacin cualitativa (e.g., descripcin en estudio de casos y etnogrficos, una historia
detallada en la investigacin narrativa). Tambin describir cmo el desenlace narrativo
ser comparado con las teoras y la literatura general en el tema. En muchos artculos de
investigacin cualitativa, los investigadores discuten la literatura al final del estudio (ver
la exposicin sobre esto en el captulo 2).

Ejemplo 10.1 Procedimientos para la investigacin cualitativa


El siguiente es un ejemplo de un procedimiento de investigacin cualitativa escrito como
parte de una propuesta doctoral (D. Miller, 1992). El proyecto de Miller fue un estudio etnogrfico
del primer ao de experiencia del director de una universidad, para un ciclo directivo de 4 aos.
Como se present en esta exposicin, se ir remitiendo a las secciones y los contenidos
correspondientes de este captulo y se destacarn en letra tipo negrita. Tambin, se ha mantenido el
uso que Miller hace del trmino Informante, aunque en la actualidad debe ser usado el trmino
ms apropiado: Participante.

El paradigma de la investigacin cualitativa


El paradigma de la investigacin cualitativa tiene sus races en la antropologa cultural y
la sociologa americana (Kirk & Miller, 1986). Este ha sido adoptado apenas recientemente por los

21
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

investigadores en educacin (Borg & Gall, 1989). La intencin de una investigacin cualitativa es
entender una situacin social particular, suceso, rol, grupo o interaccin (Locke, Spirduso &
Silverman, 1987). Este es, en su mayor parte, un proceso investigativo donde el investigador
gradualmente va tomando sentido de un fenmeno social por medio del contraste, comparacin,
rplica, catalogacin y clasificacin del objeto de estudio (Miles & Huberman). Marshall y
Rossman (1989) sugieren que este tipo de investigacin implica una inmersin en la vida cotidiana
del escenario escogido para el estudio; el investigador accede al mundo de los informantes y a
travs del desarrollo de la interaccin busca las perspectivas y los significados de los informantes.
(Estn mencionados los supuestos de la investigacin cualitativa.)
Los estudiosos afirman que la investigacin cualitativa puede ser distinguida de la
metodologa cualitativa por numerosas caractersticas particulares que son inherentes en el diseo.
La siguiente es una sntesis de suposiciones comnmente articuladas con respecto a las
caractersticas expuestas por varios investigadores:
1. La investigacin cualitativa ocurre en un escenario natural donde se presenta el
comportamiento humano y los eventos.
2. La investigacin cualitativa est basada en suposiciones que son muy diferentes de los
diseos cuantitativos. La teora o hiptesis no estn establecidas a priori.
3. El investigador es el instrumento bsico en la obtencin de datos ms que algn
mecanismo inanimado (Eisner, 1991; Frankel & Wallen, 1990; Lincoln & Guba, 1985;
Merriam, 1988).
4. Los datos que surgen de un estudio cualitativo son descriptivos. Esto es, los datos son
reportados en palabras (bsicamente las palabras de los participantes) o fotografas, ms
que en nmeros (Freankel & Wallen, 1990; Locke et al., 1987; Marshall & Rossman, 1989;
Merriam, 1988).
5. El punto de focalizacin de la investigacin cualitativa est en las percepciones y
experiencias de los participantes, y la manera en que crean un sentido en sus vidas
(Fraenkel & Wallen, 1990; Locke et al., 1987; Merriam, 1988). La intencin es, por lo
tanto, entender no una sino mltiples realidades (Lincoln & Guba, 1985).
6. La investigacin cualitativa se centra en el proceso que ocurre as como en el producto o
resultado. Los investigadores estn particularmente interesados en entender cmo es que
las cosas ocurren (Fraenkel & Wallen, 1990; Merriam, 1988).
7. La interpretacin ideogrfica es utilizada. En otras palabras, la atencin est puesta en
particulares de un caso y los datos son interpretados en relacin a stos, ms que en las
generalizaciones.
8. La investigacin cualitativa es un diseo emergente en sus propias consecuencias
negociadas. Los significados y las interpretaciones son negociadas con las fuentes
humanas de datos porque es la realidad de los sujetos la que los investigadores intentan
reconstruir (Lincoln & Guba, 1985; Merriam, 1988).
9. Esta tradicin de la investigacin cualitativa se fa en la utilizacin de conocimiento tcito
(conocimiento intuitivo y sensitivo) porque a menudo los matices de las mltiples
realidades pueden ser mejor apreciadas de esta forma (Lincoln & Guba, 1985); por lo
tanto, los datos no son cuantificables en el tradicional sentido de la palabra.
10. Objetividad y veracidad son crticos para ambas tradiciones de la investigacin. Sin
embargo, el criterio para juzgar un estudio cualitativo difiere de la investigacin
cuantitativa. En primer lugar y ante todo, los investigadores buscan credibilidad basada en
la coherencia, perspicacia y utilidad instrumental (Eisner, 1991); y honradez (Lincoln &
Guba, 1985) a travs de un proceso de verificacin ms que de medidas tradicionales de
validacin y confianza. (Estn mencionadas las caractersticas de la investigacin
cualitativa.)

22
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

El diseo de investigacin etnogrfica


Este estudio utilizar la tradicin de la investigacin etnogrfica. Emerge del campo de la
antropologa, primeramente de las contribuciones de Bronislaw Malinowski, Robert Park and Franz
Boas (Jacob, 1987; Kirk & Miller, 1986). La intencin de la investigacin etnogrfica es obtener
una imagen holstica del sujeto de estudio con nfasis en retratar las experiencias cotidianas de
individuos, observndolos y entrevistndolos a ellos mismos y a sus personas cercanas (Fraenkel &
Wallen, 1990). El estudio etnogrfico incluye entrevistas a fondo y observacin continua y gradual
del participante en una situacin (Jacob, 1987), con la intencin de capturar un panorama completo
de cmo las personas describen y estructuran su mundo (Fraenkel & Wallen, 1990). (El autor
utiliz el enfoque etnogrfico.)

El rol del investigador


Particularmente en la investigacin cualitativa, el rol del investigador como el principal instrumento
para la obtencin de datos exige la identificacin de los valores personales, suposiciones y
prejuicios al principio del estudio. La contribucin del investigador al marco de la investigacin
puede ser muy til y positiva en vez de en detrimento (Locke et al., 1987). Mis percepciones sobre
educacin superior y la direccin escolar han sido construidas a partir de mis propias experiencias.
Desde agosto de 1980 hasta mayo de 1990 serv como administrador escolar en escuelas privadas
con poblaciones de 600 a 5,000 estudiantes. Ms recientemente (1987-1990), fui decano (Dean for
Student Life) en una pequea escuela del medio oeste estadounidense. Como miembro del consejo
directivo, estuve involucrado en los niveles altos de administracin, en sus actividades y decisiones,
trabajando de manera cercana con el profesorado, oficiales del consejo, el director y el consejo del
fideicomiso. Adems de informar de manera directa al director sobre mis labores, trabaj junto a l
a lo largo de su primer ao en el puesto. Creo que este entendimiento del contexto y el rol que se
juega, aumenta mi conciencia, conocimiento y sensibilidad a muchos de los cambios, decisiones y
cuestiones a enfrentar como director en el primer ao de experiencia y me servir para el trabajo
con el informante en este estudio. Tengo conocimiento tanto de la estructura de educacin superior
como del rol del director escolar. Se deber prestar mucha atencin al trabajo del nuevo director en
los cambios iniciales, la construccin de relaciones, la toma de decisiones, su actitud de liderazgo y
su visin.
Debido a mi experiencia previa trabajando en forma cercana con un nuevo director escolar,
acarreo prejuicios a este estudio. Aunque cada esfuerzo se dirigir a asegurar la objetividad, estos
prejuicios podran formar la manera en que veo y entiendo los datos que recolecto y la forma en que
interpreto mis experiencias. Inici este estudio con la perspectiva de que la direccin escolar es una
posicin diferente y a menudo difcil. Aunque las expectativas son inmensas, me pregunto con
cunto poder el director tiene que iniciar los cambios y mostrar su liderazgo y visin. Veo el primer
ao como crtico, lleno de ajustes, frustraciones, sorpresas inesperadas y cambios. (El autor
reflexiona sobre su rol en el estudio.)

Limitando el estudio
Escenario
El estudio deber ser conducido en el campus de una universidad estatal en el medio-oeste. La
universidad est situada en una comunidad rural del medio-oeste. El alumnado de la escuela, 1,700
estudiantes, casi trplica en conjunto la poblacin del pueblo, 1,000 habitantes, cuando estn en
clases. La universidad concede los grados de asociado, licenciaturas y maestras en 51
especialidades.

Actores
El informante en el estudio es el nuevo director de la universidad estatal. El informante primario en
este estudio es l mismo; sin embargo, lo observar en el contexto de las reuniones del consejo

23
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

administrativo. El consejo directivo incluye tres vicepresidentes (Acadmico, Administrativo y


Escolar) y dos decanos (Posgrado y Educacin Continua).

Eventos
Usando la metodologa de investigacin etnogrfica, el foco de este estudio sern las experiencias
cotidianas, los hechos del nuevo director de la universidad, las percepciones y el significado
otorgado a esas experiencias a partir de la expresin del mismo informante. Esto incluye la
adaptacin a sucesos o informacin sorpresiva y la comprensin de eventos o cuestiones crticas
que surjan.

Procesos
Deber poner atencin principal al rol del nuevo director en los cambios iniciales, las relaciones
construidas, la toma de decisiones, las actitudes de liderazgo y su visin. (El autor mencion las
delimitaciones para la obtencin de datos.)

Consideraciones ticas
La mayora de los autores que discuten la investigacin cualitativa escriben sobre la importancia de
las consideraciones ticas (Locke et al., 1982; Marshall & Rossman, 1989; Merriam, 1988;
Spradley, 1980). En primer lugar y ante todo, el investigador tiene la obligacin de respetar los
derechos, necesidades, valores y deseos del (o de los) informante(s). Hasta cierto grado, la
investigacin cualitativa es siempre intromisin. La observacin del investigador invade la vida del
informante (Spradley, 1980) y frecuentemente es revelada informacin confidencial. Esto es de
particular preocupacin en este estudio donde la posicin del informante y de la institucin es
sumamente visible. Las siguientes medidas de seguridad deben tomarse para proteger los derechos
del informante: 1) Los propsitos de la investigacin debern ser presentados verbalmente y por
escrito para que sean claramente entendidos por el informante (incluyendo una descripcin de cmo
ser utilizada la informacin y los datos recabados); 2) Deber ser emitido y firmado por el
informante un permiso por escrito para proceder con el estudio segn fue aclarado; 3) Una forma de
exencin investigativa deber ser llenado con el Institutional Review Board (apndices B1 y B2); 4)
El informante ser notificado sobre todo el mecanismo y actividades de obtencin de datos; 5) Las
transcripciones textuales, las interpretaciones escritas y los reportes estarn disponibles para el
informante; 6) Los derechos, intereses y deseos del informante sern considerados en primer lugar
cuando se seleccionen las maneras en que se reportarn los datos; y 7) La decisin final con
respecto al anonimato del informante ser de este mismo. (El autor seala las cuestiones ticas y
la revisin del IRB).

Estrategias de obtencin de datos


Los datos sern recolectados de febrero a mayo de 1992, ste incluir entrevistas grabadas al
informante, de 45 minutos y con frecuencia mnima bimensual (las preguntas iniciales para la
entrevista estn en Apndice C), dos horas bimensuales de observaciones a las reuniones del
consejo administrativo, dos horas bimensuales de observaciones de las actividades diarias y un
anlisis bimensual del calendario del director y algunos documentos (minutas de reuniones,
memorndums y publicaciones). Adems, el informante est de acuerdo en registrar las impresiones
de sus experiencias, pensamientos y sentimientos en un diario grabado en casete (pautas para estas
reflexiones estn en el Apndice D). Dos entrevistas de seguimiento sern programadas para finales
de mayo de 1992 (ver el apndice E para el lmite de tiempo propuesto y el programa de
actividades). (El autor propone utilizar entrevistas cara a acara, participar como observador y
acceder a documentos privados.)
Para ayudarme en la fase de obtencin de datos utilizar un diario de campo,
proporcionando un recuento detallado de las formas en que planeo utilizar el tiempo cuando est en
el sitio de la investigacin, de igual forma lo har para la fase de trascripcin y anlisis (tambin

24
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

comparando lo planeado contra el registro de cmo realmente es utilizado el tiempo). Intento


registrar detalles relacionados a mis observaciones en una libreta de campo y llevar otro diario de
campo para escribir la crnica de mi propio pensamiento, sentimientos, experiencias y percepciones
a travs del proceso de investigacin. (El autor registra informacin descriptiva y reflexiva.)

Procedimientos para el anlisis de datos


Merriam (1988) y Marshal y Rossman (1989) afirman que la obtencin de datos y el anlisis de
stos deben ser procesos simultneos en la investigacin cualitativa. Schatzman y Strauss (1973)
demandan que el anlisis de datos cualitativos bsicamente ocasiona la clasificacin de objetos,
documentos y eventos, as como las propiedades que caracterizan a cada uno de stos. Tpicamente
por medio del proceso de anlisis de datos, los etngrafos ponen ndice o codifican los datos usados
en tantas categoras como sea posible (Jacob, 1987). Ellos buscan identificar y describir los patrones
y temas desde la perspectiva de los participantes, luego intentan entender y explicar estos patrones y
temas (Agar, 1980). Durante el anlisis de datos, stos deben estar organizados por categoras y de
manera cronolgica, revisados repetidamente y codificados tambin en forma continua. Una lista de
ideas principales que sobresalgan deber ser referido en una crnica (como sugiere Merriam, 1988).
Las entrevistas y los diarios del participante audio-grabados debern ser verbalmente trascritos. Las
notas de campo y las anotaciones al diario sern regularmente revisadas. (El autor describi los
pasos para el anlisis de datos.)
Adems, el proceso de anlisis de datos se ver favorecido con el uso del programa
informtico HyperQual para el anlisis de datos. Raymond Padilla (Universidad Estatal de Arizona)
diseo este programa en 1987 para su uso en la computadora Macintosh. HyperQual utiliza el
software HyperCard y facilita el registro de datos textuales y grficos ya que tiene designada
estantera especial para contener y organizar estos datos. Usando HyperQual el investigador puede
directamente acceder al campo de datos, incluyendo datos de entrevistas, observaciones, apuntes
del investigador e ilustraciones... (y) etiquetar (o codificar) toda o parte de la fuente de datos, as
estos apartados de datos podrn ser retirados y luego reensamblados en una nueva y esclarecedora
configuracin (Padilla, 1989, pp. 69-70). Los apartados significativos de datos podrn ser
identificados, recuperados, aislados, agrupados o reagrupados para el anlisis. Los nombres de las
categoras o las codificaciones podrn ser apuntadas inicialmente o en fecha posterior. Los cdigos
podrn ser agregados, cambiados borrados con el editor HyperQual y el texto podr ser buscado por
claves de categoras, temas, palabras o frases. (El autor menciona la propuesta del uso del
software informtico para el anlisis de datos.)

Verificacin
Para asegurar la validacin interna, las siguientes estrategias sern empleadas:
1. Triangulacin de datos. Los datos sern recolectados por medio de diversas fuentes,
incluyendo entrevistas, observaciones y anlisis de documentos;
2. Verificacin por parte de los miembros. El informante servir como verificador a lo largo
del proceso de anlisis. Un dilogo en proceso con respecto a mis interpretaciones de la
realidad del informante y sus significados asegurarn el valor de verdad de los datos;
3. Descripciones amplias y observaciones repetidas del sitio de investigacin. Observaciones
regulares y repetidas de fenmenos similares y escenarios se realizarn in situ en un periodo
de cuatro meses;
4. Evaluacin por interrogatorio. Un estudiante de doctorado, asistente de posgrado en el
Departamento de Sicologa Educacional fungir como evaluador por interrogatorio;
5. Estilos participativos de investigacin. El informante estar inmiscuido en la mayora de las
fases del estudio, desde el diseo del proyecto hasta la revisin de las interpretaciones y
conclusiones; y

25
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

6. Clarificacin de los prejuicios del investigador. Al comienzo de este estudio los prejuicios
del investigador sern expuestos por escrito en la propuesta de disertacin, bajo el
encabezado: El rol del investigador.
La estrategia bsica utilizada en este proyecto para asegurar la validacin externa ser el
suministro de descripciones ricas, amplias y detalladas para que cualquier interesado en su
reproduccin tenga un slido cuadro para la comparacin (Merriam, 1988). En este estudio sern
usadas tres tcnicas para asegurar la confiabilidad: primero, el investigador entregar un recuento
detallado de la focalizacin del estudio, el rol del investigador, la posicin del informante y las
bases para la seleccin, adems del contexto en el cual los datos sern reunidos (LeCompte &
Goetz, 1984); segundo, la triangulacin o los mltiples mtodos de obtencin y anlisis de datos
sern utilizados, lo cual fortalecer la confiabilidad al igual que la validacin interna (Merriam,
1988); finalmente, las estrategias para obtencin y anlisis de datos sern reportadas a detalle para
proveer un panorama claro y exacto de los mtodos usados en el estudio. Todas las fases de este
proyecto sern sujetas al escrutinio de un auditor externo experimentado en los mtodos de
investigacin cualitativa. (El autor identific estrategias de validacin a ser utilizadas en el
estudio.)

Reporte de resultados
Lofland (1974) sugiere que aunque las estrategias de obtencin y anlisis de datos son similares a
travs de los mtodos cualitativos, la manera en que se elaboran los reportes de resultados es
diversa. Miles y Huberman (1984) ubican la importancia de crear una exposicin de los datos y
sugieren que la redaccin del propio texto ha sido la forma ms frecuente para esta exposicin de
los datos de una investigacin cualitativa. Por tanto, los resultados sern presentados en una forma
descriptiva dentro de la narracin ms que como un reporte cientfico. La descripcin amplia ser el
vehculo para transmitir una imagen holstica de la experiencia de un nuevo director universitario.
El proyecto final ser una reconstruccin de las experiencias del informante y de los significados
que l mismo les confiere. Esto dar entrada a los lectores para experimentar, de forma vicaria, los
cambios que l pudo proponer o enfrentar y proveer una lente a travs de la cual los lectores
podrn atestiguar el mundo del sujeto de la investigacin. (Fueron mencionados los resultados del
estudio.)

Resumen
En este captulo se exploraron los pasos que se siguen para el desarrollo y escritura de un
procedimiento de investigacin cualitativa. Reconociendo las variantes que existen en los estudios
cualitativos, el captulo propone una revisin de las caractersticas generales de la investigacin
cualitativa para el caso en que los lectores no estuvieran familiarizados con este acercamiento a la
investigacin. Estas caractersticas son que la investigacin se da en el escenario natural, empleando
mltiples mtodos de obtencin de datos, es emergente ms que prefigurada, est basada en las
interpretaciones del investigador, est visualizada holsticamente, es reflexiva, utiliza razonamiento
inductivo y deductivo, y emplea una estrategia de investigacin. Las recomendaciones sugieren
mencionar una estrategia de investigacin como la de estudio de los individuos (narrativa,
fenomenolgica); la exploracin de los procesos, actividades y eventos (estudio de caso, teora
fundamental); o el anlisis de una conducta enmarcada en la mezcla de culturas de individuos o
grupos (etnogrfica). La eleccin de la estrategia necesita ser presentada y defendida; incluso, en la
propuesta es necesario ubicar el rol del investigador: experiencias pasadas, conexiones personales al
sitio de investigacin, pasos para ganar acceso y cuestiones ticas delicadas. La discusin sobre la
obtencin de datos debera incluir un enfoque firme para el muestreo y la forma en que los datos
sern recolectados (i.e., observaciones, entrevistas, documentos, materiales audiovisuales). Es muy
til indicar el tipo de protocolos para el registro de datos que ser usado. El anlisis de datos es un
proceso en desarrollo durante la investigacin, ste implica el anlisis de informacin del
participante, los investigadores generalmente emplean para el anlisis los pasos contenidos en una

26
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

estrategia especfica de investigacin. Instrucciones ms genricas incluyen la organizacin y


preparacin de los pasos, una lectura inicial de la informacin, codificacin de los datos, elaborando
desde los cdigos una descripcin y anlisis temtico, y la presentacin de los resultados en tablas,
grficos y figuras. Esto tambin implica la interpretacin de los datos a la luz de los aprendizajes
personales del mismo investigador, comparando los resultados con la literatura y teora sobre el
tema, cuestionamientos que van surgiendo en la marcha y/o progreso en una agenda para reformar.
La propuesta tambin tendra que contener una seccin con las expectativas de los posibles
resultados del estudio. Finalmente, un paso adicional importante en la planeacin de una propuesta
es mencionar las estrategias que sern utilizadas para validar la certeza de los resultados.

Bibliografa complementaria
Bogdan, R. C., & Biklen, S. K. (1992). Qualitative research for education: An introduction to
theory and methods. Boston: Allyn and Bacon.
Marshall, C., & Rossman, G. B. (1999). Designing qualitative research (3a. ed.). Thousand Oaks,
CA: Sage.
Tesch, R. (1990). Qualitative research: Analysis types and software tools. New York: Falmer.

27
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

3. INVESTIGACIN CUALITATIVA Y DISEO DE LA INVESTIGACIN.


SELECCIONANDO ENTRE CINCO TRADICIONES

Creswell, J. W. (1998). Qualitative Inquiry and Research Design. Choosing Five Traditions. Thousand Oaks,
USA: SAGE Publications.

INTRODUCCIN

La premisa bsica de este texto es que existen diferentes formas de tradiciones cualitativas y que el
diseo de la investigacin en cada una de ellas tiene caractersticas distintivas.

Propsito y razones de este libro

El intento es examinar cinco diferentes tradiciones de investigacin cualitativa: biografa,


fenomenologa, teora fundamentada, etnografa y estudio de caso. Adems se pretende comparar
estas tradiciones en seis fases del diseo de investigacin: perspectiva terica o filosfica; la
introduccin a un estudio, incluyendo la formulacin del objetivo y las preguntas de investigacin;
obtencin de datos; anlisis de datos; escritura del reporte; y estndares de calidad y verificacin.

Por tradicin de investigacin se entiende un planteamiento de investigacin cualitativa con una


historia distinta en una de las disciplinas, que ha originado libros, revistas y distintas metodologas
que la caracterizan. Estas tradiciones se conocen en otros libros como estrategias de investigacin
(Denzin & Lincoln, 1994) o variedades (Tesch, 1990).

Por diseo de investigacin se entiende el proceso completo de investigacin, de la


conceptualizacin de un problema a la escritura de la narrativa, no simplemente a los mtodos, tales
como la coleccin, anlisis y escritura del reporte.

Existen estudios cualitativos en los que no siempre se clarifica la tradicin que estn usando y sus
elementos principales. La investigacin cualitativa ha alcanzado el mismo punto en su desarrollo
que la investigacin cuantitativa haba alcanzado en 1964. En este ao Kerlinger escribi su tratado
famoso de diseos de investigacin, Foundations of Behavior Research. Estableciendo hoy un
paralelo a Kerlinger, se sugiere que tambin son necesarias la clarificacin y comparacin en la
investigacin cualitativa.

Actualmente no existe un libro (como el presente) que conduzca a la relacin de la tradicin y el


diseo de la investigacin.

Seleccin de las cinco tradiciones

Una de las clasificaciones ms populares de los estudios cualitativos es la proporcionada por Tesch
(1990), quien organiza 28 planteamientos en cuatro campos.

28
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Tabla 1. Tradiciones cualitativas mencionadas por autores


Autor Tradiciones Cualitativas Campo/Disciplin
a
Jacob (1987) Psicologa Ecolgica Educacin
Etnografa Holstica
Antropologa Cognitiva
Etnografa de la Comunicacin
Interaccionismo Simblico
Munhall y Oiler Fenomenologa Enfermera
(1986) Teora Fundamentada
Etnografa
Investigacin Histrica
Lancy (1993) Perspectivas Antropolgicas Educacin
Perspectivas Sociolgicas
Perspectivas Biolgicas
Estudios de Caso
Historias Personales
Estudios Cognitivos
Investigaciones Histricas
Strauss y Teora Fundamentada Sociologa,
Corbin (1990) Etnografa enfermera
Fenomenologa
Historias de Vida
Anlisis Conversacionales
Morse (1994) Fenomenologa Enfermera
Etnografa
Etnociencia
Teora Fundamentada
Moustakas Etnografa Psicologa
(1994) Teora Fundamentada
Hermenutica
Investigacin Fenomenolgica Emprica
Investigacin Heurstica
Fenomenologa Trascendental
Denzin y Estudios de Caso Ciencias
Lincoln (1994) Etnografa Sociales
Fenomenologa, Etnometodologa y Prcticas
Interpretativas
Teora Fundamentada
Biogrfica
Histrica
Investigacin Clnica
Miles y Planteamientos en el Anlisis Cualitativo de Datos: Ciencias
Huberman Interpretativismo Sociales
(1994) Antropologa Social
Investigacin Social Colaborativa
Slife y Williams Categoras de Mtodos Cualitativos Psicologa
(1995) Etnografa
Fenomenologa

29
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Estudios de Artefactos

Limitaciones

La intencin de enfocar cinco tradiciones no es minimizar la atencin a otros planteamientos que


valen la pena. Aqu se incluyen cinco porque representan diferentes tradiciones en las disciplinas,
han precisado procedimientos y han sido discutidas recientemente en libros cualitativos.

El centro de atencin se hace en los diseos o procedimientos de investigacin no en el terreno


filosfico (aunque este campo est ligado a los procedimientos).

El propsito es proporcionar un texto til para quienes producen investigacin cualitativa en forma
de artculos de revista, tesis o disertaciones doctorales.

2. DISEAR UN ESTUDIO CUALITATIVO

Existen elementos comunes que caracterizan a la investigacin cualitativa

Definicin de investigacin cualitativa

La investigacin cualitativa es un proceso indagatorio de comprensin basado


en las distintas tradiciones metodolgicas de indagacin que exploran un
problema social o humano. El investigador construye un cuadro holstico y
complejo, analiza palabras, reporta detalladamente los puntos de vista de los
informantes, y conduce el estudio en un escenario natural.

Tabla 2. Caractersticas de la investigacin cualitativa


Caractersticas Bogdan y Eisner Merriam
Biklen (1992) (1991) (1988)
Escenario natural (focalizado en el campo) como S S S
origen de los datos
Investigador como instrumento clave de S S --
obtencin de datos
Datos obtenidos como palabras o fotografas S -- S
Resultado como proceso ms que como S -- S
producto
Anlisis inductivo de datos, atencin a S S S
particulares
Centrado en las perspectivas de los S S S
participantes, su significado
Uso de lenguaje expresivo -- S --
Persuasin mediante la razn -- S --

Ragin (1987) caracteriza con precisin una diferencia clave cuando menciona que los
investigadores cuantitativos trabajan con pocas variables y muchos casos, mientras los
investigadores cualitativos confan en pocos casos con muchas variables. Se recomienda tomar
parte en un estudio cuantitativo antes de realizar un estudio cualitativo.

30
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Razones para realizar investigacin cualitativa

La investigacin cualitativa comparte la rigurosidad de la investigacin cuantitativa, y no debe ser


vista como un sustituto fcil de un estudio estadstico o cuantitativo. La investigacin cualitativa es
para el investigador que est dispuesto a:

Destinar tiempo considerable en el campo.


Comprometerse en el complejo proceso de anlisis que consume tiempo (la tarea ambiciosa
de clasificar entre grandes cantidades de datos y reducirlos a pocos temas o categoras).
Escribir largos pasajes, porque la evidencia debe ser sustancial y el escritor necesita mostrar
perspectivas mltiples.
Participar en una forma de investigacin que no tiene guas firmes o procedimientos
especficos y que evoluciona y cambia constantemente.

Caractersticas de un buen estudio cualitativo

Emplear procedimientos rigurosos en la coleccin de datos y pasar un tiempo apropiado en


el campo.
Enmarcar el estudio en los supuestos y caractersticas del planteamiento cualitativo.
Caractersticas como un diseo que evoluciona, la presentacin de realidades mltiples, el
investigador como un instrumento de coleccin de datos y centrarse en los puntos de vista
de los participantes.
Usar una tradicin de investigacin, que puede no ser pura. Para quienes se inician en la
investigacin cualitativa se recomienda situarse en una tradicin.
Empezar con una idea o problema simple, sin buscar relaciones causales ni comparaciones,
stas pueden emerger posteriormente.
Incluir los mtodos utilizados, un planteamiento riguroso a la coleccin de datos, anlisis de
datos y escritura del reporte.
Escribir persuasivamente, para que el lector experimente estar ah (verosimilitud).
Analizar datos utilizando mltiples niveles de abstraccin.
Escribir de manera clara, que logre involucrar al lector.

Formato para planear un estudio

No existe un formato, pero algunos autores sugieren tpicos generales para ser incluidos en un plan
escrito para un estudio cualitativo.

31
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Tabla 3. Formatos para la planeacin de un estudio cualitativo

Marshall y Rossman (1995) Creswell (1994) Maxwell (1996)


Introduccin Introduccin Resumen.
Problema y significancia Enunciado del problema. Introduccin.
(en la literatura Propsito del estudio. Contexto de la
relacionada). La gran pregunta y investigacin.
Tpico y preguntas de subpreguntas. Preguntas de
investigacin. Definiciones. investigacin.
Limitaciones del estudio. Delimitaciones y Mtodos de investigacin.
Diseo de investigacin limitaciones. Validez
Estrategia global y Significancia del estudio. Resultados preliminares.
razones (y estudio Procedimiento. Implicaciones (o
piloto). Supuestos y razones para un conclusiones).
Focalizacin del escenario diseo cualitativo. Referencias.
especfico, poblacin y El tipo de diseo usado. Apndices.
fenmeno. El rol del investigador.
Muestra de personas, Procedimientos de coleccin
conductas, eventos y/o de datos.
procesos. Mtodos para verificacin.
Aspectos relacionados con Resultados del estudio y su
la entrada, reciprocidad, relacin con la teora y la
biografa personal y literatura.
tica. Apndices
Obtencin de datos
Participacin en el
escenario.
Observacin directa.
Entrevista en profundidad.
Revisin de documentos.
Grabacin, manejo y anlisis
de fuentes de datos para el
estudio
Lnea del tiempo.
Nivel de coleccin de
datos.
Personal necesario.
Recursos necesarios.
El valor y lgica de la
investigacin cualitativa.
Criterios de sondeo.

Los ejemplos de la tabla 3 se refieren slo a disear un plan o propuesta de un estudio cualitativo.
El estudio completo contiene hallazgos y una discusin, as como el problema o tpico, preguntas
de investigacin, metodologa y verificacin o validez.

32
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

3. CINCO DIFERENTES ESTUDIOS CUALITATIVOS

Un estudio de
UN RETRATO
caso
Un
Individual caso

Grupal, cultural

Una
etnografa
Una biografa
Una
teora
Un
Una fenomenologa concepto
o Una teora fundamentada
fenmen
o
Figura 1. Diferenciacin de las tradiciones por el propsito fundamental

4. CINCO TRADICIONES CUALITATIVAS DE INVESTIGACIN

Una biografa

Es el estudio de un individuo o su experiencia, ya sea contada al investigador o encontrada en


documentos y materiales de archivo. El trmino biografa denota el amplio gnero de escritos
biogrficos: biografas individuales, autobiografas, historias de vida e historias orales.

En un estudio biogrfico, la historia de la vida de un individuo es escrita por otra persona,


usando registros y documentos de archivo.
En una autobiografa, la historia de vida es escrita por las propias personas.
La historia de vida es un planteamiento encontrado en las ciencias sociales y la antropologa
donde un investigador reporta la vida de un individuo y cmo sta refleja temas culturales o
sociales, temas personales, temas institucionales e historias sociales. El investigador obtiene
los datos principalmente mediante entrevistas y conversaciones con el individuo.
Una historia oral es un planteamiento en el cual el investigador rene recolecciones
personales de eventos, sus causas y sus efectos de uno o varios individuos. Esta
informacin puede ser obtenida mediante audiograbaciones o trabajos escritos de los
individuos que han muerto o que an estn vivos.

Las biografas pueden ser escritas objetivamente, con poca interpretacin del investigador;
profesionalmente, con un fuerte soporte histrico y una organizacin cronolgica; y artsticamente,
desde la perspectiva de presentar detalles de una manera interesante; o en una forma narrativa.

En una biografa clsica el investigador usa enunciados acerca de la teora, se preocupa por la
validez y crtica de los documentos y materiales, y la formulacin de distintas hiptesis, todas

33
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

planteadas desde la perspectiva del investigador. La biografa interpretativa es, en parte,


autobiografas de los escritores, las lneas entre lo real y lo ficticio son borrosas y conducen a los
autores a crear el sujeto en el texto.

Los escritos biogrficos tienen races en diferentes disciplinas y han encontrado renovado inters en
aos recientes.

Un estudio fenomenolgico

Un estudio fenomenolgico describe el significado de las experiencias vividas por algunos


individuos acerca de un concepto o el fenmeno. Los fenomenologistas exploran las estructuras las
estructuras de la conciencia en experiencias humanas. Los investigadores buscan la esencia, la
estructura invariante (o esencia) de la intencionalidad de la conciencia.

Existen diferentes campos filosficos tales como: fenomenologa trascendental, fenomenologa


dialgica, fenomenologa emprica, fenomenologa existencial, fenomenologa hermenutica y
fenomenologa social.

El planteamiento psicolgico se centra en el significado de las experiencias individuales.

Un estudio de teora fundamentada

La teora fundamentada intenta generar o descubrir una teora, un esquema analtico abstracto de un
fenmeno, que se relaciona con una situacin particular.

Una etnografa

Es una descripcin e interpretacin de un grupo o sistema social o cultural. Tanto como proceso
como resultado de una investigacin, una etnografa es un producto de investigacin.

Un estudio de caso

Mientras algunos consideran el caso un objeto de estudio (Stake, 1995) y otros lo consideran una
metodologa (Merriam, 1988), un estudio de caso es una exploracin de un sistema limitado o un
caso (o mltiples casos). El sistema es limitado en tiempo y espacio (un programa, un evento, una
actividad o individuos).

34
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Tabla 4. Comparacin de las cinco tradiciones

Dimensi Biografa Fenomenolog Teora Etnografa Estudio de


n a fundamenta caso
da
Propsito Explorar la Comprender Desarrollar Describir e
Desarrollar
vida de un la esencia de una teora interpretar un
un anlisis a
individuo. experiencias fundamenta grupo profundidad
acerca de un da en los cultural y
de un caso
fenmeno. datos del social. simple o de
campo. mltiples
casos.
Disciplina de Antropologa Filosofa Sociologa Antropologa Ciencia
origen Literatura Sociologa Cultural Poltica
Historia Psicologa Sociologa Sociologa
Psicologa Evaluacin
Sociologa Estudi
os Urbanos
Otras C. Soc.
Obtencin de Principalmen Entrevistas Entrevistas Principalmen Mltiples
datos te entrevistas largas con con 20-30 te fuentes:
y hasta 10 individuos observacione documentos,
documentos personas para saturar s y archivos,
categoras y entrevistas entrevistas,
detallar una con observacione
teora artefactos s y artefactos
adicionales fsicos
durante un
tiempo
prolongado
en el campo
(ejem: de 6
meses a un
ao)
Anlisis de Historias Declaracione Codificacin Descripcin Descripcin
datos Epifanas s abierta Anlisis Temas
Contenido Significados Codificacin Interpretaci Afirmaciones
histrico Temas de axial n
significados Codificacin
selectiva
Descripcin
Matriz
general de
condicion
la
al
experiencia
Forma Imagen Descripcin Teora o Descripcin Estudio en
narrativa detallada de de la esencia modelo de la profundidad
la vida de un de la terico conducta de un caso o
individuo experiencia cultural de casos
un grupo o
individuo

35
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Tabla 5. Estructura general del estudio en las cinco tradiciones

Planteamie Biografa Fenomenolo Teora Etnografa Estudio de


nto ga fundamentad caso
a
Estructura Introduccin Introduccin Introduccin
Introduccin Vieta de
general del (problema, (problema, (problema,
(problema, entrada
estudio preguntas) preguntas) preguntas)
preguntas) Introduccin
Procedimient Procedimient Procedimient
Procedimient (problema,
os de os de os de os de preguntas,
investigaci investigaci investigaci
investigaci estudio de
n (una n (una n (teora
n caso,
biografa, fenomenolo fundament(etnografa, obtencin
significanci ga y ada, obtencin de datos,
a del supuestos obtencinde datos, anlisis,
individuo, filosficos, de datos,anlisis, resultados
obtencin obtencin anlisis,resultados) )
de datos, de datos, resultados)
Descripcin Descripcin
anlisis de anlisis, Codificacin
de la del (los)
resultados) resultados) abierta cultura caso(s) y
Reporte de Declaracione Codificacin
Anlisis de su
experienci s axial temas contexto
as significantes Codificacin
culturales Desarrollo
objetivas Significados selectiva y
Interpretaci de tpicos
Los de las proposicion
n, Detalles
individuos declaracion es y lecciones acerca de
teorizan es modelos aprendidas, los tpicos
acerca de Temas de tericos preguntas selecciona
sus vidas significados Discusin decontestada dos
Segmentos Descripcin la teora y
s Afirmacione
narrativos exhaustiva contrastes s
identificad del con la Vieta de
os fenmeno literatura cierre
Marcos de existente
significado
identificad
o (eventos,
procesos,
epifanas,
temas)
Resumen
NOTA: Cada punto puede ser una seccin en un artculo o libro, o un captulo en una tesis
o disertacin

5. MARCOS TERICO Y FILOSFICO

Cinco supuestos filosficos

36
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Los investigadores cualitativos plantean sus estudios con un cierto paradigma o visin del mundo,
un conjunto bsico de creencias o supuestos que guan sus indagaciones. Estos supuestos estn
relacionados con la naturaleza de la realidad (lo ontolgico), la relacin del investigador con lo que
est siendo investigado (lo epistemolgico), el rol de los valores en un estudio (lo axiolgico) y el
proceso de investigacin (lo metodolgico).

La investigacin cualitativa es legtima por s misma y no necesita ser comparada con la


investigacin cuantitativa para lograr respetabilidad.

Tabla 6. Supuestos filosficos con implicaciones para la prctica

Supuesto Pregunta Caractersticas Implicaciones para la


prctica (ejemplos)
Ontolgico Cul es la La realidad es subjetiva y El investigador usa
naturaleza de la mltiple, segn sea vista citas y temas en
realidad? por los participantes en palabras de los
el estudio participantes y
proporciona evidencias
desde diferentes
perspectivas
Epistemolgico Cul es la relacin Los intentos del El investigador
entre el investigador y investigador para reducir colabora, invierte
lo que est siendo la distancia entre l y lo tiempo en el campo
investigado? que est siendo con los participantes, y
investigado llega a ser uno ms.
Axiolgico Cul es el rol de los El investigador reconoce El investigador discute
valores? que la investigacin est abiertamente los
cargada de valores y que valores que configuran
los prejuicios estn la narrativa e incluye
presentes su propia
interpretacin en
conjuncin con las
interpretaciones de los
participantes
Retrico Cul es el lenguaje El investigador escribe El investigador usa un
de investigacin? en un estilo informal, estilo de narrativa que
literario, usando la voz atrae, puede usar el
personal y usa trminos pronombre de la
cualitativos y definiciones primera persona, y
limitadas emplea el lenguaje de
la investigacin
cualitativa
Metodolgico Cul es el proceso El investigador usa la El investigador trabaja
de investigacin? lgica inductiva, estudia con detalles
el tpico dentro de su particulares antes de
contexto y usa un diseo las generalizaciones,
emergente describe en detalle el
contexto del estudio, y
continuamente revisa
preguntas derivadas
de las experiencias en

37
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

el campo

Perspectivas ideolgicas

Los supuestos filosficos son comunes a todos los estudios cualitativos. Adems, el investigador
puede decidir usar perspectivas ideolgicas para dirigir la atencin a las necesidades de las
personas y la accin social. Un estudio puede incluir una crtica postmoderna, una orientacin
terica crtica hacia la accin, o un planteamiento feminista como la preocupacin central. El
investigador puede incluir una o ms de estas perspectivas en diferentes aspectos de un estudio: en
una perspectiva conceptual al inicio del estudio, en el planteamiento de la obtencin de datos, en los
comentarios revelados a lo largo de la narrativa cualitativa, o en los tpicos seleccionados en el
estudio.

Postmodernismo

Thomas (1993) llama postmodernistas radicales de silln a quienes enfocan su crtica a la manera
de pensar, en lugar de enfocarse a la accin basada en esos cambios. Ms que ver al
postmodernismo como una teora, podra ser considerado como una familia de teoras y
perspectivas que tienen algo en comn (Slife & Williams, 1995).

Los postmodernistas promueven una reaccin o una crtica al siglo de las luces (XIX) y al nfasis
en la tecnologa, la razn, la racionalidad, lo universal, la ciencia y el mtodo cientfico positivista
en los principios del siglo XX (Bloland, 1995; Stringer, 1993). En respuesta, el pensamiento
postmodernista surgi en las humanidades en la dcada de 1960. el concepto bsico es que el
conocimiento demanda estar situado en las condiciones del mundo de hoy y en las mltiples
perspectivas de clase, raza, gnero y otras afiliaciones de grupo.

Teora crtica

La teora crtica surgi del pensamiento de un grupo de alemanes en la dcada de 1920, conocido
como la Escuela de Frankfurt (Morrow & Brown, 1994). Variantes de la teora crtica abundan en
todas las disciplinas de las ciencias sociales, pero el punto central es que un investigador podra
incluir el estudio cientfico de las instituciones sociales y sus transformaciones a travs de la
interpretacin de significados de la vida social; los problemas histricos de dominacin alienacin y
luchas sociales; y una crtica de la sociedad y la previsin de nuevas posibilidades (Fay, 1987;
Morrow & Brown, 1994). Estos temas tienen implicaciones metodolgicas, y privilegian algunos
mtodos sobre otros.

Planteamientos feministas

El tema de la dominacin tambin prevalece en la literatura feminista, pero el tpico central es la


dominacin de gnero en una sociedad patriarcal. Los investigadores postmodernistas tambin
abrazan muchos de los principios de las crticas postmodernas como un reto a la sociedad actual

En los planteamientos de la investigacin feminista, los propsitos son establecer colaboracin y


relaciones no explotadas, para colocar al investigador dentro del estudio, as como para evitar la
objetivizacin y conducir la investigacin que sea transformadora. Es una compleja rea de
indagacin, con numerosos marcos (orientacin masculina, orientacin feminista blanca, etc.) y

38
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

temas difciles (ausencia e invisibilidad de las mujeres, quienes pueden ser conocedoras) (Olesen,
1994).

Los investigadores feministas ven el gnero como un principio bsico de organizacin que
configura las condiciones de sus vidas.

Uso de la teora y las cinco tradiciones

Las teoras en Ciencias Sociales proporcionan una explicacin, una prediccin o una generalizacin
acerca de cmo el mundo opera. Esto puede ser planteado por los investigadores en el amplio nivel
filosfico o en el ms concreto nivel sustantivo.

Las cinco tradiciones se pueden ubicar en un continuo, de acuerdo a si usan la investigacin antes
(antes de plantear preguntas u obtener datos) o despus del estudio (despus de obtener los datos).

ANTES E ... F ... ... ... ... ... B ... EC ... ... ... ... ... ... ... ... TF DESPUS

39
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

4. DISEOS EXPERIMENTALES Y CUASIEXPERIMENTALES

Campbell, D. & Stanley, J. (1973). Diseos experimentales y cuasiexperimentales en la investigacin social.


Buenos Aires: Amorrortu.

1. Introduccin

Examinaremos en esta obra1 la validez de diecisis diseos experimentales respecto de doce amenazas
corrientes a la inferencia vlida. Por <<experimento>> entendemos aquella parte de la investigacin en la cual
se manipulan ciertas variables y se observan sus efectos sobre otras. Conviene aclarar que el propsito
particular de este libro no es estudiar el diseo experimental dentro de la tradicin de Fisher [1925, 1935],
donde el experimentados, con pleno dominio de la situacin, programa tratamientos y mediciones a fin de
lograr la mejor eficiencia estadstica, nico objetivo al que obedece la mayor o menor complejidad del diseo.
Los diseos aqu analizados son tanto ms complejos cuanto mayor es la inflexibilidad del ambiente; es decir,
en la medida en que el experimentados carece de control absoluto sobre la situacin. Aunque hay no pocos
puntos de contacto entre nuestro tratamiento y el de la corriente de Fisher, juzgamos apropiado dejar la
exposicin de esta ltima para obras de mayor envergadura, como las de Brownlee [1960], Cox [1958],
Edwards [1960], Ferguson [1959], Jonson [1949], Jonson y Jackson [1959], Lindquist [1953], McNemar
[1952] y Winer [1962]. (Tambin puede consultarse Stanley, 1957b.)

2. El problema y sus antecedentes

McCall como modelo

En 1923, W. A. McCall public un libro titulado How to experiment in education (Cmo experimenta en
educacin). Nuestro propsito es exponer aqu en forma actualizada los intereses indicados y las
consideraciones apuntadas en dicha obra; comenzaremos, pues, formulando una evaluacin acerca de ella.
Deca McCall en su introduccin: <<Hay excelentes libros y tratados que exponen el manejo estadstico de
datos experimentales, pero muy pocos acerca de cmo obtener datos adecuados y correctos a los cuales poder
aplicar el procedimiento estadstico>>. Este enunciado contina siendo hoy tan cierto que bien puede
servirnos de leitmotiv. Aunque la influencia de la corriente fisheriana remedi la situacin en algunos aspectos

1
La preparacin de esta obra, en la que colaboraron Keith N. Clayton y Paul C. Rosenblatt, cont
con el auspicio del Proyecto Psicologa Educacin de la Northwestern University, bajo el patrocinio
de la Carnegie Corporation.

40
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

fundamentales, su efecto ms conspicuo parece haber sido el de afinar y perfeccionar el anlisis estadstico,
ms que el de ayudar a conseguir <<datos adecuados y correctos>>.
Quiz por su orientacin prctica y sentido comn y porque no pretende constituir un aporte capital, el libro
de Mccall representa un clsico insuficientemente calorado todava. Cuando apareci, dos aos antes de la
primera edicin de Statistical Mtodos for research workers (Mtodos estadsticos para investigadores), de
Fisher [1925], no haba nada comparable cualitativamente a l en el mbito de la agricultura ni en el de la
psicologa. Se anticip en varios puntos fundamentales a las metodologas ortodoxas de esas dos ciencias.
Acaso la ms importante de las contribuciones de Fisher haya sido la idea de formular la igualacin
preexperimental de grupos por aleatorizacin.
Esta idea, y el consecuente rechazo de la tentativa de llegar a tal igualacin por equiparacin (pese a su
intuitiva atraccin y potencialidad de error), no mereci fcilmente la aprobacin de los investigadores del
mbito educacional. En 1923, McCall haba comprendido cules eran los elementos cualitativos
fundamentales del problema. Dio, como primer mtodo para establecer grupos comparables, el de los
<<grupos igualados por azar>>. <<As como se puede lograr la representatividad por el mtodo aleatorio (...)
tambin se puede conseguir la equivalencia por el mismo medio, siempre que el nmero de sujetos que hayan
de utilizarse sea lo suficientemente grande>> (Pg. 41. Tambin en otro punto se anticip a Fisher: la
introduccin del diseo del cuadrado latino con el rtulo de <<experimento rotatorio>>, que por otra parte
haban utilizado ya Thorndike, Mccall y Chapman [1916], tanto en formas 5X5 como 2X2, unos 10 aos
antes de que Fisher [1926] lo incorporase de modo sistemtico a su esquema de diseo experimental con
aleatorizacin.2.
La forma en que McCall utiliza el <<experimento rotatorio>> ilustra muy bien el nfasis tanto de su obra
como de la presente. El <<experimento rotatorio>> se introduce, no por razones de eficiencia, sino ms bien
para lograr algn control cuando no es posible la asignacin aleatoria a grupos equivalentes. Con una
intencin similar examinaremos aqu las imperfecciones de muchos programas experimentales, abogando no
obstante por su aplicacin en aquellas configuraciones en que no haya modo de recurrir a mejores diseos
experimentales. En este sentido, la mayor parte de los diseos analizados, incluso el <<experimento
rotatorio>> no aleatorizado, se denominan diseos cuasiexperimentales.

La desilusin provocada por los experimentos llevados a cabo en el campo de


la educacin.

En esta obra nos declaramos partidarios del mtodo experimental como nico medio de zanjar las disputas
relativas a la prctica educacional, nica forma de verificar adelantos en el campo pedaggico y nico mtodo
para acumular un saber al cual puedan introducrsele mejoras sin correr el peligro de que se descarten
caprichosamente los conocimientos ya adquiridos a cambio de novedades de inferior calidad. Sin embargo,

2
Kendall y Buckland [1957] afirman que el cuadrado latino fue inventado por el matemtico Euler
en 1782. Thorndike, Chapman y McCall no utilizan esta expresin.

41
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

con nuestra enrgica defensa de la experimentacin no pretendemos significar que este nfasis sea nuevo.
Como lo manifiesta la existencia misma del libro de McCall, en tiempos de Thorndike una ola de entusiasmo
experimental recorra el mbito de la educacin, alcanzando quiz su punto culminante en la dcada del
veinte. Aquel entusiasmo se convirti despus en apata y rechazo, as como en la adopcin de nuevas
doctrinas psicolgicas no susceptibles de verificacin experimental. Good y Scates [1954, pgs. 716-21] han
documentado un pesimismo general, que se retrotrae quizs a 1935, y citan incluso a Monroe [1938], aquel
decidido defensor de la experimentacin controlada nos han desilusionado>>.Cabe destacar, adems, que el
trnsito de la experimentacin a la redaccin de ensayos, acompaado a menudo por una conversin del
conductismo tipo Thorndike a la psicologa de la guestalt o al psicoanlisis, se produjo con frecuencia en
personas que contaban con una buena formacin en la tradicin experimental.
Para evitar que se repita este desencanto, debemos conocer los orgenes de la reaccin anterior, procurando
sortear las falsas expectativas que condujeron a ella. Merecen destacarse varios aspectos. Ante todo, se
pretendi asignar a los resultados de la experimentacin un cierto ritmo y grado exagerado de progreso, al
para que se menospreciaba injustificadamente el conocimiento no experimental. Los primeros defensores
supusieron que el progreso en la tecnologa pedaggica haba sido lento slo porque no se haba aplicado a
ella el sistema cientfico: crean que la prctica tradicional era ineficaz solo porque no haba sido fruto de la
experimentacin. Cuando se demostr que los experimentos eran a menudo tediosos, equvocos, de
reiterabilidad insegura y ratificadores, por lo comn, de conocimientos precientficos, los fundamentos
excesivamente optimistas con que se haba querido justificar la experimentacin quedaron minados por la
base, y al primitivo entusiasmo sucedi el desilusionado abandono..
Aquella sensacin era compartida tanto por los observadores como por los propios involucrados. Entre los
experimentadores se adverta una innegable aversin hacia la experimentacin. Para el investigador normal,
muy motivado, el hecho de que una de las hiptesis que sustenta no sea confirmada resulta por dems
doloroso. Como animal biolgico y psicolgico, est sujeto a leyes de aprendizaje que lo conducen
inevitablemente a asociar este dolor con los estmulos y acontecimientos inmediatos. No es extrao, pues, que
tales estmulos estn constituidos por el mismo proceso experimental de modo ms vvido y directo que la
<<verdadera>> fuente de la frustracin, a saber: la inadecuada teora. Una situacin tal puede inducir,
inconscientemente quizs, a evitar o rechazar el proceso experimental. Si, como parece probable, la ecologa
de nuestra ciencia est constituida de tal manera que hay en ella muchas ms respuestas errneas que
correctas, cabe prever el fracaso de la mayor parte de los experimentos. Hay que inmunizar, pues, de algn
modo a los jvenes investigadores contra ese resultado y, en general, justificar ante ellos la experimentacin
sobre fundamentos ms realistas: no como una panacea, pero s como el nico camino hacia el progreso
acumulativo. Tenemos que inculcar en nuestros discpulos la expectativa del tedio y la decepcin, y el deber
de la tenaz persistencia, actitudes ambas que con tanto xito se ha logrado implantar ya en las ciencias
biolgicas y fsico-naturales. Hay que ampliar el voto de pobreza de nuestros alumnos, de modo que no slo
se avengan a trabajar con insuficientes recursos financieros sino a admitir la insuficiencia de sus resultados
experimentales.

42
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Ms concretamente: debemos ensanchar nuestra perspectiva temporal, y reconocer que la experimentacin


continua y mltiple es ms propia de la actividad cientfica que los experimentos nicos y definitivos. Las
pruebas que realizamos hoy, si llegan a tener xito, exigirn repeticin y validaciones cruzadas en otros
momentos y en otras condiciones antes de convertirse en adquisicin estable para el acerco cientfico y ser
susceptibles de segura interpretacin terica. Adems, aun cuando reconocemos que la experimentacin es el
lenguaje fundamental de la demostracin y el nico tribunal decisivo para resolver los desacuerdos entre
posibles teoras rivales, no es previsible que los <<experimentos cruciales>> que contrapongan a las teoras
opuestas vayan a producir resultados claramente definitorios. Cuando se descubra, por ejemplo, que
observadores competentes, sustentan puntos de vista muy dispares entre s, ser razonable suponer a priori
que ambos habrn encontrado algo vlido sobre la situacin estudiada, y que ambos representarn una parte
de la verdad completa. Cuanto mayor sea la controversia, ms probable ser que as ocurra. Podemos, pues,
esperar en tales casos un resultado experimental de carcter mixto, o con sutiles variaciones en el saldo de
verdad entre una prueba y otra. La posicin ms sensata lograda en gran parte por la psicologa experimental
(por ejemplo, Underwood, 1957b)- evita los experimentos cruciales, reemplazndolos por relaciones e
interacciones dimensionales a lo largo de muchas gradaciones diversas de la variables.
Tampoco hay que olvidar los muy perfeccionados procedimientos estadsticos que en poca reciente se han
ido introduciendo poco a poco en la psicologa y la educacin. Durante su perodo de mayor actividad, la
experimentacin educacional avanz lentamente, empleando medios y procedimientos burdos. McCall [1923]
y sus contemporneos realizaron investigaciones en las cuales se estudiaba una sola variable por vez. Para la
enorme complejidad que caracteriza las situaciones de aprendizaje humano, aquello resultaba demasiado
lento. Hoy se sabe la gran importancia que pueden asumir diversas contingencias dependientes de la
<<accin>> conjunta de dos o ms variables experimentales. Stanley [1957, 1960, 1961b,1961c, 1962],
Stanley y Wiley [1962] y otros han destacado la imperiosa necesidad de evaluar tales interacciones.
Los experimentos pueden incluir algunas variables en cualquiera de dos sentidos o en ambos a la vez. Por
ejemplo, incorporando al diseo ms de una variable <<independiente>> (sexo, grado escolar, mtodo con
que se ensea aritmtica, estilo y tamao de los tipos de imprenta, etc.), y/o empleando ms de una variable
<<dependiente>> (nmero de errores, velocidad, diversas pruebas, etc.). Los procedimientos de Fisher son
multivariados en el primer sentido y univariados en el segundo. Estadsticos matemticos como Roy y
Gnanadesikan [1959] tratan de encontrar diseos y anlisis que unifiquen ambas formas de diseos
multivariados. Tal vez permaneciendo alertas a la evolucin de tales diseos puedan los investigadores en el
campo de la educacin reducir la brecha por lo comn demasiado amplia, entre la exposicin en la literatura
especializada de un procedimiento estadstico y su aplicacin prctica a investigaciones de envergadura.
No cabe duda de que una capacitacin ms a fondo de las investigaciones educacionales en tcnicas
modernas de estadstica experimental permitira elevar la calidad de la experimentacin pedaggica.

43
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Concepcin evolutiva sobre la ciencia y la acumulacin de conocimientos.

Como Fundamento de lo expuesto en los prrafos precedentes y lo que se expondr en los que siguen
sealamos una concepcin evolutiva del conocimiento [Cambell, 1959], segn la cual la aplicacin prctica y
el conocimiento cientfico son el resultado de la acumulacin de ciertas tentativas seleccionadas y remanentes
del caudal de observaciones recogidas por la experiencia. Esta concepcin inspira gran respeto por la
tradicin en la prctica pedaggica. Si en el transcurso de los siglos se han ensayado muchos enfoques
distintos, s de ellos algunos han obtenido mejores resultados que otros y los que mejor funcionaban es de
suponer que habrn sido los aplicados con mayor persistencia por sus creadores, imitados por otros y
trasmitidos a las generaciones siguientes, las costumbres resultantes de todo ello pueden representar un
valioso y probado subconjunto de todas las prcticas posibles.
Pero el punto de corte selectivo de esta evolucin se torna muy impreciso cuando se lo traslada a la realidad.
Las condiciones de observacin, tanto fsicas como psicolgicas, distan mucho de ser ptimas. Lo que
sobrevive o se retiene queda en gran parte determinado por el azar. Es aqu donde la experimentacin
demuestra la importancia del proceso de prueba, exploracin y seleccin. No se contempla, pues, la
experimentacin en s misma como fuente de ideas necesariamente contradictorias con relacin al saber
tradicional, sino ms bien como mecanismo de refinacin superpuesto a las acumulaciones probablemente
valiosas de la prctica sensata. Propugnar, pues, una ciencia experimental de la educacin no implica repudiar
el saber tradicional.
Algunos lectores abrigarn tal vez la sospecha de que la analoga con el esquema evolutivo darwiano se
complique con factores de carcter especficamente humano. Cuando Juan Prez, director de escuela, tiene
que decidir entre adoptar un libro de texto modificado o continuar con la versin anterior, es probable que
haga su eleccin fundndose en datos insuficientes. Aparte de la eficiencia misma para la enseanza y el
aprendizaje, son muchas las consideraciones que habr de tomar en cuenta. El director har lo correcto en una
de estas dos formas posibles: reteniendo el libro antiguo cuando sea tan bueno o mejor que el revisado, o
adoptando este ltimo cuando sea superior al primero. Pero puede equivocarse tambin de dos maneras:
reteniendo el libro antiguo cuando el nuevo es mejor, o adoptando este cuando no es superior al primero. En
cada una de las dos elecciones errneas es de suponer que se producirn inconvenientes diversos: 1) mayor
costo financiero y de gasto de energas; 2) costo para el director, en forma de quejas de los maestros, padres y
miembros del consejo escolar; 3) costo para los maestros, los alumnos y la sociedad a causa de una peor
instruccin. Estos costos, evaluados en trminos de dinero, energa, confusin, menor aprendizaje y mayor
riesgo personal, deben sopesarse frente a la probabilidad de que se produzca cada una de dichas alternativas,
as como la de que se detecte el error mismo. Si el director toma su decisin sin suficientes elementos de
juicio, fruto de una investigacin a fondo, sobre el costo 3 (peor instruccin), es posible que exagere los
costos 1 y 2. Los naipes vienen barajados a favor de un criterio conservador: mantener el libro antiguo durante

44
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

un ao ms. Cabe, sin embargo, tratar de preparar un experimento con ambos libros a la vez, de acuerdo con
un esquema de teora de la decisin [Chernoff y Moses, 1959], y adoptar una resolucin que tome
explcitamente en cuenta los diversos costos y probabilidades. Cmo conseguir que las cuidadosas
deliberaciones de un excelente administrador educativo se aproximen a este modelo de teora de la decisin es
un grave problema, cuyo bien vale la pena encarar.

Factores que atentan contra la validez tanto interna como externa.

En los prximos captulos de esta obra se describen doce factores que amenazan la validez de varios diseos
experimentales.3 Cada uno de los dichos factores se explicar con todo detalle al exponer los diseos a
propsito de los cuales constituye un problema particular; diez de los diecisis diseos se presentarn antes de
completarse la lista. A fin de lograr una perspectiva ms clara sera conveniente, sin embargo, que demos una
lista de dichos factores, as como una gua general acerca de los cuadros 1,2 y 3, que resumen parcialmente el
anlisis. Es fundamental a este respecto distinguir bien entre validez interna y validez externa. Llamamos
validez interna a la mnima imprescindible, sin la cual es imposible interpretar el modelo: Introducan, en
realidad, una diferencia los tratamientos empricos en este caso experimental concreto? Por su parte la validez
externa plantea el interrogante de la posibilidad de generalizacin: A qu poblaciones, situaciones, variables
de tratamiento y variables de medicin puede generalizarse este efecto? Ambos criterios son sin duda
importantes, aunque con frecuencia se contrapongan, en el sentido de que ciertos aspectos que favorecen a
uno de ellos perjudiquen al otro. Si bien la validez interna es el sine qua non, y a la cuestin de la validez
externa, como a la que de la inferencia inductiva, nunca se puede responder plenamente, es obvio que nuestro
ideal lo constituye la seleccin de diseos ricos en una y otra validez. As ocurre, particularmente, respecto de
la investigacin sobre mtodos de enseanza, donde el desidertum ser la generalizacin a situaciones
prcticas de carcter conocido. Tanto las distinciones como las relaciones entre estos dos tipos de
consideraciones de validez irn hacindose ms explcitas a medida que se las ilustre durante la exposicin de
diseos especficos.
Con relacin a la validez interna, presentaremos ocho clases distintas de variables externas que, de no
controlrselas en el diseo experimental, podran general efectos que se confundiran con el des estmulo
experimental. Constituyen los efectos de:

1. Historia, los acontecimientos especficos ocurridos entre la primera y la segunda medicin, adems de la
variable experimental.
2. Maduracin, procesos internos de los participantes, que operan como resultado del mero paso del tiempo
(no son peculiares de los acontecimientos en cuestin), y que incluyen el aumento de la edad, el hambre,
el cansancio y similares.
3
Gran parte de esta exposicin se funda en Campell [1957]. En general, no se harn referencias
particulares a esta fuente.

45
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

3. Administracin de tests, el influjo que la administracin de un test ejerce sobre los resultados de otro
posterior.
4. Instrumentacin, los cambios en los instrumentos de medicin o en los observadores o calificadores
participantes que pueden producir variaciones en las mediciones que se obtengan.
5. Regresin estadstica, opera all donde se han seleccionado los grupos sobre la base de sus puntajes
extremos.
6. Sesgos resultantes en una seleccin diferencial de participantes para los grupos de comparacin.
7. Mortalidad experimental, o diferencia en la prdida de participantes de los grupos de comparacin.
8. Interaccin entre la seleccin y la maduracin, etc., en algunos de los diseos cuasiexperimentales de
grupo mltiple, como el 10, se confunde con el efecto de la variable experimental (es decir, que podra
tomarse por l.

Los factores que amenazan la validez externa o representatividad, y que vamos a analizar aqu, son:

9. El efecto reactivo o de interaccin de las pruebas, cuando un pretest podra aumentar o disminuir la
sensibilidad o la calidad de la reaccin del participante a la variable experimental, haciendo que los
resultados obtenidos para una poblacin con pretest no fueran representativos de los efectos de la variable
experimental para el conjunto sin pretest del cual se seleccionaron los participantes experimentales.
10. Los efectos de interaccin de los sesgos de seleccin y la variable experimental.
11. Efectos reactivos de los dispositivos experimentales que impediran hacer extensivo el efecto de la
variable experimental a las personas expuestas a ella en una situacin no experimental.
12. Interferencias de los tratamientos mltiples, que pueden producirse cuando se apliquen tratamientos
mltiples a los mismos participantes, pues suelen persistir los efectos de tratamientos mltiples a los
mismos participantes, pues suelen persistir los efectos de tratamientos anteriores. Este es un problema
particular de los diseos de un solo grupo de tipo 8 o 9.

En la presentacin de los diseos experimentales se adoptarn un cdigo y unos smbolos grficos uniformes,
a fin de compendiar la mayora, si no la totalidad, de sus caractersticas distintivas. Una X representar la
exposicin del grupo a una variable o acontecimiento experimental, cuyos efectos se han de medir; 0 har
referencia a algn proceso particular de observacin o medicin; las X y 0 en una fila dada se aplican a las
mismas personas especficas, La dimensin representada de izquierda a derecha indica el orden temporal, en
tanto que las X y 0 dispuestas en forma vertical sealan la presencia de simultaneidad. Para hacer ciertas
distinciones importantes, como entre los diseos 2 y 6 o entre el 4 y el 10, hay que utilizar un smbolo R, que
indica asignacin aleatoria a diferentes grupos de tratamiento. Esa aleatorizacin se concibe como un proceso
que se produce en un momento dado, y sirve para lograr, dentro de lmites estadsticos conocidos, la igualdad
de los grupos antes del tratamiento. Agregaremos a ella otra convencin grfica: las filas paralelas no
separadas por lnea de puntos significan grupos de comparacin, porque el valor de dicho proceso se ha

46
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

exagerado mucho y suele ms bien conducir a inferencias errneas que contribuir a extraer conclusiones
vlidas. (Vanse ms adelante el anlisis del diseo 10 y la seccin final sobre diseos correlacionales. En el
diseo 9 se ha utilizado explcitamente un smbolo M para identificar materiales.

3. Tres diseos preexperimentales

1. Estudio de caso con una sola medicin.

Gran parte de las investigaciones actuales sobre educacin se ajustan a un diseo en el cual se estudia un solo
grupo cada vez, despus de someterlo a la accin de algn agente o tratamiento que se presuma capaz de
provocar un cambio. Estos estudios podran diagramarse de la siguiente forma:

X 0

Como ya se ha destacado [p. Ej., Boring, 1954; Stouffer, 1949], tales estudios adolecen de
tan absoluta falta de control que su valor cientfico es casi nulo. Presentamos este diseo
como punto mnimo de referencia. No obstante, a causa de la continua inversin en esta
clase de estudios y de la extraccin de inferencias causales de ellos, ser imprescindible
formular alguno que otro comentario. El proceso de comparacin, de registro de diferencias
o de contrastes es fundamental para la comprobacin cientfica (y para todos los procesos
de diagnstico del conocimiento, incluso aquellos vinculados con la retina. Resulta ilusoria
cualquier apariencia de conocimiento absoluto o intrnseco sobre objetos singulares
aislados. La obtencin de datos cientficos implica, por lo menos, una comparacin, cuya
utilidad depende de que las partes integrantes se estructuren con el mismo cuidado e
idntica precisin.
En los estudios de casos del diseo 1, se compara implcitamente un caso nico, cuidadosamente estudiado,
con otros acontecimientos observados de manera casual y recordados. Las inferencias se fundan en
expectaciones generales de cules hubieran sido los datos de no haberse producido X, etc. Tales estudios
suelen requerir una tediosa recopilacin de detalles concretos, cuidadosa observacin, administracin de tests
y similares, y en tales casos se corre el riesgo de hacer precisiones injustificadas. Cunto ms provechoso
sera el estudio si ese caudal de observaciones se redujese a la mitad, aplicndose el esfuerzo ahorrado al
estudio igualmente cuidadoso de su apropiado caso de comparacin! Parece hasta casi falto de tica el aceptar
hoy, como tesis de doctorado en el mbito educacional, estudios de casos de esa ndole (es decir, que implican
un solo grupo observado una sola vez. En ellos, los tests <<estandarizados>> solo ofrecen una ayuda muy
limitada, puesto que las fuentes antagnicas de diferencias (distintas de X) son tan abundantes que tornan casi
intil el grupo <<estndar>> de referencia como <<grupo de control>. Por los mismos motivos, las muchas
fuentes no controladas de diferencias entre el estudio actual de un caso concreto y otros que, plantendose en
el futuro, pudieran compararse con aquel son tantas, que hacen tambin intil su justificacin como punto de

47
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

referencia para estudios posteriores. En general, sera mejor distribuir el esfuerzo descriptivo entre los dos
miembros de una comparacin interesante.
Si se lo toma en conjunto con las comparaciones implcitas de <<conocimiento comn>>>, el diseo 1
presenta la mayor parte de los inconvenientes de cada uno de los diseos posteriores. Por eso dejaremos el
estudio de esos inconvenientes para cuando encaremos situaciones ms especficas.

2. Diseo pretest-postest de un solo grupo

Si bien este diseo contina siendo de gran aplicacin es la investigacin educacional, y se lo considera tan
superior al diseo 1 que se lo utiliza all donde no cabe hacer nada mejor (vase ms adelante el anlisis de los
diseos cuasiexperimentales), lo presentamos aqu como un <<mal ejemplo>> para ilustrar algunas de las
variables externas entremezcladas que pretenden atentar contra la validez interna. Esas variables ofrecen
hiptesis aceptables que explican una diferencia 01 02, opuesta a la hiptesis de que X caus la diferencia:

01 X 02

La primera de estas hiptesis rivales no controladas es la historia. Entre 01 y 02 pueden haber ocurrido
muchos otros acontecimientos capaces de determinar cambios, adems de la X sugerida por el
experimentador. Si el pretest (01) y el postest (02) se administraron en das distintos, los acontecimientos
intermedios pueden haber causado la diferencia. Para convertirse en una hiptesis rival aceptable, tal
acontecimiento debera haber afectado a la mayor parte de los estudiantes que integran el grupo examinado (p.
Ej., en algn otro perodo lectivo o por medio de una noticia periodstica muy difundida. En el estudio escolar
realizado por Collier en 1940, sobre el cual inform en 1944, se produjo la cada de Francia mientras los
estudiantes lean abundante material de propaganda nazi; los cambios de actitud comprobados parecieron ser
consecuencia, ms probablemente, de ese suceso que de la propaganda en s.1 La historia se convierte en una
explicacin rival ms aceptable del cambio cuanto ms extenso es el lapso entre 0 1 y 02, y podra considerarse
un detalle trivial en un experimento realizado dentro del breve lapso de una o dos horas, si bien aun en tal
caso deben investigarse fuentes externas como las risas, las distracciones, etc. La variable historia se
relaciona con la caracterstica de aislamiento experimental, que en muchos laboratorios de fsica suele
conseguirse con tanta aproximacin que el diseo 2 resulta aceptable a propsito de la mayor parte de sus
investigaciones. Pero en el estudio de mtodos de enseanza casi nunca se puede suponer un aislamiento
experimental tan completo. Por eso en el cuadro 1 el diseo 2 se ha marcado con un signo negativo bajo el
ttulo Historia, en el que incluiremos un grupo de posibles efectos estacionales o de programacin de
acontecimientos institucionales, aunque tambin estos podran situarse al pie del ttulo Maduracin. As, el
optimismo podra variar con las estaciones y la ansiedad producida por el programa de exmenes semestrales
1
En realidad, Collier utiliz un diseo ms adecuado que este, que en el presente sistema se
denomina diseo 10.

48
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

[p. Ej., Crook, 1937; Windle, 1954]. Tales efectos acaso produjesen una variacin 0 1 02 confundible con el
efecto de X.
Una segunda variable o categora de variables rivales recibe el nombre de maduracin. Tal como lo
entendemos aqu, este trmino abarca todos aquellos procesos biolgicos o psicolgicos que varan de manera
sistemtica con el correr del tiempo e independientemente de determinados acontecimientos externos. As, es
probable que entre 01 y 02 los estudiantes hayan aumentado de edad, apetito, fatiga, aburrimiento, etc., y
acaso la diferencia obtenida refleje ese cambio y no el de X. En educacin correctiva, que se aplica a personas
excepcionalmente disminuidas, un proceso de <<remisin espontnea>>, anlogo al que se produce en la
curacin de heridas,

Cuadro 1. Fuentes de invalidacin para los diseos 1 a 6


Fuentes de invalidacin
Interna Externa de

Interaccin de seleccin y

Interferencia de X mltiples
Interaccin de seleccin y

Dispositivos reactivos
Administracin de tests

Instrumentacin

maduracin, etc.
Maduracin

administracin
Mortalidad
Regresin

Mortalidad

de tests y X.
Seleccin

Interaccin
Historia

Diseos
Preexperimentales
1. Estudio de caso - - - - -
con una sola
medicin
X 0

2. Diseo pretest- - - - - ? + + - - - ?
postest de un
solo grupo
0 X 0

49
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

3. Comparacin con + ? + + + - - - -
un grupo esttico
X 0
0

Diseos
experimentales
propiamente dichos
4. Diseo de + + + + + + + + - ? ?
grupo de control
pretest-postest
R 0 X 0
R 0 0

5. Diseo de cuatro + + + + + + + + + ? ?
Grupos de
Solomon
R 0 X 0
R 0 0
R X 0
R 0

Cuadro 1. Fuentes de invalidacin para los diseos 1 a 6


Fuentes de invalidacin
Interna Externa

de

Interaccin de seleccin y

Interferencia de X mltiples
Interaccin de seleccin y

Dispositivos reactivos
Administracin de tests

Instrumentacin

maduracin, etc.
Maduracin

administracin
Mortalidad
Regresin

Mortalidad

de tests y X.
Seleccin

Interaccin
Historia

6. Diseo de grupo + + + + + + + + + ? ?
de control con
postest
nicamente
R X 0
R 0

Nota: En los cuadros, el signo negativo indica que hay imperfeccin definida; el positivo, que el factor est
controlado; el interrogativo, la presencia de una posible causa de preocupacin, y por ltimo, el espacio en blanco
significa que el factor no es pertinente.
Estos cuadros resumidos los presentamos con suma renuencia, ya que pueden resultar <<demasiado tiles>>, si se llega a
confiar en ellos y no en la exposicin ms completa y calificada que se incluye en el texto. Ningn indicador de + o
debe respetarse, a menos que el lector comprenda por qu se le ha colocado. En particular, va contra el espritu de este
trabajo la creacin de una confianza o suspicacia con respecto a determinados diseos.

50
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Puede confundirse con el efecto especfico de una X correctiva. (Ni que decir tiene que tal remisin no se
considera <<espontnea>> en ningn sentido causal, sino que representa ms bien los efectos acumulativos
de los procesos de aprendizaje y presiones ambientales de la experiencia global diaria, que se produciran
aunque no se hubiese introducido ninguna X.)
Una tercera explicacin rival entremezclada es el efecto de la realizacin de pruebas, el efecto del pretest
mismo. En pruebas de rendimiento e inteligencia, los estudiantes a quienes se somete a ellas por segunda vez,
o a una de sus variantes, etc., suelen desempearse mejor que los que las encaran por vez primera [p. Ej.,
Anastasi, 1958, pgs. 190-91; Cane y IEM, 1950]. Esos efectos, que alcanzan de 3 a 5 puntos de CI en
promedio para sujetos sin experiencia previa, se producen aun sin haberles hecho comentario alguno acerca
de sus puntajes o errores en el test anterior. En las pruebas de personalidad se advierte un resultado similar: en
las segundas se observa, en general, un mejor ajuste, aunque en ocasiones se halla tambin un efecto
altamente significativo en sentido contrario [[1954]. En cuanto a las actitudes hacia grupos minoritarios, una
segunda prueba suele indicar un mayor prejuicio, aunque los datos disponibles son todava escasos [Rankin y
Campbell, 1955]. Es obvio que el anonimato, una mayor conciencia de qu respuesta es la socialmente
aprobada, etc., influiran en general sobre la ndole del resultado. Para tests de prejuicio en condiciones de
anonimato, el nivel de adaptacin creado por las expresiones hostiles presentadas puede modificar las
apreciaciones del estudiante en lo referente a la tolerancia que existe para actitudes de mayor hostilidad. En
un inventario de adaptacin o de personalidad que lleva la firma del sujeto, la primera administracin del test
forma parte de una situacin de solucin de problemas en que el estudiante, trata de descubrir el propsito
oculto de la prueba. Si ya ha pasado por aquella experiencia (o si habl con sus amigos sobre las respuestas
que ellos dieron a algunos de los puntos ms destacados), sabe mejor cmo comportarse la segunda vez.
Con el problema de los efectos de test se relaciona la distincin entre las posibles mediciones de su
reactividad, lo cual constituir un importante tema en todo este libro, as como una exhortacin general a que
se hagan mediciones no reactivas siempre que sea posible. Desde hace mucho tiempo ha sido una verdad
manifiesta en las ciencias sociales que el proceso mismo de medicin puede hacer cambiar aquello que se
mide. La ganancia test-retest sera una importante consecuencia de ese cambio. (Otra, la interaccin entre la
realizacin de la prueba y X, la estudiaremos ms adelante, junto con el diseo 4. Adems, es importante
evitar esas reacciones el pretest, aun cuando surtan efectos diferentes para sujetos distintos.) Es de esperar el
efecto reactivo siempre que el proceso de prueba sea en s un estmulo al cambio, y no un mero registro de
comportamiento. As, en un experimento sobre terapia para el control del peso, el pesaje inicial puede ser de
suyo un estmulo para el adelgazamiento, aun sin tratamiento curativo alguno. De manera similar, la
ubicacin de observadores en el aula para estudiar la capacidad preentrenamiento del docente en el mbito de
las relaciones humanas puede modificar de por s su forma de comportarse. La colocacin de un micrfono
sobre el escritorio o pupitre suele variar la pauta de interaccin del grupo, etc. En general, cuanto ms nuevo
y motivante sea el elemento utilizado para las pruebas, mayor ser su influencia.
La instrumentacin o <<deterioro de los instrumentos>> [Cf. Cambell, 1957] es el trmino con que se
designa una cuarta hiptesis rival no controlada. Esa expresin se refiere a las variaciones autnomas en el
instrumento de medicin que podran ser la causa de una diferencia O 1 O2. Tales cambios seran anlogos a
la mayor o menor tensin observada en el dinammetro, la condensacin en una cmara de niebla, etc.
Cuando se recurre a observadores humanos a fin de obtener O1 y O2, su propio aprendizaje, tensin, etc.,
determinarn diferencias de O1 O2. Si se califican los ejercicios de redaccin, ensayos o trabajos de
investigacin, los estndares aplicados variarn de O 1 a O2 (la tcnica de control sugiere que se mezclen los
ejercicios de redaccin O1 y O2 y se los haga calificar sin tener conocimiento de cul ha llegado primero). Si se
observa la participacin en el aula, tal vez en la segunda sesin los observadores sean ms hbiles, o ms
indiferentes. Si se entrevista a los padres, la familiaridad de quien realiza esa labor con el programa de
entrevistas y con determinados padres puede producir ciertos desplazamientos. Un cambio en los
observadores entre O1 y O2 tambin podra provocar alguna diferencia.
Una quinta variable entremezclada en algunos casos del diseo 2 es la regresin estadstica. Por ejemplo, si
en una prueba correctiva se seleccionan alumnos para un experimento especial porque han tenido puntajes
particularmente bajos en el test de rendimiento escolar (que para ellos se convierte en O 1), en una prueba
posterior en que se adopte la mismo forma de antes u otra similar a ella, casi con seguridad O 2 tendr para ese
grupo un promedio ms elevado que O 1. Este resultado confiable no se deber a ningn efecto genuino de X,
a ningn efecto de la prctica de test y retest, etc. Es ms bien un aspecto tautolgico de la correlacin
imperfecta entre O1 y O2. Los errores de inferencia ocasionados por no haber tomado en cuenta el efecto de la
regresin han planteado tantos problemas en la investigacin educacional porque muy a menudo se desconoce
su verdadera naturaleza aun por estudiantes que han realizado cursos avanzados de estadstica moderna--.

51
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Como en exposiciones posteriores (p. Ej., el diseo 10 y el anlisis ex post ipso) la daremos por conocida, nos
detendremos aqu a explicarla brevemente, aunque sea en forma muy elemental. La figura 1 presenta algunos
datos imaginarios en los que el pretest y el postest de una poblacin entera tienen una correlacin de 0.50, sin
variacin en la media grupal o variabilidad. (Los datos se seleccionaron expresamente para que la colocacin
de las medias de fina y columna sean obvias a la simple observacin visual. El valor de 0,50 tambin se elige
por conveniencia de exposicin.) En este caso hipottico no se ha producido ningn cambio real, pero, como
es corriente, los puntajes falibles del test indican una correlacin de retest considerablemente inferior a la
unidad. Si, como se sugiri en el ejemplo dado antes, comenzamos por observar solo a los escolares
calificados con puntajes muy bajos en el pretest ---p. Ej., 7 puntos--, y en el postest solo reparamos en el
puntaje de esos alumnos, nos encontraremos con que los puntajes postest estn dispersos, pero son en general
mejores, y en promedio <<regresionaron> hacia la media grupal con un coeficiente de regresin o correlacin
de 0,50, obteniendo una media de 8,5. No obstante, en vez de constituir una prueba de progreso, esto es una
ratificacin imperfecta, y de cul es su medida.
Cuando al transcurrir el tiempo se producen acontecimientos entre el pretest y el postest, nos sentimos
tentados a establecer una relacin causal entre dicho cambio y la accin especfica del paso del tiempo. Pero
obsrvese que cabe hacer aqu un anlisis cronolgico a la inversa, comenzando, por ejemplo, con aquellos
cuyo puntaje postest es 7 y observando la dispersin de sus puntajes pretest, de los cuales se extraera la
implicacin inversa, a saber; que los puntajes van empeorando.

Figura 1. Regresin en la prediccin de puntajes postest de pretest y viceversa.

Lnea de regresin b,
que indica la mejor
prediccin de pretest
a postest.

Puntajes postests

Puntajes Medias
pretests 7 8 9 10 11 12 13 postests

13 1 1 1 1 11.5

12 1 1 2 1 1 11.0

11 1 2 3 3 2 1 10.5

10 1 1 3 1 3 1 1 10.0

9 1 2 3 3 2 1 9.5

8 1 1 2 1 1 9.0

7 1 1 1 1 8.5
10.0
8.5

9.0

10.5

11.0
9.5

pretests
Medias
11.5

Lnea de regresin c,
que indica la mejor

52
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

prediccin de postest
(a) a pretest.

Prediccin Prediccin

De grupos A medias A medias De grupos


pretests postests pretests postests
homogneos homogneos

13 13

12 12

11 11

10 10

9 9

8 8

7 7

(b) (c)

Las inferencias causales ms errneas son las que se extraen cuando la informacin se presenta en la forma
indicada en la figura 1 (b) [o la parte superior o inferior de 1 (b)]. As se da la impresin de que los alumnos
ms brillantes van perdiendo su ventaja, y viceversa, como si fuese por el efecto vulgarizador y
homogeneizante del medio institucional. Aunque esta errnea interpretacin implica que la variabilidad
poblacional en el postest debera ser menor que en el pretest, ambas son en realidad iguales. Ms todava; si se
procede al anlisis c grupos puros de puntajes postest [como en la lnea de regresin c y la figura 1 (c)], quiz
se llegue a la conclusin contraria. Como lo seal McNemar [1940], el uso del anlisis de control de tiempo
invertido y el examen directo en busca de cambios en las variabilidades poblacionales son precauciones tiles
contra dicho error de interpretacin.
Cabe observar la regresin hacia la media en otra forma anloga. Cuanto ms desviado sea el puntaje, mayor
ser el probable error de medicin. As, en cierto sentido, el tpico alumno habituado a la obtencin de
puntajes elevados se habr visto favorecido por una <<suerte>> extraordinaria (gran error positivo), al paso
que la mala fortuna acompa a quien obtuvo puntaje muy bajo (gran error negativo). La suerte es, sin
embargo, caprichosa, por lo cual en un postest se espera que quienes poseen puntajes elevados declinen algo
en el promedio, as como que los de puntajes bajos mejoren su posicin relativa. (Se aplica la misma lgica si
se comienza con los puntajes de postest y se procede hacia atrs, en direccin al postest).
La regresin hacia la media es un fenmeno general, que no se limita a la administracin del pretest y del
postest con la misma prueba o formas similares de ella. El director que observa que sus estudiantes de mayor
CI suelen obtener puntajes inferiores a los mximos (aunque muy elevados) en las pruebas de rendimiento
escolar, mientras los de menor CI no suelen ocupar el extremo inferior en esas pruebas (aunque s puestos
bastante bajos), sera culpable de falacia en la regresin si dijese que su escuela subestimula a los alumnos
ms brillantes y recarga de trabajo a los atrasados. Si seleccionase a los que obtuvieron el mayor y el menor
puntaje en la prueba de rendimiento y analizara sus CI, la misma falta de lgica lo forzara a llegar a la
conclusin opuesta.
Si bien hemos hablado aqu de la regresin a propsito de los errores de medicin, en general, ella depende
ms bien del grado de correlacin: cuanto menor sea esta, mayor ser la regresin hacia la media. La falta de
correlacin perfecta puede deberse a <<error>> y/o a fuentes sistemticas de variancia especfica propia de
una o de otra medicin.
Los efectos de la regresin son, pues, acompaamientos inevitables de la correlacin imperfecta de test-retest
para grupos seleccionados por su ubicacin extrema. No son, sin embargo concomitantes necesarios de
puntajes extremos dondequiera que ellos se produzcan. Si un grupo seleccionado por razones independientes

53
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

resulta poseer una media extrema, hay una menor expectacin a priori de que la media grupal, regresione en
una segunda prueba, pues se ha permitido a las fuerzas aleatorias o externas de variancia que influyan sobre
los puntajes iniciales en ambas direcciones. Pero no ocurre as en un grupo seleccionado a causa de su
extremidad en una variable falible, pues ella es artificial y dicho grupo regresionar hacia la media de la
poblacin de donde se lo seleccion.
Efectos de regresin ms indirectos pueden obedecer a la seleccin de sujetos con puntos extremos en
mediciones diferentes del pretest. Consideremos un caso en el cual se eligen, para recibir adiestramiento
experimental, los estudiantes que <<fracasan>> en pruebas tomadas en el aula. Como pretest, se les
administra el tipo A de un test estndar de rendimiento escolar, y como postest el tipo B de dicho test. Es
probable que la prueba tomada en clase tenga una correlacin ms alta con la administracin inmediata del
tipo A que con la administracin del tipo B unos tres meses despus (si en cada sesin toda la clase ha sido
objeto de la prueba). Cuanto ms elevada sea la correlacin, menor ser la regresin hacia la media. Por
consiguiente, los fracasos de la clase habrn determinado una regresin ascendente menor en el pretest que en
el postest, dando una seudoganancia que podra haberse confundido con un conato afortunado de educacin
correctiva. [Para ms detalles sobre ganancias y regresin, vase Lord 1956; McNemar, 1958; Rulon, 1941;
R. L. Thorndike, 1942.] Con ello se concluye la lista de inconvenientes del diseo 2 que podemos analizar en
este momento. En el cuadro 1 aparece otro signo negativo bajo el ttulo <<Validez interna>>, correspondiente
a un factor que no analizaremos hasta exponer el diseo 10 (vase pgina 93) en la seccin de diseos
cuasiexperimentales, y dos signos negativos bajo <<Validez externa>>. Que no explicaremos hasta haber
realizado el anlisis del diseo 4 (vase pgina 32).

3. Comparacin con un grupo esttico

El tercer diseo preexperimental necesario para nuestra exposicin de los factores de invalidacin es la
comparacin con un grupo esttico. Es un diseo en el cual un grupo que ha experimentado X se compara con
otro que no lo ha hecho, a fin de establecer el efecto de X.

X 01
___________
02

Ejemplos de esta clase de investigacin con: la comparacin de sistemas escolares que requieren que los
maestros tengan ttulo universitario (la X) con otros que no exigen esa condicin; la comparacin de alumnos
de cursos que reciben instruccin en lectura veloz con otros que no la reciben; la comparacin entre quienes
presenciaron determinado programa de televisin y los que no lo hicieron, etc. En marcado contraste con el
experimento del diseo 6 <<propiamente dicho>>, que veremos ms adelante, n hay en estos casos del diseo
3 ningn medio explcito que permita asegurar que los grupos habran sido equivalentes de no ser por la X. La
ausencia de un medio tal, indicada en el diagrama por las lneas punteadas que separan ambos grupos, seala
el prximo factor que requiere control: la seleccin. Si hay diferencias entre 01 y 02, ello bien puede deberse al
reclutamiento diferencial de las personas que componen los grupos: estos podran haber diferido aun sin la
presencia de X. Como se ver ms adelante en el anlisis ex post ipso, la equiparacin fundada en
caractersticas que no sean 0 suele resultar ineficaz y conducir a error, particularmente en los casos en que las
personas que constituyen el <<grupo experimental>> han procurado la exposicin a la X.
Una ltima variable entremezclada que, por ende, debe incluirse en esta lista es la llamada mortalidad
experimental, o produccin de diferencias 01 02 en grupos, al retirarse en mayor o menor nmero personas
pertenecientes a ellos. As, aunque en el diseo 3 ambos grupos haban sido alguna vez idnticos, quiz
difiriesen ahora, no por haberse producido un cambio en los integrantes individualmente considerados, sino
ms bien a causa del abandono selectivo de personas de uno de los grupos. En el campo de la investigacin
educacional, este problema suele encontrarse a menudo en los estudios sobre los efectos de la formacin
universitaria, cuando se comparan las mediciones efectuadas entre alumnos recin ingresados (que no han
tenido X) y los que estn a punto de egresar (que la han tenido). Si esos estudios indicarn que las mujeres
recin ingresadas son ms bellas que las que estn por graduarse, rechazaramos en su lugar las dificultades
que encuentra una muchacha agraciada para finalizar su carrera antes de contraer matrimonio. Este efecto se

54
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

clasifica como mortalidad experimental. (Por supuesto, si observamos a las mismas muchachas cuando
acaban de ingresar y cuando egresan, este problema desaparece, con lo cual tenemos el diseo 2).

4. Tres diseos experimentales propiamente dichos

Los tres diseos fundamentales que vamos a exponer en este captulo son los recomendados en la actualidad
por la literatura metodolgica. Son tambin, como se ver, los ms recomendados por nosotros, aun cuando
tal respaldo est sujeto a muchas restricciones concretas en cuanto a la prctica habitual, y d lugar a que
aparezcan algunos signos negativos en el cuadro 1 bajo el ttulo Validez externa.
El diseo 4 es el ms empleado de los tres; por eso, nos permitiremos la libertad de explayarnos mucho ms
en su anlisis, haciendo de l el centro de convergencia de otras consideraciones, cuya aplicacin es ms
general. Obsrvese que los tres diseos se presentan en forma de comparaciones diversas de una sola X con
ninguna X. Los diseos que han recibido mayor cantidad de tratamientos por parte de la corriente del
experimento factorial de Fisher representan elaboraciones importantes pero tangenciales respecto del hilo
conductor de esta obra, y se estudian al final del presente captulo, a continuacin del diseo 6. Ahora bien,
esta perspectiva puede servirnos para recordar aqu que comparar X con no X es un exceso de simplificacin.
En realidad la comparacin se establece con las actividades especficas desplegadas por el grupo de control
durante el perodo en que el grupo experimental recibe la X. Por lo tanto, sera mejor establecerla entre X 1 y
X0, o entre X1 y X0 o entre X1 y X2. El que la actividad de esos grupos de control con frecuencia no est
especificada aade un indeseable elemento de ambigedad a la interpretacin del efecto de X.
Teniendo en cuenta todos estos comentarios, continuaremos en este captulo insistiendo en la convencin
grfica de no presentar ninguna X en el grupo de control.

4. Diseo de grupo de control pretest-postest.

Controles de validez interna

Algunas de las consideraciones anteriores indujeron a los investigadores psicolgicos y educacionales, entre
1900 y 1920, a agregar al diseo 2 un grupo de control, creando el actual diseo ortodoxo con grupo de
control. McCall [1923], Solomon [1949] y Boring [1954] fueron en parte los protagonistas de esta historia, y
una revisin del Teachers College Record de aquel perodo implica ms todava, pues ya en 1912 se
mencionaban grupos de control sin necesidad de mayores explicaciones [p. Ej., Pearson, 1912]. Los dueos
con grupos de control as introducidos se clasifican en esta seccin bajo dos encabezamientos; el presente
diseo 4, en el que se emplean grupos equivalentes logrados por aleatorizacin, y el diseo 10
cuasiexperimental, en el que se utilizan grupos intactos de comparacin ya existentes, de equivalencia no
asegurada. El diseo 4 adopta la forma

R 01 X 02
R 03 04

Como el diseo controla en forma tan ntida las siete hiptesis descritas, las presentaciones que de l se han
hecho no han establecido en forma explcita las necesidades de control que satisfaca. En la tradicin de las
investigaciones del aprendizaje, los efectos prcticos de la administracin de pruebas parecen ofrecer el
primer reconocimiento de la necesidad de contar con un grupo de control. La maduracin era a menudo el
punto crtico de los estudios experimentales en educacin, as como del problema naturaleza-cultura (nature-
nature) en el campo del desarrollo infantil. En la investigacin de los cambios actitudinales, como en los
primeros estudios sobre los efectos de las pelculas cinematogrficas, la historia puede haber sido la
consideracin primaria de necesidad. De cualquier manera, creemos conveniente analizar brevemente aqu la
forma en que se controlan esos factores, as como las condiciones en que se lo hace.
La historia se controla en la medida en que los acontecimientos histricos generales que podran haber
producido una diferencia del tipo 01 ---02 causaran tambin una diferencia del tipo 0 3 04. Advirtase, sin
embargo, que muchas supuestas utilizaciones del diseo 4 (o 5, o 6) no controlan la existencia de una historia

55
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

intrasesional nica. Si a todos los estudiantes, elegidos al azar, que integran el grupo experimental se los trata
en una sola sesin, hacindose lo mismo con los controles, los nicos acontecimientos ocurridos en cada una
de esas sesiones y que carecen de importancia (la broma exagerada, el incendio en la otra cuadra, los
comentarios introductorios del experimentador, etc.) se convierten en hiptesis rivales que explican la
diferencia de 01 02 contra 03 04. Este no es in verdadero experimento, aunque se lo presente como
paradigma ilustrativo, como en la prueba de Solomon [1949] sobre la enseanza del alfabeto. (Para ser
exactos, tenemos que puntualizar que Solomon lo eligi para ilustrar un aspecto diferente.) Meditando sobre
nuestras <<mejores prcticas>> en relacin con ese aspecto, puede que ello carezca de importancia, pero
nuestras <<mejores prcticas>> consisten en presentar experimentos que con hasta frecuencia son imposibles
de repetir, y esa misma fuente de diferencias <<significativas>> pero externas bien podra ser una falla
importante. Adems, en los tpicos experimentos que describe el Journal of Experimental Psychology, el
control de la historia intrasesional, se logra exponiendo a estudiantes y animales a pruebas individuales, y
sometiendo aleatoriamente a los estudiantes y los perodos de prueba a condiciones experimentales o de
control. Obsrvese, no obstante, que aun con sesiones individuales la historia puede escapar al control si se
trabaja con todo el grupo experimental y no con el grupo de control, etc. El diseo 4 requiere que las sesiones
experimentales y de control sean simultneos. Si realizamos sesiones verdaderamente simultneas, tienen que
emplearse distintos experimentadores, y las diferencias entre ellos acaso se conviertan en una forma de
historia intrasesional que se confunda con X.
La solucin ptima es una aleatorizacin de las sesiones experimentales, aplicando las restricciones
requeridas para lograr una representacin equilibrada de fuentes de sesgo tan probables como son los
experimentadores, la hora, el da de la semana, la parte del semestre, la proximidad de los exmenes, etc. El
recurso habitual de trabajar con sujetos experimentales en pequeos grupos en vez de hacerlo
individualmentees inaceptable si se prescinde de ese agrupamiento en el anlisis estadstico. (Cf. Ms
adelante el examen de la asignacin de grupos intactos a diversos tratamientos.) Todos los que toman parte en
la misma sesin participan de la misma historia intrasesional y tienen, por ende, fuentes de similitud distintas
de X. Si tales sesiones se han asignado al azar, el procedimiento estadstico correcto ser el mismo que el que
sealamos ms adelante para la asignacin de aulas intactas a diversos tratamientos (Para algunos estudios
que comprenden la administracin de tests en grupos los distintos tratamientos experimentales pueden
distribuirse al azar dentro de un grupo cara a cara, como en el uso de carias formas de un test para estudiar el
efecto del orden de dificultad de los tems. En tales casos, los elementos especficos de la historia
intrasesional son comunes a ambos tratamientos y no se convierten en una hiptesis rival aceptable que se
confunda con X cuando se explican las diferencias obtenidas.)
La maduracin y la administracin de tests estn controladas en el sentido de que su manifestacin en los
grupos experimentales y de control debera ser igual. La instrumentacin se controla con facilidad cuando se
dan las condiciones para el control de historia intrasesional, en particular cuando se logra la 0 por medio de
reacciones de los estudiantes a un instrumento fijo, como una prueba impresa. Sin embargo, cuando se recurre
a observadores o entrevistadores, el problema es ya ms grave. Si el nmero de observadores es
suficientemente pequeo para que su asignacin a la observacin de sesiones individuales no sea aleatoria, no
solo habr que emplear cada observador tanto para las sesiones experimentales como para las de control, sino
que adems los observadores debern ignorar cules son los estudiantes que reciben cada uno de los distinto
tratamientos, a fin de que el conocimiento de ese hecho no sesgue sus puntajes o registros. Tales tendencias al
sesgo son causas <<confiables>> de variancias, como lo confirma la necesidad de contar en las
investigaciones mdicas con un segundo ciego en la prueba de dos ciegos, y tambin estudios recientes
[Rosenthal, 1959] y anteriores [p. Ej., Kennedy y Uphoff, 1939; Stanton y Baker, 1942]. El uso de registros de
la interaccin grupal, a fin de que los jueces puedan evaluar una serie de secciones aleatorizadas de
transcripciones pretests, postest, experimentales y del grupo de control, contribuye el perfecto control de la
instrumentacin en las investigaciones sobre la conducta escolar y la interaccin grupal.
La regresin se controla, en lo que a las diferencias de medias concierne y por muy extremo que sea el grupo
en los puntajes pretest, si tanto el grupo experimental como el de control se asignan al azar, tomndolos de
este mismo conjunto extremo.
En tales casos, el grupo de control regresiona tanto como el experimental. Sin embargo, aun en las
condiciones del diseo 4 se producen con frecuencia vacos interpretativos, a causa de los mecanismos de
regresin. Un experimentador puede aprovechar el grupo de control para confirmar los efectos de X sobre la
media grupal, y despus abandonarlo mientras examina cules han sido los subgrupos de puntaje pretest del
grupo experimental que han registrado mayores influencias. Si todo el grupo acusa una ganancia, llega a la
estimulante conclusin artificial de que quienes al principio estaban en la posicin ms baja han logrado el

56
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

mayor adelanto, mientras que los que se hallaban en la ms elevada quiz no han avanzado lo ms mnimo.
Este resultado se asegura porque, en condiciones de ganancia media de todo el grupo, el mecanismo de
regresin suple el puntaje de ganancia para los participantes con puntaje pretest inferior a la media, y tiende a
eliminarlo para quienes en el pretest tenan puntaje elevado. (Si en el conjunto no hubo ningn avance de los
bajos y el retroceso de los altos.) Un modo de evitar esos errores de interpretacin es hacer anlisis paralelos
de aquellos que en el grupo de control presentan puntajes pretest extremos, y fundar la interpretacin es hacer
anlisis paralelos de aquellos que en el grupo de control presentan puntajes pretest extremos, y fundar las
interpretaciones de ganancias diferenciales en comparaciones de los puntajes postest de los correspondientes
subgrupos experimentales y de control en el postest. (Ntese, sin embargo, que a causa de las distribuciones
asimtricas resultantes de la seleccin resulta dudosa la conveniencia de las estadsticas de curva normal.)
Se elimina la seleccin como explicacin de la diferencia en la medida en que la aleatorizacin haya
asegurado la igualdad grupal en el momento R, medida que queda determinada por nuestra estadstica de
muestreo. As, la garanta de igualdad es mayor para grandes que para pequeas cantidades de asignaciones
aleatorias. Este supuesto fallar en ocasiones en el grado sugerido por el trmino de error para la hiptesis de
no diferencia. En el diseo 4, ello significa que a veces habr una aparente diferencia <<significativa>> entre
los puntajes pretest. Por lo tanto, aunque la aleatorizacin simple o estratificada asegura la asignacin no
sesgada a los grupos de sujetos experimentales, constituye un medio muy imperfecto para garantizar la
equivalencia inicial de dichos grupos. No obstante, es la nica forma prctica de hacerlo. Lo decimos as, tan
categricamente, a causa de una muy difundida y errnea predileccin evidenciada en la investigacin
educacional durante los ltimos treinta aos, por la igualacin mediante la equiparacin. McCall [1923] y
Peters y Van Boris [1940] contribuyen a perpetuar este equvoco. Como veremos con mayor detalle al estudiar
el diseo 10 y el ex post ipso, la equiparacin no constituye una ayuda real cuando se la utiliza para solucionar
diferencias iniciales de grupos. Ello no significa que propugnemos la eliminacin lisa y llana de este
procedimiento como posible aditamento a la aleatorizacin, como cuando se obtiene mayor precisin
estadstica asignando estudiantes a pares equiparados y asignando despus al azar un miembro de cada par al
grupo experimental y otro al de control. En la literatura sobre estadstica, esto se designa con el trmino
<<bloqueo>>. Vase, en particular, los estudios de Cox [1957], Feldt [1958] y Lindquist [1953]. Pero la
equiparacin como sustituto de la aleatorizacin es tab incluso para los diseos cuasiexperimentales que no
emplean ms que dos grupos naturales intactos, uno experimental y otro de control; aun en ese endeble
<<experimento>> hay medios mejores que la armonizacin para tratar de corregir diferencias iniciales entre
las medias de una y otra muestra.
Los datos de que disponemos gracias al diseo 4 permiten establecer qu Mortalidad explica aceptablemente
la ganancia 01 02. Mortalidad, casos perdidos y casos para los cuales solo se dispone de datos parciales, son
difciles de manejar y por lo comn se los trata de disimular. La experimentacin tpica con mtodos
educativos se prolonga durante das, semanas o meses. Si se realizan los pretests y postests en las aulas de las
que se toman el grupo experimental y el grupo de control, y la condicin experimental requiere la
concurrencia a determinadas sesiones sin que ocurra lo mismo con la condicin de control, la distinta
concurrencia a las tres sesiones (pretest, tratamiento y postest) produce una <mortalidad> que puede
introducir en la muestra sutiles sesgos. Si de todos los designados en un primer momento como participantes
del grupo experimental eliminamos a los que no concurren a las sesiones de prueba, reducimos selectivamente
el grupo experimental con un mecanismo que no se aplica en forma similar al grupo de control, sesgando al
primero en el sentido de los responsables y sanos. El modo preferido de tratamiento, aunque no de utilizacin
habitual, parece ser el empleo de todos los estudiantes seleccionados, experimentales y de control, que
completaron tanto el pretest como el postest, incluso los integrantes del grupo experimental que no obtuvieron
la X. Es innegable que este procedimiento atena el efecto aparente de X, pero evita el sesgo de muestreo,
fundndose en el previo supuesto de que no haba sesgos de mortalidad ms simples. Este supuesto es
susceptible de verificacin parcial examinando tanto el nmero como los puntajes pretest de quienes
participaron en el pretest pero no en el postest. Es posible que algunas X influyeran en esa tasa de abandono,
en vez de modificar los puntajes individuales. Por supuesto, aun cuando tales tasas sean las mismas, queda
todava en pue la posibilidad de que se produzcan complicasas interacciones que propenderan a diferenciar el
carcter de los abandonos en los grupos experimentales y de control.
El problema de la mortalidad puede observarse con toda claridad en el estudio de mtodos correctivos con
voluntarios. As, por ejemplo, se invita a un grupo de lectores deficientes de una escuela secundaria a
participar en sesiones correctivas voluntarias mientras que otro grupo en las mismas condiciones no es
invitado. Del primero de ellos, quiz participen en las sesiones un 30% de sus integrantes. Los puntajes
postests, as como los pretest, provienen de pruebas de lectura estndar administradas a todos los que asistan

57
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

a clase. No es razonable comparar el 30% de voluntarios con el toral de grupo de control. Porque representan
a los ms preocupados por sus puntajes pretest, los capaces de trabajar con mayor ahnco en su propio
mejoramiento, etc.; pero es imposible localizar sus exactos equivalentes en el grupo de control. Aunque
tampoco parece justo para la hiptesis de eficacia teraputica comparar el total del grupo invitado con el total
del no invitado, es esta una solucin aceptable, si bien moderada. Ntese, empero, que puede ocurrir que lo
que produce el efecto sea la invitacin misma, y no precisamente la terapia. En general, el grupo de control no
invitado debera poseer igual conocimiento de su posicin en el pretest que el grupo invitado. Ota posibilidad
es invitar a todos los que necesitan sesiones correctivas y asignar los voluntarios a grupos de tratamiento
verdaderos y falsos; mas en el estado actual del arte es probable que cualquier terapia suficientemente bien
presentada como para que parezca una ayuda al estudiante sea tan eficaz como el tratamiento mismo que se
estudia. Cabe, no obstante, destacar la consecuencia innegable de que las pruebas experimentales de la
eficacia relativa de dos procedimientos taraputicos son mucho ms fciles de evaluar que la eficacia absoluta
de cualquiera de llos. La nica solucin utilizada en la prctica es crear grupos experimentales y de control
entre quienes desean tratamiento correctivo, manipulando los perodos de espera [p. Ej., Rogers y Dymond,
1954]. Esto, por supuesto, suscita a veces otras dificultades, como el excesivo abandono por parte del grupo
de control con terapia pospuesta. Una aplicacin feliz y al parecer no reactiva de un mecanismo de lotera
para decidir sobre la aplicacin inmediata o diferida, durante un semestre, de un curso correctivo de lectura
puede verse en Reed [1956].

Factores que atentan contra la validez externa

Los factores de invalidez externa descritos hasta ahora han sido los que directamente influan sobre los
puntajes 0, y que por s solos podan producir cambios susceptibles de confundirse con los resultados de X, es
decir, factores que, una vez agregado el grupo de control, produciran efectos evidentes en este y que se
sumaran a los de X en el grupo experimental. En el lenguaje propio del anlisis de variancias historia,
maduracin, realizacin de pruebas, etc.se los consider efectos principales, y como tales se los ha
controlado en el diseo 4, dndole validez interna. Las amenazas a la validez externa, por otra parte, pueden
considerarse efectos de interaccin entre X y alguna otra variable. Constituyen, pues, una posible especifidad
de los efectos de X respecto de algn conjunto de condiciones inconvenientemente limitadas. Como anticipo
diremos que, hasta donde nosotros sabemos, en el diseo 4 los efectos observados de X pueden ser especficos
de grupos cuyo inters fue intensificado por el pretest. Como es natural, no podemos extender nuestras
conclusiones al conjunto mayor no sometido a pretest, acerca del cual desearamos extraer conclusiones.
En este captulo examinaremos unas cuantas de esas amenazas a la posibilidad de generalizacin, as como los
procedimientos para sortearlas. Es decir que se prefieren estos diseos por razones de validez externa o
posibilidad de generalizacin, dado que hay diseos vlidos que evitan el pretest y en muchas situaciones
(aunque no necesariamente en la investigacin educacional) se desea generalizar precisamente con respecto a
los grupos no sometidos a pretest. En el campo de la docencia constituyen juicios acerca de la validez externa
las dudas que con frecuencia se expresan sobre la aplicabilidad prctica de los resultados de ciertos
experimentos muy artificiales. La introduccin de tales consideraciones en el anlisis de los mejores diseos
experimentales resulta as atractiva a quien tiene que aplicarlos, pues piensa con toda razn que se las ha
soslayado sin motivo en el tratamiento formal comn sobre metodologa experimental. El anlisis siguiente
ratificar tales apreciaciones sealando multitud de medios que, sin perder validez interna, pueden dar mayor
validez externa a los experimentos y bases ms firmes de generalizacin a la prctica docente.
Pero antes de entrar en ese tema nos es inevitable hacer una advertencia que introduce en la ciencia de la
induccin unos cuantos problemas espinosos, a causa de la persistente resistencia a aceptar lo que con toda
verdad dice Hume, a saber: que la induccin o generalizacin nunca tiene una plena justificacin lgica. Al
paso que los problemas de validez interna son susceptibles de solucin dentro de los lmites de la lgica de la
estadstica probabilstica, los de validez externa no pueden resolverse en estricto rigor lgico en una forma
ntida y concluyente. Generalizar significa siempre mezclar la extrapolacin en un cambio no representado en
nuestra muestra. Dicha extrapolacin se hace suponiendo que se conocer las leyes respectivas. As, s tenemos
un diseo 4 internamente vlido, el efecto queda demostrado solo a propsito de las condiciones especficas
que el grupo experimental y el de control tienen en comn, es decir, solo en relacin con grupos sometidos a
pretest, pero de determinada edad, inteligencia, situacin socioeconmica, regin geogrfica, momento
histrico, conjuncin estelar, orientacin del campo magntico, presin baromtrica, nivel de radiaciones
gamma, etctera.

58
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Desde el punto de vista lgico no podemos generalizar ms all de dichos lmites; es decir que no podemos
generalizar en modo alguno. Pero tratamos de hacerlo conjeturando leyes y verificando algunas de dichas
generalizaciones en otras condiciones no menos especficas pero diferentes. A lo largo de la historia de cada
una de las ciencias, se aprende a <<justificar> las generalizaciones propias de ella a causa de la acumulacin
misma de la experiencia en hacerlo, pero no es esa una generalizacin lgica, deducible de los resultados del
experimento original. En esa situacin hacemos, al generalizar, suposiciones sobre leyes an no demostradas,
incluyendo algunas que ni siquiera se indagaron. As, en la investigacin educacional, suponemos por lo
comn que la orientacin del campo magntico no la afecta. Pero sabemos de ciertos estudios que con
frecuencia el pretest ha tenido un efecto, y por lo tanto quisiramos eliminarlo como obstculo para nuestra
generalizacin. Si hiciramos una investigacin sobre barras de hierro, sabramos por la experiencia que una
primera pesada nunca produce efectos reactivos, pero que la orientacin del campo magntico, si no se la
regulara de manera sistemtica, podra limitar gravemente la posibilidad de generalizar nuestros
descubrimientos. Los motivos, pues, de invalidacin externa son presunciones de leyes generales en la ciencia
de una ciencia: conjeturas acerca de los factores que pueden interactuar con muestras variables de tratamiento
segn cierta ley, y, por lo tanto acerca de los que pueden dejarse de lado.
Adems de los elementos especficos existe una ley general emprica que nosotros, as como el resto de los
hombres de ciencia, aceptamos como supuesto: es la versin moderna de la hiptesis del Mill acerca de la
<<legalidad>> de la naturaleza. Esa versin, menos tajante y drstica, puede enunciarse como el supuesto del
<<aglutinamiento>> (stickiness) de la naturaleza: cuanto ms cercanos se hallan dos acontecimientos en
tiempo, espacio y valor medio este en cualquiera de sus dimensiones o en todas ellas--, ms tienden a
ajustarse a las mismas leyes. Si bien las interacciones complejas y las relaciones curvilneas habrn de
confundir presumiblemente los intentos de generalizacin, tal posibilidad aumenta en relacin directa con el
grado en que la situacin experimental difiere de la situacin con respecto a la cual se desea generalizar.
Nuestra necesidad de una mayor validez externa ser, pues, el requerimiento de la mxima similitud entre
experimentos y condiciones de aplicacin que sea compatible con la validez interna.
Tngase en cuenta, en este sentido, que las ciencias ms <<prsperas>>, como la fsica y la qumica, han
avanzado sin prestar la menor atencin a la representatividad (aunque s, y mucha, a la reiterabilidad por parte
de investigadores independientes). Un laboratorio artificial dentro de una torre de marfil quiz sea una
maravilla, pero no ser representativo, y a menudo la artificialidad puede resultar imprescindible s se quiere
separar analticamente variables fundamentales para los descubrimientos de muchas ciencias. Pero, sin duda,
si no interfiere con la validez interna o el anlisis, la validez externa es una consideracin de la mayor
importancia, sobre todo para una ciencia aplicada como es la pedagoga.

Interaccin de las pruebas y X. En estudios del diseo experimental en s, el peligro que constituye el pretest
para la validez externa fue denunciado por primera vez por Solomon [1949], aunque idnticas consideraciones
haban llevado antes a algunos experimentadores a la aplicacin del diseo 6, que omite el pretest. En especial
durante los estudios de cambios de actitud, en que los mismos tests introducen grandes cantidades de
contenido extraordinario (p. Ej., una tan abundante dosis de declaraciones hostiles como las que se hallan en
el test tpico de prejuicios), es bastante probable que las actitudes de la persona y su propensin a dejarse
persuadir varen por influjo del pretest. Como psiclogos, dudamos seriamente de la comparabilidad del
pblico que asiste a una proyeccin de Gentlemen's Agreement (un film antiprejuicial) inmediatamente
despus de habrsele administrado un test de 100 items sobre antisemitismo, con otro pblico que vea la
misma pelcula sin que se lo haya sometido precisamente a dicho test. Estas dudas se extienden no solo al
efecto principal del pretest, sino tambin a su efecto sobre la respuesta a la persuasin. Supongamos que esa
pelcula en particular fue tan bien realizada que algunas personas llegaron a disfrutarla por su inters
romntico, sin darse cuenta siquiera del problema social que planteaba. Tales personas no existiran
probablemente en un grupo al que se hubiere administrado un pretest. Si el pretest sensibiliz al pblico sobre
el problema, podra, por medio de una concentracin de la atencin, intensificar en s el efecto educativo de
X. Sera concebible que esa X solo resultase eficaz para un grupo al que se hubiese administrado un pretest.
Aunque es frecuente mencionar un efecto sensibilizador de esta ndole en comentarios anecdticos sobre el
tema, los pocos resultados publicados de investigaciones indican tanto la ausencia de efectos [p. Ej.,
Anderson, 1959; Duncan y otros, 1957; Glock, 1958; Lana, 1959, 1959b; Lana y King, 1960; Piers, 1955;
Sobol, 1959; Zeisel, 1947] como un efecto de interaccin que equivale a un amortiguador. As, Solomon
[1949] descubri que administrando un pretest se reduca la eficacia del entretenimiento ortogrfico
experimental, y Hovland, Lumsdaine y Sheffield [1949] sugirieron que un pretest restringa los efectos
persuasivos de las pelculas cinematogrficas. Bien vale la pena evitar este efecto de interaccin aunque no

59
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

sea tan expuesto a error como la sensibilizacin (ya que los falsos positivos son un problema mayor en
nuestra literatura que los falsos negativos, a causa de la gran cantidad de descubrimientos publicados
[Campbell, 1959, pgs. 168-70]).
Al restringir la validez externa, el efecto del pretest sobre X depende, naturalmente, del grado en que tales
mediciones repetidas son caractersticas del conjunto respecto del cual se quiere generalizar. En el mbito de
las comunicaciones masivas, la entrevista del investigador y los procedimientos del test de actitud son
bastante atpicos. Pero en la investigacin pedaggica nos interesa generalizar respecto de una situacin en
que la administracin de tests es una prctica regular. Sobre todo si el experimento puede utilizar como 0
exmenes corrientes tomados en las aulas, pero quiz tambin si las 0 experimentales son similares a las de
utilizacin habitual, no se producira ninguna interaccin indeseable entre la administracin de los tests y X.
Cuando se emplea un test implica engao, reestructuracin conceptual o cognitiva, sorpresa, tensin, etc., los
diseos con grupos no sometidos a pretest continan siendo muy convenientes, aunque no imprescindibles.

Interaccin entre la seleccin y X. Aun cuando el diseo 4 controla los efectos de seleccin a fin de explicar
las diferencias entre el grupo experimental y el de control, contina en pie la posibilidad de que los efectos
vlidamente demostrados solo se verifiquen en aquella poblacin aislada de la cual se extrajeron a la vez
ambos grupos. Esta posibilidad es tanto mayor cuanto ms graves son nuestras dificultades de conseguir
sujetos para el experimento. Consideremos las posibles consecuencias de un experimento de enseanza en el
cual el investigador se ha visto rechazado por nueve sistemas escolares y aceptado por el dcimo. Es casi
seguro que ese ltimo difera, en ms de un aspecto, de los nueve anteriores, as como del conjunto de
escuelas para el que quisiramos generalizar. Por lo tanto, no es representativo. Podra asegurarse que, en
cuanto a la escuela media, su personal tiene ms espritu, menos temor a las inspecciones y ms deseo de
mejorar. Y aunque los efectos que descubriramos fuesen internamente vlidos, podran ser especficos de
tales escuelas. A fin de poder formular un juicio lo ms exacto posible sobre la materia, convendr que los
informes de investigacin proporcionen datos sobre cuntas y cmo eran las escuela y los cursos de los que se
solicit cooperacin y la negaron, a fin de que el lector pueda estimar la gravedad de posibles sesgos
selectivos. En general, cuanto mayor es la cooperacin prestada, mayor el grado en que se afecte la rutina y
ms elevada nuestra tasa de negativas, mayor ser tambin la oportunidad de que exista un efecto de
especificidad de seleccin.
Aclaremos ms puntualmente qu es lo que en realidad significa la <<interaccin entre seleccin y X>>. Si
estuvisemos por realizar un estudio dentro de una nica escuela voluntaria, empleando la asignacin
aleatoria de sujetos a grupos experimentales y de control, no nos preocupara el <<efecto principal>> de la
escuela en s. Si este factor elevara por igual la media del grupo experimental y la del de control, no se
causara dao alguno. Pero si existiesen en la escuela caractersticas que hicieran ms eficaz al tratamiento
experimental en ella que en la poblacin de escuelas que constituyen el verdadero objetivo de la prueba, las
consecuencias podran ser graves. Queremos estar seguros de que puede menospreciarse la interaccin entre
las caractersticas de la escuela (probablemente relacionadas con el hecho de que es voluntaria) y los
tratamientos experimentales aplicados. Algunas variables experimentales podran ser bastante sensibles a las
caractersticas de la escuela, lo cual quiere decir que interactuaran con ellas; otras, no. La interaccin podra
darse en escuelas con CI medios similares, o no presentarse all donde las diferencias de Ci fuesen elevadas.
Sera de esperar, sin embargo, una mayor probabilidad de interaccin si las escuelas difiriesen mucho en
distintas caractersticas que si fuesen anlogas.
A menudo se producen importantes sesgos de muestreo a causa de la inercia de los experimentadores, que no
conceden a una seleccin ms representativa de escuelas la oportunidad de negarse a participar. De ah que la
mayora de las investigaciones sobre educacin se hagan en los establecimientos que cuentan con mayor
porcentaje de alumnos hijos de profesores universitarios. Aunque es imposible la representatividad perfecta en
el muestreo, y aun se la descuida casi en absoluto en muchas ciencias (por ejemplo, en la mayora de los
estudios publicados en el Journal of Experimental Psychology), puede y debe aspirarse a ella como a un
desidertum en la investigacin educacional. Una forma de aumentarla es reducir el nmero de alumnos o
aulas participantes que pertenezcan a un colegio o nivel dado y aumentar la cantidad de escuelas y niveles en
que se lleve a cabo el experimento. Es obvio que nunca vamos a realizar experimentos sobre muestras que
representen a todas las aulas de Estados Unidos o del mundo. Solo poco a poco aprenderemos hasta dnde se
puede generalizar un descubrimiento internamente vlido, por medio de comprobaciones empricas en ese
sentido. Pero tales intentos de generalizacin tendrn xito ms a menudo si en el experimento original se
demuestra el fenmeno en una amplia variedad de condiciones.

60
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

En cuanto a los signos positivos y negativos que aparecen en el cuadro 1, resulta evidente que nada seguro
puede consignarse en esa columna. Se la presenta, no obstante, porque los requisitos de algunos diseos
exageran o atenan la gravedad de este problema. El diseo 4, dentro del mbito de las actitudes sociales, es
tan exigente en lo que a cooperacin por parte de los participantes se refiere, que en definitiva la investigacin
solo se hace con un pblico cautivo en vez de realizarla con ciudadanos comunes, que son a quienes
quisiramos referirnos. En una situacin de esa ndole, el diseo 4 merecera un signo negativo en cuanto a
seleccin. No obstante, en la investigacin pedaggica nuestro universo de inters est constituido por un
pblico cautivo para el cual se pueden obtener diseos 4 de elevada representatividad.

Otras interacciones con X. De manera parecida, las interacciones de X con los dems factores pueden
examinarse como amenazas a la validez externa. La mortalidad diferencial sera un producto de X y no una
interaccin con ella. La interaccin de la instrumentacin con X se ha incluido implcitamente en el anlisis
de validez interna, ya que un efecto especfico de instrumentacin ante la presencia de X falseara el
verdadero efecto de X (p. ej., cuando los observadores asignan puntajes, conocen las hiptesis y saben cules
son los estudiantes que recibieron X). Una amenaza a la validez externa es la posibilidad de que los efectos
sean especficos de los instrumentos particulares (tests, observadores, medidores, etc.) empleados en el
estudio. Si en todos los tratamientos se utilizan observadores o entrevistadores mltiples, tales interacciones
pueden estudiarse directamente [Stanley, 1961a]. La regresin no interacciona con X.
La maduracin tiene consecuencias de especificidad de seleccin: los resultados pueden ser especficos de un
determinado grupo etario, del cansancio, etc. La interaccin de la historia y X implicara que el efecto haba
sido especfico de las condiciones histricas del experimento, y aunque su observacin es vlida, no se lo
hallara en otras.
El hecho de que el experimento se llevase a cabo en el transcurso de una guerra, o a continuacin de haber
fracasado una huelga de maestros, etc., podra producir una reaccin frente a X que no aparecera en otras
circunstancias. Si tuvisemos que preparar un modelo de muestreo para este problema, nos gustara que el
experimento se repitiese en una muestra aleatoria de ocasiones pretritas y futuras, lo cual, como es obvio,
resulta imposible. Adems, compartimos con otras ciencias el supuesto emprico de que no existen leyes que
dependan en verdad del tiempo, que los efectos de la historia, cuando los haya, se debern a combinaciones
especficas de condiciones de estmulo que se dieron en aquel momento, y que llegarn a incorporarse en
definitiva a leyes generales independientes del tiempo [Neyman, 1960]. (Tal vez parezca que las cosmologas
de un <<universo en expansin>> requieren una restriccin de esta afirmacin, pero no en formas pertinentes
a lo que ahora estudiamos.) Sin embargo, la feliz reiteracin de los resultados de la investigacin en distintos
tiempos y situaciones aumenta nuestra confianza en el valor de la generalizacin, al disminuir la probabilidad
de la interaccin con la historia.
Estos distintos factores no se han incluido como otros tantos encabezamientos de columnas en el cuadro 1,
porque no ofrecen bases firmes de discriminacin entre diferentes diseos.

Dispositivos reactivos. En el experimento psicolgico comn, si no en la investigacin educativa, la obvia


artificialidad de la situacin experimental y la conciencia del estudiante de que est participando en un
experimento son causas ms que suficientes de carencia de representatividad. Para sujetos humanos, se
proyecta una tarea de resolucin de problemas de orden ms elevado, en la cual se reacciona contra los
procedimientos y el tratamiento experimental no solo en razn de sus simples valores de estmulo, sino
tambin por su funcin de claves para interpretar la intencin del experimentador. El representar cargos, el
adivinar la intencin, el prepararse para la inspeccin, el sentir cada cual que <<soy un conejillo de Indias>>,
o muchas otras actitudes as generadas, no son en modo alguno representativas de la verdadera situacin
escolar; parecen calificar ms bien el efecto de X, dificultando gravemente la generalizacin. Cuando es
imposible evitar tales dispositivos reactivos, habra que continuar de cualquier manera con los experimentos
de esa ndole que tengan validez interna, pero resulta obvia la conveniencia de evitarlos cuando ello sea
posible. Al hacer esta afirmacin adherimos en parte a la conocida crtica antiexperimental que es frecuente en
los consejos de educacin y entre los docentes, contra la <<futilidad>> de <<toda esa experimentacin>>.
Nuestra ms moderada conclusin no es, sin embargo, que habra que abandonar la investigacin por ese
motivo, sino ms bien que, a causa de l, habra que mejorarla. A este respecto tenemos unas cuantas
sugerencias que ofrecer.

Cualquier aspecto del procedimiento experimental puede producir ese resultado de dispositivos reactivos. La
administracin de pretests, prescindiendo de su contenido, puede hacerlo y parte de la interaccin del pretest

61
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

con X puede ser de ese tipo, aunque hay poderosas razones para sospechar de los aspectos mismos de
contenido de la aplicacin del test. El sistema de aleatorizacin y asignacin de tratamientos quiz sea de esa
ndole. Consideremos el efecto que se produce sobre una clase cuando (como en Solomon [1949] se hace
pasar a una habitacin separada a la mitad de los alumnos, elegidos al azar. Ese acto, ms la presencia de
maestros>> extraos, tiene que crear por fuerza expectaciones de hechos desusada suscitndose as el
asombre y una activa curiosidad en cuanto objeto y finalidad. La presentacin de tratamiento X, si fuese un
acontecimiento inusitado, podra tener un efecto similar. Es de presumir que aun el postets, en un diseo 6 de
postets solamente, podra crear esas mismas actitudes. Cuanto ms evidente sea la conexin en el tratamiento
experimental y el contenido postets, ms probable ser ese efecto.
En el campo de los cambios de opinin publica, esos dispositivos reactivos suelen ser difciles de dictar pero
en la mayor parte de la investigacin de mtodos educativos, no la necesidad de que los estudiantes sepan que
se esta realizando un experimento. (Sera muy conveniente que tambin los maestros lo ignorasen, a la
manera del doble ciego en medicina, pero por lo comn esto suele ser imposible.) Varios recursos permiten
disimularlo. Si las X son variables sobre acontecimientos usuales en el aula, pero que se producen a
intervalos bastante largos dentro del calendario escolar, un tercio de la batalla se abra ganado si los
tratamiento mencionados se aplican sin previo anuncio. En forma similar, si se incluyen las 0 en exmenes
regulares, se llena el segundo requisito. Si las X son comunicaciones entradas en determinados estudiante,
puede lograrse la aleatorizacin sin necesidad de trasportar fsicamente muestras aleatorias equivalentes a
aulas distinta, etctera.
A la luz de estas consideraciones, as como de observaciones personales de los experimentadores que han
publicado datos pese a tener un rapport tsn pobre que sus hallazgos eran bastante engaosos, los autores del
presente volumen van llegando poco a poco a la conclusin de que la experimentacin dentro de las escuelas
deben realizarse, siempre que sea posible, con el personal regular de ella, en especial cuando los
descubrimientos hayan de generalizarse a otras situaciones escolares.
En estos momentos, parecen estar en boga dos tipos principales de <<experimentacin>> dentro de las
escuelas: 1) estudios <<impuestos>> a la escuela por alguien de fuera, que persigue sus propios intereses y
cuyo objetivo no es que la escuela emprenda una accin inmediata (o cambio), y 2) el llamado investigador
<<de accin>>, que procura quesean los maestros mismos quienes <<experimenten>>, tomado este trmino
en sentido muy amplio. En el primer caso los resultados pueden ser rigurosos pero no aplicables. En el
segundo, en cambio, quiz sean muy aplicables pero probablemente no son <<ciertos>>, a causa de una gran
falta de rigor en la investigacin. Otro modelo posible es que las ideas para la investigacin escolar partan de
los maestros y directores, se elaboren los diseos para someterlas a prueba en cooperacin con especialista en
metodologa de investigacin y luego se encarguen de la mayor parte de la experimentacin los promotores de
la idea. Los anlisis estadsticos respectivos podra realizarlos el investigador metodologista, y los resultados
los volvera a introducir al grupo un intermediario idneo (supervisor, director de investigaciones del consejo
escolar, etc.) que hubiera servido en tal carcter durante todo el proceso. De esa manera se lograran
resultados pertinentes y <<correctos>>. La forma de realizar investigacin bsica con un sistema de esta
ndole es un problema en gran parte sin resolver an, pero los estudios podran ser cada vez menos ad boc y
orientarse ms hacia los aspectos tericos, bajo la supervisin de un intermediario competente.
Aunque no tenemos en esta obra la intencin de destacar los buenos o malos ejemplos observables en la
literatura especializada, un reciente estudio de Page [1958] indica una utilizacin tan buena de estos aspectos
(evitando dispositivos reactivos, logrando representatividad de muestreo y evitando las interacciones entre las
pruebas y X), que vamos a citarlos aqu como ilustracin concreta de la prctica ptima. Su estudio indica que
breves comentarios escritos agregados a exmenes objetivos que se devuelven a los alumnos hacen mejorar el
rendimiento en pruebas objetivas posteriores. A esta conclusin se lleg actuando con 74 maestros, 12
consejos escolares, 6 niveles o grados (7-12), 5 niveles de rendimiento (A, B, C, D, F) y gran variedad de
sujetos; no hubo casi prueba alguna de efectos de interaccin.
Los alumnos y las clases se eligieron al azar. Se emple como pretest, el primer examen objetivo regular en
cada clase. Arrojando un dado especial, el maestro asignaba alumnos a grupos de tratamiento y, segn los
casos, agregaba o no comentarios escritos a la prueba. La siguiente prueba objetiva, tomada de acuerdo con la
programacin normal, pas a ser el postest. Hasta donde pudo determinarse, ninguno de los 2.139 alumnos se
enter de la experimentacin. Pocos son los procedimientos de instrucciones que se prestan a esta tan
disimulada aleatorizacin, ya que por lo comn la comunicacin oral necesaria se dirige a toda la clase y no a
algunos individuos. (Las comunicaciones escritas permiten la aleatorizacin, aunque la captacin, por parte
del estudiante, de los distintos tratamientos constituye un problema.) Teniendo en cuenta estos ideales los
investigadores pueden lograr que los experimentos tengan menos caractersticas reactivas que en la actualidad

62
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Por medio de exmenes regulares tomados en el aula, o tesis presentados como exmenes regulares y
anlogos en su contenido, a la vez que mediante procedimientos alternativos de enseanza presentados, sin
previo aviso ni peticin de disculpas, en el curso de las actividades escolares, es probable que en la mayora
de los casos puedan evitarse estas dos causas de dispositivos reactivos. A veces, en grandes escuelas
secundarias o en universidades donde los alumnos se inscriben en cursos populares dictados en determinados
horarios y despus se los asigna en forma arbitraria a mltiples divisiones simultneas, podran lograrse
secciones de equivalencia aleatoria mediante el control del proceso de asignacin (vase en Siegel y Siegel
[1957] la aplicacin de un proceso aleatorio natural que se aprovech en esta forma). Sin embargo, por la
accin de historias intragrupales nicas, tales secciones, al principio equivalentes, se tornan con el correr del
tiempo en segmentos cada vez ms diferenciados.
La solucin a este problema, aplicable en general, es trasladar la aleatorizacin al aula tomada como
unidad y construir grupos experimentales y de control, constituido cada uno de ellos por muchas aulas
asignadas al azar [vase Lindquist, 1940, 1953]. Por lo comn, aunque no es imprescindible, los cursos se
clasificaran para su anlisis sobre la base de factores como escuela, maestro o (cuando este tenga varias
clases), hora, asignatura, nivel intelectual medio, etc.; de ellos se asignaran por un proceso aleatorio varios
grupos de tratamiento experimental. Ya se han realizado algunos estudios de esta ndole, pero creemos que
pronto se generalizarn. Ntese que el test de significacin apropiado no consiste en mezclar todos los
estudiantes como si se los hubiese asignado al azar. Los detalles se estudiarn en el captulo siguiente.

Tests de significacin para el diseo 4

Hay que distinguir el diseo experimental del uso de tests estadsticos de significacin. El primero es el arte
de lograr comparaciones interpersonales y, como tal, sera necesario aunque el producto final consistiera en
porcentajes graficados, fotografas de grupos en accin, etc. En todos estos casos, la interpretabilidad de los
<<resultados>> depende del control sobre los factores a que hemos hecho referencia. Si la comparacin es
interpretable, se requieren tests estadsticos de significacin para decidir si las diferencias obtenidas exceden o
no las fluctuaciones previsibles cuando no existan verdaderas diferencias para muestras de ese tamao. El uso
de tests de significacin presume que es factible establecer comparaciones entre los grupos, y que la
diferencia descubierta es interpretable, pero no da pruebas de ello. De ah que nos gustara exponer el diseo
experimental sobre la base del sentido comn y de consideraciones no matemticas. Esperamos que la mayor
parte de esta obra resulte accesible a los estudiantes de ciencias de la educacin que carezcan todava de
preparacin estadstica. No obstante, hay que reconocer que la cuestin de los procedimientos estadsticos
est ntimamente vinculada al diseo experimental, razn por la cual ofrecemos estos comentarios particulares
sobre el tema. [Vase, asimismo, Green y Tukey, 1960; Kaiser, 1960; Nunnally, 1960, y Rozeboom, 1960.]

Una estadstica errnea de uso comn. Aunque el diseo 4 es el comn y frecuente, los tests de significacin
que con l se utilizan son a menudo errneos, incompletos o inapropiados. Al aplicar la <<razn crtica>>
comn o prueba t a ese diseo experimental estndar, muchos investigadores han computado dos t : una para
la diferencia pretest-postest en el grupo experimental y otra para la ganancia pretest-postest en el grupo de
control. Si la primera resulta <<estadsticamente significativa>> y la otra <<no>>, llegan a la conclusin de
que X tuvo un efecto, sin ninguna comparacin estadstica directa entre el grupo experimental y el de control.
A menudo las condiciones fueron tales que, de haberse aplicado una prueba ms apropiada, la diferencia no
habra sido significativa (como cuando los valores de significacin son casos lmite y el grupo de control
indica una ganancia que casi alcanza el nivel de significacin). Windle [1954] y Cantor [1956] han
demostrado la frecuencia de este error.

Utilizacin de puntajes de ganancia y covariancia. La prueba aceptable de uso ms comn consiste en


computar para cada grupo puntajes de ganancia pretest-postest y calcular una t entre los grupos
experimentales y de control sobre la base de esos puntajes. El <<bloqueo>> o <<nivelacin>> aleatoria de
puntajes pretest y el anlisis de covariancia utilizando como covariable los puntajes de pretest son, por lo
comn, preferibles a las simples comparaciones de puntajes de ganancia. Puesto que la mayor parte de los
experimentos en educacin no acusan diferencias significativas, y por lo tanto no suelen informarse, el uso de
este anlisis ms preciso parece ser muy conveniente. Considerando la labor que implica conducir un
experimento, el trabajo de realizar el anlisis correcto es relativamente trivial. Para ms detalles, pueden

63
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

consultarse tratamientos estndar de anlisis del tipo Fisher [vase tambin Cox, 1957, 1958; Feldt, 1958, y
Lindquist, 1953]
Aspectos estadsticos de la asignacin aleatoria a tratamientos de cursos intactos. La estadstica habitual solo
resulta apropiada en casos de asignacin aleatoria de alumnos individuales a los tratamientos. Si, en cambio,
se asignaran cursos intactos, las frmulas precedentes daran un trmino de error demasiado pequeo, pues,
como es natural, el procedimiento de aleatorizacin habr sido ms <<global>> y se habrn utilizado menos
acontecimientos aleatorios. Lindquist [1953, pgs. 172-89] ha suministrado el fundamento lgico y las
frmulas para la realizacin de un correcto anlisis. En esencia, se emplean las medias de la clase como
observaciones bsicas, y se prueban los efectos del tratamiento contra variaciones en esas medias. Un anlisis
de covariancia utilizara como covariable medias pretest.

Aspectos estadsticos de la validez interna. Las observaciones precedentes se hicieron a fin de dar a conocer
la ortodoxia estadstica relativa al diseo experimental. Las siguientes representan un esfuerzo por ampliar o
corregir esa ortodoxia, extendiendo al terreno de la estadstica del muestreo una inferencia de la distincin
entre validez externa y validez interna. Los principios estadsticos antes analizados implican en su totalidad el
muestreo en un universo infinitamente grande, ms apropiado para una encuesta de opinin pblica que para
el experimento habitual de laboratorio. En casos muy raros, como el estudio de Page [1958], hay un muestreo
real tomado de un gran universo predesignado, que se apropia las frmulas habituales. En el extremo opuesto
se encuentra el experimento de laboratorio presentado en el Journal of Experimental Psychology, por ejemplo,
en el que la validez interna ha sido la nica consideracin y todos los integrantes de un pequeo universo
nico se asignaron a los grupos de tratamiento. En este tipo de prueba se pone gran nfasis en el
procedimiento aleatorio, pero no a fin de asegurarse la representatividad respecto de otra poblacin mayor,
sino al exclusivo efecto de igualar los grupos experimentales y de control o los distintos grupos de
tratamiento. La aleatorizacin se aplica, pues, a una poblacin finita muy reducida, que es en realidad la suma
de los grupos experimentales y de control.
Esta posicin extrema sobre el universo de muestreo se justifica cuando se describen procedimientos de
laboratorio de esta ndole: se solicitan voluntarios, prometindoles o no una gratificacin en dinero, puntajes
de personalidad, puntajes para la aprobacin de cursos, o cumplimiento de un requisito obligatorio que de
todos modos tendrn que satisfacer en algn momento del curso acadmico. A medida que llegan, se los va
asignando al azar a los distinto tratamientos. Cuando se ha alcanzado determinado nmero de sujetos, se
interrumpe el experimento. Ni siquiera ha habido una seleccin aleatoria entre los integrantes de una lista
mucho mayor de voluntarios. Los primeros constituyen una muestra sesgada y el universo total
<<muestreado>> cambia de un da a otro a medida que el experimento contina, que se requiere ms presin
para reclutar voluntarios, etc. En un momento dado se detiene el procedimiento, despus de haberse utilizado
a todos los miembros designables del universo en uno u otro de los grupos de tratamiento. Ntese que los
sesgos implicados de muestreo no amenazan en lo ms mnimo la equivalencia aleatoria de los grupos de
tratamiento, sino solo su <representatividad>>.
Consideremos ahora a un cientfico ms meticuloso, que de una clase integrada por 250 personas extrae 100
al azar, se pone en contacto con ellas por carta o por telfono y, despus de entrevistarlos, los asigna, tambin
al azar, a grupos de tratamiento. Por supuesto, unos 20 de ellos no pueden ajustarse al horario de laboratorio,
estn enfermos, etc., por lo cual se ha producido una redefinicin implcita del universo. Y aunque gracias a
su perseverancia consiga los 100, lo que habr ganado, desde el punto de vista de la representatividad, ser la
posibilidad de generalizar con seguridad estadstica a propsito del curso del ao 1961 de Psicologa
Educacional A en la Escuela Normal del Estado. Este nuevo universo, aunque mayor, carece de positivo
inters cientfico. Sus lmites no son los estatuidos por ninguna teora cientfica. Los aspectos de verdadero
inters para la generalizacin debern explorarse por medio del muestreo de experimentos realizados en otros
lugares. Por supuesto, al ser menos seleccionados sus alumnos, se tiene una mayor validez externa, pero no
ganancia suficiente para que la mayora de los psiclogos experimentales consideren que se compensa con
ello el esfuerzo realizado.
Resulta, en general, obvio que el fin principal que se persigue con la aleatorizacin en experimentos de
laboratorio es la validez interna, no la externa. Por tanto, habra que utilizar mrgenes de error ms reducidos
y apropiados, basados en pequeos universos finitos. Siguiendo a Kempthorne [1955] y Wilk y Kempthorne
[1956], creemos que el modelo correcto es la aleatorizacin en urnas en vez de la extraccin de muestras de
un universo. De ese modo se dispone de un test no paramtrico ms apropiado y preciso, en el cual se toman
los puntajes obtenidos en los grupos experimentales y de control y se los asigna una y otra vez a dos
<<urnas>>, generando emprica o matemticamente una distribucin de diferencias medias que resultan en su

64
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

totalidad de asignaciones aleatorias de esos puntajes particulares. Tal distribucin de diferencias constituye el
criterio con que debera compararse la diferencia media obtenida. Cuando exista una <<interaccin posicin
tratamiento>> (heterogeneidad de efectos reales entre los sujetos), esa distribucin adoptada en la prueba
comn. Con estos comentarios no pretendemos modificar mucho la actual prctica en la administracin de
tests de significacin en la investigacin pedaggica. Las soluciones exactas son difciles de conseguir y, por
ejemplo, suele exigir la utilizacin de computadoras de gran velocidad. La direccin del error es conocida: el
empleo de la estadstica tradicional es demasiado conservador, con una excesiva tendencia a decir <<no se
registran efectos>>. Si juzgamos que nuestras publicaciones estn saturadas de <<falsos positivos>>, es decir,
de informacin sobre efectos que no resiste la prueba de una validacin cruzada (como acaece, por cierto, con
la psicologa experimental y social, aunque no todava con la investigacin pedaggica), ese error si lo es
ser siempre preferible. La posibilidad de subestimar la significacin es mayor cuando solo hay dos
condiciones experimentales y se emplean todos los sujetos disponibles [Wilk y Kempthome, 1955, pg.
1154].

5. Diseo de cuatro grupos de Solomon

Aunque el diseo 4 se usa ms, el 5, denominado diseo de cuatro grupos de Solomon [1949] tiene con razn
un mayor prestigio y constituye la primera consideracin explcita de factores de validez externa. El diseo es
el siguiente:

R 01 X 02
R 08 04
R X 05
R 06

Trazando en forma paralela los elementos del diseo 4 (0 1 a 04) con los grupos experimental y de control sin
pretest, cabe determinar tanto los efectos principales de la realizacin de la prueba como la interaccin entre
ella y X. De ese modo, no solo se aumenta la posibilidad de generalizar, sino que adems se repite el efecto de
X en cuatro formas diferentes: 02 > 01, 02 > 04, 05 >06 y 05 <03. Las inestabilidades concretas de la
experimentacin son tales que, si esas comparaciones concuerdan, el vigor de la inferencia queda muy
incrementado. Otra contribucin indirecta a la posibilidad de generalizar los hallazgos experimentales es
tambin que, en virtud de la experiencia con el diseo 5 en cualquier mbito de investigacin dado, se
averigua la posibilidad general de interacciones de <<pruebas por X>>, pudindose as interpretar mejor los
diseos 4, tanto futuros como pasados. Asimismo, puede advertirse (comparando 0 6 con 01 y 03 ) un efecto
combinado de maduracin e historia.

Pruebas estadsticas para el diseo 5.

No hay ningn procedimiento estadstico particular que utilice a un mismo tiempo los seis conjuntos de
observaciones. Las asimetras del diseo descartan el anlisis de la variancia de puntajes. (Las sugerencias de
Solomon a este respecto consideran inaceptables.) Dejando de lado los pretests, salvo como un nuevo
<<tratamiento>> coordinado con X, se pueden estudiar los puntajes postest mediante un simple anlisis 2 X 2
del diseo de variancia:

Sin X Con X
Con administracin de pretest 04 02
Sin administracin de pretest 06 05

65
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Sobre la base de las medias de las columnas se estima el efecto principal de X; de las medias de las filas, el
efecto principal del pretest y de las medias de los casilleros, la interaccin entre la aplicacin del test y X. Si
los efectos principales e interactivos de la aplicacin de las pruebas son muy pequeos, acaso sea conveniente
realizar un anlisis de covariancia de 04 contra 02, con los puntajes del pretest por covariable.

6. Diseo de grupo de control con postest nicamente

El pretest es un concepto muy arraigado en el pensamiento de los investigadores en los campos de la educcin
y la psicologa, pero en realidad no es imprescindible para los diseos experimentales propiamente dichos.
Por razones psicolgicas, es difcil renunciar a <<tener la seguridad>> de que los grupos experimentales y de
control eran <<iguales>> antes del tratamiento experimental diferencial. No obstante, la aleatorizacin
implica la mayor seguridad, aplicable a cualquier fin, de la carencia de sesgos iniciales entre grupos. Dentro
de los mrgenes de confianza establecidos por las pruebas de significacin, la aleatorizacin puede ser
suficiente, sin necesidad de recurrir al pretest. En realidad, casi todos los experimentos agrcolas realizados en
la tradicin de Fisher [1925, 1935] carecen de pretest. Ms todava, en investigacin pedaggica, sobre todo
en los grados primarios, tenemos que experimentar a menudo con mtodos que permitan la introduccin
inicial de elementos absolutamente nuevos, para los cuales son imposibles los pretests en el sentido ordinario
del trmino, lo mismo que estaran fuera de lugar los referidos a la presunta culpabilidad o inocencia en un
estudio acerca de los efectos de la informacin presentada al jurado por el abogado defensor. El diseo 6
responde a esa necesidad, y adems es apropiado para todas las situaciones en que podran utilizarse los
diseos 4 o 5, es decir, aquellas en que es posible una verdadera aleatorizacin. Su forma es la siguiente:

R X 01
R 02

Si bien este diseo se utilizaba ya en la dcada de 1920, la mayora de los textos metodolgicos no lo han
recomendado. Ello se debi en parte a que se lo confunda con el diseo 3, y tambin a la falta de confianza
en la aleatorizacin como procedimiento de igualacin.
Puede considerarse que este diseo comprende los ltimos dos grupos del diseo de cuatro grupos de
Solomon; controla la aplicacin del test como efecto principal y la interaccin, pero, a diferencia del diseo 5,
no los mide. Sin embargo, esa medicin es tangencial a la cuestin bsica de si X tuvo o no un efecto. As,
pues, el diseo 5 es preferible al 6 por las razones apuntadas, pero las mayores ventajas del 5 quiz no
justifiquen el esfuerzo que demanda (ms del doble). Asimismo, el diseo 6 es por lo comn preferible al 4, a
menos que haya alguna duda a propsito de la autenticidad del proceso aleatorio de asignacin. El diseo 6 se
usa demasiado poco en investigacin educacional y psicolgica.
Pero en el caso de repeticin de pruebas, que se presenta con frecuencia en la investigacin educacional, si se
dispone de antecedentes apropiados en materia de variables, se los debera emplear para bloqueo o nivelacin,
o como covariables. Este recomendacin la hacemos por dos motivos. Primero, porque las pruebas
estadsticas en que se apoya el diseo 4 son ms decisivas que las existentes para el 6. El esfuerzo que exige
el diseo 4 anula esta ventaja en la mayor parte de las situaciones de investigacin, pero no ocurrira as si se
dispusiese en forma automtica de antecedentes apropiados sobre puntajes. En segundo lugar, la
disponibilidad de puntajes pretest permite examinar la interaccin de X y el nivel de habilidad en el pretest,
explorando as ms a fondo la posibilidad de generalizar el hallazgo. Algo similar puede hacerse a propsito
del diseo 6, empleando otras medidas disponibles en vez del pretest, pero estas consideraciones, sumadas al
hecho de que para la investigacin pedaggica los tests frecuentes son caractersticos del universo al cual se
quieren extender las generalizaciones, pueden invertir el criterio de preferir por lo comn el diseo 6 al 4.
Ntese asimismo que para cualquier mortalidad sustancial entre R y el postest los datos de pretest del diseo 4

66
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

ofrecen mayores oportunidades de eliminar la hiptesis de mortalidad diferencial entre los grupos
experimental y de control.
Aun as, hay muchos problemas para los cuales no se dispone de pretests, o estos resultan inconvenientes o
capaces de provocar reacciones, y para esos casos es preciso seguir insistiendo, en muchos sectores, acerca de
la legitimidad del diseo 6. Adems de los estudios sobre el modo de ensear material muevo, queda una gran
cantidad de casos en los que la X y la 0 postest pueden entregarse a los alumnos o grupos como un solo
<<paquete>> natural, y un pretest resultara molesto. Tales situaciones se producen con frecuencia en los
mismos procedimientos de prueba, as como en estudios de instrucciones distintas, planillas de respuesta de
formato diferente, etc. Algo similar ocurre con los estudios sobre campaas para reclutar voluntarios, etc. En
los casos en que hay que guardar el anonimato del alumno, el diseo 6 suele ser el ms conveniente,
encarndose entonces la aleatorizacin por medio del ordenamiento mezclado de materiales destinados a la
distribucin.

Aspectos estadsticos del diseo 6


El modo ms sencillo sera la prueba t. El diseo 6 es quiz la nica situacin para la cual esa prueba es
ptima. Sin embargo, se pueden emplear el anlisis de covariancia y el bloqueo de <<variables sujeto>>
[Underwood, 1957b], as como niveles anteriores de educacin, puntajes en tests, ocupacin de los padres,
etc., consiguindose as mayor poder del test de significacin, muy similar al que brinda un pretest. No es
necesario que el pretest y el postest sean idnticos. A menudo sern formas diferentes <<del mismo>> test y
por lo tanto menos idnticos que una repeticin del pretest. La mayor precisin obtenida se vincula en forma
directa con el grado de covarancia, y aunque esta suele ser ms elevada en formas alternadas <<del mismo>>
test que en tests <<diferentes>>, se trata de una cuestin de grado tan confiable y factorialmente compleja
como la superioridad eventual de un promedio puntual respecto de un breve <<pretest>>. Advirtase, sin
embargo, que un promedio puntual no es por lo comn conveniente como medicin postest, a causa de su
probable insensibilidad a X si se lo compara con una medicin ms especficamente apropiada en contenido
y oportunidad. No tiene mucha importancia decidir si ese seudodiseo de pretest debe clasificarse como 6 o
como 4. Tendra las ventajas del primero, ya que evitara una sesin pretest introducida por el experimentador,
as como la <<reveladora>> repeticin de un contenido poco usual idntico o muy similar (como en los
estudios de cambios de actitud). Por estas razones la inclusin del diseo 6 bajo el ttulo de <<Dispositivos
reactivos>> debera ser algo ms positiva que respecto de los diseos 4 y 5. La justificacin de esta diferencia
es, por cierto, mucho ms vlida para las ciencias sociales en general que para la investigacin sobre
instruccin pedaggica.

Diseos factoriales.

Sobre la base conceptual de los tres diseos anteriores, pero en particular el 4 y el 6, pueden ampliarse las
complejas elaboraciones tpicas de los diseos factoriales de Fisher, agregando otros grupos con otras X. En
un criterio tpico de clasificacin nica o anlisis de la variancia <<en un solo sentido>>, tendramos varios
<<niveles>> del tratamiento, por ejemplo, X1, X2, X3, etc., y quiz tambin un grupo X0 (ausencia de X). Si
se considera el grupo de control como uno de los tratamientos, habra en los diseos 4 y 6 un grupo para cada
tratamiento. En el diseo 5 habra dos grupos (uno sometido a pretest, el otro no) para cada tratamiento, y aun
sera posible un anlisis de variancia de doble clasificacin (<<en dos sentidos>>). No tenemos noticia de que
se hayan realizado diseos del tipo 5 en ms de dos niveles. Por lo comn, si nos preocupa la interaccin
pretest, empleamos el diseo 6, a causa del gran nmero de grupos que podran designarse X a1 Xb1, Xa1 Xb2,
Xa1 Xb3,...,Xb3............, Xa2 Xb1, etctera.
Tales elaboraciones, complicadas con intentos de economizar eliminando a algunas de las posibles
permutaciones de Xa , han producido parte de los inquietantes misterios del diseo factorial (bloques
aleatorizados, parcelas divididas, cuadrados grecolatinos, repeticin fraccional, confusin, etc.).origen de la
enorme brecha que separa las metodologas avanzadas de las tradicionales en el mbito de la investigacin
educacional. Esperamos que esta obra ayude a salvar ese vaco por medio de una continuidad con la
metodologa tradicional y las consideraciones dictadas por el sentido comn que el estudiante lleva siempre
consigo. Tambin estimamos que gran parte de lo que debe ensearse sobre diseo experimental se entiende
mejor si se lo expone en forma de diseos de dos tratamientos, sin interferencia de otras complicaciones. No

67
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

obstante, la exposicin completa de los problemas planteados por el uso comn provocar una comprensin
mayor tanto de la necesidad como de la localizacin de modernos enfoques. Al buscar la forma ms eficaz de
resumir el anticuado pero tan difundido diseo 4 no vimos ya constreidos a disponer de un anlisis de
covariancia, casi no utilizado en esta situacin. Y en el diseo 5, con un problema de dos tratamientos que se
elabora slo para obtener controles necesarios, nos alejamos de las relaciones crticas o pruebas t, y nos
introducimos en la estadstica del anlisis de variancia.
Los detalles de los anlisis estadsticos para diseos factoriales no pueden ensearse ni aun esbozarse siquiera
en esta obra. Edwards [1960], Ferguson [1959], Jonson y Jackson [1959] y Lindquist [1953], presentan a los
investigadores pedaggicos aspectos elementales de tales mtodos. Confiamos, sin embargo, en que las
explicaciones siguientes permitirn alguna mayor comprensin de ciertas alternativas y complejidades de
particular relevancia en los aspectos de diseo analizados en nuestra obra. Las complejidades que tenemos
que analizar no comprenden las razones comunes para recurrir a cuadrados latinos ni a muchos otros diseos
incompletos en que conocimiento de ciertas interacciones se sacrifica por meras razones de costo. (Pero el uso
de cuadrados latinos como sustituto de los grupos de control en los casos en que no hay modo de aleatorizar
se estudiar ms adelante, como diseo cuasiexperimental 11.) La razn de haber prescindido aqu de esos
diseos incompletos es que para el problema de validez externa resulta muy conveniente contar con un
conocimiento detallado de las interacciones, sobre todo en una ciencia que ha tenido problemas para repetir
los descubrimientos de un investigador en otro ambiente distinto [vase Wilk y Kempthorne, 1957]. Los
conceptos que tratamos de exponer en este captulo son los de la interaccin, las clasificaciones inclusivas y
las clasificaciones cruzadas, y los modelos factoriales finitos, fijos, aleatorios y mixtos.

Interaccin

Ya hemos utilizado este concepto en situaciones en que, segn creemos, el lector no especializado lo habr
encontrado comprensible. Como antes, insistimos aqu en las consecuencias relativas a la posibilidad de
generalizar. Expondremos en forma grfica (figura 2) cinco posibles resultados de un diseo con tres niveles,
compuesto cada uno de ellos de X a, que denominaremos A y B. (Puesto que se han de graficar tres
dimensiones [A, B y 0] en dos, son varias las presentaciones que resultan posibles, de las cuales no
emplearemos ms que una.) En la figura 2(a) puede apreciarse un notable efecto principal tanto para A como
para B, pero ninguna interaccin. (Hay, por supuesto, una suma de efectos siendo A 3 B3 el ms fuerte--, pero
ninguna interaccin, ya que los efectos son aditivos.) En todos los dems casos encontramos interacciones
significativas adicionales, o bien en reemplazo de los efectos principales de A y B. Es decir que la ley sobre el
efecto de A vara de acuerdo con el valor especfico de B.
En este sentido, los efectos de interaccin son reglas de especificidad de efecto y, por tanto, conducen al
intento de generalizacin. El efecto de interaccin en 2(d) es, sin duda alguna, de ese orden. Aqu, A no
produce un efecto principal (es decir que, si se promedian los valores de las tres B para cada A, resulta una
lnea horizontal). Pero cuando se mantiene B en el nivel 1, los aumentos en A producen un efecto decreciente,
en tanto que si se mantiene B en el nivel 3, A tiene un efecto incremental. Ntese que si el experimentador
slo hubiese variado A, manteniendo B constante en el nivel 1, los resultados, aunque internamente vlidos,
hubiesen dado pie a que se hiciesen generalizaciones errneas a propsito de B 2 y B3. La caracterstica de
mltiple factorial del diseo ha llevado, pues, a realizar valiosas exploraciones sobre la posible generalizacin
o validez externa de cualquier enunciacin sumaria sobre el efecto principal de A. Las limitaciones de la
posibilidad de generalizar o de la espeficidad de los efectos aparecen en el anlisis estadstico como
interacciones significativas.
La figura 2(e) representa una forma de interaccin an mas extrema: ni A ni B producen efecto principal
alguno (no resultan reglas generales sobre qu nivel de ambas es mejor) pero las interacciones son fuertes y
bien definidas. Consideremos un resultado hipottico de esta ndole. supongamos

68
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Que tres clases de maestros son, en general, de la misma eficiencia (p. ej., los improvisadores espontneos, los
que preparan a conciencia su trabajo y los que supervisan con esmero la tarea de sus alumnos). Asimismo, tres
mtodos de enseanza resultan, en general, de idntica eficacia (p. ej., discusin en grupo, exposicin formal
y supervisin individual). En tal caso, aun en ausencia de <<efectos principales>> en cualquiera de los tipos
de maestros o mtodos pedaggicos, podra ocurrir que estos segundos tuviesen gran interaccin con la
modalidad de maestro: el improvisador espontneo tendra ms xito con la discusin en grupo u menos con
la supervisin individual, mientras que el acostumbrado a seguir de cerca de sus alumnos alcanzara los
mejores resultados en la supervisin individual y los peores en el sistema de la discusin en grupo.

69
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Desde este punto de vista, cabe distinguir los tipos de interacciones significativas halladas. Quiz nos resulte
provechoso un concepto como el de <<interacciones montonas>>. Ntese que en 2(b), como en el 2(a), hay
un efecto principal, tanto de A como de B, y que A produce el mismo efecto direccional en cualquier panel
separado de valores de B. En consecuencia, nos sentimos mucho ms seguros si generalizamos a situaciones
nuevas la expectativa de aumento en 0 con aumentos en A que si lo hacemos en 2(c), que podra producir
tambin efectos principales significativos en A y B, as como una interaccin A-B significativa. En realidad,
podramos estar casi tan seguros de la generalidad del efecto principal de A en el caso 2(b) como en el 2(a),
libre este de interaccin. Por cierto que al interpretar efectos con miras a la generalizacin se las debera
graficar y examinar bien, en todos sus detalles. Algunas interacciones <<montonas>> o unidireccionales
producen pocas limitaciones y a veces ningunasobre la especificidad. (Vase en Lubin [1961] un profundo
estudio de este problema.)

Clasificaciones inclusivas

En los ejemplos dados hasta aqu, todos los criterios de clasificacin (las A y las B) se han <<cruzado>> con
todos los dems criterios. Es decir que todos los niveles de A se han dado con todos los niveles de B. Sin
embargo, el anlisis de variancia no se limita a esa situacin.
Hasta ahora hemos utilizado, a ttulo de ilustracin, criterios de clasificacin que eran <<tratamientos
experimentales>>. Otros tipos de criterios de clasificacin, como el sexo y la edad de los alumnos, podran
introducirse en muchos experimentos en forma de clasificaciones plenamente cruzadas. Pero a fin de
incorporar los usos ms comunes de clasificaciones <<inclusivas>>, presentaremos la posibilidad de criterios
de clasificacin menos obvios. Uno de ellos es <<maestros>>. Operando en el nivel de cruzado total, se
podra hacer una prueba en una escuela secundaria en la cual diez maestros emplearan uno de los dos
mtodos posibles para ensear una determinada asignatura a distintos cursos experimentales. En ese caso los
maestros seran un criterio de clasificacin absolutamente cruzado, pues cada uno de ellos constituira un
<<nivel>> diferente. El <<efecto principal>> de los <<maestros>> sera la evidencia de que algunos de ellos
son mejores que otros, con prescindencia del mtodos que emplearon. (Los estudiantes o las clases se habrn
asignado al azar; de lo contrario se confundiran las idiosincrasias del maestro con las diferencias de
seleccin.) Una interaccin significativa entre maestros y mtodos significara que el mtodo que mejor
funcion haba dependido del docente en particular a quien se estaba considerando.
Supongamos ahora, siguiendo una interaccin de esta ndole, que nos interesa conocer si, en general, una
tcnica dada es mejor para maestros que para maestras. Si dividimos ahora nuestros diez maestros en cinco
hombres y cinco mujeres, se obtiene una clasificacin <<inclusiva>> en el sentido de que la clasificacin
maestros, aunque todava til, no considera los sexos; es decir que el mismo maestro no aparece en uno y otro
sexo, en tanto que cada maestro y cada sexo si considera los mtodos. Esta inclusividad exige un anlisis algo
distinto de aquel en que todas las clasificaciones se cruzan entre s. (Un anlisis ilustrativo puede verse en
Green y Tukey [1960] y Stanley [1961a].) Adems, quedan eliminadas ciertas interacciones de las variables
inclusivas. As, no son computables ni tienen, en realidad, sentido desde el punto de vista conceptuallas
interacciones maestros-sexo-mtodo.
<<Maestros>> tambin podra convertirse en una clasificacin inclusiva, si el experimento anterior se
extendiese a varias escuelas, de manera que ellas viniesen a constituir un criterio de clasificacin (en el cual
los efectos principales acusaran diferencias en la tasa de aprendizaje de los alumnos de los distintos
establecimientos). En tal caso los maestros seran por lo comn <<inclusivos>> dentro de las escuelas, ya que
lo habitual es que un maestro d clases en un solo colegio. En este caso en concebible una interaccin
maestro-escuela, pero no se la podra computar a menos que todos los maestros enseasen en uno y otro
establecimiento, en cuyo caso maestros y escuelas seran <<cruzados>>, no <<inclusivos>>.
A los alumnos, o sujetos de un experimento, tambin se los puede trata como criterio de clasificacin. En un
mecanismo totalmente cruzado, a cada alumno se lo somete a cada uno de los distintos tratamientos, pero en
muchos casos entra en varios, aunque no en todos, los tratamientos; es decir que no se produce el fenmeno
de la inclusin. Un caso frecuente es el estudio, durante el aprendizaje, de datos obtenidos por pruebas
individuales. Aqu podramos tener curvas de aprendizaje para los distintos alumnos, divididos estos entre dos
mtodos de estudio. Podran analizarse las interacciones prueba-mtodo y alumno-prueba, pero no alumno-
mtodo. S a los alumnos se los clasifica por el sexo, se genera tambin un fenmeno de inclusin.
Casi todas las variables de inters en la experimentacin educacional pueden cruzarse con otras variables y no
tienen por qu ser objeto de inclusin. Excepciones notables, adems de las ya mencionadas, son la edad

70
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

cronolgica, la edad mental, el grado escolar (primero, segundo, etc.) y el nivel socioeconmico. El lector
inteligente habr notado que las variables independientes, o los criterios de clasificacin, pertenecen a
distintos tipos: 1) variables manipuladas, como el mtodo de enseanza, que el experimentador puede asignar
a voluntad; 2) aspectos potencialmente manipulables, como materias estudiadas, que el experimentador podra
asignar de alguna manera aleatoria entre los alumnos que utiliza, pero que rara vez lo hace; 3) aspectos
relativamente fijos del ambiente, como comunidad, escuela o nivel socioeconmico, fuera del control directo
del experimentador pero que sirven de bases explcitas para la estratificacin de la prueba; 4) caractersticas
<<orgnicas>> de los alumnos, como edad, estatura, peso y sexo, y 5) caractersticas de reaccin de los
alumnos, como puntajes en distintos tests. Por lo comn las variables independientes manipuladas de la clase
1 son de inters fundamental, mientras que las variables independientes no manipuladas de las clases 3,4 y a
veces 5 sirven para aumentar la precisin y revelar hasta qu punto son generalizables los efectos de las
variables manipuladas. Las variables de clase 5 aparecen de ordinario como covariables o variables
dependientes. Otra forma de considerar las variables independientes es como intrnsecamente ordenadas
(grado, nivel socio-econmico, estatura, pruebas, etc.) o no ordenadas (mtodo de enseanza, asignatura,
maestro, sexo, etc.). A menudo, los efectos de las variables ordenadas suelen analizarse ms a fondo, a fin de
ver si la tendencia es lineal, cuadrtica, cbica o de grado ms elevado [Grant, 1956; Myers, 1959].

Modelos finitos, aleatorios, fijos y mixtos

Hace poco, estimulados por el trabajo indito de Tukey del ao 1949, varios estadsticos matemticos crearon
modelos <<finitos>> para el anlisis de variancias que aplican al muestreo de <<niveles>> de factores
experimentales (variables independientes) los principios, bien elaborados ya, del muestreo en poblaciones
finitas. Scheff [1956] para el diseo factorial totalmente aleatorizado de tres clasificaciones. Los modelos
finitos resultan de particular provecho porque pueden generalizarse con facilidad a situaciones en que uno o
ms de los factores son aleatorios o fijos. Ferguson dio una sencilla explicacin de aquellas extensiones en
1959.
En vez de presentar frmulas, recurriremos a una ilustracin verbal para mostrar cmo difieren entre s las
selecciones finita, aleatoria y fija de niveles de un factor. Supongamos que en un experimento dado los
<<maestros>> constituyen una de las distintas bases de clasificacin (es decir, variables independientes). Si se
dispone de 50 maestros, se podran extraer 5 de ellos al azar y utilizarlos en el estudio. Aparecera entonces en
algunas de nuestras frmulas un coeficiente de muestreo de factores (1---5/50) = 0. Por lo contrario, si
existiese una poblacin prcticamente infinita de maestros, 50 de ellos elegidos al azar constituiran un
porcentaje infinitesimal, por lo que en cada efecto <<aleatorio>> el coeficiente tendera a 1. Los anteriores
coeficientes modifican las frmulas de medias cuadrticas esperadas, y por lo tanto de trminos de <<error>>.
Ms detalles pueden verse en Brownlee [1960], Cornfield y Tukey [1956], Ferguson [1959], Wilk y
Kempthorne [1956] y Winer [1962].

Otras dimensiones de extensin

Antes de abandonar los <<verdaderos>> experimentos a propsito de los diseos cuasiexperimentales,


queremos explorar algunas otras extensiones desde este simple ncleo, aplicables a todos los diseos que se
vern ms adelante.

Aplicacin de tests en busca de efectos mediatos.

71
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

En la esfera de la persuasin bastante afn a la de la educacin y la enseanza--, Hovland y sus colegas


comprobaron, en reiteradas oportunidades, que los efectos a largo plazo son no solo cuantitativa sino tambin
cualitativamente diferentes. Estos efectos son mayores que los inmediatos en las actitudes generales, aunque
ms dbiles en algunas actitudes especficas [Hovland, Lumsdaine y Sheffield, 1949]. Las afirmaciones de
una persona desacreditada carecen de efecto persuasivo inmediato, pero ese efecto puede resultar significativo
un mes ms adelante, a menos que se recuerde a los interlocutores de qu fuente provienen [ Hovland, Janis y
Kelley, 1953]. Estos decubrimientos nos alertan contra la prctica de establecer toda nuestra evaluacin
experimental de los mtodos pedaggicos sobre la base de postests o mediciones inmediatas realizadas en
cualquier punto aislado del tiempo.
A pesar de los problemas incomparablemente mayores de ejecucin implicados (y la incomodidad que ello
constituye para el desarrollo del programa de nueve meses de una tesis de doctorado), nos permitimos
recomendar que en la planificacin de las investigaciones se incluyan perodos de postests de un mes, seis
meses y un ao.
Cuando las mediciones del postest consistan en calificaciones y puntajes de exmenes que de todos modos
van a obtenerse, ese estudio ser un simple problema de contabilidad (y mortalidad). Pero cuando sea el
experimentador quien introduzca las 0, casi todos los autores consideran que la repeticin de mediciones
postest con los mismos alumnos sera ms engaosa que el pretest. As se ha comprobado por cierto en
investigaciones sobre memoria [p. ej., Underwood, 1957a]. Al paso que el grupo de Hovland recurra a la
tpica aplicacin de un pretest (diseo 4), ellos organizaron grupos separados experimentales y de control para
cada aplazamiento cronolgico del postesr, por ejemplo:

R 0 X 0
R 0 0
R 0 X 0
R 0 0

Para Los diseos 5 o 6 se exigira una duplicacin similar de grupos. Ntese que este diseo carece de control
perfecto para su propsito de comparar las diferencias en los efectos como funcin del tiempo transcurrido,
puesto que tales diferencias podran deberse tambin a la interaccin entre X y los acontecimientos histricos
especficos que se produjeron entre la aplicacijn de los postests de corto y de largo plazo. Un control
completo de esta posibilidad lleva a la eleboracin de diseos ms complejos todava. A causa de los grandes
gastos que esos estudios exigen, salvo cuando las 0 se obtienen por algn mecanismo rutinario, parece
recomendable que quienes realizan estudios empleando 0 institucionalizadas reiteradamente disponibles
aprovechen la ventaja que ello representa y realicen observaciones ulteriores de los efectos en varios
momentos sucesivos.

Generalizacin a otras x: variabilidad en la ejecucin de x.

El objetivo de la ciencia comprende la generalizacin, no solo a otras poblaciones y momentos cronolgicos,


sino tambin a representaciones que en teora deberan ser idnticas, pero que no lo son en determinados
aspectos que, en principio, carecen de importancia. Esta meta es contraria a la demanda de un mayor control
experimental, que a menudo resulta evidente y que conduce al deseo de obtener en cada repeticin una rplica
exacta de X. As, al estudiar el efecto de una apelacin emocional frente a otra racional, y volviendo al
ejemplo del individuo que hace declaraciones pblicas, podramos conseguir que la misma persona se
dirigiese a los distintos tipos de grupo empleando todos los grados de persuasin posibles o, con mayor rigor
todava, grabar sus declaraciones a fin de que todos los pblicos incluidos en un determinado tratamiento
oyesen <<exactamente el mismo>> mensaje. Aparentemente, esto sera mejor que si varias personas hablasen
una sola vez cada una en los distintos niveles de persuasin, ya que en este caso <<no sabramos con
exactitud>> qu estmulos experimentales se aplicaron en cada sesin. Pero ocurre lo contrario si por
<<saber>> interpretamos la habilidad para seleccionar la correcta clasificacin abstracta del tatamiento y
trasmitir eficazmente la informacin a nuevos destinatarios. Con la entrevista grabada hemos repetido cada
vez muchos aspectos especficos carentes de importancia; hasta donde nos fue dado conocer, el efecto pudo
haberse creado por esos detalles y no por las caractersticas que incluimos adrede. No obstante, si tenemos

72
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

muchos ejemplos independientes, los detalles especficos sin importancia no sern susceptibles de repeticin
en cada caso, y por tanto ser ms probable que nuestra interpretacin de la causa de los efectos sea correcta.
Consideremos, por ejemplo, la comparacin de Guetzkow, kelli y McKeachie [1954] entre los mtodos de
enseanza por disertacin y por discusin. Nuestro <<conocimiento>> de cules fueron los tratamientos
experimentales, en el sentido de poder extraer recomendaciones para otros maestros, es mejor porque se
empleatron ocho docentes, cada uno de los cuales interpret cada mtodo a su manera, en vez de utilizar uno
solo, o de hacer que los ocho memorizasen detalles comunes no incluidos en la descripcin abstracta de los
procedimientos comparados. (Como en Guetzkow y otros [1954], esa ejecucin heterognea de X debera
complementarse, de ser posible, con la prctica de que cada tratamiento lo ejecutara cada uno de los
participantes en el experimento, para que ningn elemento especfico sin importancia se confundiera con un
tratamiento especfico. A fin de poder estimar la significacin de la interaccin maestro-mtodo cuando se
emplean cursos intactos, convendra que cada maestro aplicara dos veces cada mtodo.)
En un ejemplo ms sencillo, un estudio del efecto del sexo del docente sobre los primeros pasos de
instruccin aritmtica debera utilizar no uno solo, sino muchos ejemplos de cada sexo. Aunque esta es una
precaucin obvia, no siempre se la ha respetado, como lo seala Hammond [1954]. El problema constituye un
aspecto de la insistencia de Brunswik [1956] en el diseo representativo. Underwood [1957b, pgs. 281-87]
ha sostenido, sobre fundamentos similares, una posicin contraria a la estandarizacin o rplica exacta de los
aparatos utilizados en los distintos estudios, de manera compatible con su vigoroso operacionalismo.

Generalizacin a otras X: Refinamiento secuencial de X y grupos de control


noveles.

En cualquier experimento la X real es un complicado conjunto de lo que eventualmente se habr de


conceptuar como distintas variables. Una vez detectado un efecto fuerte y definido, el curso del proceso
cientfico exige que se realicen nuevos experimentos que refinen la X, destacando bien los aspectos ms
esenciales al efecto. Ese refinamiento se lograr por medio de tratamientos definidos y presentados en forma
ms particular y concreta, o bien organizando nuevos grupos de control, que igualen al grupo experimental en
un nmero cada vez mayor de aspectos del tratamiento, reduciendo las diferencias a caractersticas ms
especficas de la compleja X original. El grupo de control falso y el de control con operacin simulada que se
utilizan en la investigacin mdica son ejemplos de ello. Los experimentos anteriores demostraron un efecto
internamente vlido, pero que, no obstante pudo haberse debido a que el paciente saba que se lo someta al
tratamiento, o bien al shock quirrgico, y no a las propiedades especficas de la droga o a la remocin del
tejido cerebral: de ah la introduccin de los controles especiales para prever esas posibilidades. La
generalizacin a otras X es un proceso exploratorio de extrapolaciones sugeridas por la teora, pero sujetas a
la experiencia, en cuyo transcurso es posible que el mencionado refinamiento de X represente un importante
papel.

Generalizacin a otras 0

As como una X dada arrastra un bagaje de caracteres especficos tericamente sin importancia, pero que
pueden resultar los causantes del efecto, as tambin cualquier 0 dada, cualquier instrumento de medicin, es
un complejo en el cual el contenido correspondiente est necesariamente inserto en una situacin instrumental
concreta, cuyos detalles son marginales a la finalidad terica. As, cuando utilizamos lpices y planillas de
respuesta con calificacin mecnica. IBM solemos hacerlo por razones de conveniencia y no porque
queramos incluir en nuestros puntajes la variancia debida a la habilidad de los empleados, la familiaridad con
el formulario del test, la exactitud en la observancia de las instrucciones, etc. As mismo, nuestro examen de
la competencia especfico en un tema objeto de investigacin por medio de pruebas consistentes en la
redaccin de ensayos habr de efectuarse empleando como vehculos la habilidad literaria y el uso del
vocabulario y, por lo tanto, deber contener la variancia debida a esaas fuentes que, con frecuencia, no son
importantes para nuestros fines. Dada esa complejidad inherente a cualquier 0, nos encontramos con un
problema cuando queremos generalizar los resultados a otras 0 posibles. A qu aspecto de nuestra 0
experimental se debi aquel efecto internamente vlido? Como la finalidad de la enseanza no es solo la de
preparar individuos para futuros exmenes de ensayo y objetivos, debe tomarse siempre en cuenta ese
problema de la validez externa o la posibilidad de generalizacin.

73
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Una vez ms, desde el punto de vista conceptual, la solucin no est en confiar a ciegas en que se tendrn
mediciones <<puras>> sin complejidades carentes de importancia, sino ms bien en utilizar medidas
mltiples en las cuales los medios y detalles especficos sin importancia sean todo lo diferentes que sea
posible, al paso que el contenido comn que nos preocupa est presente en todos y cada uno de ellos. Dentro
de un experimento aislado, es ms lo que puede hacerse en este sentido por las 0 que por las X, pues en un
solo experimento se pueden lograr muchas mediciones de efecto (es decir, variables dependientes). En el
estudio de Guetzkow, Kelly y McKeachie [1954], se notaron efectos no solo en los exmenes regulares de
curso y en pruebas especiales de actitud introducidas a este din, sino tambin en comportamientos ulteriores,
como la eleccin de carrera y la inscripcin en cursos superiores sobre el mismo tema. (Aquellos
comportamientos resultaron de igual sensibilidad a las diferencias de tratamiento que las mediciones del test.)
Las 0 mltiples deberan ser un requisito ortodoxo en cualquier estudio sobre mtodos de enseanza. En el
plano ms simple, deberan aplicarse tanto exmenes objetivos como de ensayo [vanse Stanley y Beeman,
1956], junto con ndices de participacin en clase, etc. (Una extensin de esta perspectiva a la cuestin de la
validez de los tests se hallar en Campbell y Fiske [1959] y Campbell [1960].)

5. Diseos cuasiexperimentales1

Son muchas las situaciones sociales en que el investigador puede introducir algo similar al diseo
experimental en su programacin de procedimientos para la recopilacin de datos (p. ej., el cundo y el a
quin de la medicin), aunque carezca de control total acerca de la programacin de estmulos experimentales
(el cundo y el a quin de la exposicin y la capacidad de aleatorizarla), que permite realizar un autntico
experimento. En general, tales situaciones pueden considerarse como diseos cuasiexperimentales. Uno de los
propsitos de esta obra es inducir a que se utilicen estos cuasiexperimentos y se aumente el conocimiento de
los tipos de situaciones en que se dan oportunidades para su empleo. Pero precisamente porque se carece de
control experimental total, es imprescindible que el investigador tenga un conocimiento a fondo de cules son
las variables especficas que su diseo particular no controla. Por esa necesidad de evaluar cuasiexerimentos
propiamente dichos, se prepararon las listas de verificacin de fuentes de invalidacin en los cuadros 1,2 y 3.
El estudiante o posible investigador medio que haya ledo el captulo anterior, quiz se encuentre con ms
problemas sin resolver en el diseo de un experimento que los que haba considerado al comienzo que
pudieran plantearse siquiera. Ser para su bien si todo ello lo induce al diseo y ejecucin de mejores
experimentos y a una mayor circunspeccin al extraer conclusiones de los resultados obtenidos. Constituir,
sin embargo, un efecto secundario indeseable si crea en l la sensacin de desesperanza en cuanto al logro del
control experimental y lo induce a abandonar tales esfuerzos para acogerse a la prctica de mtodos de
investigacin ms informales todava. Adems, esta larga lista de fuentes de invalidacin podra, con mayor
probabilidad an, reducir la voluntad de realizar los diseos cuasiexperimentales en que se advierta desde un
primer momento que se carece de pleno control experimental. Este resultado sera la anttesis de lo que nos
habamos propuesto.
Desde el punto de vista de su interpretacin definitiva y del intento de adaptarlo al proceso evolutivo de la
ciencia, todo experimento es imperfecto. Lo que puede lograr una lista de verificacin de criterios de validez
es que el experimentados tenga ms conciencia de las imperfecciones residuales que implica su diseo, para
poder determinar en los puntos pertinentes las distintas interpretaciones de sus datos. Por supuesto que
debera disear el mejor experimento que la situacin permitiera, y buscar con el mayor empeo los
laboratorios artificiales y naturales que ofrecieran las mejores oportunidades de control. Pero, adems de todo
ello, tendra que seguir experimentando e interpretando con plena conciencia de los puntos donde los
resultados son an equvocos. Esa conciencia es importante en los experimentos en que se ha ejercido un
control <<total>>, pero es imprescindible en los diseos cuasiexperimentales.
En persecucin de ese objetivo general, researemos a esta altura de nuestra obra las ventajas e
inconvenientes de un conjunto heterogneo de diseos cuasiexperimentales, cada uno de los cuales merece
utilizarse all donde haya otros mejores susceptibles de que se los aplique. Veremos primero tres diseos
experimentales unigrupales. Una seccin aparte se ocupar de la correlacin, los diseos ex post facto, los
estudios en panel y otros temas anlogos.

Algunos comentarios preliminares sobre la teora de la experimentacin.

74
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Este captulo est destinado en principio al experimentador que desee sacar sus investigaciones del laboratorio
para trasladarlas a la situacin operativa. Sin embargo, los autores no pueden dejar de reconocer que los
psiclogos experimentales quiz vern con suspicacia cualquier intento de recomendacin de estudios en que
el control experimental no sea completo. En parte para justificar el presente trabajo ante esos monitores,
ofrecemos algunos comentarios generales acerca de la funcin de los experimentos en la ciencia, con la
conviccin de que son compatibles con la mayor parte de las modernas teoras cientficas que ellos fundan en
la perspectiva de una posible psicologa general de los procesos inductivos [Campbell, 1959]
La ciencia, como otros procesos cognitivos, comprende la formulacin de teoras, hiptesis, modelos, etc., as
como la aceptacin o el rechazo de ellos en virtud de algn conjunto de criterios externos. La
experimentacin pertenece a esa segunda fase, la del desbrozamiento, el rechazo y la revisin. Pdemos
suponer para nuestra ciencia una ecologa en la cual el nmero de posibles hiptesis positivas exceda en
mucho al de las hiptesis que a la larga demostrarn ser compatibles con nuestras observaciones. La
caracterstica predominante de la tarea de compilacin de datos para la prueba de teroras es, pues el
rechazo de hiptesis inadecuadas. Para conseguirlo resulta provechoso cualquier ordenamiento de
observaciones en virtud del cual se desautorice la teora correspondiente, incluyendo diseos
cuasiexperimentales de menor eficacia que los verdaderos experimentos.
Cabe preguntarse, sin embargo, si tales diseos imperfectos no vendrn a confirmar con falsedad una teora
inadecuada, descarriando del buen camino los siguientes esfuerzos y desperdiciando el espacio de nuestras
publicaciones con las docenas de estudios que parecen necesitarse para desarraigar un falso positivo de
notable divulgacin. Es este un grave riesgo, que, no obstante, debemos encarar, y del cual participan en
esencia, ya que no en gradolos <<verdaderos>> experimentos de los diseos 4,5 y 6. En un sentido muy
fundamental, los resultados experimentales nunca <<confirman>> ni <<demuestran>> una teora; ms bien,
la teora triunfante est probada y escapa a la refutacin. La palabra <<demostrar>>, a menudo empleada para
designar la validez deductiva, ha adquirido en nuestra generacin un significado impropio, tanto respecto de
sus anteriores aplicaciones como a su utilizacin actual en procedimientos inductivos, como la
experimentacin cientfica. Los resultados de un experimento <<ponen a prueba>> pero no <<prueban>> una
teora. Una hiptesis bien fundada es aquella que ha sobrevivido en reiteradas ocasiones a esos exmenes,
pero que siempre puede ser desplazada por otra nueva investigacin.
En la actualidad se entiende que la <<hiptesis nula>>, utilizada a menudo por conceniencia al enunciar la
hiptesis de un experimento, nunca puede ser <<aceptada>> en virtud de los datos obtenidos; solo cabe
<<rechazarla>> o <<no rechazarla>>. De igual modo, las hiptesis ms generales de hecho nunca se
<<confirman>>; cuando or conveniencia utilizamos ese trmino queremos significar, ms bien, que la
hiptesis fue expuesta a refutacin y sali airosa de ella. Este punto de vista es compatible con todas la
filosofas humanas de la ciencia que proclaman la imposibilidad de obtener pruebas concluyentes para leyes
inductivas. En trabajos reciente, Hanson [1958] y Popper [1959] han sido taxativos a este respecto. Muchos
conjuntos de datos recopilados en la investigacin educacional tiene poco o ningn valor indagatorio, y
muchos grupos de hiptesis son tan intrincados que no se los puede confirmar por medio de los mecanismos
de sondeo disponibles. No deseamos en modo alguno acrecentar la aceptabilidad de esa seudoinvestigacin.
Creemos que los diseos de investigacin que estudiamos ms adelante son, sin embargo, lo bastante
indagatorios para merecer que se los utilice all donde no se disponga de toros medios de estudio ms
eficaces.
Aunque correcta, la idea de que los experimentos jams <<confirman>> la teora contradice de tal forma
nuestras actitudes y experiencias como cientficos que nos resulta casi intolerable. En particular, ese nfasis
parece poco aceptable frente a las ruidosas y llamativas confirmaciones obtenidas en fsca y qumica, donde
los trabajos de experimentacin pueden ajustarse con minuciosidad, sobre muchos puntos de medicin, a una
compleja curva prevista por la teora. Y para la mayora de nosotros la perspectiva se torna inaceptable, en
sentido fenomenolgico, cuando se la extiende a las conclusiones inductivas de la visin. Resulta, por
ejemplo, difcil comprender que las mesas y sillas que <<vemos>> ante nosotros no sean <<confirmadas>> o
<<aprobadas>> por la evidencia visual, sino que consistan en <<meras>> hiptesis sobre objetos externos
an no desautorizadas por las mltiples indagaciones del sistema ptico. Hay algo de razn en ese rechazo.
Se confiere a una teora diversos grados de <<confirmacin>> a tenor de la mayor o menor cantidad de
hiptesis rivales aceptables de que se dispone para explicar la informacin. Cuanto menos hiptesis rivales
queden, mayor ser el grado de <<confirmacin>>. Es de presumir que en cualquier etapa de la recopilacin
de datos, aun para la ms avanzada de las ciencias, hay muchas teoras compatibles con la informacin, en

75
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

especial si se consideran todas las teoras que abarcan circunstancias complejas. Sin embargo, en la prctica
se dispone de pocas teoras cuando las hayque hagan frente a las <<bien establecidas>> o a las que han
sido verificadas a fondo mediante complicados experimentos; tampoco se proponen seriamente esas teoras
rivales. Dicha escasez es el equivalente epistemolgico de la afirmacin positiva de la teora que parecen
ofrecer los experimentos espectaculares. Una escasez semejante de hiptesis rivales se da en el conocimiento
fenomnicamente positivo que por contraste parece ofrecer, por ejemplo, la visin a la comparativa
ambigedad de la exploracin tctil a ciegas.
Dentro de esta perspectiva, la lista de fuentes de invalidacin que controlan los diseos experimentales puede
considerarse como una enumeracin de hiptesis a menudo aceptablesrivales de la hiptesis de que la
variable experimental ha surtido un efecto. Donde un diseo experimental <<controla>> uno de esos factores,
se limita a hacer insostenible esta hiptesis rival, aun cuando, en virtud tal vez de complicadas coincidencias,
contine operando para producir el resultado experimental. Las <<hiptesis rivales aceptables>> que han
requerido el uso rutinario de grupos especiales de control actan a modo de lees empricas bien establecidas:
por ejemplo, los efectos de la prctica para el agregado de un grupo de control al diseo 2, la sugestibilidad
para el falso grupo de control, el shack quirrgico para el control con operacin simulada, etc.
Las hiptesis rivales son crebles en la medida en que pueda atriburseles categora de leyes empricas.
Cuando en un cuasiexperimento se carece de controles, al interpretar los resultados hay que considerar bien la
posibilidad de que tales resultados obedezcan a factores no tomados en cuenta. Cuanto ms improbable sea
esta posibilidad, ms <<vlido>> ser el experimento.
Como lo sealamos al exponer el diseo de cuatro grupos de Solomon, cuanto ms numerosas e
independientes sean las formas en que se demuestra el efecto experimental, menos numerosas y probables se
tornan todas las dems hiptesis rivales invalidantes. Se apela entonces a la economa. La <<validez>> del
experimento viene a ser, pues, la de la admisibilidad relativa de las teoras rivales: la teora de que X tuvo un
efecto frente a las teoras de causacin que comprenden los factores no controlados.. Si cabe explicar la
totalidad de varios conjuntos de diferencias por la hiptesis nica de que X tiene un efecto, al paso que es
necesario hipotetizar varios efectos separados de variables no controladas, una para cada diferencia
observada, entonces el efecto de X viene a ser el ms definible. Es frecuente recurrir a este modo de
inferencia cuando los cientficos tienen que limitarse a resumir literatura por carecer de experimentos
perfectamente controlados. As, Watson [1959, pg. 296] hall confirmatoria la evidencia de los efectos
nocivos de la privacin materna, porque se la ve confirmada por una amplia variedad de datos, cuyas
insuficiencias especficas varan de unos estudios a otros. A su vez, Glickman [1961], a pesar de la presencia
de hiptesis rivales sostenibles en cada uno de los estudios, consider importantes las pruebas de un proceso
de consolidacin slo porque la hiptesis rival sostenible variaba de un estudio a otro. Esta forma de
induccin lgica, adoptada por lo comn en la combinacin de inferencias de distintos estudios, se introduce
deliberadamente dentro de ciertos diseos cuasiexperimentales, en especial los <<remendados>>, como el 15.
El recurrir a la economa no se justifica desde el punto de vista deductivo, sino que constituye ms bien un
supuesto general acerca de la naturaleza del mundo, que fundamente casi toda aplicacin de la teora en la
ciencia, por ms que en aplicaciones particulares resulte a menudo errnea. En relacin con esta observacin
hay otro argumento de admisibilidad, que invocaremos acaso ms en detalle a propsito del muy utilizado
diseo 10 (un buen diseo cuasiexperimental, que a menudo se confunde con el verdadero diseo 4). Es la
presuncin de que, en casos de ignorancia, el efecto principal de una variable debe juzgarse ms probable que
la interaccin de otras dos variables; o que, en general, los efectos principales son ms probables que las
interacciones. En su mxima expresin, cabe sealar que si cada interaccin de orden superior es significativa
y cada efecto es especfico de determinados valores en todas las dems dimensiones posibles de tratamiento,
ya no hay lugar para la ciencia. Si podemos generalizar alguna vez, es porque podemos hacer caso omiso de
un gran cmulo de factores potenciales determinantes.
Esto fue denominado por Underwood [1957b, pg. 6] <<supuesto de causacin finita>>. En otro lugar [1954],
el mismo autor ha registrado la frecuencia de efectos principales y de interacciones en el Journal of
Experimental Psychology, confirmando la relativa escasez de interacciones significativas (aunque las
correcciones introducidas por el editor, tendientes a presentar resultados claros, nos hacen dudar de este
hallazgo).
En los prrafos siguientes expondremos primero los experimentos con un solo grupo. Desde 1920, por lo
menos, el diseo experimental predominante en psicologa y educacin ha sido el de grupo de control, como
el 4,6 o, acaso ms a menudo an, el diseo 10, que veremos ms adelante. En las ciencias sociales, y
considerando situaciones sobre el terreno, los diseos de grupo de control han predominado a tal punto que
para algunos son sinnimo de experimentacin. A consecuencia de ello muchos investigadores llegan a

76
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

abandonar todo intento de experimentacin en situaciones en las cuales no se disponga de grupos de control
terminando as como una imprecisin innecesaria. En realidad, varios dises cuasiexperimentales aplicables
a grupos aislados podran emplearse procechosamente, y seguir los cnones lgicos e interpretativos
experimentales, en muchos casos en que es imposible el diseo con grupo de control. La cooperacin y la
posibilidad de experimentar se dan a menudo en unidades administrativas naturales: una maestra dispone de
su clase; el director de una escuela secundaria tal vez est dispuesto a realizar encuestas peridicas sobre el
estado de nimo de los alumnos, etc. En tales situaciones el tratamiento diferencial de segmentos dentro de la
unidad administrativa (requerido para el experimento con grupo de control) quiz resulte imposible en sentido
administrativo o, aun cuando ello no ocurra, sea ideseable como experimento a causa de los efectos reactivos
de los dispositivos. Para situaciones de esta ndole bien podran adoptarse experimentos con un grupo nico.

7. Experimento de series cronolgicas

El diseo de series cronolgicas consiste en lo esencial en un proceso peridico de medicin sobre algn
grupo o individuo y la introduccin de una variacin experimental en esa serie cronolgica de mediciones,
cuyos resultados se indican por medio de una discontinuidad en las mediciones registradas en la serie. Se lo
puede diagramar de la manera siguiente:

01 02 03 04 X05 07 08

Este diseo experimental tipific gran parte de la experimentacin clsica del siglo XIX en las ciencias fsicas
y biolgicas. Por ejemplo, si una barra de hierro cuyo peso no ha variado durante muchos meses se sumerge y
retira de un bao de cido ntrico, la deduccin que relacionara esta operacin con la prdida de peso de la
barra seguira alguna lgica experimental de esta ndole. Por supuesto, pueden haber existido <<grupos de
control>> de barras de hierro que se dejaron en los estantes y no perdieron peso, pero la medicin e
informacin de esos pesos constituira un caso tpico en el cual no se la considerara ni necesaria ni pertinente.
Parece, pues, probable qe ese diseo experimental se considere a menudo vlido en las ciencias de ms xito,
si bien rara vez se lo acepte en las enumeraciones de diseos experimentales disponibles en las ciencias
sociales. [Vase, sin embargo, Maxwell, 1958; Underwood, 1957b, pg. 133.] Hay buenas razones que
justifican esa diferencia de categoras, y una cuidadosa consideracin de ellas ofrecer una mejor
comprensin de las condiciones en que los cientficos sociales podran emplear con provecho el diseo
cuando no hay modo de utilizar un control experimental ms preciso. El diseo es tpico de los experimentos
clsicos del British Industrial Fatigue Research Board sobre factores que influyen en la produccin industrial
[p. ej., Farmer, Brooks y Chambers, 1923].
La figura 3 indica algunas posibles situaciones resultantes en series cronolgicas en las cuales se haba
introducido una alteracin experimental, segn se indica por medio de la lnea vertical X. Supongamos, a los
fines de este estudio, que sentimos la tentacin de deducir que X tuvo algn efecto en las series cronolgicas
con resultados como A y B, y quiz C, D y E, pero no un efecto en las series cronolgicas tal como F, G y H,
aunque el salto de valores de 04 a 05 fuese tan grande y desde el punto de vista estadstico tan persistente
como, por ejemplo, las diferencias 04 a 05 en A y B. Aunque dejaremos el anlisis del problema de las pruebas
estadsticas para algunas pginas ms adelante, se supone que el problema de la validez interna se reduce, en
definitiva a la cuestin de hiptesis competitivas aceptables que ofrezcan otras explicaciones probables,
distintas del efecto de X, acerca del desplazamiento en las series cronolgicas. Ofrecemos en el cuadro 2 un
intento de lista de comprobacin de los controles suministrados por este experimento en las mencionadas
condiciones ptimas de resultado. Las ventajas del diseo de series cronolgicas resultan muy evidentes en
contraste con el diseo 2, con el que guarda una similitud superficial, ya que carece de grupo de control y
utiliza mediciones previas y posteriores.

77
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Observando en el cuadro 2 la lista de problemas de validez interna, vemos que la imposibilidad de controlar la
historia es el ms grave inconveniente del diseo 7. Es decir que existe la hiptesis rival de que no sea X sino
otro acontecimiento ms o menos simultneo el que provoc el desplazamiento. Sobre la admisibilidad de
eliminar tales estmulos externos debe basarse en todos los casos la confianza depositada en la interpretacin
de este experimento. Analicemos un experimento que exija mediciones reiterada u el efecto que un filme
documental produce sobre el optimismo o pesimismo de los alumnos con relacin a la probabilidad de que
estalle o no una guerra. En tal caso, no suministrar un control definido sobre la historia parecera sin duda
muy grave, ya que es obvio que los estudiantes estn todos los das expuestos a multitud de fuentes de
estmulo en ese mismo sentido, adems de las que maneja el experimentador en el aula. Por supuesto que, aun
as, si el experimento se complementara con un cuidadoso registro de estmulos no experimentales de alguna
relevancia, sera quizs aceptable una interpretacin por la cual se justificara llevarlo a cabo. Como ya hemos
dicho, la variable historia es la contrapartida de lo que en el laboratorio fsico y biolgico ha sido denominado
aislamiento experimental. La admisibilidad de la historia como explicacin de desplazamientos del tipo de los
verificados en las series cronolgicas A y B de la figura 3 depende, en gran parte, de la medida del
aislamiento experimental que pueda conseguir el experimentador. Los estudios sobre reflejos condicionados
realizados por Pavlov con perros, y que eran en definitiva experimentos de <<un grupo>> o <<un animal>>,
hubiesen sido mucho menos admisibles como fundamento de las teoras del sabio ruso si, en vez de haberlos
efectuado en un laboratorio alejado de todo ruido, los hubiese practicado en cualquier esquina de la ciudad.
Que es lo que constituye un aislamiento experimental vara con el problema que se estudia y el tipo de
elementos de medicin que se utilizan. Se exigen, sin duda, ms precauciones para establecer el aislamiento
experimental necesario cuando se han de estudiar partculas subatmicas en cmara de niebla o con un
contador de centelleo, que para el experimento hipottico acerca del peso de las barras de hierro baadas en

78
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

cido ntrico. En muchas situaciones que permitiran utilizar el diseo 7, sera admisible que el
experimentador sostuviese haber trabajado en condiciones de aislamiento experimental, si tuvo conciencia de
los posibles acontecimientos rivales tambin capaces de producir el cambio y pudo descartar con suficiente
lgica la probabilidad de que estos ltimos lo explicaran. Entre otras variables externas que, por razones de
conveniencia, podran incluirse en el factor historia, estn los efectos meteorolgicos. Los experimentos de
esa ndole (p. ej., los estudios sobre rendimiento laboral) tal vez se prolonguen durante lapsos que abarquen
cambios estacionales, y entonces las fluctuaciones estacionales en iluminacin, condiciones meteorolgicas,
etc., pueden confundirse con la introduccin de variaciones experimentales. Quiz fuera mejor incluir en la
historia, aunque sean en cierto sentido anlogos a la maduracin, los desplazamientos peridicos de las series
cronolgicas referidas a las costumbres institucionales del grupo, como los ciclos semanales de trabajo y de
pagos de salarios, los perodos de exmenes y vacaciones, y las fiestas escolares. Las series de observaciones
deberan ordenarse de tal manera que se mantuvieran constantes los ciclos conocidos, o de lo contrario ser lo
bastante prolongadas como para incluir en su totalidad carios de esos ciclos.

Cuadro 2 Fuentes de invalidacin para los diseos 7 al 12.

Fuentes de invalidacin
Interna Externa

de

Interaccin de seleccin y

Interferencia de X mltiples
Interaccin de seleccin y

Dispositivos reactivos
Administracin de tests

Instrumentacin

maduracin, etc.
Maduracin

administracin
Mortalidad
Regresin

Mortalidad

de tests y X.
Seleccin

Interaccin
Historia

X
Diseos
cuasiexperimentales
7. Series - + + ? + + + + - ? ?
cronolgicas
0 0 0 0X0 0 0 0

8. Diseo de + + + + + + + + - ? - -
muestras
cronolgicas
equivalentes
X10 X0 0 X10
X00. etc
9. Diseo de + + + + + + + + - ? ? -
muestras
materiales
equivalentes
M0X10 M0X00
McX10
MdX00, etc.
10. Diseo de + + + + ? + + - - ? ?
grupo de control
no equivalente
0 X 0

79
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

0 0

Cuadro 2 Fuentes de invalidacin para los diseos 7 al 12.

Fuentes de invalidacin
Interna Externa

de

Interaccin de seleccin y

Interferencia de X mltiples
Interaccin de seleccin y

Dispositivos reactivos
Administracin de tests

Instrumentacin

maduracin, etc.
Maduracin

administracin
Mortalidad
Regresin

Mortalidad

de tests y X.
Seleccin

Interaccin
Historia

X
11. Diseos + + + + + + + ? ? ? ? -
compensados
X10___X20___X30__X40
X20___X40___X10__X30
X30___X10___X10__X20
X40___X30___X20__X10

12. Diseo de grupo - - + ? + + - - + + +


muestra
separada
pretest-postest
R 0 (X)
R X 0

12 + - + ? + + - + + + +
R 0 (X)
R X 0
R 0 (X)
R X 0

12b - + + ? + + - ? + + +
R 01 (X)
R 02(X)
R X 03

12c - - + ? + + + - + + +
R 01 X 02
R X 03

80
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Continuemos con los factores que hay que controlar: la maduracin parece quedar eliminada sobre la base de
que, si el resultado es como los de los ejemplos A y B de la figura 3, ella no ofrece de ordinario hiptesis
rivales aceptables para explicar algn desplazamiento producido entre 0 4 y 05 que no se haba dado en los
anteriores perodos observados. (No obstante, la maduracin no siempre es uniforme y regular. Ntese cmo
la sbita iniciacin de las menstruaciones en alumnas de primer ao de la escuela secundaria podra aparecer
en un diseo 7 como un efecto del cambio de escuelas sobre los registros fisiolgicos, si no supisemos que
no era as.) Asimismo, la aplicacin de tests parece, en general, hiptesis rival no creble para un salto entre 0 4
y 05. Si solo tuviramos las observaciones en 0 4 y 05, como en el diseo 2, careceramos de ese medio de
convertir en inaceptables los efectos de maduracin y los tests-retests. Esta es la gran ventaja del diseo 7
sobre el diseo 2.
De igual modo, muchas hiptesis que invocaran variaciones en la instrumentacin careceran de base racional
especfica para suponer que en aquella ocasin particular, a diferencia de otras anteriores, se haba producido
el error de los aparatos de medicin. No obstante, el signo de interrogacin en el cuadro 2 llama la atencin
recordando las posibles situaciones en que un cambio en la calibracin del instrumento de medicin podra
dar lugar a que se lo interpretase como efecto de X. Si el procedimiento de medicin, implica las
apreciaciones de observadores humanos conocedores del plan experimental, puede producirse una
seudoconfirmacin de la hiptesis a causa de las expectativas del observador. As, el cambio experimental de
poner en posesin de su cargo a un nuevo director puede producir una variacin en las estadsticas de faltas
disciplinarias, en vez de influir sobre la tasa de infracciones como tal. A menudo puede emplearse el diseo 7
para medir los efectos de un importante cambio introducido en la poltica administrativa. Teniendo esto en
cuenta, convendra evitar el cambio de instrumentos de medicin a la vez que se modifica la poltica. En la
mayor parte de los casos sera preferible, a fin de preservar la interpretabilidad de una serie cronolgica,
continuar empleando dispositivos en tanto anticuados, en vez de sustituirlos por otros ms modernos pero
distintos.
Los efectos de la regresin suelen consistir en una funcin negativamente acelerada del tiempo transcurrido,
razn por la cual no son aceptables como explicaciones de un efecto en 0 5 mayor que los efectos en 02, 03 y 04.
La seleccin como fuente de efectos principales se elimina tanto en este diseo como en el 2, si en todas las 0
estn implicadas las mismas personas. Si en un determinado grupo los datos se recopilan sobre la base de sus
integrantes individuales, se puede eliminar la mortalidad en ese experimento lo mismo que en el diseo 2. No
obstante, si las observaciones se refieren a datos colectivos, habra que llevar un registro del ausentismo, las
renuncias y las reposiciones, a fin de asegurarse de que las coincidencias y las reposiciones, a fin de
asegurarse de que las coincidencias de cambios de personal no ofrezcan hiptesis rivales aceptables.
En cuanto a la validez externa, est claro que el efecto experimental bien podra ser especfico para las
poblaciones sujetas a reiteracin de pruebas. Es improbable que ello constituya una limitacin a la
investigacin sobre la enseanza en establecimientos escolares, a menos que el experimento se realice con 0
artificiales no comunes en la situacin escolar habitual. Adems, este diseo es de particular aplicacin en las
situaciones institucionales en que se llevan registros regulares que constituyen, por tanto, parte natural del
ambiente en que se realiza el experimento. Las pruebas anuales de calificacin en las escuelas pblicas, los
registros de enfermedad, etc., no son por lo comn reactivos, puesto que son tpicos del universo al cual se
quiere hacer la generalizacin. La interaccin seleccin X se refiere a la restriccin de los efectos de la
variable experimental a esa muestra especfica, as como a la posibilidad de que esa reaccin no fuese tpica
de algn universo de inters ms general, con respecto al cual el grupo expuesto, constituido naturalmente,
sea una muestra sesgada. Por ejemplo, la necesidad de datos puede limitarnos a aquellos alumnos que han
tenido asistencia perfecta durante largos perodos: un evidente subconjunto selecto. Adems, si se han
utilizado 0 nuevas, ese reiterado acontecimiento puede haber provocado ausentismo.
Para que estas series cronolgicas se interpreten como experimentos, es imprescindible que el experimentador
especifique de antemano la relacin cronolgica esperada entre la introduccin de la variable experimental y
la manifestacin de un efecto. Si se lo hubiese hecho as, la situacin indicada en la serie cronolgica D de la
figura 3 podra ser tan concluyente como la de A. Las encuestas exploratorias que decidiesen segn las
circunstancias sobre las interpretaciones de efecto diferido, requeriran una validacin cruzada antes de que
fueran interpretables. A medida que aumenta el lapso transcurrido entre X y el efecto, aumenta asimismo la
admisibilidad de los efectos resultantes de acontecimientos histricos externos. Tambin parece

81
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

imprescindible que se especifique la X antes de examinar el resultado de la serie cronolgica. El examen post
hoc de una serie cronolgica para inferir cul fue la X que precedi al desplazamiento ms notable tiene que
descartarse, a causa de que el aprovechamiento oportunista del azar que l permite dificulta, y hasta
imposibilita, cualquier intento de comprobar la significacin de los efectos.
La preponderancia de este diseo en las ciencias ms prsperas debera hacernos sentir algn respeto por l;
recurdese, sin embargo, que los aspectos de <<aislamiento experimental>> y las <<condiciones
constantes>> lo hacen ms interpretable para ellos que para nosotros. Recurdese, asimismo, que en el uso
que suele hacerse de l, un experimento nico jams es concluyente. Aunque puede ocurrir que no se utilice
un grupo de control, antes de establecer un principio es menester que varios investigadores repitan el diseo 7
en muchos lugares distintos. Tal debera ser, asimismo, la aplicacin que nosotros le diramos a este diseo.
Deberamos utilizarlo all donde no se pueda hacer nada mejor controlado. Organizaremos nuestra
contabilidad institucional de tal modo que nos suministre el mayor nmero posible de series cronolgicas para
dichas evaluaciones , y trataremos de examinar con mayor cuidado que hasta entonces los efectos de los
cambios administrativos y otros acontecimientos sbitos y arbitrarios como X. Pero no los consideraremos
definitivos hasta haberlos repetido una y otra vez en situaciones diversas.

Tests de significacin para el diseo de serie cronolgica

Si las ciencias ms avanzadas no emplean tantos tests de significacin como la psicologa y la pedagoga es,
sin duda, porque la magnitud y claridad de los efectos con que trabajan son tales que los hacen innecesarios.
Si se aplicase en ellas nuestros tests habituales de significa in, se descubriran tambin all elevados ndices
de este factor. Parece, sin embargo, tpico de la ecologa de las ciencias sociales tener que trabajar con
minerales pobres, para os que no son necesarias las pruebas de significacin. Tambin es probable que all
donde el sentido comn o las apreciaciones intuitivas sealen con claridad un efecto resulte posible, por lo
comn, alguna prueba de significacin que ratifique las consideraciones en que se funda el juicio intuitivo.
As, se pueden aplicar pruebas de significacin sobre los efectos de X que distinguiran entre los varios
significativos y que F y G no lo son. Veamos algunos posibles enfoques.
Ante todo debemos rechazar, por inadecuados, ciertos tratamientos imaginables. Si la informacin recogida en
la figura 3 representa medias grupales, ser insuficiente una simple prueba de significacin de la diferencia
entre las observaciones de 04 y 05. Aunque en las series F y G estas suministrasen relaciones t de elevada
significacin, no podramos decir que los datos demostraban el efecto de X a causa de la presencia de otros
desplazamientos significativos similares, que a veces ocurren, y para los cuales no tendramos explicacin
experimental alguna que les correspondiese. Cuando se trabaja con la informacin obtenida de encuestas
nacionales de opinin, suelen encontrase desplazamientos muy significativos entre una y otra consulta que,
desde el punto de vista del cientfico encargado de las interpretaciones, no son ms que <<ruidos>>
aleatorios, ya que constituyen una parte de la variacin en los fenmenos para la que se carece de explicacin.
A fin de que sea interpretable, el efecto de un bien perfilado acontecimiento o variable experimental debe
trascender ese nivel ordinario de desplazamiento. Asimismo, una prueba de significacin que abarque los
datos combinados de todas las observaciones pre-X y post-X resulta inadecuada, pues no distinguira entre
casos de tipo F y casos del tipo A.
En el desarrollo de un test de significacin suele haber una enojosa falta de independencia. Si tal carencia
estuviese distribuida en forma homognea entre todas las observaciones, ella dejara de constituir una
amenaza para la validez interna, aunque fuera una limitacin a la validez externa. Lo que si resulta inoportuno
es que en casi todas las series cronolgicas se encontrar que las observaciones adyacentes son ms similares
que las no adyacentes (es decir, que la autocorrelacin del defasaje 1 es mayor que la del 2, etc.). As, una
influencia o perturbacin aleatoria externa que influya sobre un punto de observacin, por ejemplo, en 0 5 u 06,
tambin alterar 07 y 08, por lo cual no se las puede tratar como varias desviaciones independientes de la
extrapolacin de la tendencia 01 04.
El test de significacin utilizado depender en parte de la ndole hipottica del efecto de X. Si est implicado
un modelo como la lnea B, se podra utilizar una prueba de la desviacin de 0 5 respecto de la extrapolacin
de 01 04. Mood [1950, pgs. 297-98] ofrece una prueba de esta ndole. Ese test podra emplearse en todos los
casos, pero parecera innecesariamente insuficiente si se supone una mejora constante o un mayor ndice de

82
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

ganancia. Para esos casos, sera aconsejable una prueba que emplease todos los puntos. Son dos los
componentes que constituiran tales pruebas de significacin: la interseccin y la pendiente. Por interseccin
queremos significar el salto en la serie cronolgica en el punto X (o en algn desplazamiento especificado
despus de X). As las lneas A y C indican un desplazamiento de interseccin sin variacin en la pendiente.
La lnea E ilustra un cambio en la pendiente pero no en la interseccin, ya que coinciden las extrapolaciones
pre-X a X y post-X a X. A menudo ambas se cortan, y la pendiente quedara modificada por una X efectiva.
Podra conseguirse una prueba pura de interseccin en forma anloga a la aplicacin de una prueba Mood
desde una y otra direccin a la vez. En este caso estaran implicados dos puntos extrapolados, con
observaciones pre y post X extrapoladas a un punto X intermedio entre 0 4 y 05. Las pruebas estadsticas casi
con seguridad comprenderan, en todas las series cronolgicas (con excepcin de las ms extensas) ajustes
lineales a los datos, tanto por conveniencia como porque un ajuste ms exacto agotara los grados de libertad,
no dejando oportunidad alguna para verificar la hiptesis de cambio. Sin embargo, en muchos casos la
presuncin de linealidad puede no ser correcta. La admisibilidad de inferir un efecto de X es mayor en un
punto prximo a X. Cuanto ms gradual o ms lento sea el efecto supuesto, ms grave ser la confusin con la
historia, ya que aumenta el nmero de posibles causas externas.

8. Diseo de muestras cronolgicas equivalentes

La forma ms comn de diseo experimental utiliza una muestra equivalente de personas a fin de suministrar
la base con la cual comparar los efectos de la variable experimental. Como contraste, una forma recurrente de
experimentacin con un solo grupo utiliza dos muestras equivalentes de sesiones, con la variable experimental
en una de ellas y no en la otra. Ese diseo puede esquematizarse de la siguiente manera (aunque la intencin
es obtener una alternacin aleatoria, no regular):

X10 X00 X 10 X00

Este diseo puede considerarse una forma del experimento de serie cronolgica con la introduccin reiterada
de la variable experimental. El experimento es, sin duda, de mayor utilidad cuando se anticipa que el efecto de
la variable experimental ser de carcter transitorio o reversible. Al paso que la lgica del experimento puede
considerase una extensin del experimento de serie cronolgica, el modo de anlisis estadstico tiene mayor
similitud, en general, con el del experimento de dos grupos en los cuales se emplea la significacin de la
diferencia entre las medias de dos conjuntos de mediciones. Por lo comn, la mediciones estn apareadas de
manera muy especfica con las presentaciones de la variable experimental, siendo a menudo concomitante,
como en los estudios de aprendizaje, rendimiento laboral, condicionamiento, reaccin fisiolgica, etc. Acaso
el ms tpico de los primeros usos de este diseo experimental, como en los estudios de Allport [1920] y
Sorokin [1930] sobre el rendimiento escolar en condiciones diversas, consisti en la comparacin mutua de
dos variables experimentales, es decir X1 versus X2, en vez de una sola de ellas con un control. Para la
mayora de los fines resultan ineficaces la simple alternacin de condiciones y el empleo de un espaciamiento
temporal constante, sobre todo cuando pueden introducir un elemento de confusin con un ciclo diario,
semanal o mensual, o cuando a causa de la periodicidad predecible, un condicionamiento indeseable al
intervalo temporal puede intensificar la diferencia entre las distintas presentaciones. As, Sorokin se asegur
de que cada tratamiento experimental se realizara con idntica frecuencia de maana y de tarde.
Casi todos los experimentos con este diseo han empleado en proporcin pocas repeticiones de cada
condicin experimenta, pero una extensin de la teora del muestreo como la representada por Brunswik
[1956] seala la necesidad de grandes muestreos aleatorios, representativos y equivalentes, de los perodos.
Kerr [1945] es quien ms se ha aproximado tal vez a este ideal en sus experimentos acerca del influjo de la
msica sobre el rendimiento industrial. Cada uno de ellos comprendi un solo grupo experimental con una
muestra aleatorizada y equivalente de das a lo largo de varios meses. De esta forma, en un experimento pudo
comparar 56 das con msica, representada cada una por muestras equivalentes de 14 das.
Tal como lo emple Kerr, por ejemplo, el diseo 8 parece en general internamente vlido. La historia, que es
el principal inconveniente del experimento con series cronolgicas, se controla presentando X en numerosas
sesiones separadas, haciendo as improbable en extremo cualquier otra explicacin fundada en la coincidencia
de acontecimientos externos. Las otras fuentes de invalidacin se controlan con la misma lgica detallada a
propsito del diseo 7. En cuanto a la validez externa, es evidente que solo cabe extender la generalizacin a
poblaciones probadas con frecuencia. El efecto reactivo de los dispositivos y la conciencia de que se es objeto

83
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

de la experimentacin constituyen una deficiencia de esta prueba. Cuando son grupos separados los que
reciben las distintas X, puede ocurrir (sobre todo en el diseo 6) que ignoren por completo la existencia del
experimento o de los tratamientos que se comparan. No ocurre as cuando se maneja un solo grupo y se lo
expone en repetidas sesiones a una u otra condicin, por ejemplo, a una base de cmputo de pago contra otra
en el experimento de Sorokin; una condicin de trabajo contra otra en el de Allport; un tipo de ventilacin
contra otro en los estudios de Wyatt, Fraser y Stock [1926], y una clase de msica contra otra en el de Kerr
(aunque este investigador tom cuidadosas precauciones para conseguir que una programacin variada se
convirtiese en parte integrante del ambiente laboral). En cuanto a la interaccin de seleccin y X, se da, como
es habitual, la limitacin de la generalizacin de los efectos demostrados de X al tipo particular de la
poblacin de que se trata.
Este diseo experimental lleva implcito un riesgo para la validez externa que se encontrar en todos los
experimentos descritos en este trabajo en los cuales se presentan muchos niveles de X para el mismo conjunto
de personas. Ese efecto se ha denominado <<interferencia de X mltiples>>. El efecto de X 1, en la situacin
ms simple, en que se la compara con X 0, slo puede generalizarse a condiciones de presentaciones repetidas
y espaciadas de X1.No se ofrece una base slida para la generalizacin a posibles situaciones en que X 1 est
siempre presente, o a la condicin en que se la introduzca en una sola sesin. Adems, la condicin X 0 o la
ausencia de X no es tpica de perodos sin X en general, sino que es representativa solo de ausencias de X
intercaladas entre presencias de este factor. Si X 1 tiene algn efecto prolongado que llega a influir en los
perodos sin X, como parece por lo comn probable, el diseo experimental, comparado con un estudio con
diseo 6, por ejemplo, puede subestimar el efecto de X1. Por el contrario, el hecho mismo de que se
produzcan frecuentes desplazamientos puede incrementar el valor de estmulo de una X, excediendo al que se
dara en una presentacin continua y homognea. En el estudio de Kerr las melodas hawaianas influiran
sobre el trabajo de manera bastante diferente si se las intercalase durante todo un da entre otras formas de
msica, que si constituyen el nico <<alimento>> musical. Los diseos experimentales de Ebbinghaus [1985]
pueden considerarse en lo esencial de esta ndole y, como lo ha destacado Underwood [1987a], las leyes por
l descubiertas estn limitadas en sus posibilidades de generalizacin a una poblacin de personas que hayan
aprendido docenas de otras listas muy similares. Incluso gran parte de sus descubrimientos no se verifican en
personas que aprenden una sola lista de slabas desprovistas de significado. As, mientras el diseo es
internamente vlido, su validez externa suele verse limitada en gran parte por ciertos tipos de contenido.
[Vase tambin Kempthorne, 1952, cap. 29.]
Ntese, sin embargo, que muchos aspectos de la enseanza sobre los cuales se deseara experimentar pueden
muy bien tener efectos restringidos, para los fines prcticos, al perodo de presencia concreta de X. Para esos
objetivos, este diseo podra ser muy valioso. Supongamos que un maestro pone en tela de juicio el valor de
las lecciones en voz alta contra el del estudio individual en silencio. Variando esos dos procedimientos
durante una serie de unidades de lecciones, se podra preparar un experimento interpretable. De ese modo
cabra estudiar el efecto de la presencia en el aula de un padre que actuara como observador durante un debate
voluntario entre los alumnos. El conocimiento de ese tipo de diseos puede poner al alcance de un maestro
individual la verificacin experimental de las alternativas. Esto podra dar lugar a procedimientos de tipo
piloto que, de resultar promisorios, se examinaran por medio de experimentos de mayor envergadura y mejor
coordinados.
Este enfoque es aplicable a un muestreo de sesiones con un solo sujeto. Aunque no es habitual muy utilizado
en la investigacin fisiolgica, en la cual se aplica repetidas veces un estmulo a un animal, poniendo sumo
cuidado en evitar cualquier periodicidad en la estimulacin, ya que este ltimo aspecto corresponde al
requisito de aleatorizacin para aquellas sesiones en que as lo demande la lgica del diseo. Tambin pueden
utilizarse cuadrados latinos en vez de la aleatorizacin simple [p. ej., Cox, 1951; Maxell, 1958]

Tests de significacin para el diseo 8

Una vez ms necesitamos pruebas de significacin apropiadas para este tipo particular de diseo. Advirtase
que hay implcitas en l dos dimensiones de generalizacin; con respecto a las sesiones y con respecto a las
personas. Si consideramos un caso en que se utilice una sola persona, es obvio que la generalizacin de la
prueba de significacin: se limitar a esa persona en particular, comprendiendo una generalizacin entre
casos, para cuyo fin convendr utilizar una t con un nmero de grados de libertad igual al de sesiones menos

84
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

dos. Si se poseen registros individuales de cierto nmero de personas sometidas al mismo tratamiento y todas
ellas comparten el mismo grupo, se tendrn tambin datos para generalizar entre personas. En esta situacin
habitual dos estrategias parecen comunes. Una, errnea, es la de generar a propsito de cada individuo un
puntaje nico para cada tratamiento experimental, y aplicar luego tests de significacin de la diferencia entre
las medias con datos correlacionados. Esta es la lgica de los anlisis de Allport y Sorokin, aunque en realidad
no se utilizaron tests de significacin. Pero cuando solo estn implicadas una o dos repeticiones de cada
condicin experimental, los errores de muestreo de las sesiones pueden ser muy grandes o el control de la
historia muy deficiente. Los errores aleatorios en el muestreo de sesiones podran constituir lo que a la luz de
este anlisis parecen ser diferencias significativas entre unos y otros tratamientos. Esto ser un error muy
grave si el efecto de las sesiones es significativo y apreciable. Sobre ese supuesto lgico se podra obtener, por
ejemplo, una diferencia sumamente significativa entre X1 y X2, cuando cada una sola haya sido presentada
una vez y cuando en una sesin algn acontecimiento externo haya producido por azar un resultado notable.
Parece, pues, imprescindible que para cada tratamiento, se <<incluyan>> por lo menos dos sesiones y estn
representados los grados de libertad entre ellas. La mejor forma de cumplir con este requisito es, quiz, probar
ante todo la diferencia entre las medias de tratamiento y un trmino de error entre las diversas sesiones y con
respecto a cada tratamiento. Despus de establecer as la significacin del efecto del tratamiento, se podra
proceder a determinar la proporcin de sujetos para los cuales se verifica, obteniendo as datos sobre la
posibilidad de generalizar el efecto da diversas personas. Las mediciones y muestreos repetidos de sesiones
plantean muchos problemas estadsticos, algunos de los cuales no han sido resueltos todava [Collier, 1960;
Cox, 1951; Kempthorne, 1952].

9. Diseo de materiales equivalentes

El diseo 9 est ntimamente relacionado con el de muestras cronolgicas equivalentes, y su argumento se


funda en la equivalencia de las muestras de materiales a que se aplican las variables experimentales que se
comparan. Siempre, o casi siempre, hay tambin impicadas muestras cronolgicas equivalentes, pero pueden
estar intercaladas en forma tan sutil o intrincada, que prcticamente vienen a constituir una equivalencia
temporal. En un diseo con un grupo y X repetida, se reaquieren materiales equivalentes all donde la ndole
de las variables experimentales sea tal que los efectos son permanentes, y los distintos tratamientos y
repeticiones de ellos deben aplicarse a un contenido no idntico. El diseo puede expresarse as:

MaX10 MbX00 McX10 MdX00 etc.

Las M indican materiales especficos, siendo la muestra Ma,M0, etc., en trminos de muestreo, igual a la
muestra Mb,Md, etc. La importancia de la equivalencia de muestreo de ambos conjuntos de materiales
quedara acaso mejor indicada si se diagramara el diseo de esta manera:

Una persona o Muestra de materiales A(0) X0 0


Grupo Muestra de materiales B(0) X1 0

Las 0 entre parntesis indican que en algunos diseos se utilizar un pretest y en otros no.
El experimento de Jost [1897] sobre prctica masiva contra prctica distribuida ofrece un magnfico ejemplo.
En su tercer experimento se prepararon bastante al azar doce listas de doce slabas carentes de sentido. Seis se
asignaron a la prctica distribuida y seis a la masiva. Las doce se aprendieron simultneamente en un lapso de
siete das, combinndose con cuidado su programacin de modo que se controlasen la fatiga y otros aspectos.
Siete de aquellos conjuntos de seis listas distribuidas y seis masivas se aprendieron durante un lapso que se
extendi desde el 6 de noviembre de 1895 hasta el 7 de abril de 1986. Al final, Jost obtuvo resultados sobre 40
listas diferentes de slabas aprendidas con prctica masiva y 40 con prctica distribuida. La interpretabilidad
de las diferencias descubiertas en el nico sujeto de la prueba, G. E. Mller, depende de la equivalencia de
muestreo de las listas no idnticas existentes. Dentro de estos mrgenes, el experimento descripto parece tener
validez interna. Los descubrimientos, naturalmente, se limitan a los rasgos psicolgicos de Mller en 1895 y
1896 y al universo de material de memorizacin muestreado. Para poder generalizar a otras personas y
establecer una ley psicolgica ms general. Habra, por supuesto, que repetir el experimento con muchos
individuos.

85
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Otro ejemplo proviene de los primeros estudios sobre conformidad a la opinin del grupo. Moore [1921], por
ejemplo, obtuvo una estimacin <<control>> de estabilidad en retest de las respuestas a un conjunto de tems
de un cuestionario, despus de lo cual compar esa medida con la variacin resultante cuando, con otro
conjunto, se acompa el retest con una manifestacin de la opinin de la mayora. Consideremos en cambio
un estudio en el cual se solicita de los alumnos que manifiesten su parecer acerca de un determinado nmero
de temas presentados en un extenso cuestionario. Se dividen entonces las preguntas en dos grupos tan
equivalentes como sea posible. En un momento posterior, se devuelven los cuestionarios a los alumnos y el
grupo vota por cada uno de los tems indicados. Se falsifican esos votos a fin de indicar mayoras opuestas a
las que prevalecieron en las dos muestras de tems. Como medicin post-X, se solicita de los alumnos que
vuelvan a votar sobre todos los temas. En caso de que el argumento de equivalencia de muestreo de ambos
conjuntos de elementos fuera correcto, las diferencias de desplazamientos entre los dos tratamientos
pareceran suministrar una prueba definitiva acerca de los efectos de dar a conocer la opiniones del grupo, aun
en ausencia de grupo de control alguno.
A semejanza del diseo 8, el 9 tiene validez interna en todos los puntos, y en general por los mismos motivos.
Obsrvese, a propsito de la validez externa, que en el diseo 9, como en todos los experimentos con
mediciones repetidas, los efectos pueden ser bastante especficos de las personas medidas en varias sesiones.
En pruebas de aprendizaje, las mediciones son parte tan integrante de la situacin experimental propia del
mtodo tpico utilizado en la actualidad (aunque no necesariamente en el mtodo de Jost, en el cual las
prcticas comprendieron cantidades controladas de lectura de las listas), que esta limitacin a la
generalizacin pierde toda importancia. Parecera que en el diseo 9 hay menos posibilidades de dispositivos
reactivos que en el 8 a causa de la heterogeneidad de los materiales y la mayor probabilidad de que los sujetos
no adviertan que reciben tratamientos diferentes en momentos diferentes y para tems diferentes. Esta escasa
reactividad no aparecera en el experimento de Jost, pero s en el estudio de conformidad. Es probable, pues,
que la interferencia entre los niveles de la variable experimental o entre los materiales sea una innegable
imperfeccin de este experimento, al igual que en el diseo 8.
Tenemos un ejemplo, especfico del tipo de limitacin as introducido acerca de los descubrimientos de Jost.
Este investigador inform que el aprendizaje espaciado era ms eficaz que la prctica masiva. De las
condiciones generales de su experimentacin cabe inferir que estaba justificado al generalizar slo para las
personas que estuviesen aprendiendo muchas listas, o sea, las que tenan un elevado nivel de interferencia. La
investigacin contempornea indica que la superioridad del aprendizaje espaciado slo se restringe a tales
poblaciones, y que en personas que aprenden por primera vez materiales muy nuevos, no se da esa ventaja.
[Underwood y Richardson. 1958].

Estadsticas del diseo 9

Es obvio que el muestreo de materiales guarda relacin con la validez y el grado de prueba del experimento.
Como tal, es probable que la N para el clculo de la significacin de las diferencias entre las medias de grupos
de tratamiento debiera haber sido una N de listas en el experimento de Jost (o una N de elementos en el
estudio de conformidad) a fin de que se representara ese importante campo de muestreo. Se lo debe completar
con una base de generalizacin entre personas. En la actualidad, acaso lo mejor sea hacerlo en forma seriada,
estableciendo ante todo la generalizacin entre la muestra de listas o tems, computando despus un puntaje
de efectos experimentales para cada persona, y empleando todo ello como base para la generalizacin entre
personas. (Vase la bibliografa antes citada, a propsito del diseo 8, con respecto a las precauciones que
deben tomarse.)

10.Diseo de grupo de control no equivalente

Uno de los diseos experimentales ms difundidos en la investigacin educacional comprende un grupo


experimental y otro de control, de los cuales ambos han recibido un pretest y un postest, pero no poseen
equivalencia preexperimental de muestreo. Por lo contrario, los grupos constituyen entidades formadas
naturalmente (como una clase, por ejemplo) tan similares como la disponibilidad lo permita, aunque no tanto,
sin embargo, que se pueda prescindir del pretest. La asignacin de X a uno u otro grupo se supone aleatoria y
controlada por el experimentador.

86
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

0 __ X __ __ 0

0 0

Dos cosas han de tenerse claras sobre este diseo. Ante todo, que no se lo debe confundir con el 4, el diseo
con grupo de control pretest-postest, donde los sujetos experimentales que se toman de una poblacin comn
se asignan en forma aleatoria al grupo experimental y de control. En segundo lugar, que, a pesar de ello, hay
que admitir que el diseo 10 es utilizable en muchas oportunidades en que son imposibles los diseos 4,5 o 6.
Sobre todo, habr que reconocer que aun el agregado de un grupo de control no equiparado o no equivalente
reduce en gran parte la ambigedad de las interpretaciones que derivan del diseo 2 de un grupo pretest-
postest. Cuanto ms similares sean en su reclutamiento el grupo experimental y el de control y ms se
confirme esa similitud por los puntajes del pretest, ms eficaz resulta ese control. Suponiendo que estos
ideales se aproximen a los objetivos de la validez interna, podemos considerar que el diseo controla los
principales efectos de la historia, la maduracin, la administracin de tests y la instrumentacin, donde la
diferencia para el grupo experimental entre el pretest y el postest (si fuera mayor que para el grupo de control)
no puede explicarse por efectos principales de esas variables, como los que afectaran tanto al grupo
experimental como al de control. (Sin embargo, deben extremarse las precauciones sobre la historia
intrasesional mencionadas en el diseo 4.)
Un esfuerzo por explicar una ganancia pretest-postest propia del grupo experimental en trminos de factores
externos, como historia, maduracin o aplicacin de tests, tiene que suponer una interaccin entre esas
variables y las diferencias especficas de seleccin que se den entre el grupo experimental y el de control.
Aunque tales interacciones son en general poco probables, hay un cierto nmero de situaciones en las que
podran involucrarse. Acaso las ms comunes sean las interacciones que implican maduracin. Si el grupo
experimental consta de pacientes de psicoterapia y el de control de alguna otra poblacin disponible a la cual
se le hayan administrado un test y un retest, una ganancia peculiar del grupo experimental bien podra
interpretarse como un proceso espontneo de remisin tpico de grupo tan extremo, ganancia que se hubiese
producido tambin aun en ausencia de X. Tal interaccin entre seleccin y maduracin (o seleccin-historia, o
seleccin-test) podra confundirse con el efecto de X, constituyendo por tanto una amenaza a la validez
interna del experimento. Esta posibilidad ha sido representada en la octava columna del cuadro 2 y es el
principal factor de validez interna que caracteriza a los diseos 4 y 10.
Acaso se aclare este punto con un ejemplo concreto de investigacin educacional. El estudio de Sanford y
Hemphill [1952] sobre los efectos de un curso de psicologa en Anpolis ofrece una excelente ilustracin del
diseo 10. En ese trabajo, el Segundo Curso de Anpolis constituy el grupo experimental, y el Tercero, el de
control. Las mayores ganancias registradas por el grupo experimental podran explicarse como parte de un
proceso general de perfeccionamiento, con resultados mximos en los primeros dos cursos y mnimos en el
tercero y cuarto, constituyendo, por tanto una interaccin entre los factores de seleccin que diferencian los
grupos experimental y de control y las variaciones naturales maduracin caractersticas de tales grupos, y no
un efecto del programa experimental. El grupo particular de control utilizado por Sanford y Hemphill
posibilita alguna verificacin de esta interpretacin rival (en forma un tanto similar al diseo 15, que
expondremos ms adelante). La hiptesis de seleccin-.maduracin pronosticara que el Tercer Curso (grupo
de control) habra de indicar en su test inicial una superioridad respecto de las mediciones pretest del Segundo
Curso (grupo experimental), con magnitud casi igual a la hallada entre el pretest y el postest de este ltimo
grupo. Por fortuna para la interpretacin de su experimento, no ocurri en general as. Las diferencias entre
los cursos en el pretest no presentaban en la mayora de los casos el mismo sentido ni igual magnitud que las
ganancias pretest-postest del grupo experimental. Sin embargo, sus comprobaciones de una ganancia
significativa para el grupo experimental en puntajes de confianza en el cuestionario de situaciones sociales
pueden explicarse como un mecanismo artificial de seleccin-maduracin. El grupo experimental pas de
43,26 puntos a 51,42, en tanto que el Tercer Curso comenz por un puntaje de 55,82 y continu aumentado
hasta alcanzar 56,78. La hiptesis de interaccin entre seleccin y maduracin ser en ocasiones aceptable,
aun cuando los grupos obtengan puntajes pretest idnticos. El ms comn de tales casos ser aquel en que un
grupo obtenga una tasa de maduracin o variacin autnoma ms elevada que el otro. El diseo 14 ofrece una
extensin del 10 que tendera a eliminar este factor.
El otro gran problema de la validez interna en el diseo 10 es la regresin. Como se indic con <<?>> en el
cuadro 2, cabe evitar ese riesgo, pero no siempre al tropezar con l se lo sortea. En general, si se ha elegido
cualquiera de los grupos de comparacin por sus puntajes externos de 0 o mediciones correlativas, una

87
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

diferencia en el grado de desplazamiento de pretest a postest entre ambos grupos bien puede ser producto de
la regresin y no efecto de X. Esta posibilidad ha tenido mayor trascendencia a causa de una obcecada y
engaosa tradicin en el mbito de la experimentacin como una tcnica apropiada y suficiente para
establecer la equivalencia preexperimental de grupos. Este error ha ido acompaado por la falta de distincin
entre los diseos 4 y 10 y los diferentes papeles representados por la equiparacin en los puntajes de pretest
en ambas condiciones. En el diseo 4, puede considerase este procedimiento como un complemento
provechoso de la aleatorizacin, pero no como un sustituto de ella; en trminos de puntajes en el pretest o en
las variables relativas, cabe organizar la poblacin total disponible para fines experimentales en pares de
sujetos cuidadosamente equiparados; los integrantes de esos pares se asignarn al azar a las condiciones
experimentales o de control. Esa equiparacin ms la ulterior aleatorizacin suelen producir un diseo
experimental ms preciso que la aleatorizacin por s sola.
No debe confundirse con ese ideal la tcnica, correspondiente al diseo 10, de tratar de compensar las
diferencias entre los grupos experimentales y de control no equivalentes mediante un procedimiento de
equiparacin, cuando no se puede hacer la asignacin aleatoria a tratamientos. Si en el diseo 10 las medias
de los grupos son sustancialmente diferentes, el proceso de equiparacin, no solo no suministra la igualacin
pretendida, sino que provoca la presencia de efectos indeseados de regresin. Se torna previsible que ambos
grupos diferirn en sus puntajes postest en forma por completo independiente de cuales quiera efectos de X,
as como que esa diferencia variar en proporcin directa a la diferencia entre las poblaciones totales de las
que se hizo la seleccin, y en proporcin inversa a la correlacin entre el test y el pre-retest.
Rulon [1941], Stanley y Beeman [1958] y Thorndike [1942] han estudiado este problema en forma
exhaustiva, destacando el anlisis de covariancia y otras tcnicas estadsticas sugeridas por Jonson y Neyman
[vase Jonson y Jackson, 1959, pgs. 424-44] y por Peters y Van Boris [1940] para probar los efectos de la
variable experimental sin el procedimiento de hallar pares de grupos similares. No obstante, habra que tomar
en cuenta recientes advertencias de Lord [1960] a propsito del anlisis de convariancia cuando la
confiabilidad de la covariable no es absoluta. Tambin pueden aplicarse puntajes simples de ganancia, pero
suelen ser menos convenientes que el anlisis de covariancia. La aplicacin del anlisis de covariancia a esta
situacin del diseo 10 implica supuestos (como el de homogeneidad de regresin) menos posibles aqu que
en los casos del diseo 4 [vase Lindquist, 1953].
Al interpretar estudios publicados del diseo 10, en que se recurri a la equiparacin, se puede advertir que el
sentido del error es predecible. Consideremos un experimento de psicoterapia que utiliza como 0
calificaciones de descontento con la propia personalidad. Supongamos que el grupo experimental consta de
personas sometidas a terapia, en tanto que el grupo de control seleccionado est formado por personas
consideradas <<normales>>. En este caso el grupo de control presentar puntajes extremadamente bajos con
respecto al grupo normal, haciendo as menos probable que se demuestre un efecto significativo de la terapia
en vez de producir una falsa impresin de eficacia a favor del procedimiento teraputico.
El ejemplo de los pacientes de psicoterapia nos ofrece tambin un caso en el cual los supuestos de regresin
homognea y muestreo del mismo universo, salvo para los puntajes extremos, parecen inapropiados. La
inclusin de controles normales en la investigacin psicoteraputica es de alguna utilidad, pero hay que poner
suma cautela en la interpretacin de los resultados. Es importante distinguir dos versiones del diseo 10, y
darles diferente jerarqua como aproximaciones a la experimentacin propiamente dicha. Por otra parte, se da
la situacin en que el experimentador dispone de dos grupos naturales, por ejemplo dos clases, y puede elegir
con libertad cul ha de recibir X, o por lo menos no tiene ningn motivo para sospechar que se haga un
reclutamiento diferencial con relacin a X. Aunque los grupos pueden diferir en sus medias iniciales de 0, el
estudio se aproximar a la experimentacin propiamente dicha. Por otra parte, hay casos del diseo 10 en que
los participantes son a todas luces autoseleccionados: el grupo experimental busca deliberadamente la
exposicin a X, y no se cuenta con un grupo de control tomado de esa mismo poblacin. En este ltimo caso,
es menos probable que se cumpla el supuesto de regresin uniforme entre los grupos experimental y de
control, aumentando en cambio la posibilidad de interaccin seleccin-maduracin (y las dems interacciones
de seleccin). El diseo 10 <<autoseleccionado>> es, pues, mucho ms endeble, pero no ofrece informacin
que en muchos casos eliminara la hiptesis de que X surte algn efecto. El grupo de control ayuda a
interpretar, aunque sea muy divergente en el mtodo de reclutamiento y el nivel medio.
La amenaza que la administracin de tests constituye para la validez externa es la expuesta a propsito del
diseo 4 (vase pg. 32). El signo de interrogacin para la interaccin de la seleccin y X nos recuerda que el
efecto de X bien puede ser especfico de los participantes seleccionados como lo fue de los participantes de
nuestro experimento. Como los requisitos del diseo 10 pueden poner menos restricciones a nuestra libertad
de muestreo que los del diseo 4, esa expecificidad ser por lo comn menor que en un experimento de

88
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

laboratorio. La amenaza a la validez externa proveniente de la reactividad de los dispositivos existe, pero tal
vez en menor grado que en la mayora de los experimentos propiamente dichos, como el diseo 4.
Donde existe la posibilidad de utilizar dos cursos intactos con el diseo 10, o la de tomar muestras aleatorias
de los alumnos fuera de las aulas para distintos tratamientos experimentales segn un diseo 4,5 o 6, es casi
seguro que este ltimo dispositivo, ser ms reactivo, creando mayor conciencia de que se est siendo
sometido a experimento la sensacin de <<ser un conejillo de Indias>> y similares.
Los estudios de Thorndike y Woodworth, 1901; Brolyer, Thorndike y Woodyarth, 1927] constituyen otras
tantas aplicaciones del diseo 10 a X no controladas por el experimentador. Tales estudios soslayaron, al
menos en parte, el error de los efectos de regresin causados por la equiparacin simple, pero habra que
compararlos cuidadosamente con los mtodos modernos. As, es probable que el uso de estadsticas de
covariancia produjera una prueba ms contundente, por ejemplo, de transferencia del vocabulario latino al
ingls.
En otro sentido, los efectos por lo comn positivos, aunque mnimos, que se hallaron podran explicarse no
como transferencias sino como la seleccin en los cursos de latn de los alumnos cuyo ndice anual de
enriquecimiento de vocabulario habra sido mayor que el del grupo de control, aun sin la presencia del estudio
del latn. Este resultado se clasificara aqu como interaccin seleccin-maduracin. En muchos sistemas
escolares esta hiptesis rival podra verificarse ampliando la gama de las 0 previas al aprendizaje del latn que
se toman en consideracin como en un diseo 14.
Tales estudios constituyeron denodados esfuerzos por introducir la mentalidad experimental en la
investigacin de campo, y merecen que se les preste renovada atencin y se los ample con los mtodos
modernos.

11.Diseos compensados

Bajo este ttulo se renen todos aquellos diseos en los cuales se logra el control experimental o se aumenta la
precisin aplicando a todos los participantes (o situaciones) la totalidad de los tratamientos. Esos diseos
recibieron las denominaciones de <<experimentos rotativos>> [segn McCall, 1923], <<diseos de
conmutacin>> [Lempthorne, 1952]. El dispositivo de cuadrado latino es el que ms se utiliza en la
compensacin. Ese cuadrado latino es el utilizado en el diseo 11, esquematizado aqu como
cuasiexperimental, en el que se aplican cuatro tratamientos experimentales, en forma restrictivamente
aleatorizada y por turno a cuatro grupos formados de manera natural o incluso a cuatro individuos [p. ej.,
Maxwell, 1958]:

Primera SegundaTercera Cuarta


vez vez vez vez

Grupo A X10 X20 X30 X40


-------------------------------------------------------------------
Grupo B X20 X40 X10 X30
________________________________________
Grupo C X30 X10 X40 X20
________________________________________
Grupo D X40 X30 X20 X10

El diseo ha sido diagramado slo con postests, dado que presta particular utilidad all donde los pretests
resultan inapropiados y no se dispone de diseos como el 10. El diseo contiene tres clasificaciones (grupos,
sesiones y X o tratamientos experimentales). Cada clasificacin es <<ortogonal respecto de las otras dos, en el
sentido de que cada variable de cada clasificacin se produce con la misma frecuencia (una vez para un
cuadrado latino) con cada variable de cada una de las otras clasificaciones. Obsrvese que cada tratamiento (o
X) slo se da una vez en cada columna y cada fila. El mismo cuadrado latino puede modificarse de tal manera
que las X se conviertan en ttulos de filas o de columnas:

X1 X2 X3 X4
Grupo A t10 t 20 t 30 t40
Grupo B t30 t 10 t 40 t20

89
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Grupo C t20 t 40 t 10 t30


Grupo D t40 t 30 t 20 t10

Resultan as comparables las sumas de puntajes por X, al tener representados, en cada una de ellas, cada
oportunidad y grupo. Las diferencias en tales sumas no se podran interpretar como resultados artificiales de
las discrepancias grupales iniciales o de efectos de la prctica, la historia, etc. De parecida comparabilidad son
las sumas de las filas para diferencias grupales intrnsecas, y las sumas de las columnas de la primera
presentacin para las diferencias en las sesiones. Desde el punto de vista del anlisis de variancia, el diseo
parece suministrar as informacin acerca de tres efectos principales con el nmero de casilleros que suelen
exigirse para dos. Resulta evidente el costo de esta mayor eficacia: lo que parece ser un efecto principal
significativo segn cualquiera de los tres criterios de clasificacin, acaso constituye en cambio una compleja
interaccin significativa entre otros dos [Lindquist, 1953, pgs. 258-64]. Las diferencias aparentes entre los
efectos de las X podran resultar un complejo efecto especfico de interaccin entre las diferencias grupales y
las sesiones. Las inferencias sobre los efectos de X dependern de la admisibilidad de esta hiptesis rival, y
por lo tanto las estudiaremos en forma ms detallada.
Digamos, en primer lugar, que la hiptesis de tal interaccin es ms admisible para la aplicacin
cuasiexperimental descrita, que para las de los cuadrados latinos en los experimentos propiamente dichos
mencionados en los textos. En lo que se ha denominado la dimensin grupal, se entremezclan dos posibles
fuentes de efectos sistemticos. Ante todo, estn los factores de seleccin sistemtica implicados en la
formacin natural de los grupos. Cabe esperar que esos factores tengan a la vez efectos principales e
interacten con la historia, la maduracin, los efectos de la prctica, etc. Si se tuviese que organizar as un
experimento con control total, cada persona debera ser asignada a cada grupo en forma independiente y
aleatoria, eliminndose esta fuente tanto de los efectos principales como de la interaccin, al menos en lo que
concierne al error de muestreo. Es caracterstico del cuasiexperimento que la compensacin se introduzca para
suministrar una suerte de igualacin, solo porque tal asignacin aleatoria no es posible. (Como contraste, en
diseos del todo controlados, se emplea el cuadrado latino por razones de economa o para resolver problemas
peculiares del muestreo de parcelas.) Una segunda posible fuente de efectos entremezclados en los grupos es
la vinculada con secuencias especficas de tratamientos. Si todas las repeticiones de un experimento
propiamente dicho hubiesen seguido el mismo cuadrado latino, esta fuente de efectos principales y de
interaccin tambin habra estado presente. Sin embargo, en el tpico experimento propiamente dicho, a
algunos grupos de participantes de les habran asignado en la repeticin diferentes cuadrados latinos,
eliminndose as el efecto sistemtico de secuencias especficas. De ese modo se elimina tambin la
posibilidad de que determinada interaccin sistemtica haya producido un aparente efecto principal de las X.
Es probable que las sesiones produzcan un efecto principal debido a la repetida aplicacin de pruebas, la
maduracin, la prctica y los efectos acumulados o transferencias. Asimismo, la historia puede generar efectos
con respecto a las sesiones. El dispositivo en cuadrado latino impide, por supuesto, que esos efectos son
sntomas de una heterogeneidad significativa, es probable que se justifique ms la sospecha de interacciones
significativas que cuando tales efectos principales no se producen. Los efectos de la prctica, por ejemplo,
quiz sean montonos, pero tambin es probable que no sean lineales y generen efectos tanto principales
como de interaccin. Muchas aplicaciones de los cuadrados latinos en experimentos propiamente dichos,
como en la agricultura, por ejemplo, no exigen reiteradas mediciones y es caracterstico que no produzcan
ningn efecto sistemtico correspondiente de columna. Los del tipo cruzado, sin embargo, comparten este
posible inconveniente con los cuasiexperimentales.
Estas consideraciones permiten apreciar la mxima importancia de la repeticin del diseo cuasiexperimental
con diferentes cuadrados latinos especficos. Tales repeticiones, realizadas en nmero suficiente, haran del
cuasiexperimento un experimento propiamente dicho. Es probable que implicasen tambin cantidades
suficientes de grupos para posibilitar la asignacin aleatoria de grupos intactos a los tratamientos, media de
control que por lo comn es preferible. No obstante, careciendo de tales posibilidades, un cuadrado latino
nico constituye un diseo cuasiexperimental intuitivamente satisfactorio, a causa de su demostracin de
todos los efectos en la totalidad de los grupos de comparacin. Aun reconociendo los posibles errores de
interpretacin, constituye un diseo que bien vale la pena adoptar cuando no hay posibilidades de un control
ms eficaz. Una vez destacados sus graves inconvenientes, examinemos sus ventajas relativas.
Como todos los cuasiexperimentos, gana este en pujanza con la congruencia de las repeticiones internas de la
prueba. Para poner de relieve esa congruencia, deben eliminarse los efectos principales de las sesiones y los
grupos, expresando cada casillero como un desvo respecto de las medias de filas (grupo) y columnas
(momentos): Mgt- Mg.- M.t + M... Despus se reordenan los datos, con los tratamientos (X) encabezando las

90
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

columnas. Supongamos que el cuadro que obtenemos es de una satisfactoria congruencia, que el ms eficaz
de los tratamientos es el mismo en los cuatro grupos, etc. Cules son las probabilidades de que eso no sea un
efecto real de los tratamientos, sino una interaccin de grupos y sesiones? Podemos observar que casi todas
las posibles interacciones de grupos y sesiones reduciran o enturbiaran el efecto manifiesto de X. Una
interaccin que imitara un efecto principal de X sera poco probable, y lo sera menos an en cuadrados
latinos mayores.
Nos sentiramos muy atrados por este diseo cuando tuvisemos control de programacin sobre unos cuantos
grupos de formacin natural, como por ejemplo clases, pero no nos fuese posible subdividir esos grupos
naturales en subgrupos de equivalencia aleatoria, sea para una presentacin de X o para aplicar tests. En tal
situacin, si hubiera cmo aplicar un pretest, se dispondra asimismo del diseo 10; tambin implica una
posible confusin de los efectos de X con interacciones de seleccin y sesiones. Se juzga que esta posibilidad
es menos probable en el diseo compensado, porque en cada grupo se demuestran todas las comparaciones y
por lo tanto se necesitaran varias interacciones equiparadas a fin de imitar el efecto experimental.
Mientras que en los otros diseos la especial sensibilidad de uno solo de los grupos a un acontecimiento
externo (historia) o a la prctica (maduracin) podra simular un efecto de X, en el diseo compensado tales
efectos coincidentes tendran que darse en sucesivas sesiones separadas y en cada uno de los grupos. Este
resultado supone, por supuesto, que no interpretaramos un efecto principal de X como significativo si la
inspeccin de los casilleros indicase que un efecto principal desde el punto de vista estadstico ha sido
originado, fundamentalmente, por un muy poderoso efecto en solo uno de los grupos. Para un estudio ms
detenido de esta cuestin, vase Wilk y Kempthorne [1957], Lubin [1961] y Stanley [1955].

12. Diseo de muestra separada pretest-postest

Para grandes poblaciones p. ej., ciudades, fbricas, escuelas y unidades militares--, suele ocurrir que, aunque
no se pueden segregar subgrupos en forma aleatoria para tratamientos experimentales diferenciales, cabe
ejercer algo as como un control experimental completo sobre el momento de aplicacin y los destinatarios de
la 0, utilizando procedimientos de asignacin aleatoria. Ese control posibilita el diseo 12:

R 0 (X)
R X 0

En este esquema, las filas constituyen subgrupos de equivalencia aleatoria, representando la X entre
parntesis una presentacin de X sin importancia. Se mide una muestra antes de X, otra equivalente despus
de X. El diseo no es intrnsecamente eficaz, como lo indica su fila en el cuadro 2. No obstante, suele resultar
viable, y a menudo merece que se lo aplique. Se lo ha utilizado en experimentos de ciencias sociales que son
an los mejores estudios existentes en sus temas especficos [p. ej., Star y Hughes, 1950]. Aunque se lo ha
denominado <<diseo simulado antes y-despus>> [Selltiz, Jahoda, Deutsch y Cook, 1959, pg. 116], vale la
pena destacar su superioridad respecto del diseo comn antes y-despus, el diseo 2, por su control tanto del
efecto principal de la aplicacin de tests como de la interaccin de la administracin de tests con X. El defecto
fundamental del diseo es que no puede controlar la historia. As, en el estudio de la campaa de publicidad
realizado en Cincinnati para las Naciones Unidas y la UNESCO [Star y Hughes, 1950], es probable que
hechos externos de la escena internacional hubieran sido la causa de la reduccin observada en el optimismo
sobre la coexistencia pacfica con Rusia.
Esta obra aspira a estimular los diseos <<de retazos>>, en los cuales se agregan aspectos que permitan
controlar factores especficos, de ordinario uno por vez (en contraste con los experimentos propiamente
dichos, de mayor elegancia, en que con un solo grupo se controlan todas las amenazas a la validez interna).
Repitiendo el diseo 12 en diferentes situaciones y momentos, como en el diseo 12 (vase cuadro 2, pg.
80), se controla la historia, pues si el mismo efecto se da en varias ocasiones, la posibilidad de que sea
resultado de acontecimientos histricos coincidentes se torna menos probable. No obstante, las tendencias
histricas persistentes o los ciclos estacionales siguen constituyendo explicaciones rivales no controladas. Por
la repeticin del efecto en otras condiciones, cabe reducir la posibilidad de que el efecto en otras condiciones,
cabe reducir la posibilidad de que el efecto observado sea caracterstico de la nica poblacin seleccionada en
el primer momento. No obstante, si la situacin de la investigacin permite utilizar el diseo 12 , tambin ser
viable el 13, que en general resultar preferible.

91
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Es poco probable que se invoque la maduracin, o el efecto del envejecimiento de los participantes, como
explicacin rival, ni aun en estudios sobre la opinin pblica que se extiendan durante meses. Pero en la
encuesta por muestreo, y hasta en ciertos cursos universitarios, las muestras son suficientemente grandes y las
edades lo bastante heterogneas para que se puedan comparar las submuestras del grupo pretest que difieren
en maduracin (edad, nmero de semestres cursados, etc.). La maduracin, y la acaso ms peligrosa
posibilidad de tendencias persistentes y estacionales, tambin es controlable por un diseo como el 12 b, que
agrega un grupo pretest anterior, aproximando el diseo al de series cronolgicas, aunque sin la aplicacin
reiterada de tests. Para poblaciones como la de pacientes a quienes se aplican tratamientos de psicoterapia,
donde podra darse una mejora espontnea o curacin, los supuestos de linealidad implicados en forma
implcita en este control quiz no fueran aceptables. Es ms probable que la tendencia de maduracin reciba
una aceleracin negativa, haciendo as que la ganancia de maduracin 0 1 02 sea mayor que la de 02 03, en
detrimento, por tanto, de la interpretacin constituye un riesgo en este diseo, cuando se la utiliza en el marco
de las encuestas por muestreo. Si en el pretest y el postest se recurre a los mismos encuestadores, suele ocurrir
que muchos, carentes an de experiencia en el pretest, la hayan adquirido en el postest o tengan en l mayor
soltura. Si en cada tanda de encuestas se recurre a distintas personas para esa tarea, y su nmero no es
elevado, las diferencias en la idiosincrasia de los encuestadores se confunden con la variable experimental. Si
los experimentadores conocen la hiptesis, sus expectativas pueden provocar diferencias, hyase o no
trasmitido la X, como lo demostraron con sus experimentos Stanton y Baker [1942] y Smith y Imn [1950].
En un caso ideal se utilizaran muestras aleatorias equivalentes de distintos entrevistadores en cada tanda,
mantenindolos ignorantes acerca del objeto del experimento. Adems, el reclutamiento de los encuestadores
puede indicar diferencias estacionales, por ejemplo, ya que durante los meses de verano se dispone de ms
estudiantes universitarios, etc. Las tasas de rechazo son acaso menores y la duracin de las entrevistas mayor
en verano que en invierno. Para cuestionarios autoadministrados en el aula, este error instrumental ser menos
probable, aunque las orientaciones hacia la administracin de tests quiz se desplacen en formas mejor
clasificables como instrumentacin que como influjos de X sobre 0. Para pretests y postests aplicados con
varios meses de separacin, la mortalidad puede plantear un problema en el diseo 12. Si ambas muestras se
eligen en forma simultnea (punto R), es de suponer que a medida que trascurra el tiempo ms integrantes de
la muestra elegida se tornen inaccesibles, perdindose los segmentos ms transitorios de la poblacin, lo cual
producir una diferencia poblacional entre los distintos perodos de entrevista. Una advertencia de esa
posibilidad la constituyen las diferencias entre los grupos en el nmero de personas no entrevistadas.
En estudios realizados a lo largo de perodos extensos, las muestras para pretest y postest deberan
seleccionarse acaso en forma independiente y e momentos distintos apropiados, aunque ello tambin posee
una fuente de sesgo sistemtico, resultante de los posibles cambios en el esquema residencial del conjunto del
universo. En algunos medios (p. ej., en las escuelas, los archivos permitirn que se eliminen los puntajes
pretest de quienes no estarn ya disponibles en el momento del postest, haciendo as ms comparables el
postest con el pretest. Para lograr un mecanismo que haga posible esa correccin en la encuesta con muestras,
as como una ratificacin del efecto que no pudiera contaminarse con la mortalidad, se puede someter el
grupo pretest a un nuevo test, como en el diseo 12 c, donde la diferencia 01 02 confirmara la comparacin 01
03. As, el estudio que Duncan y otros [1957] efectuaron sobre la reduccin en las creencias errneas lograda
durante un curso introductorio de psicologa. (En este diseo, el grupo sometido a un retest no permite que se
examinen las ganancias de personas con puntajes iniciales diversos, por no haberse utilizado un grupo de
control para verificar la existencia de regresin.)
Lo caracterstico de este diseo es que lleva el laboratorio a la situacin de campo a la cual el investigador
desea extender sus generalizaciones, probando los efectos de X en su ambiente natural. En general, segn se
indica en los cuadros 1 y 2, los diseos 12, 12 a, 12b y 12c pueden resultar superiores en validez externa o
posibilidad de generalizacin respecto de los experimentos propiamente dichos de los diseos 4,5 y 6. Estos
diseos no requieren gran cooperacin de los participantes, ni que estn disponibles en ciertos lugares y
momentos, etc., de modo que se puede utilizar un muestreo representativo de poblaciones previamente
determinadas.
En los diseos 12 y 13 (y sin lugar a dudas tambin en algunas variantes de los diseos 4 y 6, donde X y 0 se
trasmiten por contactos individuales, etc.), es posible el muestreo representativo. Los signos positivos en la
columna de interaccin seleccin-X son muy relativos y con todo derecho se los podra cambiar por signos de
interrogacin ya que en la prctica general las unidades no se seleccionan por su relevancia terica, sino a
menudo por razones de cooperacin y accesibilidad, que posiblemente las tornen atpicas del universo al cual
se las desea generalizar.

92
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Star y Hughes [1950] no deseaban generalizar a Cincinnati, sino ms bien a los ciudadanos de Estados Unidos
o al mundo en general, y persiste la posibilidad de que la reaccin a X en aquella urbe fuese atpica de esos
universos. Pero el grado de ese sesgo de accesibilidad es tan inferior al de otros diseos ms exigentes que, en
comparacin, parece justificado atribuirle un carcter positivo.

13. Diseo de muestra separada pretest-postest con grupo de control.

Se supone que el diseo 12 ha de utilizarse en aquellas situaciones en que la X, si existe, debe presentarse al
grupo como un todo. Si se cuenta con grupos comparables (ya que no equivalentes) a los cuales sea posible
rehusar la X, se podr agregar un grupo de control al diseo 12, creando as el diseo 13:

R 0 (X)
R X 0
__________
R 0
R 0

Este diseo es bastante parecido al 10, solo que no se vuelve a someter a test a las mismas personas y, por lo
tanto, se evita la posible interaccin entre la administracin de tests y X. Como en el diseo 10, la desventaja
del 13 en cuanto a la validez interna proviene de la posibilidad de interpretar como efecto de X otra tendencia
local propia del grupo experimental que, en realidad, no ha influido. Aumentando el nmero de las unidades
sociales implicadas (escuelas, ciudades, fbricas, buques, etc.) y asignndolas en cierto nmero y control, se
conseguir eliminar la nica fuente de invalidacin, logrndose as un experimento propiamente dicho,
anlogo al diseo 4, con la nica diferencia de que se evitan nuevas pruebas sobre los mismos individuos.
Este diseo puede designarse 13a. Su esquematizacin (en el cuadro 3) se ha visto complicada por los dos
niveles de equivalencia (logrados por asignacin aleatoria) en l implicados. En el nivel de participantes,
existe en el interior de cada unidad social la equivalencia de las muestras separadas pretest y postest,
indicadas por el punto R de asignacin. Entre las varias unidades sociales que reciben cualquiera de los
tratamientos, no se verifica esa equivalencia, lo cual se indica con la lnea punteada. La R t designa la
igualacin del grupo experimental y el de control por la asignacin aleatoria de esas muchas unidades sociales
a uno u otro tratamiento.
Como puede verse en la fila correspondiente a 13 a del cuadro 3, este diseo obtiene un puntaje perfecto para
validez tanto interna como externa, esta ltima en virtud de los fundamentos ya expuestos a propsito del
diseo 12, y con mayor hincapi en el problema de la interaccin seleccin-X, a causa de que estn
representadas muchas unidades sociales y no una sola. Que nosotros, sepamos, este diseo, excelente pero
costoso, no ha sido utilizado nunca.

14. Diseo de series cronolgico mltiples

En los estudios de grandes cambios administrativos por medio de datos en series cronolgicas, al investigador
le conviene buscar una institucin similar no sujeta a X, de la cual tomar una serie cronolgica de
<<control>> anloga (idealmente, con X asignada al azar):

0 0 0 0X0 0 0 0
_ _ _ _ _ _ _ _ _ _
0 0 0 0 0 0 0 0

Este diseo contiene (en las 0 que comprenden a X) el nmero 10, de grupo de control no equivalente, pero
gana certidumbre de interpretacin por las mltiples mediciones representadas, ya que en cierto sentido el
efecto experimental se demuestra dos veces, respecto del control y respecto de los valores pre-X en su propia
serie, como en el diseo 7. Adems, la interaccin entre seleccin y maduracin se controla en el sentido de
que, si el grupo experimental demostr por lo comn una mayor tasa de ganancia, aparecera as en las 0 pre-

93
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

X. En los cuadros 2 y 3 es escasa la representacin de esta nueva ganancia, pero aparece en la columna final
de validez interna, titulada <<Interaccin de seleccin y maduracin>>. Puesto que la maduracin se controla
tanto en la serie experimental como en la de control, por las razones expuestas en nuestra primera
presentacin del diseo 7 de serie cronolgica, la diferencia en ala seleccin de los grupos, que opera
juntamente con la maduracin, instrumentacin o regresin, difcilmente podr explicar un efecto notorio. Sin
embargo, no se excluye la posibilidad de una interaccin entre la diferencia de seleccin y la historia.
Como con el diseo 7 de serie cronolgica, se ha puesto un signo negativo en la columna de validez externa
para la interaccin entre la aplicacin de pruebas y X, aunque como en el caso del mismo diseo 7, el que
comentamos se ampliar a menudo cuando la administracin de los tests no sea reactiva. Tambin la habitual
preocupacin acerca de la posible especificidad de un efecto demostrado de X en la poblacin que se estudia
queda registrada en el cuadro 3. En cuanto a los tests de significacin, se sugiere que las diferencias entre la
serie experimental y la de control se analicen como los datos del diseo 7. Parece mucho ms probable la
linealidad de estas diferencias que la de los datos no elaborados de las series cronolgicas.
Este es, en trminos generales, un excelente diseo cuasiexperimental, acaso el mejor de los ms viables.
Presente claras ventajas respecto de los diseos 7 y 10, como ya lo hemos indicado al presentar el diseo 10.
La posibilidad de efectuar reiteradas mediciones torna particularmente apropiadas las series cronolgicas
mltiples para las investigaciones que se llevan a cabo en establecimientos educativos.

Cuadro 3 Fuentes de invalidacin para los diseos 13 a 16 .


Fuentes de invalidacin
Interna Externa
de

Interaccin de seleccin y

Interferencia de X mltiples
Interaccin de seleccin y

Dispositivos reactivos
Administracin de tests

Instrumentacin

maduracin, etc.
Maduracin

administracin
Mortalidad
Regresin

Mortalidad

de tests y X.
Seleccin

Interaccin
Historia

Diseos cuasiexperi
Mentales (cont.)
13. Diseo de + + + + + + + - + + +
muestra separada
pretest-postest
con grupo de
control

94
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

R 0 (X)
R X 0
R 0
R 0

13 R 0 (X) + + + + + + + + + + +
R X 0

R 0 (X)
R1 R X 0

R 0 (X)
R X 0

R 0
R 0

R 0
R1 R 0

R 0
R 0

14. Series cronolgicas + + + + + + + + - - ?


Mltiples
0 0 0X0 0 0
0 0 0 00 0

15. Diseo de ciclo


Institucional
C1. A X 01
C1. B1 R02 X 03
C1. B2 R X 04

C1. C 05 X

Cont. Gen. Pob.


p/C1. B 06
Cont. Gen. Pob.
p/C1. C 07
02 < 01 + - + + ? - ? + ? +
05 < 04
02 < 03 - - - ? ? + + - ? +

02 < 04 - - + ? ? + ? + ? ?
06 = 07 + -
025 = 026

16. Discontinuidad + + + ? + + ? + + - + +
En la regresin
4

15. Diseo de ciclo institucional recurrente:


un diseo <<de retazo>>
4
Cont. Gen. Pob. P/C1. >> significa >> Controles generales de poblacin para la clase>>.

95
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

El diseo 15 ilustra una estrategia para la investigacin de campo en la cual se comienza por un diseo
insuficiente y se van sumando luego caractersticas particulares, a fin de investigar una u otra de las fuentes
recurrentes de invalidacin. El resultado es a menudo una burda acumulacin de verificaciones precautorias,
que carece de la simetra intrnseca de los diseos experimentales propiamente dichos, pero se asemeja a la
experimentacin. Como parte de esa estrategia, el experimentador habr de estar alerta ante las
interpretaciones antagnicas (ajenas al efecto de X) que el diseo ofrece, y tendr que buscar la explicacin
de los datos, o las posibles extensiones de ellos, que permitiran descartarlas. Otro aspecto bastante
caracterstico de estos diseos es que el aspecto es importante sin duda cuando cada comparacin especfica
sea equvoca por s sola.
El diseo <<de retazos>> especfico que exponemos se limita a un riguroso conjunto de cuestiones y
situaciones, y explora segn las circunstancias las caractersticas que estas exhiben la idea fundamental puede
apreciarse en las filas segunda y tercera del cuadro 1, donde se advierte que los signos positivos y negativos
de los diseos 2 y 3 son en su mayor parte complementarios, y que, en consecuencia, la correcta combinacin
de esos dos criterios, insuficientes por s solos, podra tener gran vigor. El diseo es apropiado para aquellas
situaciones en que se presenta en forma cclica, a cada nuevo grupo de participantes, cierto aspecto de un
proceso institucional (escuelas, mtodos de adoctrinamiento, aprendizaje de oficios, etc.). Si en esas
situaciones nos interesa la evaluacin de los efectos de una X tan global y compleja como un programa de
adoctrinamiento, es probable que el diseo de ciclo institucional recurrente ofrezca la respuesta ms apropiada
posible resultante de los diseos que hasta aqu hemos expuesto.
El diseo de ide originalmente durante una investigacin de los efectos de un ao de entrenamiento para
oficiales y pilotos sobre las actitudes hacia los superiores y los subordinados y las funciones de liderazgo de
un grupo de cadetes de la Fuerza Area, mientras se completaba un ciclo de entrenamiento de 14 meses
[Campbell y McCormack, 1957]. La restriccin que impidi que se realizara un experimento propiamente
dicho fue la imposibilidad de controlar quines estaran expuestos a la variable experimental. No haba forma
de dividir el curso de ingreso en dos mitades igualadas, una de las cuales cursara el programa anual
planificado, mientras que a la otra se la hara volver a la vida civil. Aun en el supuesto de que fuese posible un
experimento propiamente dicho de esa ndole(y el aprovechamiento oportuno de imprevistas reducciones
presupuestarias pudo haberlo hecho posible en ms de una ocasin), los efectos reactivos de ese dispositivo
experimental el inevitable trastorno en las vidas de quienes fuesen aceptados, seleccionados, trasportados a
la base area y devueltos despus a sus casasdistara mucho de hacer de ellos un grupo ideal de control. La
diferencia entre ellos y el grupo experimental que recibira el adoctrinamiento difcilmente podra constituir
una base adecuada sobre la cual generalizar las conclusiones obtenidas a las condiciones normales de
reclutamiento y entrenamiento de las milicias. Quedaba, sin embargo, el control del experimentador sobre la
programacin del momento y los destinatarios de los procedimientos de observacin. Esto, ms el hecho de
que la variable experimental era recurrente y se presentaba constantemente a cada nuevo grupo de
participantes, hizo posible cierta forma de control experimental. En aquel estudio se dispona de dos clases de
comparaciones relativas al influjo de la experiencia militar sobre las actitudes. Cada una de ellas era bastante
insuficiente desde el punto de vista del control experimental, pero cuando ambas suministraron pruebas
coincidentes, se ratificaron ent5e s en la medida en que ambas incluan sus respectivos puntos dbiles. La
primera ofreca comparaciones entre poblaciones medias al mismo tiempo pero con distinta duracin de
servicio. La segunda inclua mediciones del mismo grupo de personas en su primera semana de entrenamiento
militar y otra vez despus, transcurridos ya unos 13 meses de servicio. Un tanto estilizado, el diseo es como
sigue:

Clase A X 01
---- ---- ---- ----
Clase B 02 X 03

Este diseo combina los enfoques <<longitudinal>> y de <<corte trasversal>> que suelen emplearse en la
investigacin del desarrollo. En esta se supone que la comparacin es tal, que pueden medirse a la vez un
grupo expuesto a X y otro que va a serlo; esta comparacin entre 0 1 y 02 corresponde as al diseo 3,
<<Comparacin de grupos estticos>>. La segunda medicin del personal de la Clase B, un ciclo despus,
nos da el segmento de diseo 2, <<Pretest-postest, de un grupo>>. En el cuadro, pg. 109, las dos primeras

96
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

filas referentes al diseo 15 muestran un anlisis de esas comparaciones. La comparacin cruzada de 0 1>02
suministra diferencias que no podran explicarse por los efectos de la historia o por el test-retest, sino que
podran deberse a diferencias en el reclutamiento de un ao a otro (como se indica por medio del signo
negativo en <<Seleccin>>) o a la circunstancia de que los participantes eran un ao mayores (signo negativo
en <<Maduracin>>). Cuando todas las pruebas se realizan durante el mismo perodo, parece improbable que
haya una variable entremezclada de instrumentacin o desvos en la ndole del instrumento de medicin. En la
tpica comparacin de las diferencias de actitud entre alumnos universitarios de primero y segundo ao, el
efecto de la mortalidad no pasa de ser una explicacin rival: 0 1 y 02 podran diferir solo a causa del tipo de
personas que han abandonado sus estudios en la Clase A, pero contina teniendo representacin en la B. Este
inconveniente se puede evitar si las reacciones se identifican por individuos y el experimentador espera antes
de analizar sus datos a que la Clase B haya completado su exposicin a X y luego elimina de 0 2 todas las
medidas pertenecientes a participantes que despus no completaron su instruccin. La frecuente ausencia de
este procedimiento justifica la insercin de un signo interrogativo al lado de la variable de mortalidad. La
columna <<Regresin>> se completa con signos interrogativos a fin de sealar la posibilidad de efectos
espurios si la medida que se utiliza en el diseo experimental es la misma en que s3e fundan la aceptacin o el
rechazo de candidatos al curso de entrenamiento. En tales circunstancias seran de prever diferencias
constantes no atribuibles a los efectos de X. La comparacin pretest-postest implicada en 0 2 y 03, si resulta ser
el mismo tipo de diferencia que en la comparacin 0 2-01, elimina las dems hiptesis posibles de que la
diferencia se deba a un desvo en la seleccin o reclutamiento entre ambas clases, as como cualquier
posibilidad de que la mortalidad haya sido la causa. No obstante, si no se utilizara ms que la comparacin 0 2-
03, sera vulnerable a las explicaciones rivales de historia y aplicacin de tests.
En una situacin donde el lapso de entrenamiento que se examina es de un ao, el aspecto ms costoso del
diseo es la programacin de ambos conjuntos de mediciones con un ao de diferencia. Dada la inversin ya
realizada en este sentido, constituye un pequeo gasto ms realizar nuevas pruebas en la segunda ocasin.
Teniendo en cuenta todo ello, cabe extender el diseo institucional recurrente al esquema indicado en el
cuadro 3. Ejerciendo el poder de designar cundo y a quin se ha de medir, la Calase B se ha dividido en dos
muestras igualadas, una medida antes y despus de la exposicin y la otra medida solo despus de ella, como
en 04. Este segundo grupo permite una comparacin, sobre muestras cuidadosamente igualadas, de una
medicin inicial <<antes y despus>>; es ms precisa que la comparacin 0 1 02 en lo que respecta a la
seleccin, y superior a la comparacin 0 2 03, ya que evita los efectos de test-retest. El efecto de X queda as
documentado por medio de tres comparaciones distintas, 01>02,02<03 y 02<04.
Ntese, sin embargo, que 02 aparece en las tres, razn por la cual todo ello podra parecer confirmatorio solo
en virtud de una actuacin excntrica del mencionado conjunto particular de mediciones. La introduccin de
05, o sea la Clase C, probada en ocasin del segundo test antes de ser expuesta a X, ofrece una nueva
medicin pre-X que puede compararse con 04 y 01, etc., brindando una redundancia necesaria. La divisin de
la clase B hace esta comparacin de 0 4 05 ms clara que lo que sera una 0 3 05. Advirtase, empero, que la
divisin de una clase en dos mitades, sometida una a test y la otra no, suele constituir un dispositivo reactivo.
Por eso se ha incluido un signo de interrogacin para ese factor en la fila 0 2 <04 del cuadro 3. Que sea o no un
procedimiento reactivo depende de las condiciones concretas. Cuando se echan suertes y se pide que la mitad
de la clase pase a otra aula, es probable que el procedimiento sea reactivo [p. ej., Duncan y otros, 1957;
Solomon, 1949]. Para una clase nica, el recurso de distribuir cuestionarios o tests a todos, pero variando el
contenido a fin de que una mitad aleatoria obtenga lo que constituira el pretest y la otra se pruebe con algn
otro instrumento, puede servir para lograr que la divisin del curso no sea ms reactiva que el test de la clase
total.
El diseo, tal como se lo representa por medio de las mediciones 0 1 a 05 falla siempre en el control de la
maduracin. La gravedad de esa limitacin variar de acuerdo con el material que se investigue. Si el
experimento versa sobre la adquisicin de una habilidad o tcnica muy poco comn, la hiptesis rival de
maduracin que el simple hecho de envejecer o de adquirir experiencia gracias a las prcticas sociales
cotidianas habra producido esa habilidadpuede resultar sumamente improbable.
Sin embargo, en el citado estudio de actitudes hacia superiores y subalternos [Campbell y McCormack, 1957],
el desvo fue tal que bien podra explicarse a causa de la mayor preparacin que, casi en cualquier contexto,
habra adquirido un grupo de aquella edad y tipo particular de ambiente al crecer en edad o estar lejos de sus
hogares respectivos. En tal situacin parece imprescindible un control de maduracin. Por ese motivo se han
agregado 06 y 07 al diseo, a fin de ofrecer una prueba de corte transversal de una hiptesis general de
maduracin hecha en ocasin del segundo perodo de test. Ello exigir someter a prueba a dos grupos de
personas de la poblacin general que solo difieran en la edad, la cual se elegira a fin de que coincidiera con

97
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

las de las Clases B y C en la poca de las pruebas. Para confirmar la hiptesis de un efecto de X, los grupos 0 6
y 07 deberan ser iguales, o al menos acusar una discrepancia menor que las comparaciones que abarcan la
exposicin a X. La seleccin de tales controles poblacionales generales dependera de lo especfico de la
hiptesis. Dado nuestro conocimiento acerca de la universal importancia de las consideraciones de clase
social y educacin, esos controles podran seleccionarse de tal modo que equiparasen el reclutamiento
institucional con la clase social y la educacin anterior. Asimismo, podran ser personas que vivieran fuera de
su hogares por primera vez y que tuviesen la edad tpica de bsqueda de independencia; as en el ejemplo
dado, el grupo 06 habra estado lejos de su casa durante un ao, y el 0 7 han sido programados con la segunda
tanda de pruebas, pero si no resulta ningn efecto de X en el primer conjunto de resultados (la comparacin 0 1
> 02), tan costosos procedimientos estaran por lo comn injustificados (a menos, claro est, que se
propugnase la hiptesis de que la X institucional haba eliminado un proceso normal de maduracin). Otro
enfoque por corte trasversal del control de la maduracin puede darse si hay heterogeneidad de edades (o un
cierto nmero de aos fuera del hogar, etc.) dentro de la poblacin que ingresa en el ciclo institucional. As
ocurrira en muchas situaciones; por ejemplo, al estudiar los efectos de un curso universitario aislado. En este
caso, las mediciones de 02 podran subdividirse en un grupo de mayor y otro de menor edad, a fin de examinar
si esos dos subgrupos (020 y 02y en el cuadro 3) diferan como lo haban hecho 01 y 02 (aunque la universal
correlacin negativa entre edad y capacidad dentro de los grados escolares, etc., introduce aqu no pocos
peligros). Mejor que el control con los coetneos de toda la poblacin, la comparacin podra hacerse con otra
institucin determinada, por ejemplo9, entre los conscriptos de la Fuerza Area y los estudiantes
universitarios de primer ao. Si se ha de hacer una comparacin de esta ndole, se reduce la variable
experimental a aquellos aspectos que ambas instituciones no tienen en comn. En tal caso, es probable que los
diseos 10 y 13, por lo comn ms eficaces, sean igualmente factibles.
Los requisitos formales de este diseo parecen aplicables incluso a un problema como el de la psicoterapia.
Esta posibilidad revela cun difcil es una verificacin correcta de la variable maduracin. Como quiera que
se elijan los controles poblacionales para una situacin de psicoterapia, si no reciben este tipo de tratamiento
diferirn en aspectos importantes. Aunque estn tan enfermos como los sometidos a tratamiento
psicoteraputico, es casi seguro que diferirn en su conocimiento de l, as como en sus creencias al respecto
y su fe en ese procedimiento curativo. Un grupo de esta ndole, enfermo pero optimista, podra muy bien tener
posibilidades de recuperacin tpicas de cualquier grupo de comparacin de que pudisemos echar mano y,
por consiguiente, podra malinterpretarse una interaccin de seleccin y maduracin como un efecto de X.
Para el estudio aislado de procesos de desarrollo, el no poder controlar la maduracin no es, ciertamente, un
inconveniente, ya que ella es el objetivo mismo del anlisis. Esa combinacin de comparaciones
longitudinales y de corte trasversal debera emplearse en forma ms sistemtica en este tipo de estudios. El
estudio aislado de cortes trasversales confunde maduracin con seleccin y mortalidad. El estudio
longitudinal confunde maduracin con aplicacin reiterada de tests e historia. Por s solo no es probablemente
mejor que el de corte trasversal, aunque su costo ms elevado le otorga mayor prestigio. La combinacin de
ambos, quiz con reiteradas comparaciones de cortes trasversales en diversos momentos, parece ideal.
Tal como se presentan los esquemas del diseo 15, se supone que se podr aplicar el postest a un grupo al
mismo tiempo que el pretest a otro. No siempre ocurre as en situaciones en que tal vez se deseara utilizar este
diseo. La siguiente es una representacin ms precisa del caso tpico en la situacin escolar:

Clase A X 01
__ __ __ __ __ __ __ __ __
Clase B1 R02 X 03
Clase B2 R X 04
__ __ __ __ __ __ __ __ __ __
Clase C 05 X

Este diseo carece del claro control sobre la historia en las comparaciones 0 1> 02 y 04 > 05, por falta de
simultaneidad. No obstante, difcilmente podra aceptarse la explicacin desde el punto de vista de la historia
si ambas comparaciones acusaran el efecto, como no fuera postulando una serie bastante compleja de
coincidencias.
Ntese que ninguna tendencia histrica general, como la que sin duda hallamos en las actitudes sociales, se
confunde con resultados experimentales concretos. Una tendencia entre 0 1 y 03, mientras que la hiptesis de

98
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

que X tiene un efecto exige que 01 y 03 sean iguales y 02 difiera de ambas en el mismo sentido. En general, si
se repite carias veces el experimento, es poco probable que la confusin con la historia constituya un
problema, ni siquiera en esta versin del diseo. Pero, para ciclos institucionales de menos de un ao, habr
posibilidad de confusin con variaciones estacionales en actitudes, moral, optimismo, inteligencia, etc. Si la X
es un curso desarrollado solo en la temporada de otoo, * y entre septiembre y enero la gente suele
experimentar mayor agresividad y pesimismo a causa de los factores climticos de la estacin, esa tendencia
estacional recurrente se confundir con los efectos de X en todas sus manifestaciones. Para situaciones de esta
ndole pueden utilizarse, y resultan aconsejables, los diseos 10 y 13.
Si las comparaciones de corte trasversal y longitudinales indican efectos anlogos de X, ello sera inexplicable
como interaccin entre la maduracin y las diferencias de seleccin entre las clases. No obstante, se ha dejado
en blanco la columna porque este control no aparece en las presentaciones fragmentarias del cuadro 3. Las
calificaciones de los criterios de validez externa se ajustan en general al esquema de los diseos anteriores que
contienen los mismos fragmentos. Los signos de interrogacin en la columna <<Interaccin de seleccin y
X>>, advierten simplemente que los descubrimientos se limitan al ciclo institucional que se estudia. Dada la
complejidad de X, es posible que se realice la investigacin por razones prcticas ms que con propsitos
tericos, y tal vez se quiera en este caso generalizar a una institucin en particular.

16. Anlisis de discontinuidad en la regresin

Este diseo es practicable en una situacin en que se han utilizado ya diseos ex post facto. Aunque de muy
limitada aplicacin, parece justificado presentarlo aqu por el hecho de que esas situaciones poco numerosas
son, en su mayor parte, educacionales. Tambin parece oportuno incluirlo como ejemplo de la conveniencia
de indagar, en cada situacin concreta, todas las implicaciones de una hiptesis causal, buscando nuevos
afloramientos de esta ltima, mediante los cuales se la pudiera verificar. La situacin que tomaremos
[Thistlethwaite y Campbell 1960] consiste en el otorgamiento de premios a los aspirantes ms calificados,
sobre la base de un puntaje de corte dentro de un conjunto cuantificado de calificaciones. El premio puede ser
una beca, el ingreso en una universidad tan prestigiosa que todos los aprobados se inscriben en ella, un ao de
estudios en Europa, etc. Despus de ese acontecimiento, tanto los solicitantes que reciben el premio como los
que no lo obtienen son objetos de mediciones respecto de varias 0 que representan logros, actitudes, etc,
posteriores. Se plantea entonces el interrogante de s el premio provoca alguna diferencia. El problema de
inferencia es difcil porque casi todas las cualidades que acreditan a un alumno para el premio (salvo, a veces,
otros factores, como sus necesidades econmicas y el estado en que reside) son las mismas que habran
llevado a un mejor desempeo en esas 0. Tenemos casi la certeza anticipada de que los premiados habran
obtenido puntajes superiores en las 0 que quienes no lo fueron, aunque no se hubiesen otorgado los premios.
La figura 4 presenta el tema del diseo. Ilustra la relacin prevista entre capacidad pre-premio y rendimientos
posteriores, ms los resultados adicionales de las oportunidades educacionales o motivacionales
consiguientes. Consideremos ante todo un experimento propiamente dicho del tipo del diseo 6, con el cual
contrastaremos nuestro cuasiexperimento. Ese experimento propiamente dicho podra racionalizarse como un
proceso de solucin de empate, o como un experimento adicional, en el que, para una estrecha amplitud de
puntajes en el punto de corte o por debajo pero muy cerca de l, la asignacin aleatoria dara lugar a un grupo
experimental ganador del premio y un grupo de control no ganador. Es de presumir que tales grupos tendran
un desempeo similar al representado por los dos crculos en la lnea de corte de la figura 4. Para esa estrecha
amplitud de capacidades, se lograra un experimento propiamente dicho. Tales experimentos son factibles y
habra que realizarlos.
El diseo cuasiexperimental 16 trata de establecer ese experimento propiamente dicho examinando la lnea de
regresin para una discontinuidad en el punto de corte, claramente implcita en la hiptesis causal. Si el
resultado fuese como el diagramado y los crculos de la figura 4 representasen extrapolaciones de las dos
mitades de la lnea de regresin, y no un experimento de solucin de empate dividido al azar, la prueba del
efecto sera casi tan incosteable como en el experimento propiamente dicho.

*
Vale decir, la primera en el hemisferio Sur. (N. Del E.)

99
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

Algunos de los tests de significacin estudiados en el diseo 7 son tambin aplicables aqu. Ntese que la
hiptesis es a todas luces de diferencia de ordenada ms que de pendien5e y que el paso tiene que estar
localizado en el punto X de la lnea de regresin: cualquier <<desfasaje>> o <<dispersin>> es incompatible
con la hiptesis. Son, pues, apropiadas las pruebas paramtricas y no paramtricas que evitan supuestos de
linealidad. Ntese asimismo que tales supuestos son por lo comn ms aceptables para los datos de regresin
que para series cronolgicas. (Con determinados tipos de datos, como los porcentajes, puede ser necesaria una
transformacin lineal). Tal vez sea conveniente efectuar una prueba t vinculada con la diferencia entre los dos
puntos linealmente extrapolados. Acaso el test ms eficaz fuera un anlisis de covariancia, en el cual el
puntaje de decisin de otorgamiento del premio sera la covariable de los rendimientos ulteriores, y el
tratamiento estara representado por la adjudicacin o no adjudicacin del premio.
Es probable la aplicacin de este tipo de diseo? Sin duda alguna se refiere a una situacin recurrente en la
cual abundan las afirmaciones a favor de la eficacia de X. Vale la pena verificar esas afirmaciones? Un
sacrificio necesario es que todos los elementos que entran en la decisin final se combinen en un ndice
compuesto, determinando con nitidez el punto de corte. Pero estamos convencidos de que todos los factores
que influyen en una decisin el aspecto que presenta la fotografa, la jerarqua del curso deducida de la
reputacin de la escuela secundaria, las relaciones del padre con los directivos del establecimiento, etc.--,
pueden incluirse en un ndice de esta ndole, por medio de puntajes, si no se cuenta con un medio ms directo.
Tambin deberamos estar ya convencidos [Meehl, 1954] de que una frmula de ponderacin correlacional
mltiple para la combinacin de los elementos (aun empleando como criterio decisiones anteriores del comit
de seleccin) suele ser mejor que las ponderaciones de un comit en cada caso particular. Nada perderamos,
pues, y mucho se podra ganar en todo sentido, cuantificando las decisiones de todo tipo relativas al premio.
De proceder as, y s se llevasen registros de otorgamientos y rechazos, cabra hacer un seguimiento de los
efectos varios aos despus.
Acaso convenga relatar aqu una parbola verdica. Una generosa fundacin, interesada en mejorar la
educacin superior, don a una universidad de Estados Unidos medio milln de dlares para que estudiase los
efectos de la escuela sobre sus alumnos. Diez aos despus no haba aparecido un solo informe ni siquiera
remotamente relacionado con el tema. Tomaron con alguna seriedad los donantes o los favorecidos con la
donacin las especificaciones de la propuesta formal? Exista alguna respuesta posible al interrogante
propuesto? Los diseos 15 y 16 parecen ofrecer las nicas aproximaciones viables. Pero, por supuesto, quiz
ningn cientfico sienta verdadera curiosidad por los efectos de una X tan global.
Veremos el anlisis del cuadro 3. A causa de la sincrona entre el grupo experimental y el de control, historia y
maduracin parecen estar controladas. La administracin de tests como efecto principal tambin est, pues

100
UAD LAGUNA 2007 Maestra en Psicoterapia y Psicologa Clnica Seminario de Tesis
III/JJAC

tanto el grupo experimental como el de control la han recibido. Los errores de instrumentacin bien podran
plantear un problema si la 0 de seguimiento se realizase bajos los auspicios determinantes del premio, en el
sentido de que la gratitud por haberlo recibido y el resentimiento por lo contrario pudieran inducir a distintas
manifestaciones de actitud, mayor o menor exageracin del xito alcanzado en la vida, etc. Este defecto se
observara asimismo en el experimento propiamente dicho de solucin de empate. Podra controlrselo
haciendo que los seguimientos los efectuara otro organismo o institucin diferente. Creemos, conforme a los
argumentos que anteceden, que tanto la regresin como la seleccin estn controladas en lo que atae a sus
posibles contribuciones espurias a la inferencia, aun cuando la seleccin sea sesgada y exista regresin: ambas
han sido controladas al representrselas en detalle, no mediante la igualacin. La mortalidad constituira un
problema si fuese el ente de otorgamiento del premio el que dirigiese la medicin de seguimiento, pues
quienes lo recibieron, los ex alumnos, etc., cooperaran probablemente con mucha mejor disposicin que los
no ganadores. Ntese cmo el deseo, por lo comn conveniente, del investigador de lograr que la muestra
seleccionada sea bien representativa puede inducir aqu a error. Si la conduccin del seguimiento con un
membrete distinto provocara una reduccin en la cooperacin, por ejemplo, del 90 al 50%, el experimentador
tal vez se resistiese a hacer el cambio, ya que l tiene como meta una representacin del 100% de los
ganadores del premio. Es posible que olvide que su verdadero objetivo es obtener datos interpretables, que
ningn dato es interpretable si est asilado, y que es imprescindible contar con un grupo de contraste similar a
fin de utilizar la informacin que posee sobre los ganadores. Tanto por este motivo como por el problema de
instrumentacin, quiz fuese mejor desde el punto de vista cientfico tener auspicios independientes y un 50%
de respuestas de ambos grupos en vez de un 90% de los ganadores y un 50% de los no ganadores. Una vez
ms, el problema de la mortalidad sera el mismo para el experimento propiamente dicho de solucin de
empate. En ambos casos, la amenaza que implica para la validez interna la interaccin seleccin-maduracin
queda controlada. En cuanto al cuasiexperimento, se lo controla en el sentido de que esa interaccin no podra
dar una explicacin lcita de una clara discontinuidad de la lnea de regresin en X. La amenaza y la validez
externa de una interaccin aplicacin de pruebas-X queda controlada, a su vez, en la medida en que las
mediciones fundamentales utilizadas al decidir la adjudicacin del premio integran el universo al cual se
quiere generalizar. Tanto el verdadero experimento de solucin de empate como el anlisis de discontinuidad
de regresin estn particularmente sujetos a la limitacin de la validez externa por la interaccin seleccin_X,
ya que el efecto slo ha quedado demostrado con respecto a una gama muy estrecha de talentos, es decir, slo
para los situados en el puntaje de corte. En el cuasiexperimento, las posibilidades de inferencia tal vez
parezcan ms amplias, pero ntese que los inconvenientes del supuesto de ajuste lineal son mnimos cuando
se los extrapola solamente a un punto, como en el diseo ilustrado en la figura 4. Generalizaciones ms
amplias implican la extrapolacin del ajuste debajo de X a travs de toda la gama de valores de X, y en cada
grado mayor de extrapolacin aumenta el nmero de hiptesis rivales aceptables. Tambin aumenta la
dispersin de los valores extrapolados de diferentes tipos de curvas ajustadas a los valores inferiores a X,
etctera.

101

You might also like