Professional Documents
Culture Documents
Razones y tasas
Una razn es la relacin entre dos categoras. Por ejemplo:
Categoras
Masculino
Femenino
Frecuencia
60
30
60
Nmero de eventos
100 o 1 000
Nmero total de eventos posibles
Ejemplo =
10 000
1000 = 33.33
300 000
Es decir, hay 33.33 nacidos vivos por cada 1 000 habitantes en Santa Luca.
Corolario
Ahora bien, hemos analizado descriptivamente los datos por variable del estudio y los visualizamos
grficamente. En caso de que alguna distribucin resulte ilgica, debemos cuestionarnos si la variable
debe ser excluida, sea por errores del instrumento de medicin o en la recoleccin de los datos, ya que
la codificacin puede ser verificada. Por ejemplo, supongamos que nos encontramos un porcentaje
alto de valores perdidos (de 20%),10 debemos preguntarnos: por qu tantos participantes no respondieron o contestaron errneamente? O, al medir la satisfaccin laboral, resulta que 90% se encuentra
sumamente satisfecho (es lgico?); u otro caso sera que, en ingresos anuales el promedio fuera de
15 000 dlares por familia (resulta creble en tal municipio?). La tarea es revisar la informacin descriptiva de todas las variables.
Ahora, debemos demostrar la confiabilidad y validez de nuestro instrumento, sobre la base de los
datos recolectados.
dad que pueden oscilar entre cero y uno, donde recordemos que un coeficiente de cero significa nula
confiabilidad y uno representa un mximo de confiabilidad. Cuanto ms se acerque el coeficiente a
cero (0), mayor error habr en la medicin.
Los procedimientos ms utilizados para determinar la confiabilidad mediante un coeficiente son:
1. Medida de estabilidad (confiabilidad por test-retest). En este procedimiento un mismo instrumento
de medicin se aplica dos o ms veces a un mismo grupo de personas, despus de cierto periodo. Si
la correlacin entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento
se considera confiable. Se trata de una especie de diseo panel. Desde luego, el periodo entre las
mediciones es un factor a considerar. Si el periodo es largo y la variable susceptible de cambios, ello
suele confundir la interpretacin del coeficiente de fiabilidad obtenido por este procedimiento. Y
si el periodo es corto las personas pueden recordar cmo respondieron en la primera aplicacin del
instrumento, para aparecer como ms consistentes de lo que en realidad son (Bohrnstedt, 1976).
El proceso de clculo con dos aplicaciones se representa en la figura 10.10.
Resultados de la prueba A,
momento 1
Resultados de la prueba A,
momento 2
Coeficiente de correlacin
Figura 10.10
Medida de estabilidad.
2. Mtodo de formas alternativas o paralelas. En este esquema no se administra el mismo instrumento de medicin, sino dos o ms versiones equivalentes de ste. Las versiones (casi siempre dos)
son similares en contenido, instrucciones, duracin y otras caractersticas, y se administran a
un mismo grupo de personas simultneamente o dentro de un periodo relativamente corto. El
instrumento es confiable si la correlacin entre los resultados de ambas administraciones es positiva de manera significativa. Los patrones de respuesta deben variar poco entre las aplicaciones.
Una variacin de este mtodo es el de las formas alternas prueba-posprueba (Creswell, 2005),
cuya diferencia reside en que el tiempo que transcurre entre la administracin de las versiones es
mucho ms largo, que es el caso de algunos experimentos. El mtodo se representa en la figura
10.11.
Coeficiente de correlacin
Resultados de la prueba
A1
Figura 10.11
Resultados de la prueba
A2
301
302
Resultados de la mitad de la
prueba A
Coeficiente de correlacin
Figura 10.12
4. Medidas de coherencia o consistencia interna. stos son coeficientes que estiman la confiabilidad:
a) el alfa de Cronbach (desarrollado por J. L. Cronbach) y b) los coeficientes KR-20 y KR-21 de
Kuder y Richardson (1937). El mtodo de clculo en ambos casos requiere una sola administracin del instrumento de medicin. Su ventaja reside en que no es necesario dividir en dos mitades
a los tems del instrumento, simplemente se aplica la medicin y se calcula el coeficiente. La
mayora de los programas estadsticos como SPSS y Minitab los determinan y solamente deben
interpretarse.
Respecto a la interpretacin de los distintos coeficientes mencionados cabe sealar que no hay una
regla que indique: a partir de este valor no hay fiabilidad del instrumento. Ms bien, el investigador
calcula su valor, lo reporta y lo somete a escrutinio de los usuarios del estudio u otros investigadores.
Pero podemos decir de manera ms o menos general que si obtengo 0.25 en la correlacin o
coeficiente, esto indica baja confiabilidad; si el resultado es 0.50, la fiabilidad es media o regular. En
cambio, si supera el 0.75 es aceptable, y si es mayor a 0.90 es elevada, para tomar muy en cuenta.
Con respecto a los mtodos basados en coeficientes de correlacin, rogamos al lector se forme una
idea ms clara despus de revisar el apartado de correlacin que se presenta ms adelante en este captulo. Pero s hay una consideracin importante que hacer ahora. El coeficiente que elijamos para
determinar la confiabilidad debe ser apropiado al nivel de medicin de la escala de nuestra variable
(por ejemplo, si la escala de mi variable es por intervalos, puedo utilizar el coeficiente de correlacin
de Pearson; pero si es ordinal podr utilizar el coeficiente de Spearman o de Kendall; y si es nominal,
otros coeficientes). Alfa trabaja con variables de intervalos o de razn y KR-20 y KR-21 con tems
dicotmicos. El cclculo del coeficiente alfa se incluye en el CD anexo: Material complementario
Captulos Cap
Captulo 8 Anlisis estadstico: segunda parte.
nali
Con la finalidad
de comprender mejor los mtodos para determinar la confiabilidad vea la tabla
10.10.
303
Nmero de
versiones diferentes
del instrumento
Una versin.
Dos versiones
diferentes, pero
equivalentes.
Formas alternas y
prueba-posprueba
Mitades partidas
Una vez
Una vez
Una fragmentada
en dos partes
equivalentes.
Una versin
Mtodo
Estabilidad
(test-retest)
Formas alternas
Dos versiones
diferentes, pero
equivalentes.
Nmero de
participantes que
proveen los datos
Cada participante
responde al instrumento dos veces.
Cada participante
responde a cada
versin del instrumento.
Cada participante
responde a cada
versin del instrumento.
Cada participante
responde a la
nica versin.
Cada participante
responde a la
nica versin.
Instrumento
Comentario
304
Otro caso es el ya comentado de Nez (2001) y su instrumento para medir el sentido de vida,
cuya fiabilidad fu
fue de 0.96 en su tercera versin con 99 tems (vea en el CD anexo Material complementario In
Investigacin cuantitativa Ejemplo 5).
Como podem
podemos observar en la tabla 10.11, entre ms informacin se proporcione sobre la confiabilidad, el lector se forma una idea ms clara sobre su clculo y las condiciones en que se demostr.
Es indispensable incluir las dimensiones de la variable medida, el tamao de muestra y el mtodo
utilizado. Una cuestin importante es que los coeficientes son sensibles al nmero de tems o reactivos,
entre ms agreguemos, el valor del coeficiente tender a ser ms elevado.
Insistimos en que el coeficiente alfa es para intervalos y los coeficientes Kuder Richarson para
tems dicotmicos (por ejemplo: s-no). Estos ltimos se usan en el mtodo de mitades partidas,
aunque como sealan Creswell (2005) y Babbie (2009) se confa en la mitad de la informacin
del instrumento, por lo que conviene agregar el clculo de profeca Spearman-Brown.
Adems de estimar un coeficiente de correlacin y/o un coeficiente de coherencia entre los tems
del instrumento, es conveniente calcular la correlacin tem-escala completa. sta representa la vinculacin de cada reactivo con toda la escala. Habr tantas correlaciones como tems contenga el instrumento. Corbetta (2003, p. 237) lo ejemplifica adecuadamente de la siguiente manera: si estamos
midiendo el autoritarismo, es lgico pensar que quien alcanza altas puntuaciones en esta variable en
toda la escala (es muy autoritaria), habr de tener puntuaciones elevadas en todos los tems que la
conforman. Pero si uno de los reactivos sistemticamente (en un nmero considerable de individuos)
presenta valores contradictorios con respecto a la escala total, podemos concluir que ese tem no funciona adecuadamente (contradice a los dems reactivos). Los tems que alcancen coeficientes de correlacin bajos con la escala, tal vez deban analizarse y, eventualmente, eliminarse.
Asimismo, cada uno de los reactivos puede ser evaluado en su capacidad de discriminacin
mediante la prueba t de Student (paramtrica). Se consideran dos grupos, el primero integrado por
25% de los casos con los puntajes ms altos obtenidos en el tem y el otro grupo compuesto por 25%
de los casos con los puntajes ms bajos. Los tems cuya prueba no resulte significativa sern reconsiderados.
Los conceptos estadsticos aqu vertidos (por ejemplo, correlacin) tendrn mayor sentido, una
vez que se revisen ms ampliamente, lo cual se har ms adelante en este captulo.
La validez
Ya se coment en el captulo anterior que la evidencia sobre la validez del contenido se obtiene mediante las opiniones de expertos y al asegurarse que las dimensiones medidas por el instrumento sean
representativas del universo o dominio de dimensiones de la(s) variable(s) de inters (a veces mediante
un muestreo aleatorio simple). La evidencia de la validez de criterio se produce al correlacionar las
puntuaciones de los participantes, obtenidas por medio del instrumento, con sus valores logrados en
el criterio. Recordemos que una correlacin implica asociar puntuaciones obtenidas por la muestra en
dos o ms variables.
Por ejemplo, Nez (2001), adems de aplicar su instrumento sobre el sentido de vida, administr otras dos pruebas que supuestamente miden variables similares: el PIL (propsito de vida) y el
Logo-test de Elizabeth Lukas. El coeficiente de correlacin de Pearson entre el instrumento diseado
y el PIL fue de 0.541, valor que se considera moderado. El coeficiente de correlacin de Spearmans
rho fue igual a 0.42 entre el Logo Test y su instrumento, lo cual indica dos cuestiones: los tres instrumentos no miden la misma variable, pero s conceptos relacionados.
La evidencia de la validez de constructo se obtiene mediante el anlisis de factores. Tal mtodo nos
indica cuntas dimensiones integran a una variable y qu tems conforman cada dimensin. Los reactivos que no pertenezcan a una dimensin, quiere decir que estn aislados y no miden lo mismo que
los dems tems; por tanto, deben eliminarse. Es un mtodo que tradicionalmente se ha considerado
complejo, por los clculos estadsticos implicados, pero que es relativamente sencillo de interpretar y
como los clculos hoy en da los realiza la computadora, est al alcance de cualquier persona que se
inicie dentro de la investigacin. Este mtodo se revisa con ejemplos reales en el CD anexo
Material Complementario Captulos Captulo 8 Anlisis estadstico: segunda parte.
La confiabilidad se obtiene en Minitab siguiendo los comandos: Estadsticas (Statistics)
Confiabilidad/supervivencia (Reliability/Survival), y en SPSS no olvide consultar en el CD anexo el
manual respectivo. En las futuras versiones de estos programas, las opciones podran cambiar, pero es
cuestin de localizar en dnde se solicita el anlisis de inters.
Una vez que se determina la confiabilidad (de 0 a 1) y se muestra la evidencia sobre la validez, si
algunos tems son problemticos (no discriminan, no se vinculan a otros tems, van en sentido contrario a toda la escala, no miden lo mismo, etc.), se eliminan de los clculos (pero en el reporte de la
investigacin, se indica cules fueron eliminados, las razones de ello y cmo alteran los resultados);
posteriormente se vuelve a realizar el anlisis descriptivo (distribucin de frecuencias, medidas de tendencia central y de variabilidad, etctera).
En el CD anexo Material complementario Investigacin cuantitativa Ejemplo 4 Diseo
de una escala autoaplicable para la evaluacin de la satisfaccin sexual en hombres y mujeres mexicanos (lvarez Gayou, Honold y Milln, 2005), se presenta la validacin de un instrumento que muestra todos los elementos para ello, paso por paso. Incluye la generacin de redes semnticas. Su
abordaje es desde el punto de vista de la salud y con propiedad cientfica.
305
S P S S
Con frecuencia, el propsito de la investigacin va ms all de describir las distribuciones de las varia5
bles: se pretende probar hiptesis y generalizar los resultados obtenidos en la muestra a la poblacin o
universo. Los datos casi siempre se recolectan de una muestra y sus resultados estadsticos se denominan estadgrafos; la media o la desviacin estndar de la distribucin de una muestra son estadgrafos.
A las estadsticas de la poblacin se les conoce como parmetros. stos no son calculados, porque no se
recolectan datos de toda la poblacin, pero pueden ser inferidos de los estadgrafos,
Estadstica inferencial Se utiliza para
de ah el nombre de estadstica inferencial. El procedimiento de esta naturaleza de
probar hiptesis y estimar parmetros.
la estadstica se esquematiza en la figura 10.13.
Recoleccin de
los datos en la
muestra
Figura 10.13
Clculo de
estadgrafos
Inferencia de los
parmetros mediante
tcnicas estadsticas
apropiadas
Poblacin
o
universo