You are on page 1of 18

Confiabilidad y validez

La validez y la confiabilidad de los instrumentos


de medicin
Los instrumentos de medicin requieren de estudios

cientficos que determinen si stos pueden generar


inferencias vlidas y demostrar un nivel aceptable de
estabilidad.
Las pruebas, escalas e inventarios requieren para
probar si funcionan o no de estudios de validez y
confiabilidad.
Ningn instrumento puede demostrar su efectividad
si dichos estudios no se llevan a cabo.

Confiabilidad
Es el grado de consistencia que posee el instrumento de

medicin.
Ningn instrumento psicomtrico puede ser de gran
valor hasta que se pruebe su consistencia o confiabilidad
En la teora clsica de medicin la confiabilidad es igual a
la puntuacin observada que a su vez es igual a la
puntuacin verdadera + un factor de error que puede ser
sistemtico o aleatorio
Mientras ms reactivos tiene el instrumento, mayor debe
ser la confiabilidad.
Existe un momento donde no importa cuntos reactivos
tenga, la confiabilidad del instrumento se va a mantener
estable.

Tcnicas para obtener la


confiabilidad

TEST - RETEST
Se le administra el

instrumento a un grupo
de personas, se deja
pasar un tiempo y luego
se administra el mismo
instrumento al mismo
grupo.
Se correlacionan los
pares de puntuaciones,
donde el ndice de
correlacin debe fluctuar
entre .60 y .70 como
mnimo.

Prueba A en
tiempo 1

Prueba A en
tiempo 2

r=.60 0 ms

Formas alternas y equivalentes


Se le administra la forma

A del instrumento a un
grupo de personas, se
deja pasar un tiempo y
luego se administra la
forma B del instrumento
al mismo grupo.
Se correlacionan los
pares de puntuaciones,
donde el ndice de
correlacin debe fluctuar
entre. 60 y. 70 como
mnimo.

Forma A en
tiempo 1

r=.60 0 ms

Forma B en
tiempo 2

Confiabilidad de consistencia interna


Nos ayuda a determinar el grado de interrelacin que

existe entre los reactivos de un instrumento.


La consistencia interna no contempla los elementos
que afectan a la confiabilidad a travs del tiempo,
por lo que ambas tcnicas son complementarias y no
son iguales.
En cierto modo trata de indagar sobre el grado de
homogeneidad de las respuestas.

Confiabilidad usando el alfa de Cronbach


Establece una relacin entre los reactivos y la

puntuacin total del instrumento.


Se usa mucho cuando hay escalas de medicin tipo
Likert.
La correlacin debe ser de .60 en adelante.

Puntuacin
total

Confiabilidad entre evaluadores


Unos expertos en el contenido del instrumento

contestan el instrumento.
Se supone que las puntuaciones sean similares.
Se calcula un ndice de concordancia.
A mayor concordancia, ms confiable resultar ser el
instrumento.

Validez

Validez
Se supone que el instrumento pueda medir con

precisin el constructo o dimensin que pretende


medir.
Al igual que la confiabilidad, es un proceso donde se
obtienen diversas evidencias sobre la capacidad del
instrumento para generar inferencias vlidas.
Un instrumento que mide inferencias vlidas sobre
un constructo, tiene que ser confiable.

Validez de contenido
Tiene que ver con cun representativo es el

contenido del instrumento con relacin al constructo


que pretende medir.
El contenido del instrumento tiene que ser
representativo del universo de conductas que
pretende medir.
Se usa la tabla de especificaciones como una de las
tcnicas para evaluar la validez del contenido.

Validez de criterio
Se establece una relacin entre el instrumento

(predictor) y un criterio.
Un criterio es cualquier medida que determine xito
a corto o largo plazo.

Existen dos tcnicas para evaluar la validez de

criterio:
Concurrente. Se administra el instrumento a un grupo y
seguido se recoge una medida de desempeo.
Predictivo. Se administra el instrumento a un grupo, se deja
pasar un tiempo (ejemplo, 6 meses) y se recoge la medida de
desempeo.

En ambos casos, se lleva a cabo un anlisis de

correlacin y mientras ms alta la correlacin, mayor


ser la validez de criterio.

Validez de constructo
Es el grado en que un instrumento tiende a medir las

inferencias del constructo para el cual fue diseado.


Hay que llevar a cabo varios estudios para probar la
capacidad del instrumento de medir el constructo,
pero tambin de diferenciarse de otros.

Fuentes de evidencia de validez


Fuentes internas: Se relaciona con el test y sus tems
Evidencias basadas en el contenido del test
Se obtiene demostrando que el contenido del test es una muestra
representativa del constructo
Debe existir correspondencia entre el contenido del test y el
dominio
Se apoya en el juicio de expertos

Evidencias basadas en la estructura del test


Indican

si las relaciones entre los tems y las dimensiones


permiten confirmar la existencia del constructo que el test
pretende medir.

Evidencias basadas en el proceso de respuesta


Refleja

la interaccin entre los procesos cognitivos comprometidos


en el proceso de respuesta al test
La informacin se obtiene por medio de entrevistas con los
examinados que permitan el anlisis de las respuestas individuales

Fuentes externas: Se relaciona con las puntuaciones del


test con variables externas
Evidencia convergente-discriminante
Al

construir un test se debe comparar los puntajes obtenidos con


otros test elaborados
Pretende evidenciar que el test mide realmente el constructo que
se propone medir, al relacionarse con otros test reconocidos que
miden el mismo constructo y no se relacionarse con test que miden
constructos diferentes.

You might also like