You are on page 1of 12

UNIVERSIDAD ABIERTA PARA ADULTOS

(UAPA)

NOMBRE

Orquídea Acevedo bueno

MATRICULA

11-0527

FACILITADORA

Renata Jiménez

ASIGNATURA

Teorías de los test y fundamento de medición

FECHA 12 \02\2019
Introducción

En este tema hablaremos sobre la confiabilidad y validez En lo concerniente a la validez y la confiabilidad es un instrumento de medición, Podemos señalar
que cuando se este llevando a cabo una investigación perteneciente al mundo debe ser confiable y valida.

La confiabilidad se refiere al grado en que una técnica es consistente con lo que pretende medir, es decir, la confianza que esa técnica amerita. Se pueden
distinguir diferentes formas de confiabilidad:

La confiabilidad y la validez son cualidades esenciales que deben estar presentes en todos los instrumentos de carácter científico para la recogida de datos. En
palabras de Pérez (1998:71), si el instrumento o instrumentos reúnen estos requisitos habrá cierta garantía de los resultados obtenidos en un determinado
estudio y, por lo tanto, las conclusiones pueden ser creíbles y merecedoras de una mayor confianza.

Uno de los mayores problemas que se debe evitar, es que la información obtenida no le permita responder a los objetivos de la investigación. Si los
instrumentos no son validados, podrá encontrar una variada información pero sin ninguna articulación con los propósitos y compromisos asumidos en la
investigación.

Con la validez demostramos la utilidad del instrumento, se haya en un proceso permanente, en continua revisión, se ve el uso que se le da. Es válido para una
persona, sistema y tiempo determinado. Si le vamos a dar un uso diferente al test tiene que ser adaptado. La validación tiene una caducidad (10-15 años), no
hay garantías de que el test sea igualmente útil, hay que revisar si aún los datos de validez son aceptables.
Estimado Participante:

En esta semana vas a trabajar las siguientes actividades:

1. Redacta de un ensayo con un mínimo de tres páginas sobre la confiabilidad y validez, respetando los conceptos
básicos que emiten su opinión en el texto básico.

Confiabilidad

“grado en que un instrumento produce resultados consistentes”

La confiabilidad se refiere al grado en que una técnica es consistente con lo que pretende medir, es decir, la confianza que esa técnica
amerita. Se pueden distinguir diferentes formas de confiabilidad:

Test re- test: consiste en usar la misma técnica en dos momentos diferentes con un lapso entre 1 y 6 meses (se recomienda que no
sea menor a un mes porque la persona recordaría la técnica ni mayor a seis meses por la evolución que podría haber sufrido el
paciente). Esto también depende de si lo que se mide es o no estable a través del tiempo.

Formas equivalentes, alternas o paralelas: se toman dos versiones diferentes (pero equivalentes en cuanto a contenido y dificultad) de
la misma técnica. Esto permite evaluar la confiabilidad interna de la técnica. Por ejemplo en los exámenes suele haber un tema 1 y un
tema 2.

División por mitades: se divide la misma técnica en dos partes iguales (por ejemplo ítems pares e impares). Esto también permite
medir la confiabilidad interna de la técnica.

Confiabilidad entre evaluadores o calificadores: es el grado de acuerdo o consistencia que existe entre dos o más evaluadores.

La confiabilidad y la validez son cualidades esenciales que deben estar presentes en todos los instrumentos de carácter científico para
la recogida de datos. En palabras de Pérez (1998:71), si el instrumento o instrumentos reúnen estos requisitos habrá cierta garantía de
los resultados obtenidos en un determinado estudio y, por lo tanto, las conclusiones pueden ser creíbles y merecedoras de una mayor
confianza.

Uno de los mayores problemas que se debe evitar, es que la información obtenida no le permita responder a los objetivos de la
investigación. Si los instrumentos no son validados, podrá encontrar una variada información pero sin ninguna articulación con los
propósitos y compromisos asumidos en la investigación.
Ningún instrumento psicométrico puede considerarse de valor a menos que sea una medida consiste, o confiable. En consecuencia,
una de las primeras cosas que será necesario determinar acerca de una prueba de elaboración reciente es si resulta lo
suficientemente confiable como para medir lo que fue diseñada para medir. Si, en ausencia de cualquier cambio permanente en una
persona debido al crecimiento, el aprendizaje, alguna enfermedad o lesión, las puntuaciones en una prueba varían con la ocasión o la
situación, es probable que la prueba no sea lo suficientemente confiable como para ser usada en describir y evaluar a la gente y hacer
predicciones sobre su conducta.

Note que confiabilidad no es lo mismo que estabilidad: al determinar la confiabilidad se asume que la prueba mide una característica
relativamente estable. A diferencia de la inestabilidad, la falta de confiabilidad es resultado de errores de medición producidos por
estados internos temporales, como la baja motivación o la falta de disposición, o de condiciones externas como un ambiente de prueba
incomodo o con distracciones.

Tipos de pruebas para determinar la confiabilidad

Pre- post prueba- se administra el instrumento en dos ocasiones distintas a la misma población para estimar la correlación entre la
primera y segunda, si el instrumento mide lo correcto, deberá producir los resultados similares en las dos.

Splif-Half Method- se construye el instrumento con dos grupos de preguntas (pares y nones) que midan igual. Se administra el
instrumento se determina el puntaje de los pares y nones. Se le estima la correlación y puntuación. A mayor la correlación más
confiable se considera el instrumento porque las preguntas pares y nones reflejan puntaciones casi iguales.

Forma equivalente- se administra el instrumento dos veces a la misma población. La segunda se cambia el orden de preguntas y se
construye una versión equivalente a la primera se comparan para determinar si son similares o discrepantes.

Validez

Validez del proceso- procedimientos empleados en la investigación están en armonía con el objetivo del estudio significa que la forma
de conducir la investigación no altera los datos del fenómeno que se estudia. En pocas palabras, la forma de realizar la investigación
no incide con la forma de actuar o pensar.

Validez del análisis de datos- técnicas utilizadas en el análisis de los datos son sensitivas a la información recopilada en el estudio.
Significa que las técnicas no producen falsas impresiones de los datos.

La constatación de la validez de un instrumento de medida no ofrece mayores problemas cuando se trata de cuantificar variables
objetivas, como el peso, la estatura o el volumen. Pero en el caso de variables psicológicas es necesario probar de forma empírica que
el instrumento es válido para aquello que dice evaluar. No obstante, más que el test en sí mismo, lo que se somete a validación son
las posibles inferencias que se vayan a realizar a partir de los resultados obtenidos. Tanto la fiabilidad como la validez son dos
propiedades psicométricas que deben cumplir las interpretaciones e inferencias que se hagan de los resultados obtenidos por los tests
psicológicos. La validez, pues, no debe ser una característica propia del test, sino de las generalizaciones y usos específicos de las
medidas que el test proporciona.

Con la validez demostramos la utilidad del instrumento, se haya en un proceso permanente, en continua revisión, se ve el uso que se
le da. Es válido para una persona, sistema y tiempo determinado. Si le vamos a dar un uso diferente al test tiene que ser adaptado. La
validación tiene una caducidad (10-15 años), no hay garantías de que el test sea igualmente útil, hay que revisar si aún los datos de
validez son aceptables.

Al aplicar un test buscamos tres propósitos:

1. Establecer una relación funcional con una variable.

2. Medimos para analizar rasgos psicológicos.

3. Analizar comportamientos manifiestos.

Todas esas medidas con diferentes propósitos, tienen diferentes tipos de validez:

a. Validez predictiva, predecir un comportamiento.

b. Validez de contenido (ítems)

c. Validez de constructo (rasgo)

Un mismo test si tiene diferentes usos necesita diferentes tipos de validez. La validez nos tiene que dar la utilidad de un instrumento,
hasta qué punto es útil y es más útil que otros instrumentos que están en el mercado.

2. Elabora de un mapa conceptual sobre el tema de La Validez.


teoria de la generalizacion: dicen los
psicometras que una prueb, no teien una sino
Con la validez demostramos la utilidad del instrumento, se muchas confiabilidades, dependiendo de las
haya en un proceso permanente, en continua revisión, se ve el variadas fuentes de error de medicion, que se
uso que se le da. Es válido para una persona, sistema y tiempo toman en consideracion al calcular un
determinado. Si le vamos a dar un uso diferente al test tiene coeficiente de confiabilidad
que ser adaptado. La validación tiene una caducidad (10-15
años), no hay garantías de que el test sea igualmente útil, hay
que revisar si aún los datos de validez son aceptables.

entre mayor sea el rango de diferencias individuales en


teoria de la generalizacion: dice los
las puntuaciones de una prueba mayor sera la psicometras, que un aprueba no tiene
confiablilidad de la prueba una sino mucha confiabilidades
dependiendo de varias fuentes, de
error de medicion, que se toman en
cuenta en consideracion al calcular
un coeficiente de confiabilidad

existen varios coeficintes


en la confibilidad:
formas paralelas
consistencia interna
test-retest

VALIDEZ una prueba puede tener muchas


clases de validez, dependiendo de validez concurrente: se emplean siempre
los propositos especificos para que una prueba se aplica a personas
los cuales fue diseñada, la clasificadas en varias categorias
poblacion objetivo, las condiciones
en que se aplica y el metodo para
determinar la validez

validez predictiva: atañe a la precision


validez de contenido con que las puntuaciones de una prueba
grado en que una predicen puntuaciones de criterio
prueba mide lo que esta
diseñada para medir

Validez de contenido: apariencia


fisica de una prueba con respecto a
sus propositos particulares
factores que afectas la validez
con relacion criterios: diferencias
de grupo extension de la prueba y
comntaminacion del criterio

validez con relacion a criterio relaciona


calificaciones en la preuba con el empeño
en medidas o estandares de criterio con los
cuales pueden compararse las
calificaciones
UNIDAD VI

RESUMEN DE UNA PÁGINA

Confiabilidad: Definición del Concepto. 6.2. El Error en la Medición y sus tipos. 6.3. Validez del Constructo. 6.a. Validez referid
Confiabilidad: a al Criterio. 6.b. Validez de Contenido. 6.4. Introducción del Programa estadístico del SPSS.

Confiabilidad: Definición del Concepto

Se puede definir como la capacidad de un producto de realizar su función de la manera prevista . De otra forma, la confiabilidad se
puede definir también como la probabilidad en que un producto realizará su función prevista sin incidentes por un período de tiempo
especificado y bajo condiciones indicadas

. El Error en la Medición y sus tipos

Los tipos de errores de medición pueden ser aleatorios, sistemáticos, despreciativos o significativos, entre otros. Se conoce como error
de medición a la diferencia existente entre el valor que se ha obtenido y el valor real del objeto medido.
1- Error aleatorio

Los errores aleatorios son aquellos que se dan cuando se hacen medidas consecutivas de un mismo objeto o fenómeno, obteniendo
valores diferentes en cada caso.

2- Error sistemático

A diferencia de los errores aleatorios, los errores sistemáticos dependen directamente del sistema que se está empleando para realizar
la medición. Por este motivo, son errores constantes.

Si se emplean instrumentos des calibrados, estos arrojarán medidas erróneas. El error se va a presentar incluso si se repite el proceso
de medición.

En las ciencias sociales, el error sistemático se produce cuando hay una condición que afecte de manera general el desempeño de
todos los individuos de la muestra.

3- Error despreciativo

Es aquel error que, por ser mínimo, no constituye un problema para las mediciones que se están llevando a cabo.
4- Error significativo

El error significativo es aquel que representa un problema para el trabajo que se está realizando. Si la diferencia de medidas es muy
grande, evidentemente se tratará de un error significativo.

5- Error por defectos en el instrumento empleado

Muchos de los errores que se cometen al momento de hacer mediciones pueden ser atribuidos a los instrumentos que se emplean.

Existen algunos instrumentos que requieren ser calibrados para que las medidas obtenidas sean precisas.

Los termómetros deben ser sometidos a mantenimiento y calibración cada cierto tiempo, para que no existan errores significativos en
las medidas de la temperatura.

6- Error causado por la persona que toma la medida

El ser humano es imperfecto. Por lo tanto, cuando un individuo es el encargado de tomar las mediciones, existe un margen de
probabilidades de que se cometa un error.

Validez del Constructo

es el grado en que una prueba mide los significados que esta da. En el modelo clásico de validez, la validez de constructo es uno de
los tres tipos principales de evidencia de validez, junto a la validez de contenido y validez de criterio. La teoría moderna de la validez
define a la validez de constructo como la preocupación primordial de la investigación en validez, considerando los otros tipos de
evidencia de validez.
La validez de constructo es la adecuación de las inferencias hechas sobre la base de observaciones o mediciones (a menudo
resultados de exámenes), específicamente si una prueba mide el constructo previsto

Validez referida al Criterio

Validez de contenido

Se dice que una prueba o test cumple con las condiciones de validez de contenido si constituye una muestra adecuada y
representativa de los contenidos y alcance del constructo o dimensión a evaluar. En los casos en los que la materia objeto de medición
se puede precisar con facilidad, la población de contenidos que se pretende evaluar está bien definida, por lo que la selección de los
ítems del test no ofrece mayores dificultades, pudiéndose recurrir a métodos estadísticos de muestreo aleatorio para obtener una
muestra representativa de ítems. No obstante, en el campo de la psicología no siempre es posible disponer de poblaciones de
contenidos bien definidas (por ejemplo, si se pretenden medir variables psicológicas clásicas, como la extraversión, la inteligencia o el
liderazgo). En estos casos suele recurrirse a un análisis racional de ítems, consistente en la evaluación de los contenidos del test por
parte de un grupo de expertos en el área a tratar.6 La validez de contenido es esencial a la hora de realizar inferencias o
generalizaciones a partir de los resultados del test.

Un caso particular de la validez de contenido es la denominada «validez aparente». Una prueba posee una validez aparente adecuada
cuando produce en los sujetos a los que se aplica la impresión de que efectivamente es una prueba adecuada. Es un tipo peculiar de
validez de contenido, pero que tiene su parte de importancia al poder influir sobre la motivación de los participantes, que pueden
mostrar una actitud negativa ante la prueba si no perciben que ésta tenga el sentido que se le supone.3
Validez de criterio

También conocida como «validez criterial «validez relativa al criterio» o «validez de pronóstico», se refiere al grado de eficacia con que
se puede predecir o pronosticar una variable de interés (criterio) a partir de las puntuaciones en un test. Es frecuente que en los
procesos de selección de personal se utilicen instrumentos que pretendan determinar o predecir el rendimiento futuro de los
candidatos al puesto de trabajo basándose en las respuestas obtenidas. Para ello es necesario que se haya obtenido una evidencia
empírica de que los resultados obtenidos en la prueba correlacionen efectivamente con el rendimiento futuro en el puesto de trabajo.

Introducción del Programa estadístico del SPSS.

SPSS es un programa estadístico informático muy usado en las ciencias sociales y aplicadas, además de las empresas de
investigación de mercado. El nombre originario correspondía al acrónimo de Statistical Package for the Social Sciences (SPSS),
reflejando la orientación a su mercado original (ciencias sociales), aunque este programa es también muy utilizado en otros campos
como la mercadotecnia. Sin embargo, en la actualidad la parte SPSS del nombre completo del software (IBM SPSS) no es acrónimo
de nada.

Es uno de los programas estadísticos más conocidos teniendo en cuenta su capacidad para trabajar con grandes bases de datos y
una sencilla interfaz para la mayoría de los análisis. En la versión 12 de SPSS se podían realizar análisis con dos millones de registros
y 250.000 variables. El programa consiste en un módulo de base y módulos anexos que se han ido actualizando constantemente con
nuevos procedimientos estadísticos. Cada uno de estos módulos se compra por separado.

Por ejemplo, SPSS puede ser utilizado para evaluar cuestiones educativas.

Actualmente, compite no sólo con programas licenciados como SAS, MATLAB, Statistica, Stata, sino también con software de código
abierto y libre, de los cuales el más destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete libre llamado PSPP,
con una interfaz llamada PSPPire que ha sido compilada para diversos sistemas operativos como Linux, además de versiones para
Windows y macOS. Este último paquete pretende ser un clon de código abierto que emule todas las posibilidades del SPSS.
Opinión personal

Mi opinión personal es que los temas tratados en esta unidad son de suma importancia porque lo utilizamos en nuestra vida diaria y
es importante aprenderse que son y para qué sirven donde y cuando utilizarlos a mí me encanto mucho empaparme de lo que es la
confiabilidad y la validez.

You might also like