Guía Psicometría I

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA
La Universidad Católica de Loja
MODALIDAD ABIERTA Y A DISTANCIA
Departamento de Psicología
Sección Psicología Básica y Social
Psicometría
Guía didáctica
5 créditos
Titulación Ciclo
 Licenciado en Psicología IV
Autor:
Mg. Richard Eduardo Ruiz Ordóñez
Estimado estudiante recuerde que la presente guía didáctica está disponible en el EVA en formato PDF interactivo,
lo que le permitirá acceder en línea a todos los recursos educativos.
Asesoría virtual:
11408 www.utpl.edu.ec
PSICOMETRÍA
Guía didáctica
Richard Eduardo Ruiz Ordóñez
UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA
CC Ecuador 3.0 By NC ND
Diagramación, diseño e impresión:
EDILOJA Cía. Ltda.
Telefax: 593-7-2611418
San Cayetano Alto s/n
www.ediloja.com.ec
edilojainfo@ediloja.com.ec
Loja-Ecuador
Primera edición
Séptima reimpresión
ISBN-978-9942-00-961-6
Esta versión impresa ha sido acreditada bajo la licencia Creative Commons Ecuador 3.0 de reconocimiento -no comercial- sin obras
derivadas; la cual permite copiar, distribuir y comunicar públicamente la obra, mientras se reconozca la autoría original, no se utilice
con fines comerciales, ni se realicen obras derivadas. http://www.creativecommons.org/licences/by-nc-nd/3.0/ec/
Abril, 2015
2. Índice
2. Índice.................................................................................................................................... 3
3. Introducción........................................................................................................................ 5
4. Bibliografía......................................................................................................................... 6
4.1. Básica.............................................................................................................................. 6
4.2. Complementaria.............................................................................................................. 6
5. Orientaciones generales para el estudio................................................................... 8
6. Proceso de enseñanza-aprendizaje para el logro de competencias................. 11
PRIMER BIMESTRE
6.1. Competencias Genéricas................................................................................................. 11

6.2 Planificación para el trabajo del alumno......................................................................... 12
6.3. Sistema de evaluación de la asignatura (primero y segundo bimestres)....................... 14
6.4. Orientaciones específicas para el aprendizaje por competencias.................................... 15
UNIDAD 1: FUNDAMENTOS DE LA MEDICIÓN EN PSICOLOGÍA...................................................... 15
1.1. La medición en psicología............................................................................................... 15
1.2. Psicometría y test psicológicos........................................................................................ 16
1.3. Reseña histórica.............................................................................................................. 17
Autoevaluación 1.................................................................................................................... 20
UNIDAD 2: CLASIFICACIÓN DE LOS TEST..................................................................................... 21
2.1. Test de ejecución máxima (inteligencia, aptitudes y habilidades)................................. 21
2.2. Test de comportamiento típico........................................................................................ 23
Autoevaluación 2.................................................................................................................... 26
UNIDAD 3: NORMAS TÉCNICAS.................................................................................................. 27
3.1. Introducción.................................................................................................................... 27
3.2. El concepto de confiabilidad............................................................................................ 27
3.3. Factores que afectan la confiabilidad.............................................................................. 28
3.4. Dimensiones de la confiabilidad...................................................................................... 29
3.5. Métodos para verificar la confiabilidad........................................................................... 29
Autoevaluación 3.................................................................................................................... 31
UNIDAD 4: VALIDEZ.................................................................................................................. 32
4.1. Introducción.................................................................................................................... 32
4.2. Fuentes de evidencia de validez..................................................................................... 35
4.3. Utilidad de los test en contextos de clasificación............................................................ 36
4.4. Generalización de la validez: el metaanálisis................................................................. 36
Autoevaluación 4.................................................................................................................... 37
UNIDAD 5: INTERPRETACIÓN DE LAS PUNTUACIONES.................................................................. 38
5.1. Interpretación referida a normas..................................................................................... 38
5.2. Otros métodos de interpretación de puntuaciones.......................................................... 39
Autoevaluación 5.................................................................................................................... 40
SEGUNDO BIMESTRE
6.5. Competencias Genéricas................................................................................................. 41

6.6. Planificación para el trabajo del alumno......................................................................... 42
6.7. Orientaciones específicas para el aprendizaje por competencias.................................... 44
UNIDAD 6: CONSTRUCCIÓN DE LOS TEST.................................................................................... 44
6.1. Definición del dominio.................................................................................................... 45
6.2. Redacción de los ítems................................................................................................... 48
6.3. Revisión de expertos....................................................................................................... 48
6.4. Análisis factorial y de los ítems....................................................................................... 49
Autoevaluación 6.................................................................................................................... 52
UNIDAD 7: ADAPTACIÓN DE TEST A OTRAS CULTURAS................................................................. 53
7.1. ¿Por qué adaptar test?.................................................................................................. 53
7.2. Fuentes de sesgo ........................................................................................................... 54
7.3. Influencia del lenguaje.................................................................................................... 56
7.4. Métodos de adaptación.................................................................................................. 56
Autoevaluación 7.................................................................................................................... 58
UNIDAD 8: TEORIA DE LOS ÍTEMS.............................................................................................. 59
8.1. Teorías clásicas de los test (TCT).................................................................................... 59
8.2. Teoría de respuesta al ítem (TRI)................................................................................... 62
Autoevaluación 8.................................................................................................................... 64
7. Solucionario........................................................................................................................ 65
8. Glosario................................................................................................................................ 73
9. Anexos.................................................................................................................................. 79
PRELIMINARES Guía didáctica: Psicometría
3. Introducción
Un saludo cordial de parte, de quienes hacemos la Escuela de Psicología de la Universidad Técnica

Particular de Loja. “Lo importante no es lo que nos hace el destino, sino lo que nosotros hacemos de él”.
¡Felicidades! Usted se encuentra en la mitad del proceso, para obtener su profesionalización; el esfuerzo
que realiza cada día, es sumamente valioso, por lo tanto, empecemos de manera decidida, este ciclo de
estudios; y alcanzaremos el éxito.
Esta disciplina de Psicometría, corresponde al quinto ciclo de la carrera de Psicología, que la Universidad
Técnica Particular de Loja, a través de la Escuela de Psicología, le ofrece a usted, en este ciclo de estudios
de pregrado. Esta asignatura contiene 5 créditos.
La utilización de pruebas psicométricas es muy importante, dentro de las actividades del profesional
en psicología, por lo que la asignatura de psicometría, es de mucha valía, le permitirá comprender los
requisitos técnicos y fundamentos teóricos para el empleo de los tests.
Con esta asignatura se pretende que nuestros alumnos, (futuros psicólogos) adquieran los fundamentos
teóricos, así como los procesos metodológicos, que le permitan poner en práctica la medición objetiva
de ciertas manifestaciones de la conducta, elaborando teorías, modelos, para elaborar y aplicar métodos
e instrumentos para la medición de variables psicológicas.
Cuando se habla de instrumentos de medición en psicología, nos referimos a todos aquellos

procedimientos u operaciones que permiten llegar a obtener, con un alto grado de certeza posible,
información acerca de la expresión de los fenómenos que suceden en el ser humano.
El estudio de la asignatura de psicometría, permitirá a los alumnos, tener criterios científicos en relación a
las diferencias individuales, su naturaleza, los antecedentes pre científicos y científicos del desarrollo de
la psicometría, los aportes teóricos, los contextos sociales, los procedimientos técnicos y metodológicos
de las pruebas psicológicas.
La temática que abarca la asignatura ha sido estructurada en 8 unidades, distribuidas 5 para el primer
bimestre y tres para el segundo bimestre.
La primera unidad comprende los fundamentos de la medición psicológica, la segunda se refiere a

la manera como se clasifican los test; la tercera y cuarta unidad hace relación a las normas técnicas
para la elaboración de los test, tales como: confiabilidad, validez; en la quinta unidad abordaremos la
interpretación de las puntuaciones.
En el segundo bimestre, la unidad 6 está enfocada a la construcción de test, lo que nos permitirá conocer
los métodos de construcción de test; la unidad 7 se refiere a la adaptación de test a nuestra cultura,
lo que nos permitirá, evitar posibles sesgos en la medición transcultural de constructos psicológicos y
finalmente la unidad 8 abarca algunas teorías en relación a los test.
Recuerden estimados estudiantes, que estaré junto a ustedes para acompañarles y orientarles en el
proceso de aprendizaje.
¡Éxito y bien!
UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja 5

Guía didáctica: Psicometría PRELIMINARES
4. Bibliografía
4.1. Básica
• Tornimbeni, Silvia y otros. (2008). Introducción a la Psicometría. Buenos Aires: Paidós.
El texto de Psicometría permite adentrarnos en los temas e instrumentos clásicos de la disciplina y,

por otro, ofrece un panorama de los desarrollos más actuales, tales como los test informatizados.
El texto básico comprende 8 capítulos. Los autores son docentes de la Universidad Nacional de
Córdoba, de la Facultad de Psicología.
• Ruiz Ordóñez, Richard, (2011). Guía de Estudio de Psicometría. Loja-Ecuador: Editorial UTPL
La guía orienta el aprendizaje, por lo tanto debe leerla desde la primera página, a través de ella le
va indicando qué es lo que debe estudiar y cómo hacerlo. Realice todas las actividades planteadas.
En medida que avanza en el estudio de la guía, lo hará con el texto básico.
4.2. Complementaria
• Thorndike, Robert l. (1989). Psicometría Aplicada. México, Limusa.
El autor hace una explicación sobre la elaboración de pruebas psicológicas. Tiene una explicación
estadística y desarrollo de técnicas de varios instrumentos de medición.
• Susana Urbina, Anne Anastasi, (1998); Test Psicológicos tercera edición. Madrid: Ediciones Pearson
educación.
Esta edición proporciona explicaciones sencillas de algunos conceptos y procedimientos de uso común
y rápido desarrollo que influyen en las prácticas psicométricas del siglo XXI, como es el caso de los test
adaptados a las computadoras, el metaanálisis, el modelamiento de ecuaciones estructurales, el uso de
intervalos de confianza, las pruebas transculturales y el uso creciente del análisis factorial en el desarrollo
de los test de habilidad y de personalidad.
• Aiken, R. Lewis. (2003). Test Psicológicos y evaluación. undécima edición. México: Ediciones Pearson
educación.
Test psicológicos y evaluación es una obra cuyo principal objetivo es, ayudar a mejorar los conocimientos,
la comprensión y la práctica de las personas que diseñan test, los aplican y los resuelven, los califican e
interpretan los resultados y toman decisiones con base a los datos así obtenidos.
El texto es amplio pero se presenta de una manera accesible. Refleja el cambio constante que se está
produciendo en las pruebas, en la teoría y en la tecnología en el campo de la psicología. El texto está
pensado para un fácil manejo por parte de los estudiantes. La sección estadística se encuentra en el
apéndice para que el estudiante acceda a esta información a su propio ritmo de estudio.
• Asociación Americana de Psicología [En línea]. Disponible en www. apa. org [Consulta: 18-06-
2011].
6 UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja

En esta página de la American Psychological Association es posible encontrar bases documentales de

gran utilidad en relación a test.
• Editorial de test psicológicos [En línea]. Disponible en www.teaediciones.com [Consulta: 18-06-

2011].
Podrá usted revisar editoriales, que hacen relación a la publicación de test en España y su comercialización.
En esta página encontrará los test más utilizados en la actualidad en el campo de la Psicología en el
mundo.
• Universidad Nacional de Córdova (2011). Revista Evaluar de la Facultad de Psicología [En línea].
Disponible en www. revistaevaluar.com.ar [Consulta: 18-06-2011].
En la Facultad de Psicología de la Universidad Nacional de Córdoba, Argentina existe una revista

electrónica especializada, Evaluar, que periódicamente publica trabajos teóricos y empíricos relacionados
con la medición psicológica y educativa.

Guía didáctica: Psicometría PRELIMINARES
5. Orientaciones generales para el estudio
Estimado alumno: el aprendizaje autónomo es un proceso que debe llevarse de manera responsable,
sistemática y secuencial. Para el estudio de la materia usted dispone de un texto básico y una guía
didáctica, materiales que ya se citaron en la bibliografía.
El texto básico que le ofrecemos ha sido seleccionado por su claridad y aplicaciones prácticas para el
trabajo que requerimos. Los contenidos se encuentran secuencialmente estructurados.
Le sugiero tomar en cuenta las siguientes consideraciones, para que pueda aprovechar al máximo los
contenidos de la asignatura:
• Parta de las competencias, que se persiguen en la asignatura, así sabrá lo que se pretende
estudiar.
• Distribuya el tiempo necesario, a fin de que pueda avanzar secuencialmente en cada una de
las unidades y no acumule todo el contenido para el final del bimestre.
• Dedique por lo menos 4 horas semanales, de manera que concluya con el análisis de cada
una de las unidades.
• Utilice la técnica de la lectura comprensiva, que le ayudará en la asimilación significativa de

los diferentes temas.
• Inicie el estudio con una lectura cuidadosa y atenta de esta guía didáctica que es el
instrumento metodológico que le guiará en el aprendizaje de esta asignatura. La guía le
orientará en el manejo del texto básico y le especificará las diversas actividades que deberá
cumplir.
• Realice una lectura rápida, del texto básico: Introducción a la Psicometría, ello se logra
leyendo en primera instancia títulos, recuadros, resaltados con negrilla, observando gráficos,
lea el prólogo, el prefacio; con ello usted adquiere una primera impresión de su texto; cada
capítulo del libro se debe analizar de manera secuencial.
• Con ayuda del texto y la guía didáctica siga con una lectura atenta y comprensiva del desarrollo
de cada capítulo planteado. Son 280 páginas que debe leerlas comprensivamente. Utilice
un resaltador y subraye lo más importante. A medida que vaya revisando la guía didáctica
es de suma importancia que lea comprensivamente los contenidos que se encuentran en el
texto básico, ellos, se constituyen en los fundamentos teóricos para la construcción de cada
una de las actividades que se sugieren en la guía didáctica, en la evaluación a distancia y
en la evaluación presencial. Las actividades que se pide contestar en la guía, realícelas por
favor.
• Resuelva las actividades recomendadas en la guía didáctica, los ejercicios que se plantean
en cada capítulo y las actividades recomendadas; al hacerlo también estará resolviendo
gran parte de su trabajo a distancia.

• Aplique estrategias de aprendizajes como: resúmenes, esquemas, mapas conceptuales,

cuadros comparativos, organizadores gráficos, etc. que apoyen a la adquisición del
conocimiento y el desarrollo de su capacidad de síntesis en de cada uno de los contenidos
a estudiar.
• Desarrolle las autoevaluaciones propuestas al final de cada unidad.
• Resuelva las evaluaciones a distancia (una por cada bimestre), que le sirven como estrategia
de aprendizaje y contribuyen en la preparación de las evaluaciones presenciales.
• Participe activamente en el Entorno Virtual de Aprendizaje (EVA) e interactúe con el

profesor y con sus compañeros a través de foros de discusión, que en cada bimestre se le
propondrán.
• Asista a la videoconferencia, en la que se explicará sobre los temas de la asignatura y

participe con preguntas e inquietudes que surjan en el desarrollo de los contenidos.
• Resuelva las evaluaciones a distancia (una por cada bimestre) que le sirven como estrategia
de aprendizaje y contribuyen en la preparación de las evaluaciones presenciales.
• Recuerde que la evaluación a distancia es de carácter obligatorio y no recuperable; consta

de dos partes: prueba objetiva que tiene un valor de dos puntos (2), la prueba de ensayo
cuatro puntos (4) lo que da un total de seis puntos (6).
• Si en el desarrollo de los contenidos surge alguna duda o inquietud, puede comunicarse

con su profesora-tutora a través de los diferentes medios: telefónicamente en el horario
establecido y que consta en la portadilla de las evaluaciones a distancia y por el correo
electrónico o a través del Entorno Virtual de Aprendizaje (EVA).
• La clave del aprendizaje, está en preguntar, como mediador de esta asignatura es mi

responsabilidad aclarar sus inquietudes. No dude en llamarme a la extensión 2001-2003,
los días lunes y martes de 18H00 a 20H00, o comunicarse conmigo a través del EVA; como
psicólogo, comprendo sus expectativas, miedos y temores; para mí constituye una privilegio
ser su docente ya que: “Una forma de alcanzar mis metas, es ayudar a otros a alcanzar las
suyas”.
• Finalmente, le recomiendo revisar la “Planificación para el trabajo del alumno”, este cuadro
le explica las competencias específicas que se anhelan alcanzar a través de la asignatura; los
indicadores de aprendizaje a lograrse con las unidades de estudio; las actividades que usted
realizará; y, el tiempo sugerido para dedicarlo al análisis de cada una de ellas.

PRIMER BIMESTRE Guía didáctica: Psicometría
6. Proceso de enseñanza-aprendizaje para el logro de competencias
PRIMER BIMESTRE
6.1. Competencias Genéricas
• Habilidad para trabajar en forma autónoma.
• Capacidad para organizar y planificar el tiempo.
• Capacidad de investigación.
• Habilidad para buscar, procesar y analizar información procedente de fuentes diversas.
• Capacidad de aplicar los conocimientos.
• Capacidad crítica y autocrítica.
• Capacidad de adaptación al cambio.
• Habilidades interpersonales.
• Habilidad en el uso de las tecnologías TICs.
• Compromiso con la calidad.
• Compromiso ético.

Guía didáctica: Psicometría PRIMER BIMESTRE
6.2 Planificación para el trabajo del alumno

CRONOGRAMA
COMPETENCIAS INDICADORES DE CONTENIDOS ACTIVIDADES DE
ORIENTATIVO
ESPECIFICAS APRENDIZAJE UNIDADES/TEMAS APRENDIZAJE
(Tiempo estimado)
• Dominar los Descubre los Parte 1: • Familiarizarse con Semana 1
fundamentos fundamentos de la Unidad 1: el material de 4 horas de autoestudio
históricos, medición en psicología FUNDAMENTOS DE estudio. y 4 horas de interacción
biológicos y PSICOMETRÍA • Lectura (EVA).
sociales de comprensiva de
la psicología 1.1. La medición en los temas de la
para cimentar psicología primera unidad.
el ejercicio 1.2.Psicometría y test • Desarrollo de
profesional. psicológicos las actividades
1.3. Reseña Histórica recomendadas
(guía y texto).
• Interacción en el
EVA.
• Inicio del desarrollo
de la evaluación
a distancia del
primer bimestre.
• Ser capaz de Distingue los diferentes Unidad 2: • Familiarizarse con Semana 2

identificar tipos de test CLASIFICACIÒN DE el material de 4 horas de autoestudio
diferencias, LOS TEST estudio. y 4 horas de interacción
problemas y • Lectura (EVA).
necesidades a nivel comprensiva de
2.1. Test de ejecución
individual los temas de la
máxima
segunda unidad.
2.2. Test de comporta- • Reflexión e
miento típico interiorización de
los objetivos de la
unidad.
• Desarrollo de
las actividades
recomendadas
• Ser capaz de (guía y texto).
describir y • Interacción en el
medir variables EVA.
(personalidad, • Continuar con
inteligencia y el desarrollo de
otras aptitudes, la evaluación
actitudes, etc.) a distancia del
y procesos primer bimestre.
cognitivos,
emocionales,
psicobiológicos y
conductuales.

CRONOGRAMA
ORIENTATIVO
(Tiempo estimado)
Analizar las normas y Parte 2 • Revisar el material Semana 3 y 4
técnicas en aplicación Unidad 3: de estudio. 8 horas de autoestudio
de los test CONFIABILIDAD • Reflexión e y 8 horas de interacción
interiorización de (EVA).
3.1. Introducción los objetivos de la
3.2. El concepto de unidad.
confiabilidad • Lectura
3.3. Factores que comprensiva de los
afectan la temas de la tercera
confiabilidad unidad.
3.4. Dimensiones de la • Desarrollo de
confiabilidad las actividades
3.5. Métodos para recomendadas
verificar la (guía y texto).
confiabilidad • Interacción en el
3.6. Confiabilidad y EVA.
puntuaciones
individuales
3.7. Confiabilidad en la
teoría de respuesta
del ítem
Analizar las normas Unidad 4: • Revisar el material Semana 5
técnicas en aplicación VALIDEZ de estudio. 4 horas de autoestudio
de los test • Lectura y 4 horas de interacción
4.1. Introducción comprensiva de los (EVA).
4.2. Fuentes de temas de la cuarta
evidencia de unidad.
validez • Desarrollo de
4.3. Utilidad de los test las actividades
en contextos de recomendadas
clasificación (guía y texto).
4.4. Generalización de • Interacción en el
la validez: el meta EVA.
análisis
Unidad 5: • Lectura Semana 6
INTERPRETACIÒN DE comprensiva de los 4 horas de autoestudio
LAS PUNTUACIONES temas de la tercera y 4 horas de interacción
y cuarta unidad. (EVA).
5.1. Interpretación • Desarrollo de
referida a las actividades
normas recomendadas
5.2. Otros (guía y texto).
métodos de • Interacción en el
interpretación EVA.
• Terminar evaluación
de
a distancia del
puntuaciones
primer bimestre.
Explicar de manera Unidad 1, 2, 3, 4 y 5 • Relectura y Semana 7 y 8
argumentativa el del primer bimestre. desarrollo de preparación de la
contenido del primer las actividades y prueba presencial.
bimestre ejercicios de la guía
y texto básico.
• Revisión de las cinco
autoevaluaciones
y parte objetiva
de la evaluación a
distancia del primer
bimestre.

6.3. Sistema de evaluación de la asignatura (primero y segundo bimestres)
Formas de evaluación 2. Heteroevaluación

Evaluación Evaluación a
1. Autoevaluación *
presencial distancia **
3. Coevaluación
Interacción en el EVA
Parte de ensayo
Prueba objetiva
Parte objetiva
Competencia: criterio
Comportamiento ético X X X X X X
Cumplimiento, puntualidad,
Actitudes
X X X
responsabilidad.
Esfuerzo e interés en los trabajos. X X X X X X
Respeto a las personas y a las
X X
normas de comunicación.
Creatividad e iniciativa. X X X
Habilidades
Contribución en el trabajo
X X
colaborativo y de equipo.
Presentación, orden y ortografía. X X X X
Emite juicios de valor
X X X
argumentadamente.
Dominio del contenido. X X X X X X
Conocimientos
Investigación (cita fuentes de

X
consulta).
Aporta con criterios y soluciones. X X X
Análisis y profundidad en el
X X X
desarrollo de temas.
Máximo 1 punto
PORCENTAJE 10% 20% 30% 70%

Estrategia de
aprendizaje
presenciales y en el
evaluación a
(completa la
distancia)
Puntaje 2 4 6 14
Actividades
EVA
TOTAL 20 puntos
Para aprobar la asignatura se requiere obtener un puntaje mínimo de 28/40 puntos, que equivale al 70%.
* Son estrategias de aprendizaje, no tienen calificación; pero debe responderlas con el fin de autocomprobar su
proceso de aprendizaje.
** Recuerde: la evaluación a distancia consta de dos partes: una objetiva y otra de ensayo, debe desarrollarla y
entregarla en su respectivo centro universitario.
Señor estudiante:
Tenga presente que la finalidad de la valoración cualitativa es
principalmente formativa.

6.4. Orientaciones específicas para el aprendizaje por competencias
Con un atento saludo, le doy la más cordial bienvenida al apasionante mundo de la Psicometría.
Estimado alumno, esta asignatura le permitirá adquirir conocimientos en relación a los test psicológicos,
lo que le permitirá potenciar las herramientas psicológicas, que se deben considerar en el campo de la
profesión, sobre todo al realizar el diagnóstico en casos clínicos.
UNIDAD 1: FUNDAMENTOS DE LA MEDICIÓN EN PSICOLOGÍA
Recursos educativos multimedia
“Actualmente se requiere de conocimientos básicos sobre

instrumentos de medición no solo entre quienes lo elaboran o
aplican, sino también de parte de cualquiera que se sirva de sus
resultados como fuente de datos para tomar decisiones acerca
de sí mismo y de los demás”.
Iniciemos el tema explicando el concepto de medición. Para muchos seguramente es subjetivo hablar
de medición en el ser humano, pero lo más importante será comprender que los atributos personales se
establecen a través de relaciones.
1.1. La medición en psicología
Como podemos darnos cuenta el problema de la medición, posiblemente es más controversial en

psicología que en otros dominios del conocimiento, debido a la complejidad del comportamiento
humano y las limitaciones de los instrumentos utilizados en psicología. Esto confirma la importancia
que tiene la psicometría en el campo de la psicología; antes de adentrarnos en este tema le invitamos a
resp onder la siguiente interrogante:
¿Por qué no existe consenso en la comunidad psicológica acerca del estatus teórico de la medición?
Una vez que ha contestado y reflexionado en torno a este cuestionamiento, es el momento para intentar
una definición de lo que se entiende por medición. Su respuesta acerca de la “medición auténtica” estará
determinada por el enfoque que usted tiene sobre la naturaleza humana.
En el texto básico capítulo 1, tema: “Fundamentos de la medición en psicología” encontrará otras

definiciones de medición.

Para fundamentar el criterio de medición debemos fundamentarnos en los dos modelos fundamentales
del concepto de medición en psicología, desde el análisis de la historia y la filosofía, los cuales son:
modelo clásico y representacional.
Modelos
Clásico Representacional
Cómo psicólogos debemos comprender, que los números utilizados en medición no representan
propiamente cantidades, sino relaciones. Para comprender esto es necesario que considere los diferentes
“niveles de medición”.
En psicología, en general, los resultados de los test son tratados como datos
de una escala intervalar, aunque originalmente provengan de escalas
ordinales.
ACTIVIDADES RECOMENDADAS
1. Diseñe un cuadro comparativo entre el modelo clásico y representacional.
2. A través de una tabla, explique: ¿qué es la medición psicológica, según los autores del modelo
clásico?
3. Establezca las diferencias entre los tipos de escalas, para medir una propiedad: nominal, ordinal,
intervalar, proporcional.
4. ¿Por qué el modelo clásico, representa un estándar óptimo, pero difícilmente alcanzable en la
actualidad?
1.2. Psicometría y test psicológicos
Continuemos con la lectura del siguiente tema:
Para iniciar el estudio de este contenido remítase al texto básico capítulo 1 y

revise el tema: “Psicometría y test psicológicos”.
¿Cómo le fue con la lectura? Le resultó fácil interiorizar la explicación de las areas fundamentales de la
psicometría, ¿verdad?

Ahora que ya tiene una idea sobre el tema, es necesario aclararle algunas características básicas sobre los
procedimientos de medición del comportamiento humano.
• Una de las áreas fundamentales de la psicología es la psicometría, que se ocupa de los

procedimientos de medición del comportamiento humano, incluyendo a los denominados
test psicológicos.
• Recuerde que nunca se miden a las personas, sino algunos de sus atributos, es decir,
características particulares de los individuos. En psicología nadie se propone “medir” un
niño, sino su autoestima por ejemplo.
• El nivel de precisión alcanzado por la medición en psicología permite exhibir algunas

ventajas, respecto a la observación natural o no formal del comportamiento, como el
tiempo requerido para administración y puntuar un test en comparación con el tiempo
que demandaría la observación de desempeño o comportamiento de una persona en su
ambiente natural.
En este momento delimitemos el concepto de test:
Test psicológico
El término inglés test (prueba, examen) proviene

del vocablo latino testa–testis, que denominaba a
una balanza utilizada en la antigüedad para pesar
vasijas de barro.
Para conocer nuevas definiciones de test de otros autores, ubíquese en las páginas 25 a la 28 y complete
la siguiente tabla:
Definición
Anastasi y Urbina (1998)
APA (1999)
1.3. Reseña histórica
Una vez que ha comprendido lo que es un test psicológico, conviene analizar las distintas etapas o fases
por las que ha atravesado la psicometría.

El hecho de que las personas difieran en su comportamiento y que esas diferencias puedan medirse, se
ha reconocido desde los albores de la civilización.
En el texto constan las ideas más relevantes en relación a la historia de la psicomtría; centrémonos en
el planteamiento que realiza Galton, Cattell, Binet; revisemos una breve explicación en el esquema
siguiente.
PROCESO HISTÓRICO DE LA PSICOMETRÍA
Interesante lo que plantean estos autores de la década anterior, pero en la actualidad el alcance de la
informática en psicometría es importante, sin embargo no se limitan al empleo de test asistidos por
computadora, en las últimas décadas se ha diseñado una variedad de programas estadísticos.
Para conocer cada uno de los criterios de otros autores, remítase al texto
básico, capítulo 1, páginas 28 a la 37 tema: “Reseña històrica” y lea
comprensivamente cada una de ellas.

Es hora de trabajar en lo siguiente:
1. Efectúe un cuadro comparativo de la reseña histórica de la medición psicológica.
2. Elabore un cuadro sinóptico de las aplicaciones más interesantes de la informática en los tests
psicológicos.
Ahora, es necesario detectar lo que ha captado de los temas estudiados, para

lo cual le sugerimos desarrollar la autoevaluación 1, y lo que aún no ha logrado
interiorizarlo retómelo para que sea aprendido adecuadamente. ¡Adelante!

Autoevaluación 1
Escriba una (V) o una (F) según sean verdaderos o falsos los siguientes enunciados. En caso que el
enunciado sea falso explique el argumento verdadero.
1. ( ) En la actualidad, no existe consenso en la comunidad psicológica, acerca del estatus

teórico de la medición.
2. ( ) La psicometría moderna, evidencia la presencia creciente de los test basados en lápiz

y papel.
3. ( ) En los últimos años del siglo XX se produjo un acercamiento entre la psicometría y la

psicología cognitiva, y se elaboraron modelos psicométricos denominados “modelos
comportamentales”.
4. ( ) Binet, propuso crear el test de medición de funciones mentales más complejas, tales
como juicio, memoria y razonamiento.
5. ( ) El concepto de isomorfismo corresponde a la equivalencia entre el orden y la distancia

de los niveles de una propiedad cualquiera y el sistema numérico utilizado para
medirla.
6. ( ) En el modelo representacional, los números utilizados en la medición indican

cantidades.
7. ( ) La escala ordinal, incluye tanto la relación de equivalencia, como la relación de orden.
8. ( ) Los test psicológicos se construyen, en general, para medir constructos que pueden
observarse directamente.
9. ( ) Según la APA, un test es un instrumento de medición del comportamiento de un

individuo, a partir del cual pueden inferirse otros comportamientos relevantes.
10. ( ) El año 1935 ha sido calificado como “bisagra” entre el período “histórico” y “moderno”
dentro de la psicometría; debido a que se fundó la Sociedad Psicométrica y la primera
publicación especializada en medición psicológica.
Verifique sus respuestas en el solucionario que se

encuentra al final de la presente guía didáctica.
Ir a solucionario

UNIDAD 2: CLASIFICACIÓN DE LOS TEST
Una vez que hemos concluido con el estudio de la unidad 1, es necesario continuar con la clasificación
de los test que comprende la unidad 2, usted puede profundizar sobre el tema en cualquier otra fuente
que esté a su alcance.
Existen algunos criterios para clasificar los test. Así por ejemplo algunos los agrupan en: a) individuales o
grupales; de ejecución o c) basados en la teoría clásica o de respuesta al ítem.
La clasificación efectuada por Cronbach (1998) distinguió entre test de ejecución máxima y medidas de
ejecución o respuesta típica, según demande el mayor rendimiento del examinado en sus respuestas
(tests de habilidades) o midan el comportamiento habitual sin requerir respuestas correctas (inventarios
de personalidad).
Es necesario que usted discrimine los diferentes tipos de test. Conviene por lo tanto empezar recordando
estas definiciones.
2.1. Test de ejecución máxima (inteligencia, aptitudes y habilidades)
Iniciemos el estudio de este tema reflexionando sobre lo siguiente: la característica principal de los test
de ejecución máxima es que demandan a los examinados, es que respondan de la forma más eficiente
que pueden frente a tareas problemáticas.
Una vez que ha meditado en torno a este cuestionamiento, es hora de explicar.
¿Qué miden los test de ejecución máxima?
Estos test miden diferencias individuales en el nivel de ejecución máximo ante distintas tareas, cuando
se intenta realizarlas (Nunnally, 1991). Esto significa que los desempeños solamente pueden medirse
cuando las personas están motivadas para realizar una tarea de la mejor manera posible.
Bajo el concepto genérico de test de ejecución máxima se incluyen variables relacionadas, tales como las
aptitudes, las habilidades y la inteligencia.
Un test que se considera un indicador adecuado de g es el de Matrices Progresivas de Raven (1993). Las
matrices de Raven se consideran las mejores pruebas de inteligencia general g no verbal. Estas matrices
miden un concepto muy general del funcionamiento intelectual.
Para Raven la variable fundamental o rasgo latente según terminología contemporánea, es el

razonamiento analógico abstracto. Hay varias formas de matrices progresivas de Raven (MPR), que
incluyen a las matrices progresivas coloreadas (MPC), matrices progresivas estándar (MPE), y las matrices
progresivas avanzadas (MPA).
Los reactivos de las pruebas son estables sobre la clase de grupos socioeconómicos y entre sociedades
con tradición literaria, además están de acuerdo con el modelo de Rasch para respuestas dicotómicas.
A continuación le proponemos algunos ejemplos de la manera en cómo se administra las preguntas del
test:

Ejemplo: complete la figura que falta.
Fuente: Guía de estudio, test psicológicos, UTPL.
¿Qué le pareció el tema, interesante verdad? Avancemos con el siguiente cuestionario de habilidades
múltiples. A continuación estudiaremos a Howard Gardner (1994, 1999) quien, efectuó una crítica radical
al modelo de inteligencia general con su “Teoría de las inteligencias múltiples”.
Para Gardner los test miden preferentemente aptitudes relacionadas con los
requerimientos académicos de la cultura occidental.
Gardner afirma que existen diferentes tipos de inteligencia, que actúan

de forma independiente y que en cada individuo presentan combinaciones
distintas entre sí que dan razón cómo las personas son diferentes y adoptan
roles diversos en la vida profesional. Existe un cuestionario interesante para
determinar habilidades, personales, sobre todo aplicada al campo educativo.
En la actualidad, las escalas más utilizadas para la medición de la inteligencia en nuestro medio son las
elaboradas por David Wechsler en 1939, con varias actualizaciones posteriores.

La primera versión de la escala se publicó en 1939 con el nombre «Escala de Inteligencia Wechsler-
Bellevue». Posteriormente, se publicaron los formatos WPPSI para niños de 4-6 años y WISC para edades
comprendidas entre 6 y 16 años. Esta última, cuyo nombre original es Wechsler Intelligence Scale for
Children-Revised (WISC-R), ha sido adaptada por TEA con el nombre Escala de Wechsler para Niños
Revisada (WISC-R). Su aplicación es individual y mide aspectos cuantitativos y cualitativos. Ofrece
puntuaciones típicas ponderadas por edades, para cada una de las pruebas y cocientes intelectuales
(CI), independientes para las escalas verbales, manipulativa y total.
En las versiones actuales de las escalas de Wechsler los ítems están ordenados según los parámetros de
dificultad (Hogan, 2004).
Posteriormente también se ha dado paso en lo referente a la orientación de carrera y la selección de

personal que son áreas de trabajo del psicólogo, donde resulta de significativa importancia la medición
de aptitudes cognitivas. En estos ámbitos son muy empleadas las pruebas multifactoriales como el Test
de Aptitudes Diferenciales (DAT).
El DAT permite aptitudes diferenciales, veamos algunas ideas clave:
• EL TEST DE APTITUDES DIFERENCIALES (DAT): Ofrece un procedimiento integrado,

científico y bien estandarizado para medir las aptitudes de estudiantes de ambos sexos para
fines de orientación educacional y vocacional. Representan un desarrollo lógico y constante
progreso de la teoría y la práctica de la medición psicológica.
Otro ámbito relevante para el uso de los test de ejecución máxima es la neuropsicología, que estudia las
relaciones entre el cerebro y la conducta (Kolb y Wishaw, 1986).
En el texto básico páginas de la 40 a la 49, usted encontrará una breve

referencia sobre el tema.
Una vez que hemos analizado esta temática, es momento de trabajar en lo siguiente:
• Investigue en Internet a qué hace relación el factor cognitivo general (g).
• Establezca las semejanza y diferencias entre el Test de Matrices Progresivas de Raven y el Test de
Inteligencia Wechsler (Wisc–IV).
2.2. Test de comportamiento típico
A continuación estudiamos aquellos test que evalúan el comportamiento, recurriendo a distintas

afirmaciones.

En este tipo de test ninguna respuesta puede ser calificada como correcta o incorrecta. Aquí se evalúa
el comportamiento habitual de los individuos, recurriendo a distintas afirmaciones ante los cuales el
examinado debe indicar su nivel de acuerdo o agrado. Los test de respuesta típica comprenden las
medidas de rasgos de personalidad, intereses y actitudes. Así como de otros constructos afectivos y
motivacionales relacionados, como las creencias de autoeficacia (Cronbach, 1998).
Los resultados de estos tests deben interpretarse con precaución y no debe ser el único criterio de
evaluación, utilizado para tomar decisiones clasificatorias o diagnósticas respecto a las personas.
Dentro de estos tests de comportamiento típico tenemos los siguientes:
Escalas de autoeficacia: la teoría social cognitiva ha destacado el papel de la autoeficacia, percibida

entre las variables motivacionales y afectivas. Bandura (1997) define a la autoeficacia como la creencia
en las propias capacidades para realizar determinados cursos de acción.
Seguidamente es importante comprender el porqué de las aversiones relacionadas a las carreras y

ocupaciones por lo que los inventarios deben ser revisados con cautela.
Inventario de Intereses Vocacionales: han sido definidos como perfiles de agrados y aversiones respecto
a las actividades relacionadas con carreras y ocupaciones.
Los inventarios poco nos dicen respecto al éxito académico u ocupacional que podrá alcanzar una
persona, pero nos ayudan a identificar carreras u ocupaciones donde puede encontrar satisfacción.
Escalas de actitudes: las actitudes se refieren a predisposiciones aprendidas para responder positiva
o negativamente ante objetos sociales particulares, es decir, tipos de personas, instituciones sociales o
situaciones. Las actitudes son tendencias individuales a reaccionar, positiva o negativamente, frente a
un valor social.
Inventario de rasgos de personalidad: la personalidad hace referencia a las tendencias afectivas básicas
de una persona. El propósito fundamental de medición de la personalidad es describir a los individuos
sobre la base de sus rasgos de personalidad predominantes. Los rasgos de personalidad se relacionan
con la conducta típica de las personas en su vida cotidiana, tales como el nivel de ansiedad o amabilidad.
Otros inventarios de personalidad de uso clínico miden un trastorno patológico específico, como el
Inventario de Depresión de Beck (1996).
Inventario de habilidades sociales: otro desarrollo psicométrico contemporáneo es el de la medición de

habilidades sociales (HHSS). Las HHSS han sido definidas como el conjunto de conductas que favorecen
el desarrollo social de la persona y por medio de las cuales esta expresa sus sentimientos, actitudes,
deseos, opiniones o derechos de un modo adecuado a la situación, respetando la expresión de esas
conductas en los demás.
En el texto básico página 49-65, usted encontrará una breve referencia sobre
el tema: “Test de comportamiento típico”.

• ¿Cuáles son los test más conocidos a nivel de su localidad en relación a intereses vocacionales,
inventarios de rasgos de personalidad e inventario de habilidades sociales?
• Realice una entrevista a un psicólogo clínico, donde usted determine si son los test de ejecución
máxima o los de comportamiento típico los que más utiliza en su ejercicio profesional.
• Escriba una carta al tutor, comentándole según su investigación, cuál es el mejor test de rasgos de
personalidad que existe en la actualidad. Argumente o contraargumente
Es momento de verificar los aprendizajes que constituyen la base de nuestro estudio. Por
ello le sugerimos desarrollar la siguiente autoevaluación, para detectar lo que aún no está
suficientemente interiorizado y poder retomarlo a fin de lograr su total comprensión.

Autoevaluación 2
Escriba una (V) o una (F) según sean verdaderos o falsos los siguientes enunciados.
1. ( ) En el test de MPR, los examinados deben responder seleccionando la secuencia

faltante que completa la serie.
2. ( ) La teoría de H. Gardner está basada en criterios neuropsicológicos.
3. ( ) Las escalas de Wechsler son muy empleadas en psicología clínica y educacional.
4. ( ) La evaluación neuropsicológica posibilita el diagnóstico de la cantidad y calidad de

daño cognitivo, que puede haber sufrido una persona ante una lesión cerebral.
5. ( ) Los inventarios de intereses vocacionales, predicen el éxito académico o vocacional

que alcanzará una persona.
6. ( ) Hay gran variedad de test de intereses vocacionales pero se presentan dificultades

considerables, cuando se emplean de modo transcultural.
7. ( ) Desde el punto de vista conceptual, no es difícil diferenciar las actitudes de los

intereses.
8. ( ) Para explicar el desarrollo de la personalidad de un individuo se debe recurrir a la

genética del comportamiento y las teorías del aprendizaje.
9. ( ) Los inventarios de rasgos de personalidad se utilizan en ámbitos tan diversos como la

clínica psicológica, la psicología ocupacional y la investigación.
10. ( ) En los últimos años se han construido tests que no solo contemplan características
intrapsicológicas, sino que también miden aspectos relacionados con los diferentes
ambientes en los cuales se desenvuelve el individuo.

Ir a solucionario

UNIDAD 3: NORMAS TÉCNICAS
Vamos a iniciar el estudio de la tercera unidad, no sin antes aclarar que su aplicación es importante en
el ámbito psicológico sobre todo clínico. El profesional en psicología debe conocer las normas técnicas
para la elaboración de test.
Empecemos compartiendo lo que es la confiabilidad.
CONFIABILIDAD
“La confiabilidad es un concepto, pero también es una

medida práctica de qué tan consistente y estable podría
ser un instrumento de medición de una prueba”.
3.1. Introducción
Como se afirmó en los capítulos anteriores, la medición psicológica parte de ciertos supuestos
fundamentales. Uno de esos supuestos hace relación a la confiablidad que es el que a continuación
estudiaremos.
Cuanto mayor sea el error, menos confiables serán los resultados en el proceso de medición.
3.2. El concepto de confiabilidad
Son varias las definiciones en relación a la confidencialidad. La confiabilidad puede entenderse como la
exactitud o precisión de una medición, o el grado en el cual las puntuaciones de un test están libres de
esos errores de medición.
Para la Asociación Americana de Psicología, la confiabilidad significa la consistencia entre los puntajes
de un test obtenidos por los mismos individuos en distintas ocasiones o entre diferentes conjunto de
ítems equivalentes (APA, 1999).
Los diferentes métodos utilizados para evaluar la confiabilidad, utilizan el coeficiente de correlación
como estadístico fundamental. La confiabilidad no es una característica del test en sí mismo, según la
teoría clásica de los test, sino una propiedad de las puntuaciones del test, cuando este se administra a
una muestra específica y bajo condiciones particulares (APA, 1999).
La confiabilidad de una prueba es definida también como la consistencia de las puntuaciones obtenidas
por las mismas personas cuando se les examina en distintas ocasiones con el mismo test, con conjuntos
equivalentes de reactivos o en otras condiciones de examinación.

Ninguna prueba es un instrumento perfectamente confiable, de ahí que todas deban ser acompañadas
por un reporte de su confiabilidad. También es necesario especificar las características de la muestra
normativa, ya que la confiabilidad declarada caracteriza a la prueba cuando se aplica en condiciones
normales a personas similares a las que conformar la muestra normativa u original.
Hay tantas variedades de confiabilidad como condiciones que afecten los resultados de la prueba, ya
que cada una de estas pueden ser irrelevantes para cierto propósito y por consecuencia clasificada como
varianza de error.
Es importante en este momento que se remita al texto básico páginas de

la 71 a la 76 y defina con sus propias palabras lo que entiende usted por
confiabilidad.
Con los conocimientos adquiridos trabaje en lo siguiente.
Explique: ¿Por qué el puntaje de una persona en un test psicológico nunca será perfectamente consistente
de una ocasión a la próxima, aun en el caso de que se evalué con una misma prueba? Argumente su
respuesta.
3.3. Factores que afectan la confiabilidad
Una vez que tiene claro el concepto de confiabilidad, debemos comprender que existen algunos factores
que afectan la confiabilidad y que debemos tenerlos en cuenta. A continuación encontrará un esquema
gráfico donde se explica los factores que afectan a la confiabilidad.
Elaborado por: Mg. Richard Ruiz O.

Fuente: Tornimbeni, Silvia y otros. (2008). Introducción a la Psicometría.

Bien, hasta aquí una ligera explicación del tema.
Como complemento al estudio de este contenido, le animo a revisar en su texto básico las
páginas 76 a la 80. Repase este contenido, realice una red conceptual y establezca sus
inquietudes sobre los factores que afectan la confiabilidad.
Diseñe ruedas de atributos para comprender los factores que afectan la confiabilidad de la aplicación
de los test.
Con seguridad usted asimiló este interesante contenido, ahora avancemos en el estudio del siguiente
tema. Si existe alguna duda recuerde realizar asesoría a través del EVA o comunicándose vía telefónica.
3.4. Dimensiones de la confiabilidad
Cuando establecemos el concepto de confiabilidad, hay que comprender algunas dimensiones, cada
una de las cuales se relaciona con las diferentes fuentes de error de medición y con distintos métodos
para identificarla, ellas son:
Es necesario empezar leyendo con atención en el texto básico el tema:

“Dimensiones de la confiabilidad”. Establezca por favor las características de
cada dimensión.
3.5. Métodos para verificar la confiabilidad
Seguidamente vamos a centrarnos en la conceptualización e importancia de los métodos para verificar

la confiabilidad.
El texto básico nos plantea los métodos para corroborar la confiabilidad de un instrumento de medición,
es necesario administrar el instrumento a una muestra según el diseño de investigación específico y,

por otro lado, los datos que resulten de tal aplicación deben ser analizados mediante procedimientos
apropiados. Los métodos son:
3.5.1. Test–retest: este método consiste en administrar un test en dos oportunidades a la misma muestra
de sujetos, con un determinado intervalo entre las dos administraciones, y calcular la correlación
entre los puntajes obtenidos en la primer y segunda vez.
3.5.2. Formas equivalentes: consiste en administrar dos formas equivalentes de un test a un mismo grupo
de individuos. En el caso de que este método se utilice para verificar la estabilidad, la administración
de la segunda forma se realiza transcurrida un tiempo a partir de la administración de la primera
forma, y posteriormente se correlacionan los resultados obtenidos.
3.5.3. Partición en mitades: se administra el test en una ocasión a una muestra de individuos y
posteriormente se divide la prueba en dos mitades comparables, obteniendo de esta manera dos
puntuaciones para cada individuo de la muestra. Finalmente se correlacionan las puntuaciones
correspondientes a ambas mitades del test por miedo de un coeficiente de correlación.
3.5.4. Métodos de covarianza de los ítems: a partir de una única aplicación del test a una muestra se
obtiene una estimación del grado de covarianza de los ítems, utilizando como estadístico el
coeficiente alfa de Cronbach o la fórmula alternativa de Kuder Richardson, cuando se trabaja con
ítems dicotómicos.
3.5.5. Acuerdo entre los examinadores: el método consiste en administrar un test a una muestra, entregar
los resultados del test a un conjunto de jueces que los puntuarán independientemente.
Con los conocimientos adquiridos es importante que en este momento revise de las páginas 81 a la 94.
Efectúe una lectura minuciosa y diseñe un glosario de términos los mismos que le permitan comprender
el enfoque teórico. Estas fórmulas estadísticas usted debe tenerlas presentes, ya que se aplicarán en la
asignatura de estadística.
Se ha concluido la tercera unidad de estudio, ahora le invito a desarrollar la

autoevaluación 3, a fin de que verifique el avance de sus conocimientos.

Autoevaluación 3
1. ( ) Un error sistemático, es aquel que genera constantemente una puntuación elevada o

baja en una persona al margen de los cambios que puedan darse en el rasgo medido
por el test.
2. ( ) La confiabilidad se verifica mediante un coeficiente de correlación entre las medidas

repetidas de un fenómeno.
3. ( ) Hogan (2004) clasifica a los principales factores que afectan la confiabilidad en

internos y externos.
4. ( ) En términos generales, los test son más confiables a medida que aumenta el número
de respuestas alternativas de un rango limitado.
5. ( ) Cuando en el proceso de puntuación de un test interviene de manera importante el

criterio del evaluador, puede presentarse variaciones que aumentan la confiabilidad
de los puntajes.
6. ( ) Cuando un coeficiente de correlación es utilizado para estimar la estabilidad de las

puntuaciones de un test, también suele denominarse coeficiente de estabilidad.
7. ( ) En la actualidad el coeficiente alfa es el estadístico más popular para estimar la

consistencia interna de una prueba.
8. ( ) Un aspecto importante a considerar en un estudio de confiabilidad, es el tamaño de

coeficiente de confiabilidad.
9. ( ) La puntuación obtenida por un individuo en cualquier test está compuesta por la

puntuación verdadera, menos el error de medición.
10. ( ) El test–retest consiste en administrar dos formas equivalentes de un test a un mismo

grupo de individuos.

Ir a solucionario

UNIDAD 4: VALIDEZ
En esta unidad continuamos con las normas técnicas para el desarrollo de los test. Existe otra
norma como la validez que desarrollaremos en este momento.
Iniciemos el tema planteándonos la siguiente interrogante: ¿qué es la validez?
La validez hace referencia a la veracidad o exactitud

en el puntaje de una prueba o la interpretación de
un experimento”.
4.1. Introducción
Seguidamente vamos a centrarnos en la conceptualización e importancia de la validez.
La validez se relaciona con la investigación del significado teórico de las puntuaciones obtenidas por
medio de un test.
Las puntuaciones evidencian propiedades de validez cuando se verifica que el test realmente mide el
constructo que pretende medir, justificando adecuadamente las inferencias realizadas en función de sus
resultados (Nunally, 1991).
Para comprender la validez debemos tener claridad del concepto de constructo que detallo a
continuación:
Por lo expuesto, se deduce que la validez de un instrumento de medición se refiere a que la prueba que
se está usando realmente mida lo que debe medir.
Todos los procedimientos utilizados para determinar la validez se interesan en las relaciones entre la
ejecución de las pruebas y otros factores observados independientemente de las características de
la conducta considerada. Para investigar estas relaciones se han empleado distintos métodos, cuyos
nombres tradicionalmente se han concentrado en aspectos de la validez que son importantes para
distintos usos de la prueba.

La situación ideal en lo referente a la validez es que un test represente adecuadamente y mida la varianza
relevante del constructo, o expresado de otro modo, que las interpretaciones de los resultados de una
prueba estén libres de sesgo de medición.
Señor estudiante una breve introducción histórica, puede contribuir a esclarecer la situación actual de
este concepto, observemos:
En el texto básico, página 102 encontrará el desarrollo de cada una de las etapas. Léalos
comprensivamente, en qué consiste cada una de las etapas, de la historia del concepto
de validez.
Validez de contenido
Los procedimientos de validación por la descripción del contenido comprenden el examen sistemático
del contenido de la prueba para determinar si cubre una muestra representativa del área de conducta que
debe medirse. El área de conducta por examinar debe analizarse sistemáticamente para garantizar que
los reactivos cubran todos los aspectos importantes y en la proporción correcta. Se debe tener en cuenta
no sobregeneralizar ni incluir factores irrelevantes en los resultados. Básicamente se deben contestar
dos preguntas: a)¿cubre la prueba una muestra representativa de las habilidades y conocimientos
especificados? b) ¿el desempeño en la prueba está razonablemente libre de la influencia de variables
irrelevantes?
Validez de facie: la validez de contenido no debe confundirse con la validez aparente que no es validez
en el sentido técnico porque no se refiere a lo que la prueba verdaderamente mide sino a lo que “parece”
medir. Aunque usar el término “validez” puede resultar confuso, la validez de facie es en sí misma un rasgo
deseable de los instrumentos, porque alude a que la prueba “parece válida” para quien la administra,
quien la responde y para otros observadores. Esta validez puede mejorarse replanteando los reactivos
para que parezcan relevantes y plausibles en medio particular en que serán usados por ejemplo es
posible elaborar una prueba de aritmética para personal naval en la terminología náutica sin alterar con
ello las funciones medidas.
Validez en relación a un criterio
Los procedimientos de validación de criterio-predicción indican la efectividad de la prueba para

predecir el desempeño del individuo en actividades específicas. La medida de criterio contra la que
se validan los resultados del instrumento puede obtenerse aproximadamente al mismo tiempo que
los resultados de la prueba o después de un intervalo establecido. Las relaciones temporales entre el
criterio y la prueba permiten diferenciar la validación concurrente y la predictiva. La validez predictiva
permite anticiparse sobre un intervalo y la información que proporciona es muy pertinente para las

pruebas usadas en selección y clasificación de personal, diagnóstico de reincidencia en el área forense,

ingreso al secundario o a la universidad de estudiantes. Otros ejemplos son el uso de las pruebas para
descartar sujetos que pueden desarrollar trastornos emocionales en ambientes de tensión o extraños o
para identificar personal militar para determinados programas de capacitación ocupacional.
Con la validación concurrente, en cambio, la prueba se aplica a personas que ya cuentan con datos de
criterio, por ejemplo comparando los resultados obtenidos en la prueba por aspirantes universitarios
con los promedios académicos al momento del examen. La distinción lógica entre la validez concurrente
y la predictiva se basa en los objetivos más que en el tiempo. La validación concurrente es adecuada para
las pruebas que se emplean para “diagnosticar” el estado actual más que para predecir los resultados
futuros.
Se debe tener en cuenta la contaminación del criterio como fuente de error en la validación de la prueba,
es decir, una precaución esencial es asegurar que los propios resultados no influyan en la condición
del criterio de cualquier individuo. Es por ello que los resultados deben mantenerse estrictamente
confidenciales.
Validez de constructo
Esta expresión se introduce por primera vez en 1954 en las “Recomendaciones técnicas para las pruebas
psicológicas y las técnicas de diagnóstico” (APA, 1954). La validez de constructo ha centrado la atención
en la función que cumple la teoría psicológica en la elaboración de la prueba y en la necesidad de
formular hipótesis que puedan ser comprobadas o refutadas en el proceso de validación. La validez de
constructo de un instrumento es el grado en el que puede afirmarse que mide un constructo o rasgo
teórico. Requiere de la acumulación gradual de diversas fuentes de información.
Cambios en el desarrollo: la diferenciación por edad es un importante criterio utilizado en la validación

de una serie de pruebas tradicionales de inteligencia. Un ejemplo es el Stanford-Binet en donde se
espera que durante la niñez las habilidades aumenten con la edad, por lo tanto si la prueba es válida
sus resultados deberían mostrar dicho incrementos pues se basa en el supuesto de que “la inteligencia
aumenta con la edad” al menos hasta la madurez. Una prueba validada con el criterio evolutivo mide
características conductuales que se incrementan con la edad en las condiciones existente en el entorno
en el que se estandarizó el instrumento. Como diferentes culturas pueden estimular y fomentar el
desarrollo de características conductuales disímiles, no puede suponerse que el criterio de diferenciación
por edad sea universal. Como cualquier otro criterio está circunscrito por el contexto cultural particular
del que fue derivado.
Correlaciones con otras pruebas: se citan las correlaciones entre una prueba nueva y otros instrumentos
similares como evidencia de que la nueva mide aproximadamente la misma área de conducta que otras
que llevan el mismo nombre como pruebas de “inteligencia”.
Interesante el tema ¿verdad? Le invito entonces a continuar con la siguiente actividad:

Explique según la APA (1999) como define a la validez.
Avancemos con el siguiente contenido donde es preciso comprender las fuentes de evidencia internas
y externas de la validez, estudiémoslas entonces:
4.2. Fuentes de evidencia de validez
Existen dos tipos de evidencia de validez: internas y externas. Las internas se clasifican así:
Las fuentes externas de validez pueden ser las medidas de algún criterio que el test intenta predecir,
así como las puntuaciones de otros test que miden constructos semejantes o parecidos. Veamos.
Revisemos ahora otras categorías relevantes, para la fuente de evidencia de validez:

Es tiempo de comprehender estas fuentes de evidencia y conocer cada una de ellas, recuerde que la
evidencia relacionada con las consecuencias de aplicación de test solo es relevante para la validez
cuando se relaciona con alguna fuente de invalidez. Tras esta argumentación, le invito a revisar en su
texto básico, las páginas 104 a la 125, para profundizar en las fuentes de validez.
4.3. Utilidad de los test en contextos de clasificación
Iniciemos el tema reflexionando: el coeficiente de correlación entre una variable predictoria y un

criterio externo es un estadístico necesario pero insuficiente cuando se trata de determinar el valor
práctico de un test como herramienta para la toma de decisiones en situaciones que demandan la
clasificación de las personas.
Existen cuatro propósitos diferentes de cómo pueden usarse los tests según Cronbach (1998):
1. Autoconocimiento
2. Clasificación
3. Evaluación de programas de intervención
4. Investigación
Revisemos las páginas 125 a la 132, para poder determinar en qué categorías de las
anteriores se encuentran los inventarios de intereses vocacionales, los test de selección
de personal… compártanos sus criterios, recuerde interactuar a través del EVA, a mayor
interacción, mayor aprendizaje.
4.4. Generalización de la validez: el metaanálisis
A continuación hablaremos del metaanálisis, ¿qué es el metaanálisis? es el método que permite integrar
y combinar los resultados de diversos estudios empíricos mediante técnicas específicas.
Este método comienza con la reunión, clasificación y codificación de las investigaciones existentes sobre
un tema. El metaanálisis se utiliza más frecuentemente para generalizar la evidencia predictiva de un
test en relación con un criterio. Existen algunos criterios y cuestionamiento al metaanálisis, que le invito
a profundizar.
Hemos concluido la unidad y es momento de verificar los aprendizajes que constituyen la base de
nuestro estudio. Por ello le sugerimos desarrollar la autoevaluación, de manera que lo que aún no esté
suficientemente interiorizado, lo retome para que todo quede comprendido.

Autoevaluación 4
1. ( ) Una crítica que se hace al metaanálisis atañe a los sesgos de publicación.
2. ( ) Una tasa básica, se refiere a la frecuencia (expresada en porcentaje) de una condición

patológica de una población determinada.
3. ( ) La clasificación facilitada sirve primordialmente al individuo, y solo marginalmente a

las instituciones.
4. ( ) Al construir un test se deben comparar los puntajes obtenidos, tanto con otros test
elaborados para medir el mismo atributo, como los diseñados para medir otros
atributos.
5. ( ) Las evidencias relacionadas con la estructura interna de un test indican si las relaciones
entre los ítems y las dimensiones permiten confirmar la existencia de los constructos
que el test pretende medir.
6. ( ) Las fuentes externas de evidencia se relacionan con el test y sus componentes (ítems)
en sí mismos.
7. ( ) Si alguna dimensión del constructo esta escasamente representada por el contenido

del test se denomina varianza irrelevante de constructo.
8. ( ) El concepto de validez es uno de los más complejos y controvertidos de la teoría de

los test.
9. ( ) No debe confiarse exclusivamente en el juicio de expertos para evaluar la calidad y

pertinencia de los ítems.
10. ( ) Es necesario verificar que estadísticamente los ítems se agrupan del modo que se
predice teóricamente, y para esa finalidad el procedimiento ideal es el análisis
factorial.

Ir a solucionario

UNIDAD 5: INTERPRETACIÓN DE LAS PUNTUACIONES
5.1. Interpretación referida a normas
Esta es la última unidad del primer bimestre, en la que hablaremos de la interpretación referida a normas.
En esta unidad comprenderemos que un test está formado por varios ítems, ante los cuales el individuo
debe emitir sus respuestas.
Para empezar el estudio de este contenido le sugiero realice una lectura de la temática
(páginas 137–159), efectúe un resumen del contenido.
Analicemos lo siguiente:
Por lo tanto el producto final de los procesos de estandarización son los baremos de un test, que han sido
definidos como tablas de equivalencia entre puntuaciones originarias y transformadas que permiten la
comparación de resultados individuales con los de un grupo de referencia.
En el siguiente esquema observaremos algunos criterios de estandarización de un test:

Responda: ¿qué criterios debe considerar en la construcción de baremos de un test? ¿Por qué se deben
actualizar los baremos?
Para responder a estas interrogantes, remítase al texto básico, lea comprensivamente la

temática que hace relación a muestra de estandarización (páginas 139–142).
Es necesario que usted señor estudiante, asimile estos conocimientos para que los considere al momento
de la muestras de estandarización, las cuales que en algunas ocasiones usted tendrá que decidir si
construye sus propias normas o emplea baremos elaborados por otro investigador.
¿Qué le pareció la lectura?, ¿interesante verdad? Con los conocimientos adquiridos, es hora de llevarlos
a la práctica.
• ¿Qué expresan los percentiles?

• ¿Qué es la distribución normal? ¿Cómo se representa?
Ahora, es necesario comprender otros métodos de interpretación de puntuaciones ¡Adelante!
5.2. Otros métodos de interpretación de puntuaciones
Existen otros métodos de, interpretación de puntuaciones, establezca las diferencias entre las
puntuaciones ipsativas y la interpretación referida a criterio.
Las puntuaciones ipsativas se obtienen en test que utilizan un formato de ítems de elección forzada,
donde el examinado debe seleccionar una opción de respuestas entre varias alternativas.
En la interpretación referida a criterio consiste en comparar las puntuaciones con un criterio de logro
u objetivo a alcanzar, previamente especificado.
En el texto básico página 155-159, realice una lectura comprensiva,

lo que le permitirá profundizar en este contenido.
¡Excelente! Falta poco para terminar el primer bimestre, resuelva la autoevaluación y lo habrá conseguido.

Autoevaluación 5
1. ( ) Los baremos son normas establecidas para evaluar los méritos personales (según la el
diccionario de la Real Academia Española).
2. ( ) Los baremos son producto de un proceso de muestreo técnicamente riguroso.
3. ( ) Sin recursos humanos y económicos considerables es muy dificultoso construir

baremos regionales y nacionales.
4. ( ) Es necesaria la actualización periódica de los baremos.
5. ( ) La media y la desviación estándar son preestablecidas con la finalidad de facilitar la

comprensión con otros test que miden un diferente constructo.
6. ( ) Las transformaciones no lineales, a diferencia de las lineales, asumen una distribución

a priori que altera la forma de distribución de los puntajes originales.
7. ( ) Los percentiles expresan el porcentaje de personas, en un grupo de referencia, que

queda por debajo de una puntuación original determinada.
8. ( ) En la actualidad, los cálculos requeridos para construir baremos se realizan por

medio de programas estadísticos computarizados.
9. ( ) Las puntuaciones finales de una escala ipsativa, expresan un perfil de los “puntos”
fuertes y débiles de un individuo sin compararlo con un grupo de referencia.
10. ( ) Los test referidos a normas sugieren más bien cuánto han aprendido los individuos, y
esclarecen adecuadamente qué han aprendido.
Apreciado profesional en formación, hemos culminado el estudio de contenidos del primer bimestre.
Empiece a prepararse para la prueba presencial.
Ir a solucionario

SEGUNDO BIMESTRE Guía didáctica: Psicometría
SEGUNDO BIMESTRE
6.5. Competencias Genéricas
• Habilidad para trabajar en forma autónoma.
• Habilidad para buscar, procesar y analizar información procedente de fuentes diversas.
• Capacidad de aplicar los conocimientos.
• Capacidad crítica y autocrítica.
• Capacidad de investigación.
• Capacidad para identificar, plantear y resolver problemas.

Guía didáctica: Psicometría SEGUNDO BIMESTRE
6.6. Planificación para el trabajo del alumno
CRONOGRAMA
ORIENTATIVO
(Tiempo estimado)
• Dominar los Parte 3: • Leer con atención Semana 9, 10, 11
fundamentos Ejemplifica test Unidad 6: los contenidos de la 18 horas de autoestudio
históricos, psicológicos CONSTRUCCIÓN DE unidad 6 que están y 12 horas de
biológicos y sociales desarrollados en interacción (EVA).
de la psicología para LOS TEST esta guía didáctica.
Identifica las
cimentar el ejercicio características para
6.1 Definición del • Analizar los
profesional. el diseño de test
dominio ejemplos
psicológicos. propuestos sobre la
6.2.Redacción de los
ítems construcción de los
6.3. Revisión de test.
expertos • Analizar las teorías
6.4. Análisis factorial y propuestas para la
de los ítems redacción de los
ítems.
• Revisar el
documento sobre
la revisión de
expertos.
• Resolver la
autoevaluación 6
• Iniciar el desarrollo
• Ser capaz de de la evaluación a
identificar distancia.
diferencias, Adapta test a su cultura Unidad 7: • Leer con atención Semana 12-13
problemas y ADAPTACIÓN DE TEST los contenidos de la 16 horas de autoestudio
necesidades a nivel A OTRAS CULTURAS unidad 7 que están y 8 horas de interacción
individual desarrollados en (EVA).
7.1. Por qué adaptar test esta guía didáctica.
7.2. Fuentes de sesgo. • Elaborar una síntesis
7.3. Influencia del de cómo influye el
lenguaje. lenguaje del test en
7.4. Métodos de la cultura.
adaptación
• Explicar con
argumentos lo que
el alumno lograría
con la adaptación
de test a su cultura.
• Ser capaz de
describir y • Resolver la
medir variables autoevaluación 7.
(personalidad,
• Seguir el desarrollo
inteligencia y
de la evaluación a
otras aptitudes,
distancia.
actitudes, etc.) y
procesos cognitivos,
emocionales,
psicobiológicos y
conductuales.

CRONOGRAMA
ORIENTATIVO
(Tiempo estimado)
Analizar las teorías de Unidada 8: • Estudiar Semana 14
los ítems. TEORÍAS DE LOS ÍTEMS atentamente los 8 horas de autoestudio
contenidos de la y 4 horas de interacción
8.1. Teorías clásicas de unidad. (EVA).
los test. • Elaborar un
8.2. Teoría de respuesta resumen sobre la
al ítem teoría de los ítems.
• Identificar las
características de
cada teoría.
• Desarrollar la
autoevaluación 8.
• Avanzar con el
desarrollo de
la evaluación a
distancia.
Unidades 6, 7, 8 Nueva revisión de Semana 15 y 16
contenidos del 12 horas de autoestudio
bimestre, de las y 8 horas de interacción
autoevaluaciones y de (EVA).
la evaluación a distancia
como preparación para
la evaluación presencial
correspondiente al
segundo bimestre.

6.7. Orientaciones específicas para el aprendizaje por competencias
Apreciado estudiante, espero que después de conocer su calificación, realice una autoevaluación
personal y de la materia, con la finalidad de proceder a fortalecer los aspectos que más nos han ayudado
y mejorar aquellos que nos resultaron difíciles. Recuerde organizar su tiempo y ser disciplinado.
Con energía renovada, empezamos con el análisis de la unidad seis, la misma que hace referencia a
como construir test psicológicos.
UNIDAD 6: CONSTRUCCIÓN DE LOS TEST
Empecemos el tema manifestando que existen algunos modelos para la construcción de test. Es
necesario considerar que los diversos tipos de test utilizan procedimientos de construcción que difieren
en algunos aspectos.
En general el procedimiento estándar que se usa para construir cualquier test comprende los siguientes
pasos, observemos el esquema:
Lo más importante es la redacción de los ítems del test, a la hora de construir un cuestionario, uno de
los primeros pasos es precisamente elaborar los ítems. Si se falla a este nivel sobran los siguientes pasos.
No existen unas reglas fijas que puedan ser aplicadas automáticamente a la hora de generar ítems; sí se
pueden dar algunas recomendaciones que ayuden a evitar los errores más frecuentes:

a) A cada pregunta debe corresponderle una sola respuesta. Las preguntas no deben formularse de
forma ambigua o dando lugar a varias respuestas válidas.
b) El contenido de la pregunta debe ser oportuno y referirse sólo al objeto de nuestro estudio y a la
variable concreta que queremos investigar.
c) Las preguntas deberán formularse con precisión debiendo tener controlado el tipo de respuesta.
Cada uno de los ítems o preguntas debe evaluar un solo aspecto o dimensión. Es conveniente que
no excedan de quince palabras.
Las preguntas pueden clasificarse en abiertas y cerradas. Son dos tipos de pregunta en las que lo que se
indaga tiene que ver con la libertad de respuesta deseada.
La elaboración de las pruebas es un tema complejo que implica la aplicación de principios establecidos;
la obtención de una buena prueba no es una cuestión fortuita sino la respuesta a diversos interrogantes
como los que se describen a continuación:
• ¿Qué es lo que la prueba medirá según su diseño?

• ¿Cuál es el objetivo de la prueba?
• ¿Existe necesidad de esta prueba?
• ¿Quién usará esta prueba?
• ¿Qué contenido abarcará esta prueba?
• ¿Cómo se aplicará la prueba?
• ¿Cuál es el formato ideal de la prueba?
• ¿Debería elaborarse más de una forma de la prueba?
• ¿Qué capacitación especial se requerirá de los administradores de la prueba para aplicarla o
interpretarla?
• ¿Qué clases de respuestas se requerirán de quienes respondan la prueba?
• ¿Cómo se interpretarán los resultados de la prueba?
En conclusión podemos decir que para elaborar un test se necesita un grupo interdisciplinario, o por
lo menos de varios especialistas en el tema. Una vez que la prueba está elaborada, hay que validarla,
es decir, probarla con grupos de control para asegurarnos de que realmente mida lo que pretende
medir, que sus resultados sean confiables, la validación lleva tiempo y se hacen numerosas pruebas de
confiabilidad.
Espero que esta breve explicación le haya permitido visualizar lo esencial del tema. Seguramente que sí.
Sin embargo, usted puede ampliar sus conocimientos consultando la bibliografía que esté a su alcance.
6.1. Definición del dominio
Iniciemos el tema recordando que en la construcción de un test requiere, en primer lugar, un exhaustivo
análisis conceptual del dominio o constructo a medir, lo que implica la selección y revisión de las teorías
más relevantes, rigurosas, contemporáneas, en relación con el constructo que se pretende medir.
Preguntémonos ¿Qué significa, que todas las dimensiones del constructo deben incluirse?
Siguiendo a Tornimbeni et al. (2004) la construcción de una escala de medición de algún aspecto del
comportamiento humano requiere previamente un exhaustivo análisis conceptual del dominio o rasgo
a medir. Para estos autores se debe obtener definiciones conceptuales ajustadas del rasgo en cuestión
y decidir cuál tipo de indicadores operacionales son adecuados para describirlo. Todas las dimensiones

importantes del rasgo estudiado deben incluirse. Si se trata de una prueba para medir “rendimiento”, la
definición del dominio puede realizarse delimitando el universo de situaciones a ser evaluadas. Así por
ejemplo, en el caso de un examen de Estadística, el universo abarcaría los objetivos y contenidos del
programa de la asignatura. En la medición del rendimiento se pueden utilizar pruebas referidas a criterios
o referidas a normas. Los procedimientos de construcción de las pruebas referidas a criterios difieren
de aquellos usados tradicionalmente en las pruebas de rendimiento. Para la elaboración de pruebas
por normas, se parte de la construcción de una tabla de especificaciones que es una tabla de doble
entrada por medio de la cual se relacionan los objetivos cuyo logro se desea evaluar con los contenidos
específicos correspondientes. A partir de esta tabla se determina la cantidad de ítems que conformará la
prueba y se lleva a cabo su redacción.
En la construcción de una prueba con referencia a criterios, en cambio, no se realiza una tabla de
especificaciones, sino que se define y delimita el dominio de conductas correspondientes a cada objetivo.
Siguiendo dicha definición se elaboran los ítems que evaluarán ese dominio de conductas y todos los
desempeños individuales serán referidos a ese dominio. Tal como lo establece Pophan (1975) citado por
Tornimbeni et al.(2004) por dominio debe entenderse “el conjunto de conductas que debería exhibir el
alumno en relación con un objetivo dado, si este ha sido alcanzado”. Es decir, todas aquellas tareas que
el alumno debería poder realizar si el objetivo ha sido logrado. Para Hambleton y Rogers (1991) citados
por los mismos autores, el “dominio” puede ser de conductas, objetivos, destrezas y competencias y
la amplitud del dominio varía en función de la finalidad del test. Si el dominio comprende más de un
objetivo pueden construirse subtest para cada objetivo, y se evalúa el rendimiento de los sujetos en
cada uno de ellos. Para la especificación del dominio de conductas o clase de tareas que el individuo
debe realizar, seguiremos el esquema propuesto por Tornimbeni et al (2004) que proponen:
i. Definición del objetivo: se establece cuál o cuáles serán los objetivos que se evaluarán
a través de la prueba, por ejemplo, la habilidad de “comprensión”, que incluye
aquellas conductas o respuestas que se refieren únicamente a una comprensión de
los mensajes literales contenidos en la comunicación.
ii. Descripción del objetivo: se define en términos de conductas observables el o los

objetivos a ser evaluados. En el ejemplo anterior se especificaría un objetivo de la
habilidad de comprensión tal como “ser capaz de analizar el propósito del autor y su
punto de vista examinando una comunicación escrita”.
iii. Especificación de las características de la situación de evaluación: se especifican todos

aquellos aspectos a tener en cuenta en la situación de evaluación, por ejemplo, en un
texto de divulgación científica, seleccionar el párrafo e identificar la oración donde se
expresa la intención del autor.
iv. Características de la respuesta: se especifica cuál es la respuesta que se espera

del sujeto, en este caso, que seleccione de manera correcta el párrafo y la oración
correspondiente.

Complete la siguiente tabla en relación, a los criterios que se debe considerar para la construcción de
las siguientes pruebas:
Criterios de dominio
Pruebas
Habilidades para el estudio.
Escala de autoeficacia para el

manejo de peso corporal.
Test de medición de
rendimiento de un dominio
específico.
Es tiempo de revisar la definición de dominio y establecer los criterios de

dominio para comprender a mayor profundidad la temática. (Analizar
página 162-163 del texto básico).
En conclusión, existen varios procedimientos recomendados para la especificidad del dominio de

conductas o clase de tareas que el individuo debe realizar. En general:
1. Definición del objetivo.

2. Indicadores operacionales del objetivo.
3. Especificación de las características de la situación de evaluación.
4. Características de la respuesta.
Espero que esta explicación haya sido de su agrado y además le permita tener una idea general del tema.
1. Además de definir el dominio, se debe establecer también aspectos suplementarios. Si o No ¿Por

qué?
Continuemos en el estudio del siguiente tema, que hace relación a la construcción de ítems, para los test.

6.2. Redacción de los ítems
Es vital apreciado estudiante establecer pautas para la redacción de ítems de test, a continuación en el
siguiente esquema, le presento algunas de ellas:
Según lo afirman Tornimbeni et al. (2004) existen pautas convencionales para la redacción de ítems
de prueba. Estas incluyen recomendaciones tales como: redactar ítems congruentes con el objetivo
de medición y evitar los ítems demasiado largos (de más de 20 vocablos), las oraciones complejas con
ambigüedades de sentido, las frases con dobles negaciones, el uso de expresiones extremas (nunca,
siempre, todos) y utilizar el lenguaje más apropiado al nivel de maduración y educativo de la población
(Osterlind, 1990). Para Nunnally (1991) los dos errores más comunes en la redacción de ítems son: a)
ambigüedad (preguntas difusas que admiten varias respuestas) y b) trivialidad (centrarse en aspectos
poco importantes del rasgo o dominio en cuestión).
Existen formatos de selección de respuesta y de construcción de respuesta, los primeros facilitan la

calificación automatizada y pueden aplicarse con facilidad a gran cantidad de evaluados. El formato de
selección de respuesta en presentar una elección de respuestas y requerir la selección de una alternativa.
Existen tres tipos: los ítems de opción múltiple, los ítems de relación y los ítems de verdadero/falso. Un
reactivo de opción múltiple consta de tres elementos un enunciado o base del ítem, una alternativa u
opción correcta o clave y varias alternativas u opciones incorrectas llamadas distractores.
Después de analizar la redacción de ítems (página 164-168), es importante

que usted considere las recomendaciones con referencia al enunciado o base
del ítem, con referencia a las alternativas de respuesta.
Es necesario en este momento construya 20 ítems, para determinar depresión

en adolescentes.
6.3. Revisión de expertos
Iniciemos el tema afirmando que es trascendente que los ítems preliminares sean revisados por jueces
expertos. Tal como lo explica Tornimbeni et al. (2004), la mayoría de los autores recomiendan que los
ítems preliminares de un test sean revisados por expertos en construcción de pruebas, en el dominio
o rasgo a medir y en el nivel de comprensión de la población a la cual se apunta con la prueba.
Las tres características que los expertos deben evaluar en cada ítem son:

a) Claridad semántica y corrección gramatical.
b) Adecuación de su dificultad al nivel educativo y evolutivo de las personas.
c) Congruencia con el rasgo o dominio medido.
Este último ítem es el principal parámetro y se refiere al grado de consistencia que debe existir entre
un ítem particular y las metas esenciales de la prueba dado que esto será un factor posterior de
confiabilidad y validez (Oesterlind, 1990). A los jueces se les pide que evalúen la calidad y consistencia
de los ítems y se descartan aquellos con puntuaciones medias más bajas y con escaso grado de
acuerdo, respectivamente. Se recomienda que los ítems seleccionados sean aquellos en que, al menos,
un 60% de los jueces coinciden (Herrera Rojas, 1993). Es útil también incluir preguntas que demanden
información cualitativa sobre los ítems lo que puede facilitar un mejoramiento en el fracaso de algunos
de ellos.
Interesante sería, su usted pudiera visitar a un profesional de la psicología y pida sean evaluadas sus
preguntas en relación a la construcción de un test por ejemplo para medir depresión, en relación a
estos tres parámetros:
Parámetros Valoración
Claridad semántica y corrección

gramatical.
Adecuación del nivel de comprensión

de la población meta.
Congruencia con el constructo o

dominio especifico.
6.4. Análisis factorial y de los ítems
Ahora nos compete conocer procedimientos esenciales y recomendables para construir escalas
confiables y con significado teórico, uno de ellos es el análisis factorial:
a) Análisis factorial
El Análisis factorial, es una técnica estadística avanzada que permite reducir las variables que representan
un constructo específico y que luego utiliza las calificaciones de factores como variables dependientes.
Spearman (1923) fue el primero en aplicar la técnica del análisis factorial para investigar la estructura de
la inteligencia y también para identificar las diferencias individuales a través de los tests de inteligencia.
A partir de la aplicación del análisis factorial.
El análisis factorial es un método basado, por un lado, en el concepto de coeficiente de correlación

de Pearson y, por otro, en el de unidad funcional, constituye en esencia un análisis algebraico de las
covariaciones cuya finalidad es poner al descubierto el orden y la relación en que estas covariaciones
impliquen. La validación de un test se puede realizar con este método a partir de datos exclusivamente
experimentales.

El análisis factorial es además el único método que ha permitido construir, desde la perspectiva
experimental, lo que es la psicología de las aptitudes.
El test que mide constructos psicológicos (aptitudes, rasgos de personalidad,

intereses, actitudes) el procedimiento esencial y recomendable para construir
escalas confiables y con significados teóricos es el análisis factorial.
El análisis factorial es un método para agrupar las variables (ítems por

ejemplo) que se correlacionan fuertemente entre sí, y cuyas correlaciones
con las variables de otros agrupamientos (factores) es menor.
A continuación, le presento un esquema de cómo se realiza un análisis factorial:
Elaboración: Richard Ruiz.

Fuente: Introducción a la psicometría.
Espero que esta explicación haya sido de su agrado y además le permita tener una idea general del tema.

Tras la revisión del texto básico (páginas 169–184) le sugerimos realice las siguientes actividades:
1. Consulte otras definiciones de análisis factorial.
2. ¿Qué decisiones estratégicas deben tomarse durante el desarrollo de un análisis factorial?
3. ¿Cuál es la diferencia entre análisis factorial exploratorio y análisis confirmatorio?
4. En su cuaderno de apuntes, explique detenidamente cada uno de los pasos del análisis factorial
exploratorio.
a) Análisis de ítems
En relación al análisis de los ítems, podemos afirmar que es el procedimiento más empleado en el
análisis de ítems, es la correlación de cada ítem con el puntaje total de la prueba.
La capacidad discriminativa de un
ítem se refiere al grado en que este
diferencia adecuadamente entre los
examinados con relación al rasgo o
dominio que el test pretende medir
(Anastasi y Urbina 1998).
Hemos finalizado esta unidad, no dude en preguntar. Repase las páginas 185–190.
Seguramente estas ideas contribuyeron a la comprensión del tema, entonces es hora de afirmar los
conocimientos hasta aquí adquiridos a través del desarrollo de la autoevaluación. ¡Hágalo por favor!

Autoevaluación 6
1. ( ) Además de definir el dominio del test, es necesario delimitar aspectos complementarios

del tests, tales como la finalidad y la población meta de test.
2. ( ) En la redacción de ítems de test, se debe utilizar frases con doble negación.
3. ( ) Con referencia a las alternativas de respuesta, en cuanto al formato, se deberá evitar

que la alternativa correcta sea la más larga.
4. ( ) Es conveniente que los jueces expertos, tengan experiencia en la población a la cual

se dirige el test.
5. ( ) El análisis factorial es una técnica de reducción de datos, cuyo objetivo principal es

agrupar un conjunto de variables en pocas dimensiones que expliquen la mayor
variabilidad de respuesta.
6. ( ) En el análisis factorial exploratorio la estructura factorial se define a priori sobre la

base de un modelo teórico.
7. ( ) Cuando se trata de muestras muy pequeñas, se recomienda conducir un análisis

factorial diferenciado para cada sexo.
8. ( ) Luego de administrar el test a la muestra de investigación, y antes de emprender

el análisis factorial, debe determinarse si los ítems están suficientemente
interrelacionados para que este método pueda aplicarse provechosamente.
9. ( ) La extracción del número incorrecto de factores es una de las decisiones más

problemáticas del análisis factorial.
10. ( ) El resultado inicial del análisis factorial (antes de la rotación) es una matriz factorial, es
decir, la matriz de correlaciones de las variables de los factores.

Ir a solucionario

UNIDAD 7: ADAPTACIÓN DE TEST A OTRAS CULTURAS
Ahora corresponde estudiar la adaptación de test a otras culturas, sobre todo a la nuestra.
Actualmente se reconoce que la adaptación de un test es un proceso mucho más complejo que la
mera traducción de ese test en un idioma diferente. Una adaptación implica considerar no solo las
palabras utilizadas al traducir la prueba sino también las variables culturales involucradas.
7.1. ¿Por qué adaptar test?
La utilización de test psicológicos creados en otros contextos culturales es una práctica habitual en todo
el mundo.
El uso de un test en un contexto cultural diferente genera diversas dificultades. El idioma, la familiaridad
con los estímulos del test (ítems) y las diferentes características de las muestras de estandarización son
ejemplos de fuentes de posibles sesgos en la mediación transcultural de constructos psicológicos.
La equivalencia se manifiesta
cuando las puntuaciones de un
test reflejan diferencias entre las
personas evaluadas que existen
verdaderamente en el rasgo en
cuestión.
Los constructores/editores de test deberían de asegurarse que el proceso de adaptación

tiene en cuenta las diferencias lingüísticas y culturales entre las poblaciones a las que se
dirigen las versiones adaptadas de los test.
Los constructores/editores de los test deberían proporcionar datos que garanticen que el lenguaje
utilizado en las instrucciones, en los propios ítems y en el manual del test, son apropiados para todas la
poblaciones culturales e idiomáticas a las que va dirigido el test.
Los constructores/editores de test deberían aportar evidencia de que las técnicas de evaluación elegidas,
los formatos de los ítems, las reglas de los test y los procedimientos son familiares a todas las poblaciones
a las que van dirigidos.
Los constructores/editores de test deberían facilitar evidencia de que el contenido de los ítems y los
materiales de los estímulos son familiares a todas las poblaciones a las que van dirigidos.

Los constructores/editores de test deberían aportar una justificación racional sistemática, tanto
lingüística como psicológica, para mejorar la precisión del proceso de adaptación, así como reunir datos
acerca de la equivalencia de todas las versiones en los distintos idiomas.
Los constructores/editores de test deberían asegurarse que el diseño de recogida de datos permita el
uso de técnicas estadísticas apropiadas para establecer la equivalencia entre los ítems correspondientes
a las diferentes versiones idiomáticas del test.
Los constructores/editores de test deberían aplicar técnicas estadísticas apropiadas para 1) establecer
la equivalencia entre las diferentes versiones de un test, y 2) identificar componentes problemáticos o
aspectos del test que puedan ser inadecuados para alguna de las poblaciones a las que va destinado el
test.
Los constructores/editores de test deberían proporcionar información sobre la evaluación de la validez

en todas las poblaciones objetivo a las que va dirigido el test adaptado.
Los constructores/editores de test deberían aportar datos estadísticos sobre la equivalencia de los test
para todas las poblaciones a las que van dirigidos.
No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a diferentes poblaciones
cuando se prepara una escala común, o cuando se comparan estas poblaciones.
Sin embargo, pueden ser útiles para reforzar la validez de contenido de las puntuaciones de cada
población por separado.
7.2. Fuentes de sesgo
Si deseamos usar las pruebas para predecir resultados en alguna situación futura como por ejemplo en
el desempeño de un aspirante a la universidad, necesitamos instrumentos con alta validez predictiva
del criterio particular. Este requisito suele descuidarse en el desarrollo de las llamadas “pruebas libres de
influencia cultural”. En un esfuerzo por incluir en esas pruebas solo las funciones comunes a diferentes
culturas o subculturas, puede elegirse un contenido que tenga poca relevancia para el criterio que se
pretenda predecir. Una mejor solución es elegir un contenido relevante para el criterio e investigar luego
las posibles diferencias poblacionales de la efectividad de la prueba para el propósito pretendido.
Desde mediados de la década de los setenta se ha observado una rápida acumulación de investigaciones
sobre problemas de sesgo de la prueba. En este contexto, el término “sesgo” se emplea en su bien
establecido sentido estadístico, para desganar un error constante o sistemático en contraste con uno
que se debe al azar. Las principales preguntas que se han planteado con respecto al sesgo de la prueba
tiene que ver con el coeficiente de validez (sesgo de la pendiente) y la relación entre las medias del
grupo en la prueba y en el criterio (sesgo de intersección). Si una prueba produce un coeficiente de
validez significativamente diferente en dos grupos, la diferencia se describe como sesgo de la pendiente
y esta clase de diferencia entre grupos se conoce como “validez diferencial”. Una prueba exhibe sesgo
de intersección si sistemáticamente subpredice o sobrepredice una ejecución del criterio para un grupo
particular.
El problema del sesgo de la intersección se relaciona más con lo que ha sido llamado equidad de la
prueba”. Aunque los términos “equidad” y “sesgo” de la prueba a veces se usan indistintamente para
cubrir todos los aspectos del uso del instrumento con minorías culturales.

Gradualmente empezó a cambiar el interés de la investigación en la evaluación del sesgo de las pruebas
al diseño de estrategias de selección para su uso justo con minorías culturales. Entre las metas por
reconciliar están las de proporcionar iguales oportunidades a todos los individuos, elevar al máximo la
tasa del éxito y la productividad, incrementar la mezcla demográfica y la representatividad y extender el
tratamiento preferencial a grupos desfavorecidos por inequidades anteriores.
Para continuar con este tema, conviene explicar que existen diferentes fuentes de sesgo, entre ellas
tenemos:
Elaboración: Mg. Richard Ruiz O.

Fuente: Tornimbeni, Silva y otros (2008) Introducción a la Psicometría.
Sesgo de constructo:
Este tipo de sesgo se da “cuando el constructo medido no es idéntico a través de los grupos culturales...”
( p.p. 264, Van de Vijver y Tanzer, 1997). La importancia que cada cultura otorga a ciertas conductas
se encuentra en esta categoría. Conductas de ética y civismo que en algunas sociedades pueden
ser normales en otras pueden constituir un verdadero rasgo de rigidez y asemejarse a una conducta
obsesivo compulsivo.
Sesgo metodológico: este sesgo reconoce tres formas.
El sesgo de muestra: que se da cuando las muestras son incomparables entre sí. La cantidad de años de
escolaridad que poseen los sujetos de una muestra es una variable determinante en el desempeño del
mismo en un test determinado, especialmente si se trata de un test de habilidad. El nivel sociocultural,
la motivación, la composición por género y edad de los sujetos son otras variables que pueden hacer
incomparables a dos muestras que pueden mostrar resultados muy diferentes en un test determinado.
El sesgo en el instrumento: que puede provenir de las características del instrumento. La familiaridad
que los sujetos tienen con los estímulos presentados tiene una gran importancia. Algunos estímulos
tales como objetos, dibujos, figuras u otros elementos utilizados en algunas culturas no existen en otras
o son irrelevantes. El ítem de ejemplo en el Subtest de ordenamiento de lámina WISC III que muestra
a una mujer frente a una máquina expendedora de latas de gaseosa tiene muy poco valor en culturas
árabes, por ejemplo, o en zonas rurales de nuestro país. El idioma es otra fuente de sesgo de instrumento.

El sesgo de administración: incluye problemas tales como dificultades en la comunicación, es decir,

dificultades para que el entrevistado entienda las instrucciones del entrevistador ya sea por la dificultad
de las palabras utilizadas, el modo de explicación de las instrucciones o un inadecuado manejo del
idioma de alguna de las partes. También se incluyen las alteraciones en la manera de administrar las
pruebas. Normalmente los manuales incluyen instrucciones de administración que en muchos casos
no son adecuadas para la población a aplicar. Los administradores del test entonces adaptan esas
instrucciones según su criterio personal. Otro punto importante es el uso de cronómetros que produce
serias alteraciones en los resultados.
Sesgo de ítem: se produce cuando el mismo tiene diferentes significados en distintas culturas. Ciertos
grupos culturales pueden obtener puntajes significativamente distintos en un ítem determinado a
pesar de obtener un puntaje total similar. La deseabilidad social o la relevancia cultural, entre otros
factores, pueden producir el sesgo de ítem. Tanzer ( 1995) demostró que aunque la estructura factorial
de un test de autoconcepto académico era similar cuando se lo aplicó a estudiantes australianos y
singaporeanos, existían diferencias sustanciales entre estas muestras cuando se compararon algunos
ítem específicamente. Este tipo de sesgos también actúa en test neuropsicológicos.
Discrimine las diferencias existentes entre los tipos de sesgos. Remítase a su texto básico páginas 193 a
la 196 del texto básico.
7.3. Influencia del lenguaje
En este aspecto conviene recordar que el lenguaje es otro factor que afecta el desempeño en la
evaluación transcultural que utiliza test psicológicos.
El idioma puede producir diferencias en el rendimiento de un test determinado y por lo tanto es inconveniente
utilizar baremos extranjeros.
Explique: ¿cómo el lenguaje afecta el desempeño de los test?
7.4. Métodos de adaptación
Actualmente se reconoce que la adaptación de un test es un proceso mucho más complejo que la mera
traducción a un idioma diferente.

Remítase a las páginas 197 a la 205 del texto básico, para comprender, los niveles de adaptación de
pruebas psicológicas.
Explique cada uno de los niveles de adaptación de las pruebas psicológicas.
La Comisión Internacional de Test establece algunas pautas para adaptar un test de una cultura a otra,
entre las cuales tenemos en el siguiente esquema:
Elaboración: Mg. Richard Ruiz O.

Fuente: Tornimbeni, Silva y otros (2008) Introducción a la Psicometría.
Bien, hemos concluido la unidad y por lo tanto, ha llegado el momento de verificar los
aprendizajes. Le recuerdo que aunque las autoevaluaciones no deben ser enviadas a la
Universidad ni son objeto de calificación usted debe desarrollarlas, pues serán de gran
beneficio en el refuerzo de sus conocimientos.

Autoevaluación 7
1. ( ) Existe sesgo en la medición, cuando las diferencias individuales en las mediciones de

un test reflejan las diferencias reales en un rasgo o habilidad.
2. ( ) La existencia de un sesgo en un test, puede conducir a obtener resultados gravemente

erróneos.
3. ( ) El sesgo de constructo se presenta “cuando el constructo medido es idéntico en

diferentes grupos culturales”.
4. ( ) El sesgo, ocurre cuando las muestras son incomparables entre sí.
5. ( ) El sesgo en el instrumento puede provenir de las características del test.
6. ( ) El idioma es otra fuente de sesgo del instrumento.
7. ( ) El sesgo de administración incluye los problemas de comunicación, es decir,

dificultades para que el entrevistado entienda las instrucciones del examinador.
8. ( ) El sesgo de ítem se genera cuando este último posee diferentes significados en

culturas consideradas.
9. ( ) La deseabilidad social o la relevancia cultural, entre otros factores, puede producir el

sesgo de ítem.
10. ( ) En relación a los niveles de adaptación de las pruebas psicológicas, la adaptación,

corresponde a la simple traducción de un test asumiendo a priori la equivalencia del
constructo.
11. ( ) En la opción de ensamble el instrumento original se modifica tan profundamente que

prácticamente se transforma en un nuevo test.
12. ( ) Una vez traducido adecuadamente el test, es necesario establecer si esta versión
traducida es equivalente a la original. Para ello se requiere un diseño experimental y
el análisis de los datos obtenidos a través de ese diseño.
13. ( ) En la administración del test original y traducido a individuos bilingües se les

administra ambas versiones del test (la original y la traducida al nuevo idioma) a
personas que hablen ambos idiomas.
14. ( ) La utilización de test psicológicos creados en otros contextos culturales es una

práctica habitual en todo el mundo.
15. ( ) Estados Unidos, es el país en el que se producen la mayoría

de los instrumentos de medición psicológica.

Ir a solucionario

UNIDAD 8: TEORIA DE LOS ÍTEMS.
Estamos en la tercera parte del texto básico, denominada teoría de los test, que abarca de las páginas
209 a la 242, por lo que le invito a realizar primero una lectura general de este contenido.
La psicometría hace uso de

los modelos formales que le
permiten lograr la estimación
de la puntuación verdadera de
un individuo en un rasgo con el
menor error posible.
Existen diversos paradigmas o modelos que permiten explicar el significado de las puntuaciones
obtenidas con los test. El análisis o modelado de las matrices de datos obtenidas da como resultado:
• La estimación del nivel en que poseen los sujetos la(s) característica(s) que mide el test (valores
escalares de los sujetos).
• La estimación de los parámetros de los ítems (valores escalares de los ítems).
El problema central de la teoría de los test es la relación que existe entre:
• el nivel del sujeto en la variable inobservable que se desea estudiar y
• su puntuación observada en el test.
Es decir el objetivo de cualquier teoría de tests es realizar inferencias sobre el nivel en que los sujetos
poseen la característica o rasgo inobservable que mide el test, a partir de las respuestas que estos han
dado a los elementos que lo forman el mismo. Así para medir o estimar las características latentes de los
sujetos es necesario relacionar estas con la actuación observable en una prueba y esta relación debe ser
adecuadamente descrita por una función matemática. Las distintas teorías de test difieren justamente
en la función que utilizan para relacionar la actuación observable en el test con el nivel del sujeto
en la variable inobservable. Y sirven para dar cuenta del error de medida inherente a toda medición
psicológica o estimación del error; y proporcionar una estimación del rasgo o característica evaluada
(estimación del rasgo).
8.1. Teorías clásicas de los test (TCT)
Estimados alumnos el modelo lineal de medición con el que se asienta la Teoría

Clásica de los test es sencilla, y satisface la mayor parte de las necesidades de los
profesionales de la medición psicológica.
La teoría clásica de los test, iniciada por Spearman, sostiene que la puntuación observable de una
persona en un test es una función de dos componentes: su puntaje verdadero (inobservable) y el
error de medición implícito en la prueba. El TCT (modelo lineal de la teoría clásica) es un modelo de
puntuación verdadera como valor esperado, esperado como concepto matemático, probabilístico. Es

decir, el puntaje verdadero de un sujeto en un test sería el promedio aritmético de las puntuaciones
empíricas obtenidas en infinitas aplicaciones (Muñiz, 2001).
La teoría clásica de los tests (TCT) es, en síntesis, el conjunto de principios teóricos y métodos cuantitativos
derivados de ellos, que fundamentan la construcción, aplicación, validación e interpretación de distintos
tipos de test y que permiten derivar escalas estandarizadas aplicables a una población (Hambleton, 1994).
Los principios en que se basa son relativamente simples y se aplican tanto a las pruebas de desempeño,
como a las de aptitud. Durante sus diferentes fases de desarrollo, se han elaborado procedimientos de
análisis cuantitativo que han sido de gran utilidad, destacándose en lo general, tres grandes etapas que
se identifican por su objeto de interés primordial, así como por los métodos cuantitativos y tipos de
análisis teóricos que utilizan.
La primera etapa que Cattell (1986) denomina itemetría, se caracteriza principalmente por la construcción
de pruebas conformadas por reactivos cuyas propiedades estadísticas eran el centro de atención
principal.
La siguiente etapa es la que Cattell (1986) denomina psicometría estructural y se caracteriza por el uso de
las nuevas herramientas estadísticas tales como el análisis factorial con sus diversas variantes técnicas,
como un medio para encontrar la “estructura natural” de las habilidades en el contexto de los factores
culturales, la dotación genética, la personalidad, los rasgos, los motivos dinámicos y las dimensiones que
dan lugar a la acción y al comportamiento. Su objetivo primordial no era como tal, aplicar pruebas, sino
determinar la relación que hay entre los conceptos clínicos sobre personalidad, y los fundamentos de la
investigación experimental multivariada (cuantitativa por naturaleza), así como analizar las interacciones
dinámicas entre los rasgos y los estadíos de la personalidad. Los test se consideraban significativos en la
medida que armonizaban con los constructos teóricos formulados conceptualmente.
La etapa funcional en el desarrollo de los test es aquella que “trasciende a las aplicaciones inmediatas
y simplistas que identificaban a las estadísticas con factores conductuales, y profundiza en las leyes y
formulaciones conceptuales del comportamiento: que relaciona rasgos, procesos y estados psicológicos
con las mediciones y estrategias estructurales” (Cattell, 1986). Ese tipo de leyes, según Cattell, se refieren
a las relaciones sistemáticas y consistentes obtenidas de los estudios empíricos sobre el desarrollo, en
el conocimiento acerca de los rasgos determinados en forma hereditaria, de los rasgos modificables
por las experiencias y el aprendizaje y de la modulación de los estados psicológicos producidos por las
relaciones psicofisiológicas. En resumen, el desarrollo de la teoría clásica de los test ha procedido de
etapas orientadas en forma pragmática para desarrollar test y validar reactivos, (donde los constructos
psicológicos teóricos se definían operacionalmente como “aquello que mide la prueba x”); hacia
etapas conceptualmente más elaboradas en que los test se derivan de teorías del comportamiento
más articuladas y donde cada reactivo tiene un significado conceptual definido en un contexto teórico
particular.
Finalmente, no obstante que el desarrollo de la teoría clásica de los test llegó, con la etapa funcional de
los test, a un punto en que la conceptualización de los resultados de los test, y consecuentemente su
proceso de desarrollo, permitían mediante sofisticados procedimientos estadísticos, sacar a los reactivos
de los límites impuestos por la prueba en su conjunto, la limitación teórica aún permanecía y se hacía
necesario un nuevo marco conceptual para salvarlo. Este nuevo esquema para la conceptualización de
los reactivos como unidades independientes del test y del grupo utilizado para normarlo, se obtuvo con
la teoría de respuesta al ítem.

1. ¿Cuál es la hipótesis fundamental de la teoría clásica?
Supuestos:
Para cada individuo, su El error es igual a la

puntuación observada puntuación observada,
es igual a la puntuación menos la verdadera.
verdadera más el error.
2. Escriba los corolarios, que se desprenden de los supuestos anteriores (revisar páginas 211-213 del
texto básico).
1.
2.
3.
4.
5.
Es necesario que usted señor estudiante realice un estudio pormenorizado del tema a fin de que se
familiarice con él y pueda aplicarlo en su ámbito profesional.
Continuemos con el análisis del siguiente contenido.
Teoría de la generalizabilidad
Cronbach y Glaser (1972) postularon la teoría de la generalizabilidad (TG) que es una extensión del
modelo clásico en el que diversas mediciones del mismo individuo pueden variar tanto por efecto de
una variación en lo que se mide como por el error de medición (Nunnally y Bernstein, 1995). En esta
teoría las decisiones sobre la bondad de un instrumento se basan en estudiar las fuentes y tipos de error,
utilizando el análisis de varianza. Cuando se mide una variable se trata de generalizar los resultados
a un dominio o universo confiable de observaciones. El puntaje del universo es semejante al puntaje
verdadero en el modelo clásico. La diferencia es que en la TCT se considera que la varianza de error es
de una sola clase y, en cambio, la TG reconoce que existen otros universos de generalización y por lo
tanto muchos puntajes de universo posibles. Solo cuando el universo se ha definido podemos afirmar
cuáles son las fuentes de variación que producen error. Las diferentes fuentes de error en esta teoría
se denominan facetas, término que introdujo Cronbach para designar cada una de las características
de la situación de medición que pueden cambiar de un momento a otro y, por tanto, hacer variar los
resultados obtenidos.

Según esta teoría los puntajes observados solo poseen interés si son representativos de todos los
puntajes posibles de un mismo universo. Población es el conjunto de personas de las que se extrae una
muestra; y universo es el conjunto de todos los ítems posibles de un constructo; y universo de condiciones
de Medición al conjunto de todas las facetas estudiadas. Las distintas fuentes de variaciones asociadas
a las facetas y a sus interacciones se estima que contribuyen a la varianza de error y disminuyen la
generalizabilidad de los puntajes observados en las personas evaluadas.
8.2. Teoría de respuesta al ítem (TRI)
Como en cualquier experimento, en los test se presenta el problema de controlar en las respuestas el
error de medida. El ajuste estadístico es la forma específica de control de error en el contexto de teoría
de respuesta al ítem. La TRI debe su nombre a que se interesa más en las propiedades de los ítems
individuales que en las propiedades globales del TCT.
La literatura sobre test registra en los últimos 30 años un desplazamiento progresivo del esquema
proporcionado por la teoría clásica de los tests, hacia el contexto y los procedimientos delineados por
la teoría de respuestas al ítem (TRI) [Del inglés: Ítem Response Theory-IRT]. Esta teoría, fue desarrollada
para resolver varios de los problemas que presentaba la TCT (Hambleton & Swaminathan, 1985) y que no
habían sido resueltos de una manera satisfactoria.
Algunos de esos problemas son:
(1) El uso de índices de los reactivos cuyos valores dependen de la población particular de la cual
fueron obtenidos, y
(2) La estimación de la habilidad del examinado depende del conjunto específico de reactivos
incluidos en la prueba.
Es decir, las características del examinado y las características de la prueba no pueden separarse en un
instrumento elaborado conforme a los principios de la teoría clásica de los tests; y por el contrario, cada
uno solo puede ser interpretado en términos del otro. Las características del examinado en las cuales
la teoría TRI está interesada, son la “habilidad” que mide el test. Para la TCT, la noción de habilidad se
expresa por medio del llamado puntaje verdadero que se define como “el valor esperado a partir de la
destreza observada en la prueba en cuestión” (Hambleton, Swaminathan, y Rogers, 1991).La habilidad
del examinado se define solo en términos de una prueba específica. Si el test es “difícil”, el examinado
parecerá tener un nivel bajo de habilidad. Si el test es “fácil”, el examinado parecerá tener un mayor nivel
de habilidad. Y el nivel de dificultad de la prueba se define como “la proporción de examinados en el
grupo de interés, que contestó el reactivo correctamente” (Hambleton, Swaminathan y Rogers, 1991).
Por lo tanto, el que un ítem sea difícil o fácil depende de la habilidad de los examinados a quienes se
aplicó la prueba y a su vez, la habilidad de los examinados depende del nivel de dificultad de la prueba.
De la misma forma, el nivel de discriminación de los reactivos y los coeficientes de validez y confiabilidad
de la prueba se definen también en base a las características del grupo particular de examinados. Así,
las características del test y de los reactivos cambian a medida que cambia el contexto de la prueba. Por
lo tanto, es muy difícil comparar examinados a quienes se aplican diferentes test; o aún, comparar ítems
cuyas características se obtuvieron utilizando diferentes grupos de examinados. Esto significa que los
coeficientes de los reactivos son dependientes del grupo al mismo tiempo que son dependientes del
test. Esta clase de dependencia es la que se trata de eliminar mediante la TRI.
Las principales características de la TRI como una alternativa a la teoría clásica de los test son:

1. Las características de los reactivos no dependen del grupo del cual fueron obtenidos;
2. Los puntajes que describen la habilidad del examinado no dependen del test en su conjunto;
3. El modelo se expresa a nivel del reactivo más que a nivel del test;
4. El modelo no requiere de pruebas paralelas para determinar el índice de confiabilidad; y
5. Provee una medida de la precisión de cada índice de habilidad.
Una de las ventajas de la construcción de los test de acuerdo a los modelos de la TRI es que se pueden
elaborar test individualizados, es decir, “a la medida” de los sujetos que permiten inferir en cada uno de
los evaluados un verdadero valor del rasgo de la manera más precisa.
Luego de la lectura le propongo reflexionar en torno a la siguiente actividad.
Realice un cuadro comparativo entre las teorías clásicas de los test y la teoría de respuesta al ítem.
Teorías clásicas de los tests Teoría de respuesta al ítem
1. Remítase a la página 222 y 223 del texto básico, y conteste: ¿cuáles son los postulados y
supuestos de la TRI?
En el apéndice del libro se nos comparte, cómo en

la actualidad se realiza análisis psicométricos en
programas computarizados, los mismos que simplifican
enormemente la realización de análisis manuales. Lea
comprensivamente el apéndice que se encuentra en las
páginas 245-267 que le será de gran utilidad. Hoy en día
existen cursos cortos sobre este tipo de programas, si le
es posible, no escatime esfuerzo alguno por inscribirse en
alguno de ellos, como el SPSS.
¡Felicitaciones! hemos culminado el estudio del contenido, ahora para finalizar proceda
a responder la autoevaluación, la misma que nos permitirá descubrir el nivel de
conocimiento adquirido.

Autoevaluación 8
1. ( ) Los errores de medición varían en torno a algún valor verdadero.
2. ( ) La puntuación verdadera de un sujeto en un test estaría dada por el promedio

aritmético de las puntuaciones empíricas obtenidas en infinitas aplicaciones.
3. ( ) La teoría clásica de los test es un modelo de puntuación verdadera como valor

esperado.
4. ( ) La teoría de generalizabilidad postula que el concepto de confiabilidad en el contexto

de la TCT es muy ilimitado, pues tiene en cuenta todas las posibles fuentes de error.
5. ( ) El análisis de varianza (ANOVA) proporciona las herramientas estadísticas para realizar

un estudio de generalizabilidad.
6. ( ) El ANOVA permite estudiar de manera simultánea el efecto de varias variables

independientes sobre una variable dependiente, así como las interacciones.
7. ( ) El ajuste estadístico es la forma específica de control de error en el contexto de teoría

de respuesta al ítem.
8. ( ) La TRI suministra un fundamentación probabilística al problema de la medición de

constructos inobservables (latentes), considerando al ítem como unidad básica de
medida en lugar del puntaje total del test como en la TCT.
9. ( ) En el dominio de la medición psicológica, el significado más adecuado de modelo es

una combinación numérica de variables para predecir una variable dependiente.
10. ( ) Se ha señalado que el modelo de Rasch es el único que conduce a una auténtica
medición en psicología.
11. ( ) Una de las ventajas de la TRI es que proporciona un marco de referencia unificado,
para interpretar los sesgos en el nivel de los ítems.
12. ( ) Las mediciones a través de test psicológicos se realizan sobre individuos en un

momento determinados de sus vidas.
13. ( ) Toda medición, cualquiera sea el campo científico en que se implemente, conlleva
errores.
14. ( ) La lectura o registro de dato no varía de un evaluador a otro.
15. ( ) La psicometría hace uso de modelos formales que le permiten lograr esa estimación
de la puntuación verdadera de un individuo en un rasgo con el menor error posible.

SOLUCIONARIO Guía didáctica: Psicometría
7. Solucionario
PRIMER BIMESTRE
UNIDAD 1
Pregunta Respuesta
1. V
2. F
3. V
4. V
5. V
6. F
7. V
8. F
9. F
10. V

Guía didáctica: Psicometría SOLUCIONARIO
UNIDAD 2
Pregunta Respuesta
1. V
2. V
3. V
4. V
5. F
6. V
7. F
8. V
9. V
10. V

UNIDAD 3
Pregunta Respuesta
1. V
2. V
3. F
4. V
5. V
6. V
7. V
8. V
9. F
10. V

UNIDAD 4
Pregunta Respuesta
1. V
2. V
3. F
4. V
5. V
6. F
7. F
8. V
9. V
10. V

UNIDAD 5
Pregunta Respuesta
1. V
2. V
3. V
4. F
5. F
6. V
7. V
8. V
9. V
10. F

SEGUNDO BIMESTRE
UNIDAD 6
Pregunta Respuesta
1. V
2. F
3. V
4. V
5. V
6. F
7. F
8. V
9. F
10. V

UNIDAD 7
Pregunta Respuesta
1. F
2. V
3. F
4. V
5. V
6. V
7. V
8. V
9. V
10. F
11. V
12. V
13. V
14. V
15. V

UNIDAD 8
Pregunta Respuesta
1. V
2. V
3. V
4. F
5. V
6. V
7. V
8. V
9. V
10. V
11. V
12. V
13. V
14. F
15. V

GLOSARIO Guía didáctica: Psicometría
8. Glosario
amplitud: distancia entre los valores extremos de un fenómeno registrado de manera permanente en
un determinado período temporal. Constituye un parámetro que define un ritmo.
análisis de reactivos: proceso de evaluar las preguntas de opción múltiple utilizando el nivel de dificultad
y la capacidad de la pregunta para discriminar o diferenciar entre el desempeño de grupos.
análisis factorial: técnica estadística avanzada que permite reducir las variables que representan un
constructo especifico y que luego utiliza las calificaciones de factores como variables dependientes.
atención: actividad mediante la que aumenta la eficacia de la persona para percibir, recordar, etc.
azar: la explicación, sin suponer nada, de las diferencias entre grupos que implica que las diferencias se
debe a variables distintas de las que se están estudiando.
centil (percentil): cada uno de los valores de un carácter cuantitativo que comparten la extensión de los
valores en 100 subconjuntos de frecuencias iguales.
coeficiente de correlación: índice de la fortaleza de una relación entre dos variables. su valor varía entre
-1.00 y +1.00 y puede ser positivo o negativo.
coeficiente de correlación momento producto de pearson: índice de la relación entre variables.
cognitiva (psicología): enfoque psicológico que estudia los procesos y las estructuras de la cognición.
cognitiva (terapia): tratamiento psicológico dirigido a que el paciente tome conciencia de la distorsión
con la que percibe e interpreta los sucesos desdichados de su existencia.
cognitivas (aptitudes): características de la capacidad intelectual de las personas para pasar de lo

desconocido a lo conocido. Representan de modo general el dominio de la inteligencia, mientras que
las aptitudes verbales, espaciales, numéricas y de memoria representan campos más concretos.
constructo (validez de): en qué medida una observación es congruente con la teoría.
contenido (validez de): naturaleza y relevancia de las preguntas de un test cuando constituyen un
muestreo representativo de lo que el test trata de explorar.
control: forma de ordenar o regular las actividades cognitivas.
correlación: índice sobre el grado de relación entre dos variables que varía entre -1 y +1 pasando por 0. el
valor o indica ausencia de relación, mientras que +1 indica una relación perfecta entre las dos variables.
correlación intraclásica: medida de semejanza entre pares de, por ejemplo, gemelos.
covariación (entre dos variables): los cambios de una variable están sintonizados con los cambios de la
otra variable.

Guía didáctica: Psicometría GLOSARIO
covarianza: parámetro asociado a una distribución de dos variables que permite apreciar el grado de la
relación.
decodificación: transformación de un mensaje codificado previamente para ser utilizado en un

determinado momento.
definición operativa: una variable se define para que se pueda observar y medir.
dependiente (variable): variable que se observa o mide para poner en evidencia los efectos que ejercen
sobre ella un cambio en las condiciones de observación o de medida.
descriptiva (estadística): métodos estadísticos para resumir una serie de observaciones, sin generalizar
los resultados a la población de la que se extrajeron las observaciones.
desviación: característica de dispersión de una distribución. distancia que separa un determinado valor
de un origen que suele ser la media de la población.
diagnóstico psicológico: es el factor determinante para la selección, después que el niño ha sido
identificado por el procedimiento que fuere. En el diagnóstico se han de tener en cuenta y evaluar, al
menos, tres aspectos: la inteligencia, la creatividad o inventiva y la personalidad.
distribución: relación entre las modalidades o los valores de un carácter y sus efectivos o sus frecuencias.
distribución bimodal: una distribución de frecuencias en la que las puntuaciones se agrupan en los dos
extremos.
distribución normal: una distribución de frecuencias en la que las puntuaciones se agrupan alrededor
del punto medio. En inglés también se denomina the bell curve, la curva en campana.
edad mental: nivel de desarrollo intelectual definido, mediante un test compuesto por una serie de
pruebas de dificultad creciente, por las respuestas observadas como promedio en la población de niños
de una determinada edad cronológica.
educción de correlatos: percepción de un carácter a partir del conocimiento de su relación con otro
carácter ya conocido.
educción de relaciones: percepción de la relación que une dos caracteres a partir del conocimiento de
ambos caracteres.
elección (tiempo de reacción de): tiempo de reacción donde las respuestas a diferentes estímulos
deben ser diferentes.
encuesta: método de investigación que se usa cuando se estudian muchas variables en un contexto que
el investigador no puede alterar.
equivalentes de un test (formas): formas de un test que suministran medidas intercambiables de una
misma variable hipotética.
error de medida: la diferencia entre el valor obtenido y el valor verdadero.

escala de medida: modalidades o valores observables de una determinada variable.
estabilidad: calidad de un test que se valora a través de la correlación observada entre los resultados
que proporciona en el transcurso de dos aplicaciones sucesivas en los mismos sujetos.
estimación: a partir de n observaciones suministradas por una prueba, la estimación es el juicio sobre el
valor de un parámetro de la población.
estimación (escala de): procedimiento de un observador cuando suministra la evaluación de un rasgo,

de un resultado y, en general, de una característica de un sujeto o de una situación, sobre una escala de
medida.
estructura factorial: matriz de correlaciones entre las variables y los factores. ésta suele ser la matriz de
mayor interés psicológico.
evaluación (escala de): instrumento de medida que permite cuantificar aspectos de la conducta.
factor: variable hipotética capaz de dar cuenta de las correlaciones entre variables observadas (factores
comunes) o de las propias medidas (factores específicos asociados a los factores comunes o componen
tes principales). Cualquier combinación lineal de variables puede ser un factor. estas combinaciones se
toman como constructos, dimensiones o vectores que pueden dar cuenta en términos matemáticos
de las correlaciones presentes en una matriz de correlaciones. Existen tres tipos de factores: a) general:
presente en todos los test de una matriz de correlaciones; b) de grupo: presente en grupos de test, y c)
específicos: de un test en concreto.
factorial (análisis): métodos para el análisis de datos que tratan de representar de un modo sintético un
gran número de datos.
fiabilidad: característica de un test que proporciona resultados coherentes sobre los individuos a los que
se les administra. Coherencia de resultados observados en momentos distintos. Resultados obtenidos
en dos partes de un test o en las formas paralelas de un test. Resultados obtenidos por dos examinadores
diferentes.
habilidad (intelectual): destreza al realizar una determinada acción que exige una conducta inteligente.
Las habilidades intelectuales constituyen la aptitud efectiva de la que es capaz la persona a partir de su
aptitud básica.
heredabilidad (h2): índice que resulta de calcular la influencia del genotipo en los caracteres humanos
a nivel poblacional.
independiente (variable): variable que describe los cambios impuestos por el investigador en las
condiciones de observación o de medida de una conducta para contrastar una hipótesis, según la cual
estos cambios tendrán un efecto sobre la conducta descrita a modo de variable dependiente.
indicador: característica de una conducta que permite inferir una determinada estructura o proceso
psicológico.
inferencia (estadística): métodos para formular juicios sobre una población, a partir de los resultados
observados sobre una muestra extraída al azar.

intervalo: cada grupo de valores que ocupan una fila en una distribución de frecuencias.
intervalo (escala de): escala de medida ordinal en la que está definida la igualdad de dos intervalos
entre diferentes medidas.
ítem: elemento de un test que constituye una situación particular y que cumple el papel de un estímulo
ante el que el sujeto solo puede dar una respuesta entre las dos o más respuestas previstas.
media: característica de tendencia central de una distribución de valores sobre una escala de intervalos.
mediana: característica de tendencia central que, en la distribución de una variable ordinal, es superada
por el 50 por 100 de los casos.
medición: proceso de asignar números a características.
metaanálisis: estudio estadístico que resume los hallazgos de un gran número de investigaciones.
metodología experimental: el investigador manipula la variable independiente y asigna aleatoriamente

los sujetos a las condiciones experimentales.
moda: valor o clase de una distribución que presenta el efectivo más elevado.
modalidad: cada una de las maneras en que se presenta una característica.
multimedia: combinación de distintos sistemas dentro de un ordenador. imágenes, animaciones,

sonido, vídeo, etc.
norma: datos característicos de una población, para una tarea y un determinado material. Se suele usar
en la construcción de material de experimentación.
normal (distribución): distribución de una variable, que tiene forma de campana y es simétrica. la media,
la mediana y la moda deben coincidir para que se cumpla la distribución normal.
normalización: transformación de una serie de valores para adaptarlos a una distribución normal.
normalizada (variable): variables en las que las desviaciones respecto a la media se expresan tomando
como unidad la desviación típica.
primario (factor): en un análisis factorial, factor localizado en la intersección de los planos que en una
estructura simple contiene los vectores que representan las variables observadas.
procedimiento: serie organizada de acciones que permite alcanzar una meta.
proceso: unidad elemental del funcionamiento mental que, según un modelo, puede agregarse a otras
para dar lugar a una unidad superior (por ejemplo, una estrategia).
prueba (test): situación estandarizada en la que se sitúa a los individuos para poder observar su conducta
y sus resultados.
psicometría: teoría y tecnología de los instrumentos de medida en psicología.

psicotecnia: tests que permiten medir las aptitudes de la persona.
puntuación: resultado logrado por una persona en una prueba.
puntuación factorial: puntuaciones de los sujetos en los factores, es decir, en la combinación lineal de
una serie de variables.
rasgo: se puede describir como la probabilidad de que se pueda reaccionar de una determinada manera
en respuesta a ciertas situaciones. El rasgo supone que: a) la conducta del individuo es consistente, es
decir, tiende a presentar la misma reacción habitual dentro de un campo similar de situaciones; b) los
individuos varían en el grado o frecuencia de cualquier tipo de conducta, y c) las personalidades tienen
una estabilidad significativa.
relaciones (escala de): escala de medidas en las que estarían definidas el origen y la unidad, y que se
construyen pidiendo al sujeto que forme, iguale o compare relaciones entre estímulos.
rendimiento: actuación de un individuo en una determinada situación natural o artificial en la que existe
algún criterio de éxito.
representación mental: entidad de naturaleza cognitiva que refleja en el sistema mental del individuo
una fracción del universo exterior a ese sistema.
representatividad: cualidad que posee la muestra que presenta las mismas características que la
población de la que fue extraída y que permite una generalización a esa población de las observaciones
hechas sobre la muestra.
rotación factorial: en el análisis factorial supone una transformación de un sistema de pesos o cargas
factoriales que permite dar cuenta de un conjunto de correlaciones observadas en otro sistema de pesos
que presenta esa misma propiedad.
sesgo: error sistemático que suscita estimaciones superiores o inferiores en relación a la media del valor
del parámetro en la población.
screning: es una fase del proceso de identificación que tiene como objetivo encontrar niños
potencialmente superdotados que puedan requerir una intervención educativa distinta o especial.
(alonso y benito, 2004)
t (puntuaciones): escala de puntuaciones transformadas con media de 50 y desviación típica de 10.
talento: habilidad excepcional para realizar una actividad humana particular.
típicas (puntuaciones): puntuaciones con media de 0 y con varianza y desviación típica igual a 1.
tipo: representación elegida para proporcionar un marco de referencia al describir a individuos concretos.
tipología: sistema de clasificación de individuos en tipos físicos y psicológicos en los que casi siempre
hay correspondencias entre los tipos físicos y psicológicos, de quienes se espera que los primeros
determinen a los segundos.

validación: método para probar la validez de una teoría, un modelo, una hipótesis, un concepto o un
test, a partir de los datos empíricos disponibles.
validez: propiedad de un modelo, de un enunciado, de un concepto, de un indicador o un test, por la

que éste se corresponde con lo que se espera de él.
validez externa: los datos de un experimento de laboratorio se pueden generalizar a las condiciones de
la vida real.
validez interna: los cambios en la variable dependiente se pueden atribuir a los cambios en la variable
independiente.
variable: representación numérica de una característica.
varianza: característica de dispersión de un conjunto de n medidas realizadas sobre una escala de

intervalos.


ANEXOS Guía didáctica: Psicometría
9. Anexos
DI CTI ONARY
TH ESA UR US
El presente material ha sido reproducido con fines netamente didácticos, cuyo
objetivo es brindar al estudiante mayores elementos de juicio para la comprensión
de la materia, por lo tanto no tiene fin comercial.
Anexo 1
¿Para aplicar un test es necesario que el examinador sea un profesional calificado?
Sin lugar a dudas que la aplicación de un test requiere que el examinador sea un profesional calificado,
sobre todo en los test individuales. Los test no pueden elegirse al azar y mucho peor aplicarse por alguien
que no esté calificado para hacerlo.
Cuando se habla de estandarización de las pruebas se señala ya la importancia de contar con un

examinador capacitado profesional, debido a que las puntuaciones que obtienen el examinador
permite evaluar los resultados de un individuo en términos de ciertas normas, por lo tanto es necesario
percatarse de la importancia de seguir con precisión las instrucciones y de familiarizarse con ellas, caso
contrario su calificación puede ser incorrecta o inexacta y las consecuencias de sus resultados serán
desastrosas.
Un inexperto no tendrá un control cuidadoso de las condiciones de aplicación y la interpretación

adecuada de los resultados requiere una comprensión cabal de la prueba, del sujeto que la presentó y
de las condiciones en que fue aplicada, es decir de un profesional.
Debemos frenar los abusos o malas interpretaciones que se dan a los instrumentos de medición
psicológica que lo único que están haciendo al aplicarse mal es lastimar al individuo, por lo tanto el
examinador debe ser un profesional calificado, con experiencia, para que cualquier instrumento
científico o herramienta sea eficaz en la vida del ser humano.
La ignorancia, es atrevida dirán muchos y es verdad, un test solo lo puede aplicar un profesional
calificado que nos garantice que los resultados se emplearán apropiadamente y que está familiarizado
con el trabajo que se necesita y cuidado que existen usuarios inescrupulosos o mal intencionados que
pueden causar un grave daño.

Guía didáctica: Psicometría ANEXOS
Anexo 2
PRINCIPIOS TÉCNICOS Y METODOLÓGICOS DE LAS PRUEBAS PSICOLÓGICAS
NORMA VALIDEZ CONFIABILIDAD
La norma es el desempeño La validez de una prueba psicológica Confiabilidad significa

normal o promedio. hace referencia al grado con el que consistencia.
verdaderamente una prueba mide lo que
El desempeño se expresa pretende medir. La confiabilidad de una prueba
con el número de reactivos es la consistencia de las
correctos, tiempo, número La validez proporciona una comprobación puntuaciones obtenidas por las
de errores se conoce como directa de qué tan bien cumple una mismas personas cuando se les
puntuación cruda (bruta o prueba su función. aplica la misma prueba o una
directa). forma equivalente.
Para determinar la validez se requiere de
Durante el proceso de criterios independientes y externos de lo Antes de permitir la libre
estandarización, la prueba que la prueba intenta medir. circulación de una prueba
se aplica a una muestra psicológica debe llevarse a cabo
grande y representativa Una correlación o coeficiente de validez una verificación cuidadosa y
de las personas a las que elevada significa que los individuos que objetiva de su confiabilidad.
va dirigida. Este grupo obtuvieron en la prueba una calificación
conocido como muestra de relativamente alta han sido más o menos Para comprobar la confiabilidad
estandarización, sirve para exitosos, mientras que los que obtuvieron de una prueba se comparan las
establecer las normas. bajas calificaciones en la prueba han puntuaciones obtenidas por las
tenido un pobre desempeño. mismas personas en diversos
momentos con diferentes
El coeficiente de validez nos permite conjuntos de reactivos,
determinar qué tan bien se predice el examinadores o calificadores, o
desempeño que se toma como criterio a en cualquier otra condición de
partir de las puntuaciones de la prueba. examinación pertinente.
RERO/pch/Loja, Ecuador/01-07-2011/72
cll/2014-06-19
kvv/2015-03-17

Guía Psicometría I

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Guía Psicometría I

Uploaded by

Copyright:

Available Formats

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA

La Universidad Católica de Loja

MODALIDAD ABIERTA Y A DISTANCIA

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA

5. Orientaciones generales para el estudio................................................................... 8

6. Proceso de enseñanza-aprendizaje para el logro de competencias................. 11

6.1. Competencias Genéricas................................................................................................. 11

6.5. Competencias Genéricas................................................................................................. 41

Un saludo cordial de parte, de quienes hacemos la Escuela de Psicología de la Universidad Técnica

Cuando se habla de instrumentos de medición en psicología, nos referimos a todos aquellos

La primera unidad comprende los fundamentos de la medición psicológica, la segunda se refiere a

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja 5

• Tornimbeni, Silvia y otros. (2008). Introducción a la Psicometría. Buenos Aires: Paidós.

El texto de Psicometría permite adentrarnos en los temas e instrumentos clásicos de la disciplina y,

• Thorndike, Robert l. (1989). Psicometría Aplicada. México, Limusa.

6 UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja

En esta página de la American Psychological Association es posible encontrar bases documentales de

• Editorial de test psicológicos [En línea]. Disponible en www.teaediciones.com [Consulta: 18-06-

En la Facultad de Psicología de la Universidad Nacional de Córdoba, Argentina existe una revista

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja 7

5. Orientaciones generales para el estudio

• Utilice la técnica de la lectura comprensiva, que le ayudará en la asimilación significativa de

8 UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja

• Aplique estrategias de aprendizajes como: resúmenes, esquemas, mapas conceptuales,

• Desarrolle las autoevaluaciones propuestas al final de cada unidad.

• Participe activamente en el Entorno Virtual de Aprendizaje (EVA) e interactúe con el

• Asista a la videoconferencia, en la que se explicará sobre los temas de la asignatura y

• Recuerde que la evaluación a distancia es de carácter obligatorio y no recuperable; consta

• Si en el desarrollo de los contenidos surge alguna duda o inquietud, puede comunicarse

• La clave del aprendizaje, está en preguntar, como mediador de esta asignatura es mi

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja 9

6. Proceso de enseñanza-aprendizaje para el logro de competencias

6.1. Competencias Genéricas

• Habilidad para trabajar en forma autónoma.

• Capacidad para organizar y planificar el tiempo.

• Habilidad para buscar, procesar y analizar información procedente de fuentes diversas.

• Capacidad de aplicar los conocimientos.

• Capacidad crítica y autocrítica.

• Capacidad de adaptación al cambio.

• Habilidad en el uso de las tecnologías TICs.

• Compromiso con la calidad.

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja 11

6.2 Planificación para el trabajo del alumno

• Ser capaz de Distingue los diferentes Unidad 2: • Familiarizarse con Semana 2

12 UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja 13

6.3. Sistema de evaluación de la asignatura (primero y segundo bimestres)

Formas de evaluación 2. Heteroevaluación

Investigación (cita fuentes de

PORCENTAJE 10% 20% 30% 70%

14 UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja

6.4. Orientaciones específicas para el aprendizaje por competencias

UNIDAD 1: FUNDAMENTOS DE LA MEDICIÓN EN PSICOLOGÍA

Recursos educativos multimedia

“Actualmente se requiere de conocimientos básicos sobre

1.1. La medición en psicología

Como podemos darnos cuenta el problema de la medición, posiblemente es más controversial en

En el texto básico capítulo 1, tema: “Fundamentos de la medición en psicología” encontrará otras

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja 15

1. Diseñe un cuadro comparativo entre el modelo clásico y representacional.

1.2. Psicometría y test psicológicos

Continuemos con la lectura del siguiente tema:

Para iniciar el estudio de este contenido remítase al texto básico capítulo 1 y

16 UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA La Universidad Católica de Loja