Professional Documents
Culture Documents
Departamento de Psicología
Sección Psicología Básica y Social
Psicometría
Guía didáctica
5 créditos
Titulación Ciclo
Licenciado en Psicología IV
Autor:
Mg. Richard Eduardo Ruiz Ordóñez
Estimado estudiante recuerde que la presente guía didáctica está disponible en el EVA en formato PDF interactivo,
lo que le permitirá acceder en línea a todos los recursos educativos.
Asesoría virtual:
11408 www.utpl.edu.ec
PSICOMETRÍA
Guía didáctica
Richard Eduardo Ruiz Ordóñez
CC Ecuador 3.0 By NC ND
Diagramación, diseño e impresión:
EDILOJA Cía. Ltda.
Telefax: 593-7-2611418
San Cayetano Alto s/n
www.ediloja.com.ec
edilojainfo@ediloja.com.ec
Loja-Ecuador
Primera edición
Séptima reimpresión
ISBN-978-9942-00-961-6
Esta versión impresa ha sido acreditada bajo la licencia Creative Commons Ecuador 3.0 de reconocimiento -no comercial- sin obras
derivadas; la cual permite copiar, distribuir y comunicar públicamente la obra, mientras se reconozca la autoría original, no se utilice
con fines comerciales, ni se realicen obras derivadas. http://www.creativecommons.org/licences/by-nc-nd/3.0/ec/
Abril, 2015
2. Índice
2. Índice.................................................................................................................................... 3
3. Introducción........................................................................................................................ 5
4. Bibliografía......................................................................................................................... 6
4.1. Básica.............................................................................................................................. 6
4.2. Complementaria.............................................................................................................. 6
PRIMER BIMESTRE
SEGUNDO BIMESTRE
7. Solucionario........................................................................................................................ 65
8. Glosario................................................................................................................................ 73
9. Anexos.................................................................................................................................. 79
PRELIMINARES Guía didáctica: Psicometría
3. Introducción
Esta disciplina de Psicometría, corresponde al quinto ciclo de la carrera de Psicología, que la Universidad
Técnica Particular de Loja, a través de la Escuela de Psicología, le ofrece a usted, en este ciclo de estudios
de pregrado. Esta asignatura contiene 5 créditos.
La utilización de pruebas psicométricas es muy importante, dentro de las actividades del profesional
en psicología, por lo que la asignatura de psicometría, es de mucha valía, le permitirá comprender los
requisitos técnicos y fundamentos teóricos para el empleo de los tests.
Con esta asignatura se pretende que nuestros alumnos, (futuros psicólogos) adquieran los fundamentos
teóricos, así como los procesos metodológicos, que le permitan poner en práctica la medición objetiva
de ciertas manifestaciones de la conducta, elaborando teorías, modelos, para elaborar y aplicar métodos
e instrumentos para la medición de variables psicológicas.
El estudio de la asignatura de psicometría, permitirá a los alumnos, tener criterios científicos en relación a
las diferencias individuales, su naturaleza, los antecedentes pre científicos y científicos del desarrollo de
la psicometría, los aportes teóricos, los contextos sociales, los procedimientos técnicos y metodológicos
de las pruebas psicológicas.
La temática que abarca la asignatura ha sido estructurada en 8 unidades, distribuidas 5 para el primer
bimestre y tres para el segundo bimestre.
En el segundo bimestre, la unidad 6 está enfocada a la construcción de test, lo que nos permitirá conocer
los métodos de construcción de test; la unidad 7 se refiere a la adaptación de test a nuestra cultura,
lo que nos permitirá, evitar posibles sesgos en la medición transcultural de constructos psicológicos y
finalmente la unidad 8 abarca algunas teorías en relación a los test.
Recuerden estimados estudiantes, que estaré junto a ustedes para acompañarles y orientarles en el
proceso de aprendizaje.
¡Éxito y bien!
4. Bibliografía
4.1. Básica
• Ruiz Ordóñez, Richard, (2011). Guía de Estudio de Psicometría. Loja-Ecuador: Editorial UTPL
La guía orienta el aprendizaje, por lo tanto debe leerla desde la primera página, a través de ella le
va indicando qué es lo que debe estudiar y cómo hacerlo. Realice todas las actividades planteadas.
En medida que avanza en el estudio de la guía, lo hará con el texto básico.
4.2. Complementaria
El autor hace una explicación sobre la elaboración de pruebas psicológicas. Tiene una explicación
estadística y desarrollo de técnicas de varios instrumentos de medición.
• Susana Urbina, Anne Anastasi, (1998); Test Psicológicos tercera edición. Madrid: Ediciones Pearson
educación.
Esta edición proporciona explicaciones sencillas de algunos conceptos y procedimientos de uso común
y rápido desarrollo que influyen en las prácticas psicométricas del siglo XXI, como es el caso de los test
adaptados a las computadoras, el metaanálisis, el modelamiento de ecuaciones estructurales, el uso de
intervalos de confianza, las pruebas transculturales y el uso creciente del análisis factorial en el desarrollo
de los test de habilidad y de personalidad.
• Aiken, R. Lewis. (2003). Test Psicológicos y evaluación. undécima edición. México: Ediciones Pearson
educación.
Test psicológicos y evaluación es una obra cuyo principal objetivo es, ayudar a mejorar los conocimientos,
la comprensión y la práctica de las personas que diseñan test, los aplican y los resuelven, los califican e
interpretan los resultados y toman decisiones con base a los datos así obtenidos.
El texto es amplio pero se presenta de una manera accesible. Refleja el cambio constante que se está
produciendo en las pruebas, en la teoría y en la tecnología en el campo de la psicología. El texto está
pensado para un fácil manejo por parte de los estudiantes. La sección estadística se encuentra en el
apéndice para que el estudiante acceda a esta información a su propio ritmo de estudio.
• Asociación Americana de Psicología [En línea]. Disponible en www. apa. org [Consulta: 18-06-
2011].
Podrá usted revisar editoriales, que hacen relación a la publicación de test en España y su comercialización.
En esta página encontrará los test más utilizados en la actualidad en el campo de la Psicología en el
mundo.
• Universidad Nacional de Córdova (2011). Revista Evaluar de la Facultad de Psicología [En línea].
Disponible en www. revistaevaluar.com.ar [Consulta: 18-06-2011].
Estimado alumno: el aprendizaje autónomo es un proceso que debe llevarse de manera responsable,
sistemática y secuencial. Para el estudio de la materia usted dispone de un texto básico y una guía
didáctica, materiales que ya se citaron en la bibliografía.
El texto básico que le ofrecemos ha sido seleccionado por su claridad y aplicaciones prácticas para el
trabajo que requerimos. Los contenidos se encuentran secuencialmente estructurados.
Le sugiero tomar en cuenta las siguientes consideraciones, para que pueda aprovechar al máximo los
contenidos de la asignatura:
• Parta de las competencias, que se persiguen en la asignatura, así sabrá lo que se pretende
estudiar.
• Distribuya el tiempo necesario, a fin de que pueda avanzar secuencialmente en cada una de
las unidades y no acumule todo el contenido para el final del bimestre.
• Dedique por lo menos 4 horas semanales, de manera que concluya con el análisis de cada
una de las unidades.
• Inicie el estudio con una lectura cuidadosa y atenta de esta guía didáctica que es el
instrumento metodológico que le guiará en el aprendizaje de esta asignatura. La guía le
orientará en el manejo del texto básico y le especificará las diversas actividades que deberá
cumplir.
• Realice una lectura rápida, del texto básico: Introducción a la Psicometría, ello se logra
leyendo en primera instancia títulos, recuadros, resaltados con negrilla, observando gráficos,
lea el prólogo, el prefacio; con ello usted adquiere una primera impresión de su texto; cada
capítulo del libro se debe analizar de manera secuencial.
• Con ayuda del texto y la guía didáctica siga con una lectura atenta y comprensiva del desarrollo
de cada capítulo planteado. Son 280 páginas que debe leerlas comprensivamente. Utilice
un resaltador y subraye lo más importante. A medida que vaya revisando la guía didáctica
es de suma importancia que lea comprensivamente los contenidos que se encuentran en el
texto básico, ellos, se constituyen en los fundamentos teóricos para la construcción de cada
una de las actividades que se sugieren en la guía didáctica, en la evaluación a distancia y
en la evaluación presencial. Las actividades que se pide contestar en la guía, realícelas por
favor.
• Resuelva las actividades recomendadas en la guía didáctica, los ejercicios que se plantean
en cada capítulo y las actividades recomendadas; al hacerlo también estará resolviendo
gran parte de su trabajo a distancia.
• Resuelva las evaluaciones a distancia (una por cada bimestre), que le sirven como estrategia
de aprendizaje y contribuyen en la preparación de las evaluaciones presenciales.
• Resuelva las evaluaciones a distancia (una por cada bimestre) que le sirven como estrategia
de aprendizaje y contribuyen en la preparación de las evaluaciones presenciales.
• Finalmente, le recomiendo revisar la “Planificación para el trabajo del alumno”, este cuadro
le explica las competencias específicas que se anhelan alcanzar a través de la asignatura; los
indicadores de aprendizaje a lograrse con las unidades de estudio; las actividades que usted
realizará; y, el tiempo sugerido para dedicarlo al análisis de cada una de ellas.
PRIMER BIMESTRE
• Capacidad de investigación.
• Habilidades interpersonales.
• Compromiso ético.
CRONOGRAMA
COMPETENCIAS INDICADORES DE CONTENIDOS ACTIVIDADES DE
ORIENTATIVO
ESPECIFICAS APRENDIZAJE UNIDADES/TEMAS APRENDIZAJE
(Tiempo estimado)
Analizar las normas y Parte 2 • Revisar el material Semana 3 y 4
técnicas en aplicación Unidad 3: de estudio. 8 horas de autoestudio
de los test CONFIABILIDAD • Reflexión e y 8 horas de interacción
interiorización de (EVA).
3.1. Introducción los objetivos de la
3.2. El concepto de unidad.
confiabilidad • Lectura
3.3. Factores que comprensiva de los
afectan la temas de la tercera
confiabilidad unidad.
3.4. Dimensiones de la • Desarrollo de
confiabilidad las actividades
3.5. Métodos para recomendadas
verificar la (guía y texto).
confiabilidad • Interacción en el
3.6. Confiabilidad y EVA.
puntuaciones
individuales
3.7. Confiabilidad en la
teoría de respuesta
del ítem
Analizar las normas Unidad 4: • Revisar el material Semana 5
técnicas en aplicación VALIDEZ de estudio. 4 horas de autoestudio
de los test • Lectura y 4 horas de interacción
4.1. Introducción comprensiva de los (EVA).
4.2. Fuentes de temas de la cuarta
evidencia de unidad.
validez • Desarrollo de
4.3. Utilidad de los test las actividades
en contextos de recomendadas
clasificación (guía y texto).
4.4. Generalización de • Interacción en el
la validez: el meta EVA.
análisis
Unidad 5: • Lectura Semana 6
INTERPRETACIÒN DE comprensiva de los 4 horas de autoestudio
LAS PUNTUACIONES temas de la tercera y 4 horas de interacción
y cuarta unidad. (EVA).
5.1. Interpretación • Desarrollo de
referida a las actividades
normas recomendadas
5.2. Otros (guía y texto).
métodos de • Interacción en el
interpretación EVA.
• Terminar evaluación
de
a distancia del
puntuaciones
primer bimestre.
Explicar de manera Unidad 1, 2, 3, 4 y 5 • Relectura y Semana 7 y 8
argumentativa el del primer bimestre. desarrollo de preparación de la
contenido del primer las actividades y prueba presencial.
bimestre ejercicios de la guía
y texto básico.
• Revisión de las cinco
autoevaluaciones
y parte objetiva
de la evaluación a
distancia del primer
bimestre.
1. Autoevaluación *
presencial distancia **
3. Coevaluación
Interacción en el EVA
Parte de ensayo
Prueba objetiva
Parte objetiva
Competencia: criterio
Comportamiento ético X X X X X X
Cumplimiento, puntualidad,
Actitudes
X X X
responsabilidad.
Esfuerzo e interés en los trabajos. X X X X X X
Respeto a las personas y a las
X X
normas de comunicación.
Creatividad e iniciativa. X X X
Habilidades
Contribución en el trabajo
X X
colaborativo y de equipo.
Presentación, orden y ortografía. X X X X
Emite juicios de valor
X X X
argumentadamente.
Dominio del contenido. X X X X X X
Conocimientos
presenciales y en el
evaluación a
(completa la
distancia)
Puntaje 2 4 6 14
Actividades
EVA
TOTAL 20 puntos
Para aprobar la asignatura se requiere obtener un puntaje mínimo de 28/40 puntos, que equivale al 70%.
* Son estrategias de aprendizaje, no tienen calificación; pero debe responderlas con el fin de autocomprobar su
proceso de aprendizaje.
** Recuerde: la evaluación a distancia consta de dos partes: una objetiva y otra de ensayo, debe desarrollarla y
entregarla en su respectivo centro universitario.
Señor estudiante:
Tenga presente que la finalidad de la valoración cualitativa es
principalmente formativa.
Con un atento saludo, le doy la más cordial bienvenida al apasionante mundo de la Psicometría.
Estimado alumno, esta asignatura le permitirá adquirir conocimientos en relación a los test psicológicos,
lo que le permitirá potenciar las herramientas psicológicas, que se deben considerar en el campo de la
profesión, sobre todo al realizar el diagnóstico en casos clínicos.
Iniciemos el tema explicando el concepto de medición. Para muchos seguramente es subjetivo hablar
de medición en el ser humano, pero lo más importante será comprender que los atributos personales se
establecen a través de relaciones.
¿Por qué no existe consenso en la comunidad psicológica acerca del estatus teórico de la medición?
Una vez que ha contestado y reflexionado en torno a este cuestionamiento, es el momento para intentar
una definición de lo que se entiende por medición. Su respuesta acerca de la “medición auténtica” estará
determinada por el enfoque que usted tiene sobre la naturaleza humana.
Para fundamentar el criterio de medición debemos fundamentarnos en los dos modelos fundamentales
del concepto de medición en psicología, desde el análisis de la historia y la filosofía, los cuales son:
modelo clásico y representacional.
Modelos
Clásico Representacional
Cómo psicólogos debemos comprender, que los números utilizados en medición no representan
propiamente cantidades, sino relaciones. Para comprender esto es necesario que considere los diferentes
“niveles de medición”.
En psicología, en general, los resultados de los test son tratados como datos
de una escala intervalar, aunque originalmente provengan de escalas
ordinales.
ACTIVIDADES RECOMENDADAS
2. A través de una tabla, explique: ¿qué es la medición psicológica, según los autores del modelo
clásico?
3. Establezca las diferencias entre los tipos de escalas, para medir una propiedad: nominal, ordinal,
intervalar, proporcional.
4. ¿Por qué el modelo clásico, representa un estándar óptimo, pero difícilmente alcanzable en la
actualidad?
¿Cómo le fue con la lectura? Le resultó fácil interiorizar la explicación de las areas fundamentales de la
psicometría, ¿verdad?
Ahora que ya tiene una idea sobre el tema, es necesario aclararle algunas características básicas sobre los
procedimientos de medición del comportamiento humano.
• Recuerde que nunca se miden a las personas, sino algunos de sus atributos, es decir,
características particulares de los individuos. En psicología nadie se propone “medir” un
niño, sino su autoestima por ejemplo.
Test psicológico
ACTIVIDADES RECOMENDADAS
Para conocer nuevas definiciones de test de otros autores, ubíquese en las páginas 25 a la 28 y complete
la siguiente tabla:
Definición
APA (1999)
Una vez que ha comprendido lo que es un test psicológico, conviene analizar las distintas etapas o fases
por las que ha atravesado la psicometría.
El hecho de que las personas difieran en su comportamiento y que esas diferencias puedan medirse, se
ha reconocido desde los albores de la civilización.
En el texto constan las ideas más relevantes en relación a la historia de la psicomtría; centrémonos en
el planteamiento que realiza Galton, Cattell, Binet; revisemos una breve explicación en el esquema
siguiente.
Interesante lo que plantean estos autores de la década anterior, pero en la actualidad el alcance de la
informática en psicometría es importante, sin embargo no se limitan al empleo de test asistidos por
computadora, en las últimas décadas se ha diseñado una variedad de programas estadísticos.
Para conocer cada uno de los criterios de otros autores, remítase al texto
básico, capítulo 1, páginas 28 a la 37 tema: “Reseña històrica” y lea
comprensivamente cada una de ellas.
ACTIVIDADES RECOMENDADAS
2. Elabore un cuadro sinóptico de las aplicaciones más interesantes de la informática en los tests
psicológicos.
Autoevaluación 1
Escriba una (V) o una (F) según sean verdaderos o falsos los siguientes enunciados. En caso que el
enunciado sea falso explique el argumento verdadero.
4. ( ) Binet, propuso crear el test de medición de funciones mentales más complejas, tales
como juicio, memoria y razonamiento.
8. ( ) Los test psicológicos se construyen, en general, para medir constructos que pueden
observarse directamente.
10. ( ) El año 1935 ha sido calificado como “bisagra” entre el período “histórico” y “moderno”
dentro de la psicometría; debido a que se fundó la Sociedad Psicométrica y la primera
publicación especializada en medición psicológica.
Ir a solucionario
Una vez que hemos concluido con el estudio de la unidad 1, es necesario continuar con la clasificación
de los test que comprende la unidad 2, usted puede profundizar sobre el tema en cualquier otra fuente
que esté a su alcance.
Existen algunos criterios para clasificar los test. Así por ejemplo algunos los agrupan en: a) individuales o
grupales; de ejecución o c) basados en la teoría clásica o de respuesta al ítem.
La clasificación efectuada por Cronbach (1998) distinguió entre test de ejecución máxima y medidas de
ejecución o respuesta típica, según demande el mayor rendimiento del examinado en sus respuestas
(tests de habilidades) o midan el comportamiento habitual sin requerir respuestas correctas (inventarios
de personalidad).
Es necesario que usted discrimine los diferentes tipos de test. Conviene por lo tanto empezar recordando
estas definiciones.
Iniciemos el estudio de este tema reflexionando sobre lo siguiente: la característica principal de los test
de ejecución máxima es que demandan a los examinados, es que respondan de la forma más eficiente
que pueden frente a tareas problemáticas.
Estos test miden diferencias individuales en el nivel de ejecución máximo ante distintas tareas, cuando
se intenta realizarlas (Nunnally, 1991). Esto significa que los desempeños solamente pueden medirse
cuando las personas están motivadas para realizar una tarea de la mejor manera posible.
Bajo el concepto genérico de test de ejecución máxima se incluyen variables relacionadas, tales como las
aptitudes, las habilidades y la inteligencia.
Un test que se considera un indicador adecuado de g es el de Matrices Progresivas de Raven (1993). Las
matrices de Raven se consideran las mejores pruebas de inteligencia general g no verbal. Estas matrices
miden un concepto muy general del funcionamiento intelectual.
Los reactivos de las pruebas son estables sobre la clase de grupos socioeconómicos y entre sociedades
con tradición literaria, además están de acuerdo con el modelo de Rasch para respuestas dicotómicas.
A continuación le proponemos algunos ejemplos de la manera en cómo se administra las preguntas del
test:
¿Qué le pareció el tema, interesante verdad? Avancemos con el siguiente cuestionario de habilidades
múltiples. A continuación estudiaremos a Howard Gardner (1994, 1999) quien, efectuó una crítica radical
al modelo de inteligencia general con su “Teoría de las inteligencias múltiples”.
Para Gardner los test miden preferentemente aptitudes relacionadas con los
requerimientos académicos de la cultura occidental.
En la actualidad, las escalas más utilizadas para la medición de la inteligencia en nuestro medio son las
elaboradas por David Wechsler en 1939, con varias actualizaciones posteriores.
La primera versión de la escala se publicó en 1939 con el nombre «Escala de Inteligencia Wechsler-
Bellevue». Posteriormente, se publicaron los formatos WPPSI para niños de 4-6 años y WISC para edades
comprendidas entre 6 y 16 años. Esta última, cuyo nombre original es Wechsler Intelligence Scale for
Children-Revised (WISC-R), ha sido adaptada por TEA con el nombre Escala de Wechsler para Niños
Revisada (WISC-R). Su aplicación es individual y mide aspectos cuantitativos y cualitativos. Ofrece
puntuaciones típicas ponderadas por edades, para cada una de las pruebas y cocientes intelectuales
(CI), independientes para las escalas verbales, manipulativa y total.
En las versiones actuales de las escalas de Wechsler los ítems están ordenados según los parámetros de
dificultad (Hogan, 2004).
Otro ámbito relevante para el uso de los test de ejecución máxima es la neuropsicología, que estudia las
relaciones entre el cerebro y la conducta (Kolb y Wishaw, 1986).
Una vez que hemos analizado esta temática, es momento de trabajar en lo siguiente:
ACTIVIDADES RECOMENDADAS
• Establezca las semejanza y diferencias entre el Test de Matrices Progresivas de Raven y el Test de
Inteligencia Wechsler (Wisc–IV).
En este tipo de test ninguna respuesta puede ser calificada como correcta o incorrecta. Aquí se evalúa
el comportamiento habitual de los individuos, recurriendo a distintas afirmaciones ante los cuales el
examinado debe indicar su nivel de acuerdo o agrado. Los test de respuesta típica comprenden las
medidas de rasgos de personalidad, intereses y actitudes. Así como de otros constructos afectivos y
motivacionales relacionados, como las creencias de autoeficacia (Cronbach, 1998).
Los resultados de estos tests deben interpretarse con precaución y no debe ser el único criterio de
evaluación, utilizado para tomar decisiones clasificatorias o diagnósticas respecto a las personas.
Inventario de Intereses Vocacionales: han sido definidos como perfiles de agrados y aversiones respecto
a las actividades relacionadas con carreras y ocupaciones.
Los inventarios poco nos dicen respecto al éxito académico u ocupacional que podrá alcanzar una
persona, pero nos ayudan a identificar carreras u ocupaciones donde puede encontrar satisfacción.
Escalas de actitudes: las actitudes se refieren a predisposiciones aprendidas para responder positiva
o negativamente ante objetos sociales particulares, es decir, tipos de personas, instituciones sociales o
situaciones. Las actitudes son tendencias individuales a reaccionar, positiva o negativamente, frente a
un valor social.
Inventario de rasgos de personalidad: la personalidad hace referencia a las tendencias afectivas básicas
de una persona. El propósito fundamental de medición de la personalidad es describir a los individuos
sobre la base de sus rasgos de personalidad predominantes. Los rasgos de personalidad se relacionan
con la conducta típica de las personas en su vida cotidiana, tales como el nivel de ansiedad o amabilidad.
Otros inventarios de personalidad de uso clínico miden un trastorno patológico específico, como el
Inventario de Depresión de Beck (1996).
En el texto básico página 49-65, usted encontrará una breve referencia sobre
el tema: “Test de comportamiento típico”.
ACTIVIDADES RECOMENDADAS
• ¿Cuáles son los test más conocidos a nivel de su localidad en relación a intereses vocacionales,
inventarios de rasgos de personalidad e inventario de habilidades sociales?
• Realice una entrevista a un psicólogo clínico, donde usted determine si son los test de ejecución
máxima o los de comportamiento típico los que más utiliza en su ejercicio profesional.
• Escriba una carta al tutor, comentándole según su investigación, cuál es el mejor test de rasgos de
personalidad que existe en la actualidad. Argumente o contraargumente
Es momento de verificar los aprendizajes que constituyen la base de nuestro estudio. Por
ello le sugerimos desarrollar la siguiente autoevaluación, para detectar lo que aún no está
suficientemente interiorizado y poder retomarlo a fin de lograr su total comprensión.
Autoevaluación 2
Escriba una (V) o una (F) según sean verdaderos o falsos los siguientes enunciados.
10. ( ) En los últimos años se han construido tests que no solo contemplan características
intrapsicológicas, sino que también miden aspectos relacionados con los diferentes
ambientes en los cuales se desenvuelve el individuo.
Ir a solucionario
Vamos a iniciar el estudio de la tercera unidad, no sin antes aclarar que su aplicación es importante en
el ámbito psicológico sobre todo clínico. El profesional en psicología debe conocer las normas técnicas
para la elaboración de test.
CONFIABILIDAD
3.1. Introducción
Como se afirmó en los capítulos anteriores, la medición psicológica parte de ciertos supuestos
fundamentales. Uno de esos supuestos hace relación a la confiablidad que es el que a continuación
estudiaremos.
Cuanto mayor sea el error, menos confiables serán los resultados en el proceso de medición.
Son varias las definiciones en relación a la confidencialidad. La confiabilidad puede entenderse como la
exactitud o precisión de una medición, o el grado en el cual las puntuaciones de un test están libres de
esos errores de medición.
Para la Asociación Americana de Psicología, la confiabilidad significa la consistencia entre los puntajes
de un test obtenidos por los mismos individuos en distintas ocasiones o entre diferentes conjunto de
ítems equivalentes (APA, 1999).
Los diferentes métodos utilizados para evaluar la confiabilidad, utilizan el coeficiente de correlación
como estadístico fundamental. La confiabilidad no es una característica del test en sí mismo, según la
teoría clásica de los test, sino una propiedad de las puntuaciones del test, cuando este se administra a
una muestra específica y bajo condiciones particulares (APA, 1999).
La confiabilidad de una prueba es definida también como la consistencia de las puntuaciones obtenidas
por las mismas personas cuando se les examina en distintas ocasiones con el mismo test, con conjuntos
equivalentes de reactivos o en otras condiciones de examinación.
Ninguna prueba es un instrumento perfectamente confiable, de ahí que todas deban ser acompañadas
por un reporte de su confiabilidad. También es necesario especificar las características de la muestra
normativa, ya que la confiabilidad declarada caracteriza a la prueba cuando se aplica en condiciones
normales a personas similares a las que conformar la muestra normativa u original.
Hay tantas variedades de confiabilidad como condiciones que afecten los resultados de la prueba, ya
que cada una de estas pueden ser irrelevantes para cierto propósito y por consecuencia clasificada como
varianza de error.
ACTIVIDADES RECOMENDADAS
Explique: ¿Por qué el puntaje de una persona en un test psicológico nunca será perfectamente consistente
de una ocasión a la próxima, aun en el caso de que se evalué con una misma prueba? Argumente su
respuesta.
Una vez que tiene claro el concepto de confiabilidad, debemos comprender que existen algunos factores
que afectan la confiabilidad y que debemos tenerlos en cuenta. A continuación encontrará un esquema
gráfico donde se explica los factores que afectan a la confiabilidad.
Como complemento al estudio de este contenido, le animo a revisar en su texto básico las
páginas 76 a la 80. Repase este contenido, realice una red conceptual y establezca sus
inquietudes sobre los factores que afectan la confiabilidad.
ACTIVIDADES RECOMENDADAS
Diseñe ruedas de atributos para comprender los factores que afectan la confiabilidad de la aplicación
de los test.
Con seguridad usted asimiló este interesante contenido, ahora avancemos en el estudio del siguiente
tema. Si existe alguna duda recuerde realizar asesoría a través del EVA o comunicándose vía telefónica.
Cuando establecemos el concepto de confiabilidad, hay que comprender algunas dimensiones, cada
una de las cuales se relaciona con las diferentes fuentes de error de medición y con distintos métodos
para identificarla, ellas son:
El texto básico nos plantea los métodos para corroborar la confiabilidad de un instrumento de medición,
es necesario administrar el instrumento a una muestra según el diseño de investigación específico y,
por otro lado, los datos que resulten de tal aplicación deben ser analizados mediante procedimientos
apropiados. Los métodos son:
3.5.1. Test–retest: este método consiste en administrar un test en dos oportunidades a la misma muestra
de sujetos, con un determinado intervalo entre las dos administraciones, y calcular la correlación
entre los puntajes obtenidos en la primer y segunda vez.
3.5.2. Formas equivalentes: consiste en administrar dos formas equivalentes de un test a un mismo grupo
de individuos. En el caso de que este método se utilice para verificar la estabilidad, la administración
de la segunda forma se realiza transcurrida un tiempo a partir de la administración de la primera
forma, y posteriormente se correlacionan los resultados obtenidos.
3.5.3. Partición en mitades: se administra el test en una ocasión a una muestra de individuos y
posteriormente se divide la prueba en dos mitades comparables, obteniendo de esta manera dos
puntuaciones para cada individuo de la muestra. Finalmente se correlacionan las puntuaciones
correspondientes a ambas mitades del test por miedo de un coeficiente de correlación.
3.5.4. Métodos de covarianza de los ítems: a partir de una única aplicación del test a una muestra se
obtiene una estimación del grado de covarianza de los ítems, utilizando como estadístico el
coeficiente alfa de Cronbach o la fórmula alternativa de Kuder Richardson, cuando se trabaja con
ítems dicotómicos.
3.5.5. Acuerdo entre los examinadores: el método consiste en administrar un test a una muestra, entregar
los resultados del test a un conjunto de jueces que los puntuarán independientemente.
ACTIVIDADES RECOMENDADAS
Con los conocimientos adquiridos es importante que en este momento revise de las páginas 81 a la 94.
Efectúe una lectura minuciosa y diseñe un glosario de términos los mismos que le permitan comprender
el enfoque teórico. Estas fórmulas estadísticas usted debe tenerlas presentes, ya que se aplicarán en la
asignatura de estadística.
Autoevaluación 3
Escriba una (V) o una (F) según sean verdaderos o falsos los siguientes enunciados.
4. ( ) En términos generales, los test son más confiables a medida que aumenta el número
de respuestas alternativas de un rango limitado.
Ir a solucionario
UNIDAD 4: VALIDEZ
En esta unidad continuamos con las normas técnicas para el desarrollo de los test. Existe otra
norma como la validez que desarrollaremos en este momento.
4.1. Introducción
La validez se relaciona con la investigación del significado teórico de las puntuaciones obtenidas por
medio de un test.
Las puntuaciones evidencian propiedades de validez cuando se verifica que el test realmente mide el
constructo que pretende medir, justificando adecuadamente las inferencias realizadas en función de sus
resultados (Nunally, 1991).
Para comprender la validez debemos tener claridad del concepto de constructo que detallo a
continuación:
Por lo expuesto, se deduce que la validez de un instrumento de medición se refiere a que la prueba que
se está usando realmente mida lo que debe medir.
Todos los procedimientos utilizados para determinar la validez se interesan en las relaciones entre la
ejecución de las pruebas y otros factores observados independientemente de las características de
la conducta considerada. Para investigar estas relaciones se han empleado distintos métodos, cuyos
nombres tradicionalmente se han concentrado en aspectos de la validez que son importantes para
distintos usos de la prueba.
La situación ideal en lo referente a la validez es que un test represente adecuadamente y mida la varianza
relevante del constructo, o expresado de otro modo, que las interpretaciones de los resultados de una
prueba estén libres de sesgo de medición.
Señor estudiante una breve introducción histórica, puede contribuir a esclarecer la situación actual de
este concepto, observemos:
En el texto básico, página 102 encontrará el desarrollo de cada una de las etapas. Léalos
comprensivamente, en qué consiste cada una de las etapas, de la historia del concepto
de validez.
Validez de contenido
Los procedimientos de validación por la descripción del contenido comprenden el examen sistemático
del contenido de la prueba para determinar si cubre una muestra representativa del área de conducta que
debe medirse. El área de conducta por examinar debe analizarse sistemáticamente para garantizar que
los reactivos cubran todos los aspectos importantes y en la proporción correcta. Se debe tener en cuenta
no sobregeneralizar ni incluir factores irrelevantes en los resultados. Básicamente se deben contestar
dos preguntas: a)¿cubre la prueba una muestra representativa de las habilidades y conocimientos
especificados? b) ¿el desempeño en la prueba está razonablemente libre de la influencia de variables
irrelevantes?
Validez de facie: la validez de contenido no debe confundirse con la validez aparente que no es validez
en el sentido técnico porque no se refiere a lo que la prueba verdaderamente mide sino a lo que “parece”
medir. Aunque usar el término “validez” puede resultar confuso, la validez de facie es en sí misma un rasgo
deseable de los instrumentos, porque alude a que la prueba “parece válida” para quien la administra,
quien la responde y para otros observadores. Esta validez puede mejorarse replanteando los reactivos
para que parezcan relevantes y plausibles en medio particular en que serán usados por ejemplo es
posible elaborar una prueba de aritmética para personal naval en la terminología náutica sin alterar con
ello las funciones medidas.
Con la validación concurrente, en cambio, la prueba se aplica a personas que ya cuentan con datos de
criterio, por ejemplo comparando los resultados obtenidos en la prueba por aspirantes universitarios
con los promedios académicos al momento del examen. La distinción lógica entre la validez concurrente
y la predictiva se basa en los objetivos más que en el tiempo. La validación concurrente es adecuada para
las pruebas que se emplean para “diagnosticar” el estado actual más que para predecir los resultados
futuros.
Se debe tener en cuenta la contaminación del criterio como fuente de error en la validación de la prueba,
es decir, una precaución esencial es asegurar que los propios resultados no influyan en la condición
del criterio de cualquier individuo. Es por ello que los resultados deben mantenerse estrictamente
confidenciales.
Validez de constructo
Esta expresión se introduce por primera vez en 1954 en las “Recomendaciones técnicas para las pruebas
psicológicas y las técnicas de diagnóstico” (APA, 1954). La validez de constructo ha centrado la atención
en la función que cumple la teoría psicológica en la elaboración de la prueba y en la necesidad de
formular hipótesis que puedan ser comprobadas o refutadas en el proceso de validación. La validez de
constructo de un instrumento es el grado en el que puede afirmarse que mide un constructo o rasgo
teórico. Requiere de la acumulación gradual de diversas fuentes de información.
Correlaciones con otras pruebas: se citan las correlaciones entre una prueba nueva y otros instrumentos
similares como evidencia de que la nueva mide aproximadamente la misma área de conducta que otras
que llevan el mismo nombre como pruebas de “inteligencia”.
ACTIVIDADES RECOMENDADAS
Avancemos con el siguiente contenido donde es preciso comprender las fuentes de evidencia internas
y externas de la validez, estudiémoslas entonces:
Existen dos tipos de evidencia de validez: internas y externas. Las internas se clasifican así:
Las fuentes externas de validez pueden ser las medidas de algún criterio que el test intenta predecir,
así como las puntuaciones de otros test que miden constructos semejantes o parecidos. Veamos.
Es tiempo de comprehender estas fuentes de evidencia y conocer cada una de ellas, recuerde que la
evidencia relacionada con las consecuencias de aplicación de test solo es relevante para la validez
cuando se relaciona con alguna fuente de invalidez. Tras esta argumentación, le invito a revisar en su
texto básico, las páginas 104 a la 125, para profundizar en las fuentes de validez.
Existen cuatro propósitos diferentes de cómo pueden usarse los tests según Cronbach (1998):
1. Autoconocimiento
2. Clasificación
3. Evaluación de programas de intervención
4. Investigación
Revisemos las páginas 125 a la 132, para poder determinar en qué categorías de las
anteriores se encuentran los inventarios de intereses vocacionales, los test de selección
de personal… compártanos sus criterios, recuerde interactuar a través del EVA, a mayor
interacción, mayor aprendizaje.
A continuación hablaremos del metaanálisis, ¿qué es el metaanálisis? es el método que permite integrar
y combinar los resultados de diversos estudios empíricos mediante técnicas específicas.
Este método comienza con la reunión, clasificación y codificación de las investigaciones existentes sobre
un tema. El metaanálisis se utiliza más frecuentemente para generalizar la evidencia predictiva de un
test en relación con un criterio. Existen algunos criterios y cuestionamiento al metaanálisis, que le invito
a profundizar.
Hemos concluido la unidad y es momento de verificar los aprendizajes que constituyen la base de
nuestro estudio. Por ello le sugerimos desarrollar la autoevaluación, de manera que lo que aún no esté
suficientemente interiorizado, lo retome para que todo quede comprendido.
Autoevaluación 4
Escriba una (V) o una (F) según sean verdaderos o falsos los siguientes enunciados.
4. ( ) Al construir un test se deben comparar los puntajes obtenidos, tanto con otros test
elaborados para medir el mismo atributo, como los diseñados para medir otros
atributos.
5. ( ) Las evidencias relacionadas con la estructura interna de un test indican si las relaciones
entre los ítems y las dimensiones permiten confirmar la existencia de los constructos
que el test pretende medir.
6. ( ) Las fuentes externas de evidencia se relacionan con el test y sus componentes (ítems)
en sí mismos.
10. ( ) Es necesario verificar que estadísticamente los ítems se agrupan del modo que se
predice teóricamente, y para esa finalidad el procedimiento ideal es el análisis
factorial.
Ir a solucionario
Esta es la última unidad del primer bimestre, en la que hablaremos de la interpretación referida a normas.
En esta unidad comprenderemos que un test está formado por varios ítems, ante los cuales el individuo
debe emitir sus respuestas.
Para empezar el estudio de este contenido le sugiero realice una lectura de la temática
(páginas 137–159), efectúe un resumen del contenido.
Analicemos lo siguiente:
Por lo tanto el producto final de los procesos de estandarización son los baremos de un test, que han sido
definidos como tablas de equivalencia entre puntuaciones originarias y transformadas que permiten la
comparación de resultados individuales con los de un grupo de referencia.
Responda: ¿qué criterios debe considerar en la construcción de baremos de un test? ¿Por qué se deben
actualizar los baremos?
Es necesario que usted señor estudiante, asimile estos conocimientos para que los considere al momento
de la muestras de estandarización, las cuales que en algunas ocasiones usted tendrá que decidir si
construye sus propias normas o emplea baremos elaborados por otro investigador.
¿Qué le pareció la lectura?, ¿interesante verdad? Con los conocimientos adquiridos, es hora de llevarlos
a la práctica.
ACTIVIDADES RECOMENDADAS
Existen otros métodos de, interpretación de puntuaciones, establezca las diferencias entre las
puntuaciones ipsativas y la interpretación referida a criterio.
Las puntuaciones ipsativas se obtienen en test que utilizan un formato de ítems de elección forzada,
donde el examinado debe seleccionar una opción de respuestas entre varias alternativas.
En la interpretación referida a criterio consiste en comparar las puntuaciones con un criterio de logro
u objetivo a alcanzar, previamente especificado.
¡Excelente! Falta poco para terminar el primer bimestre, resuelva la autoevaluación y lo habrá conseguido.
Autoevaluación 5
Escriba una (V) o una (F) según sean verdaderos o falsos los siguientes enunciados.
1. ( ) Los baremos son normas establecidas para evaluar los méritos personales (según la el
diccionario de la Real Academia Española).
9. ( ) Las puntuaciones finales de una escala ipsativa, expresan un perfil de los “puntos”
fuertes y débiles de un individuo sin compararlo con un grupo de referencia.
10. ( ) Los test referidos a normas sugieren más bien cuánto han aprendido los individuos, y
esclarecen adecuadamente qué han aprendido.
Apreciado profesional en formación, hemos culminado el estudio de contenidos del primer bimestre.
Empiece a prepararse para la prueba presencial.
Ir a solucionario
SEGUNDO BIMESTRE
• Capacidad de investigación.
CRONOGRAMA
COMPETENCIAS INDICADORES DE CONTENIDOS ACTIVIDADES DE
ORIENTATIVO
ESPECIFICAS APRENDIZAJE UNIDADES/TEMAS APRENDIZAJE
(Tiempo estimado)
• Dominar los Parte 3: • Leer con atención Semana 9, 10, 11
fundamentos Ejemplifica test Unidad 6: los contenidos de la 18 horas de autoestudio
históricos, psicológicos CONSTRUCCIÓN DE unidad 6 que están y 12 horas de
biológicos y sociales desarrollados en interacción (EVA).
de la psicología para LOS TEST esta guía didáctica.
Identifica las
cimentar el ejercicio características para
6.1 Definición del • Analizar los
profesional. el diseño de test
dominio ejemplos
psicológicos. propuestos sobre la
6.2.Redacción de los
ítems construcción de los
6.3. Revisión de test.
expertos • Analizar las teorías
6.4. Análisis factorial y propuestas para la
de los ítems redacción de los
ítems.
• Revisar el
documento sobre
la revisión de
expertos.
• Resolver la
autoevaluación 6
• Iniciar el desarrollo
• Ser capaz de de la evaluación a
identificar distancia.
diferencias, Adapta test a su cultura Unidad 7: • Leer con atención Semana 12-13
problemas y ADAPTACIÓN DE TEST los contenidos de la 16 horas de autoestudio
necesidades a nivel A OTRAS CULTURAS unidad 7 que están y 8 horas de interacción
individual desarrollados en (EVA).
7.1. Por qué adaptar test esta guía didáctica.
7.2. Fuentes de sesgo. • Elaborar una síntesis
7.3. Influencia del de cómo influye el
lenguaje. lenguaje del test en
7.4. Métodos de la cultura.
adaptación
• Explicar con
argumentos lo que
el alumno lograría
con la adaptación
de test a su cultura.
• Ser capaz de
describir y • Resolver la
medir variables autoevaluación 7.
(personalidad,
• Seguir el desarrollo
inteligencia y
de la evaluación a
otras aptitudes,
distancia.
actitudes, etc.) y
procesos cognitivos,
emocionales,
psicobiológicos y
conductuales.
CRONOGRAMA
COMPETENCIAS INDICADORES DE CONTENIDOS ACTIVIDADES DE
ORIENTATIVO
ESPECIFICAS APRENDIZAJE UNIDADES/TEMAS APRENDIZAJE
(Tiempo estimado)
Analizar las teorías de Unidada 8: • Estudiar Semana 14
los ítems. TEORÍAS DE LOS ÍTEMS atentamente los 8 horas de autoestudio
contenidos de la y 4 horas de interacción
8.1. Teorías clásicas de unidad. (EVA).
los test. • Elaborar un
8.2. Teoría de respuesta resumen sobre la
al ítem teoría de los ítems.
• Identificar las
características de
cada teoría.
• Desarrollar la
autoevaluación 8.
• Avanzar con el
desarrollo de
la evaluación a
distancia.
Unidades 6, 7, 8 Nueva revisión de Semana 15 y 16
contenidos del 12 horas de autoestudio
bimestre, de las y 8 horas de interacción
autoevaluaciones y de (EVA).
la evaluación a distancia
como preparación para
la evaluación presencial
correspondiente al
segundo bimestre.
Apreciado estudiante, espero que después de conocer su calificación, realice una autoevaluación
personal y de la materia, con la finalidad de proceder a fortalecer los aspectos que más nos han ayudado
y mejorar aquellos que nos resultaron difíciles. Recuerde organizar su tiempo y ser disciplinado.
Con energía renovada, empezamos con el análisis de la unidad seis, la misma que hace referencia a
como construir test psicológicos.
Empecemos el tema manifestando que existen algunos modelos para la construcción de test. Es
necesario considerar que los diversos tipos de test utilizan procedimientos de construcción que difieren
en algunos aspectos.
En general el procedimiento estándar que se usa para construir cualquier test comprende los siguientes
pasos, observemos el esquema:
Lo más importante es la redacción de los ítems del test, a la hora de construir un cuestionario, uno de
los primeros pasos es precisamente elaborar los ítems. Si se falla a este nivel sobran los siguientes pasos.
No existen unas reglas fijas que puedan ser aplicadas automáticamente a la hora de generar ítems; sí se
pueden dar algunas recomendaciones que ayuden a evitar los errores más frecuentes:
a) A cada pregunta debe corresponderle una sola respuesta. Las preguntas no deben formularse de
forma ambigua o dando lugar a varias respuestas válidas.
b) El contenido de la pregunta debe ser oportuno y referirse sólo al objeto de nuestro estudio y a la
variable concreta que queremos investigar.
c) Las preguntas deberán formularse con precisión debiendo tener controlado el tipo de respuesta.
Cada uno de los ítems o preguntas debe evaluar un solo aspecto o dimensión. Es conveniente que
no excedan de quince palabras.
Las preguntas pueden clasificarse en abiertas y cerradas. Son dos tipos de pregunta en las que lo que se
indaga tiene que ver con la libertad de respuesta deseada.
La elaboración de las pruebas es un tema complejo que implica la aplicación de principios establecidos;
la obtención de una buena prueba no es una cuestión fortuita sino la respuesta a diversos interrogantes
como los que se describen a continuación:
En conclusión podemos decir que para elaborar un test se necesita un grupo interdisciplinario, o por
lo menos de varios especialistas en el tema. Una vez que la prueba está elaborada, hay que validarla,
es decir, probarla con grupos de control para asegurarnos de que realmente mida lo que pretende
medir, que sus resultados sean confiables, la validación lleva tiempo y se hacen numerosas pruebas de
confiabilidad.
Espero que esta breve explicación le haya permitido visualizar lo esencial del tema. Seguramente que sí.
Sin embargo, usted puede ampliar sus conocimientos consultando la bibliografía que esté a su alcance.
Iniciemos el tema recordando que en la construcción de un test requiere, en primer lugar, un exhaustivo
análisis conceptual del dominio o constructo a medir, lo que implica la selección y revisión de las teorías
más relevantes, rigurosas, contemporáneas, en relación con el constructo que se pretende medir.
Preguntémonos ¿Qué significa, que todas las dimensiones del constructo deben incluirse?
Siguiendo a Tornimbeni et al. (2004) la construcción de una escala de medición de algún aspecto del
comportamiento humano requiere previamente un exhaustivo análisis conceptual del dominio o rasgo
a medir. Para estos autores se debe obtener definiciones conceptuales ajustadas del rasgo en cuestión
y decidir cuál tipo de indicadores operacionales son adecuados para describirlo. Todas las dimensiones
importantes del rasgo estudiado deben incluirse. Si se trata de una prueba para medir “rendimiento”, la
definición del dominio puede realizarse delimitando el universo de situaciones a ser evaluadas. Así por
ejemplo, en el caso de un examen de Estadística, el universo abarcaría los objetivos y contenidos del
programa de la asignatura. En la medición del rendimiento se pueden utilizar pruebas referidas a criterios
o referidas a normas. Los procedimientos de construcción de las pruebas referidas a criterios difieren
de aquellos usados tradicionalmente en las pruebas de rendimiento. Para la elaboración de pruebas
por normas, se parte de la construcción de una tabla de especificaciones que es una tabla de doble
entrada por medio de la cual se relacionan los objetivos cuyo logro se desea evaluar con los contenidos
específicos correspondientes. A partir de esta tabla se determina la cantidad de ítems que conformará la
prueba y se lleva a cabo su redacción.
En la construcción de una prueba con referencia a criterios, en cambio, no se realiza una tabla de
especificaciones, sino que se define y delimita el dominio de conductas correspondientes a cada objetivo.
Siguiendo dicha definición se elaboran los ítems que evaluarán ese dominio de conductas y todos los
desempeños individuales serán referidos a ese dominio. Tal como lo establece Pophan (1975) citado por
Tornimbeni et al.(2004) por dominio debe entenderse “el conjunto de conductas que debería exhibir el
alumno en relación con un objetivo dado, si este ha sido alcanzado”. Es decir, todas aquellas tareas que
el alumno debería poder realizar si el objetivo ha sido logrado. Para Hambleton y Rogers (1991) citados
por los mismos autores, el “dominio” puede ser de conductas, objetivos, destrezas y competencias y
la amplitud del dominio varía en función de la finalidad del test. Si el dominio comprende más de un
objetivo pueden construirse subtest para cada objetivo, y se evalúa el rendimiento de los sujetos en
cada uno de ellos. Para la especificación del dominio de conductas o clase de tareas que el individuo
debe realizar, seguiremos el esquema propuesto por Tornimbeni et al (2004) que proponen:
i. Definición del objetivo: se establece cuál o cuáles serán los objetivos que se evaluarán
a través de la prueba, por ejemplo, la habilidad de “comprensión”, que incluye
aquellas conductas o respuestas que se refieren únicamente a una comprensión de
los mensajes literales contenidos en la comunicación.
ACTIVIDADES RECOMENDADAS
Complete la siguiente tabla en relación, a los criterios que se debe considerar para la construcción de
las siguientes pruebas:
Criterios de dominio
Pruebas
Test de medición de
rendimiento de un dominio
específico.
Espero que esta explicación haya sido de su agrado y además le permita tener una idea general del tema.
ACTIVIDADES RECOMENDADAS
Continuemos en el estudio del siguiente tema, que hace relación a la construcción de ítems, para los test.
Es vital apreciado estudiante establecer pautas para la redacción de ítems de test, a continuación en el
siguiente esquema, le presento algunas de ellas:
Según lo afirman Tornimbeni et al. (2004) existen pautas convencionales para la redacción de ítems
de prueba. Estas incluyen recomendaciones tales como: redactar ítems congruentes con el objetivo
de medición y evitar los ítems demasiado largos (de más de 20 vocablos), las oraciones complejas con
ambigüedades de sentido, las frases con dobles negaciones, el uso de expresiones extremas (nunca,
siempre, todos) y utilizar el lenguaje más apropiado al nivel de maduración y educativo de la población
(Osterlind, 1990). Para Nunnally (1991) los dos errores más comunes en la redacción de ítems son: a)
ambigüedad (preguntas difusas que admiten varias respuestas) y b) trivialidad (centrarse en aspectos
poco importantes del rasgo o dominio en cuestión).
Iniciemos el tema afirmando que es trascendente que los ítems preliminares sean revisados por jueces
expertos. Tal como lo explica Tornimbeni et al. (2004), la mayoría de los autores recomiendan que los
ítems preliminares de un test sean revisados por expertos en construcción de pruebas, en el dominio
o rasgo a medir y en el nivel de comprensión de la población a la cual se apunta con la prueba.
Las tres características que los expertos deben evaluar en cada ítem son:
Este último ítem es el principal parámetro y se refiere al grado de consistencia que debe existir entre
un ítem particular y las metas esenciales de la prueba dado que esto será un factor posterior de
confiabilidad y validez (Oesterlind, 1990). A los jueces se les pide que evalúen la calidad y consistencia
de los ítems y se descartan aquellos con puntuaciones medias más bajas y con escaso grado de
acuerdo, respectivamente. Se recomienda que los ítems seleccionados sean aquellos en que, al menos,
un 60% de los jueces coinciden (Herrera Rojas, 1993). Es útil también incluir preguntas que demanden
información cualitativa sobre los ítems lo que puede facilitar un mejoramiento en el fracaso de algunos
de ellos.
Interesante sería, su usted pudiera visitar a un profesional de la psicología y pida sean evaluadas sus
preguntas en relación a la construcción de un test por ejemplo para medir depresión, en relación a
estos tres parámetros:
Parámetros Valoración
Ahora nos compete conocer procedimientos esenciales y recomendables para construir escalas
confiables y con significado teórico, uno de ellos es el análisis factorial:
a) Análisis factorial
El Análisis factorial, es una técnica estadística avanzada que permite reducir las variables que representan
un constructo específico y que luego utiliza las calificaciones de factores como variables dependientes.
Spearman (1923) fue el primero en aplicar la técnica del análisis factorial para investigar la estructura de
la inteligencia y también para identificar las diferencias individuales a través de los tests de inteligencia.
A partir de la aplicación del análisis factorial.
El análisis factorial es además el único método que ha permitido construir, desde la perspectiva
experimental, lo que es la psicología de las aptitudes.
Espero que esta explicación haya sido de su agrado y además le permita tener una idea general del tema.
ACTIVIDADES RECOMENDADAS
Tras la revisión del texto básico (páginas 169–184) le sugerimos realice las siguientes actividades:
4. En su cuaderno de apuntes, explique detenidamente cada uno de los pasos del análisis factorial
exploratorio.
a) Análisis de ítems
En relación al análisis de los ítems, podemos afirmar que es el procedimiento más empleado en el
análisis de ítems, es la correlación de cada ítem con el puntaje total de la prueba.
La capacidad discriminativa de un
ítem se refiere al grado en que este
diferencia adecuadamente entre los
examinados con relación al rasgo o
dominio que el test pretende medir
(Anastasi y Urbina 1998).
Hemos finalizado esta unidad, no dude en preguntar. Repase las páginas 185–190.
Seguramente estas ideas contribuyeron a la comprensión del tema, entonces es hora de afirmar los
conocimientos hasta aquí adquiridos a través del desarrollo de la autoevaluación. ¡Hágalo por favor!
Autoevaluación 6
Escriba una (V) o una (F) según sean verdaderos o falsos los siguientes enunciados.
10. ( ) El resultado inicial del análisis factorial (antes de la rotación) es una matriz factorial, es
decir, la matriz de correlaciones de las variables de los factores.
Ir a solucionario
Ahora corresponde estudiar la adaptación de test a otras culturas, sobre todo a la nuestra.
Actualmente se reconoce que la adaptación de un test es un proceso mucho más complejo que la
mera traducción de ese test en un idioma diferente. Una adaptación implica considerar no solo las
palabras utilizadas al traducir la prueba sino también las variables culturales involucradas.
La utilización de test psicológicos creados en otros contextos culturales es una práctica habitual en todo
el mundo.
El uso de un test en un contexto cultural diferente genera diversas dificultades. El idioma, la familiaridad
con los estímulos del test (ítems) y las diferentes características de las muestras de estandarización son
ejemplos de fuentes de posibles sesgos en la mediación transcultural de constructos psicológicos.
La equivalencia se manifiesta
cuando las puntuaciones de un
test reflejan diferencias entre las
personas evaluadas que existen
verdaderamente en el rasgo en
cuestión.
Los constructores/editores de los test deberían proporcionar datos que garanticen que el lenguaje
utilizado en las instrucciones, en los propios ítems y en el manual del test, son apropiados para todas la
poblaciones culturales e idiomáticas a las que va dirigido el test.
Los constructores/editores de test deberían aportar evidencia de que las técnicas de evaluación elegidas,
los formatos de los ítems, las reglas de los test y los procedimientos son familiares a todas las poblaciones
a las que van dirigidos.
Los constructores/editores de test deberían facilitar evidencia de que el contenido de los ítems y los
materiales de los estímulos son familiares a todas las poblaciones a las que van dirigidos.
Los constructores/editores de test deberían aportar una justificación racional sistemática, tanto
lingüística como psicológica, para mejorar la precisión del proceso de adaptación, así como reunir datos
acerca de la equivalencia de todas las versiones en los distintos idiomas.
Los constructores/editores de test deberían asegurarse que el diseño de recogida de datos permita el
uso de técnicas estadísticas apropiadas para establecer la equivalencia entre los ítems correspondientes
a las diferentes versiones idiomáticas del test.
Los constructores/editores de test deberían aplicar técnicas estadísticas apropiadas para 1) establecer
la equivalencia entre las diferentes versiones de un test, y 2) identificar componentes problemáticos o
aspectos del test que puedan ser inadecuados para alguna de las poblaciones a las que va destinado el
test.
Los constructores/editores de test deberían aportar datos estadísticos sobre la equivalencia de los test
para todas las poblaciones a las que van dirigidos.
No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a diferentes poblaciones
cuando se prepara una escala común, o cuando se comparan estas poblaciones.
Sin embargo, pueden ser útiles para reforzar la validez de contenido de las puntuaciones de cada
población por separado.
Si deseamos usar las pruebas para predecir resultados en alguna situación futura como por ejemplo en
el desempeño de un aspirante a la universidad, necesitamos instrumentos con alta validez predictiva
del criterio particular. Este requisito suele descuidarse en el desarrollo de las llamadas “pruebas libres de
influencia cultural”. En un esfuerzo por incluir en esas pruebas solo las funciones comunes a diferentes
culturas o subculturas, puede elegirse un contenido que tenga poca relevancia para el criterio que se
pretenda predecir. Una mejor solución es elegir un contenido relevante para el criterio e investigar luego
las posibles diferencias poblacionales de la efectividad de la prueba para el propósito pretendido.
Desde mediados de la década de los setenta se ha observado una rápida acumulación de investigaciones
sobre problemas de sesgo de la prueba. En este contexto, el término “sesgo” se emplea en su bien
establecido sentido estadístico, para desganar un error constante o sistemático en contraste con uno
que se debe al azar. Las principales preguntas que se han planteado con respecto al sesgo de la prueba
tiene que ver con el coeficiente de validez (sesgo de la pendiente) y la relación entre las medias del
grupo en la prueba y en el criterio (sesgo de intersección). Si una prueba produce un coeficiente de
validez significativamente diferente en dos grupos, la diferencia se describe como sesgo de la pendiente
y esta clase de diferencia entre grupos se conoce como “validez diferencial”. Una prueba exhibe sesgo
de intersección si sistemáticamente subpredice o sobrepredice una ejecución del criterio para un grupo
particular.
El problema del sesgo de la intersección se relaciona más con lo que ha sido llamado equidad de la
prueba”. Aunque los términos “equidad” y “sesgo” de la prueba a veces se usan indistintamente para
cubrir todos los aspectos del uso del instrumento con minorías culturales.
Gradualmente empezó a cambiar el interés de la investigación en la evaluación del sesgo de las pruebas
al diseño de estrategias de selección para su uso justo con minorías culturales. Entre las metas por
reconciliar están las de proporcionar iguales oportunidades a todos los individuos, elevar al máximo la
tasa del éxito y la productividad, incrementar la mezcla demográfica y la representatividad y extender el
tratamiento preferencial a grupos desfavorecidos por inequidades anteriores.
Para continuar con este tema, conviene explicar que existen diferentes fuentes de sesgo, entre ellas
tenemos:
Sesgo de constructo:
Este tipo de sesgo se da “cuando el constructo medido no es idéntico a través de los grupos culturales...”
( p.p. 264, Van de Vijver y Tanzer, 1997). La importancia que cada cultura otorga a ciertas conductas
se encuentra en esta categoría. Conductas de ética y civismo que en algunas sociedades pueden
ser normales en otras pueden constituir un verdadero rasgo de rigidez y asemejarse a una conducta
obsesivo compulsivo.
El sesgo de muestra: que se da cuando las muestras son incomparables entre sí. La cantidad de años de
escolaridad que poseen los sujetos de una muestra es una variable determinante en el desempeño del
mismo en un test determinado, especialmente si se trata de un test de habilidad. El nivel sociocultural,
la motivación, la composición por género y edad de los sujetos son otras variables que pueden hacer
incomparables a dos muestras que pueden mostrar resultados muy diferentes en un test determinado.
El sesgo en el instrumento: que puede provenir de las características del instrumento. La familiaridad
que los sujetos tienen con los estímulos presentados tiene una gran importancia. Algunos estímulos
tales como objetos, dibujos, figuras u otros elementos utilizados en algunas culturas no existen en otras
o son irrelevantes. El ítem de ejemplo en el Subtest de ordenamiento de lámina WISC III que muestra
a una mujer frente a una máquina expendedora de latas de gaseosa tiene muy poco valor en culturas
árabes, por ejemplo, o en zonas rurales de nuestro país. El idioma es otra fuente de sesgo de instrumento.
Sesgo de ítem: se produce cuando el mismo tiene diferentes significados en distintas culturas. Ciertos
grupos culturales pueden obtener puntajes significativamente distintos en un ítem determinado a
pesar de obtener un puntaje total similar. La deseabilidad social o la relevancia cultural, entre otros
factores, pueden producir el sesgo de ítem. Tanzer ( 1995) demostró que aunque la estructura factorial
de un test de autoconcepto académico era similar cuando se lo aplicó a estudiantes australianos y
singaporeanos, existían diferencias sustanciales entre estas muestras cuando se compararon algunos
ítem específicamente. Este tipo de sesgos también actúa en test neuropsicológicos.
ACTIVIDADES RECOMENDADAS
Discrimine las diferencias existentes entre los tipos de sesgos. Remítase a su texto básico páginas 193 a
la 196 del texto básico.
En este aspecto conviene recordar que el lenguaje es otro factor que afecta el desempeño en la
evaluación transcultural que utiliza test psicológicos.
El idioma puede producir diferencias en el rendimiento de un test determinado y por lo tanto es inconveniente
utilizar baremos extranjeros.
ACTIVIDADES RECOMENDADAS
Actualmente se reconoce que la adaptación de un test es un proceso mucho más complejo que la mera
traducción a un idioma diferente.
ACTIVIDADES RECOMENDADAS
Remítase a las páginas 197 a la 205 del texto básico, para comprender, los niveles de adaptación de
pruebas psicológicas.
La Comisión Internacional de Test establece algunas pautas para adaptar un test de una cultura a otra,
entre las cuales tenemos en el siguiente esquema:
Bien, hemos concluido la unidad y por lo tanto, ha llegado el momento de verificar los
aprendizajes. Le recuerdo que aunque las autoevaluaciones no deben ser enviadas a la
Universidad ni son objeto de calificación usted debe desarrollarlas, pues serán de gran
beneficio en el refuerzo de sus conocimientos.
Autoevaluación 7
12. ( ) Una vez traducido adecuadamente el test, es necesario establecer si esta versión
traducida es equivalente a la original. Para ello se requiere un diseño experimental y
el análisis de los datos obtenidos a través de ese diseño.
Estamos en la tercera parte del texto básico, denominada teoría de los test, que abarca de las páginas
209 a la 242, por lo que le invito a realizar primero una lectura general de este contenido.
Existen diversos paradigmas o modelos que permiten explicar el significado de las puntuaciones
obtenidas con los test. El análisis o modelado de las matrices de datos obtenidas da como resultado:
• La estimación del nivel en que poseen los sujetos la(s) característica(s) que mide el test (valores
escalares de los sujetos).
Es decir el objetivo de cualquier teoría de tests es realizar inferencias sobre el nivel en que los sujetos
poseen la característica o rasgo inobservable que mide el test, a partir de las respuestas que estos han
dado a los elementos que lo forman el mismo. Así para medir o estimar las características latentes de los
sujetos es necesario relacionar estas con la actuación observable en una prueba y esta relación debe ser
adecuadamente descrita por una función matemática. Las distintas teorías de test difieren justamente
en la función que utilizan para relacionar la actuación observable en el test con el nivel del sujeto
en la variable inobservable. Y sirven para dar cuenta del error de medida inherente a toda medición
psicológica o estimación del error; y proporcionar una estimación del rasgo o característica evaluada
(estimación del rasgo).
La teoría clásica de los test, iniciada por Spearman, sostiene que la puntuación observable de una
persona en un test es una función de dos componentes: su puntaje verdadero (inobservable) y el
error de medición implícito en la prueba. El TCT (modelo lineal de la teoría clásica) es un modelo de
puntuación verdadera como valor esperado, esperado como concepto matemático, probabilístico. Es
decir, el puntaje verdadero de un sujeto en un test sería el promedio aritmético de las puntuaciones
empíricas obtenidas en infinitas aplicaciones (Muñiz, 2001).
La teoría clásica de los tests (TCT) es, en síntesis, el conjunto de principios teóricos y métodos cuantitativos
derivados de ellos, que fundamentan la construcción, aplicación, validación e interpretación de distintos
tipos de test y que permiten derivar escalas estandarizadas aplicables a una población (Hambleton, 1994).
Los principios en que se basa son relativamente simples y se aplican tanto a las pruebas de desempeño,
como a las de aptitud. Durante sus diferentes fases de desarrollo, se han elaborado procedimientos de
análisis cuantitativo que han sido de gran utilidad, destacándose en lo general, tres grandes etapas que
se identifican por su objeto de interés primordial, así como por los métodos cuantitativos y tipos de
análisis teóricos que utilizan.
La primera etapa que Cattell (1986) denomina itemetría, se caracteriza principalmente por la construcción
de pruebas conformadas por reactivos cuyas propiedades estadísticas eran el centro de atención
principal.
La siguiente etapa es la que Cattell (1986) denomina psicometría estructural y se caracteriza por el uso de
las nuevas herramientas estadísticas tales como el análisis factorial con sus diversas variantes técnicas,
como un medio para encontrar la “estructura natural” de las habilidades en el contexto de los factores
culturales, la dotación genética, la personalidad, los rasgos, los motivos dinámicos y las dimensiones que
dan lugar a la acción y al comportamiento. Su objetivo primordial no era como tal, aplicar pruebas, sino
determinar la relación que hay entre los conceptos clínicos sobre personalidad, y los fundamentos de la
investigación experimental multivariada (cuantitativa por naturaleza), así como analizar las interacciones
dinámicas entre los rasgos y los estadíos de la personalidad. Los test se consideraban significativos en la
medida que armonizaban con los constructos teóricos formulados conceptualmente.
La etapa funcional en el desarrollo de los test es aquella que “trasciende a las aplicaciones inmediatas
y simplistas que identificaban a las estadísticas con factores conductuales, y profundiza en las leyes y
formulaciones conceptuales del comportamiento: que relaciona rasgos, procesos y estados psicológicos
con las mediciones y estrategias estructurales” (Cattell, 1986). Ese tipo de leyes, según Cattell, se refieren
a las relaciones sistemáticas y consistentes obtenidas de los estudios empíricos sobre el desarrollo, en
el conocimiento acerca de los rasgos determinados en forma hereditaria, de los rasgos modificables
por las experiencias y el aprendizaje y de la modulación de los estados psicológicos producidos por las
relaciones psicofisiológicas. En resumen, el desarrollo de la teoría clásica de los test ha procedido de
etapas orientadas en forma pragmática para desarrollar test y validar reactivos, (donde los constructos
psicológicos teóricos se definían operacionalmente como “aquello que mide la prueba x”); hacia
etapas conceptualmente más elaboradas en que los test se derivan de teorías del comportamiento
más articuladas y donde cada reactivo tiene un significado conceptual definido en un contexto teórico
particular.
Finalmente, no obstante que el desarrollo de la teoría clásica de los test llegó, con la etapa funcional de
los test, a un punto en que la conceptualización de los resultados de los test, y consecuentemente su
proceso de desarrollo, permitían mediante sofisticados procedimientos estadísticos, sacar a los reactivos
de los límites impuestos por la prueba en su conjunto, la limitación teórica aún permanecía y se hacía
necesario un nuevo marco conceptual para salvarlo. Este nuevo esquema para la conceptualización de
los reactivos como unidades independientes del test y del grupo utilizado para normarlo, se obtuvo con
la teoría de respuesta al ítem.
ACTIVIDADES RECOMENDADAS
Supuestos:
2. Escriba los corolarios, que se desprenden de los supuestos anteriores (revisar páginas 211-213 del
texto básico).
1.
2.
3.
4.
5.
Es necesario que usted señor estudiante realice un estudio pormenorizado del tema a fin de que se
familiarice con él y pueda aplicarlo en su ámbito profesional.
Continuemos con el análisis del siguiente contenido.
Teoría de la generalizabilidad
Cronbach y Glaser (1972) postularon la teoría de la generalizabilidad (TG) que es una extensión del
modelo clásico en el que diversas mediciones del mismo individuo pueden variar tanto por efecto de
una variación en lo que se mide como por el error de medición (Nunnally y Bernstein, 1995). En esta
teoría las decisiones sobre la bondad de un instrumento se basan en estudiar las fuentes y tipos de error,
utilizando el análisis de varianza. Cuando se mide una variable se trata de generalizar los resultados
a un dominio o universo confiable de observaciones. El puntaje del universo es semejante al puntaje
verdadero en el modelo clásico. La diferencia es que en la TCT se considera que la varianza de error es
de una sola clase y, en cambio, la TG reconoce que existen otros universos de generalización y por lo
tanto muchos puntajes de universo posibles. Solo cuando el universo se ha definido podemos afirmar
cuáles son las fuentes de variación que producen error. Las diferentes fuentes de error en esta teoría
se denominan facetas, término que introdujo Cronbach para designar cada una de las características
de la situación de medición que pueden cambiar de un momento a otro y, por tanto, hacer variar los
resultados obtenidos.
Según esta teoría los puntajes observados solo poseen interés si son representativos de todos los
puntajes posibles de un mismo universo. Población es el conjunto de personas de las que se extrae una
muestra; y universo es el conjunto de todos los ítems posibles de un constructo; y universo de condiciones
de Medición al conjunto de todas las facetas estudiadas. Las distintas fuentes de variaciones asociadas
a las facetas y a sus interacciones se estima que contribuyen a la varianza de error y disminuyen la
generalizabilidad de los puntajes observados en las personas evaluadas.
Como en cualquier experimento, en los test se presenta el problema de controlar en las respuestas el
error de medida. El ajuste estadístico es la forma específica de control de error en el contexto de teoría
de respuesta al ítem. La TRI debe su nombre a que se interesa más en las propiedades de los ítems
individuales que en las propiedades globales del TCT.
La literatura sobre test registra en los últimos 30 años un desplazamiento progresivo del esquema
proporcionado por la teoría clásica de los tests, hacia el contexto y los procedimientos delineados por
la teoría de respuestas al ítem (TRI) [Del inglés: Ítem Response Theory-IRT]. Esta teoría, fue desarrollada
para resolver varios de los problemas que presentaba la TCT (Hambleton & Swaminathan, 1985) y que no
habían sido resueltos de una manera satisfactoria.
(1) El uso de índices de los reactivos cuyos valores dependen de la población particular de la cual
fueron obtenidos, y
(2) La estimación de la habilidad del examinado depende del conjunto específico de reactivos
incluidos en la prueba.
Es decir, las características del examinado y las características de la prueba no pueden separarse en un
instrumento elaborado conforme a los principios de la teoría clásica de los tests; y por el contrario, cada
uno solo puede ser interpretado en términos del otro. Las características del examinado en las cuales
la teoría TRI está interesada, son la “habilidad” que mide el test. Para la TCT, la noción de habilidad se
expresa por medio del llamado puntaje verdadero que se define como “el valor esperado a partir de la
destreza observada en la prueba en cuestión” (Hambleton, Swaminathan, y Rogers, 1991).La habilidad
del examinado se define solo en términos de una prueba específica. Si el test es “difícil”, el examinado
parecerá tener un nivel bajo de habilidad. Si el test es “fácil”, el examinado parecerá tener un mayor nivel
de habilidad. Y el nivel de dificultad de la prueba se define como “la proporción de examinados en el
grupo de interés, que contestó el reactivo correctamente” (Hambleton, Swaminathan y Rogers, 1991).
Por lo tanto, el que un ítem sea difícil o fácil depende de la habilidad de los examinados a quienes se
aplicó la prueba y a su vez, la habilidad de los examinados depende del nivel de dificultad de la prueba.
De la misma forma, el nivel de discriminación de los reactivos y los coeficientes de validez y confiabilidad
de la prueba se definen también en base a las características del grupo particular de examinados. Así,
las características del test y de los reactivos cambian a medida que cambia el contexto de la prueba. Por
lo tanto, es muy difícil comparar examinados a quienes se aplican diferentes test; o aún, comparar ítems
cuyas características se obtuvieron utilizando diferentes grupos de examinados. Esto significa que los
coeficientes de los reactivos son dependientes del grupo al mismo tiempo que son dependientes del
test. Esta clase de dependencia es la que se trata de eliminar mediante la TRI.
Las principales características de la TRI como una alternativa a la teoría clásica de los test son:
1. Las características de los reactivos no dependen del grupo del cual fueron obtenidos;
2. Los puntajes que describen la habilidad del examinado no dependen del test en su conjunto;
3. El modelo se expresa a nivel del reactivo más que a nivel del test;
4. El modelo no requiere de pruebas paralelas para determinar el índice de confiabilidad; y
5. Provee una medida de la precisión de cada índice de habilidad.
Una de las ventajas de la construcción de los test de acuerdo a los modelos de la TRI es que se pueden
elaborar test individualizados, es decir, “a la medida” de los sujetos que permiten inferir en cada uno de
los evaluados un verdadero valor del rasgo de la manera más precisa.
ACTIVIDADES RECOMENDADAS
Realice un cuadro comparativo entre las teorías clásicas de los test y la teoría de respuesta al ítem.
1. Remítase a la página 222 y 223 del texto básico, y conteste: ¿cuáles son los postulados y
supuestos de la TRI?
¡Felicitaciones! hemos culminado el estudio del contenido, ahora para finalizar proceda
a responder la autoevaluación, la misma que nos permitirá descubrir el nivel de
conocimiento adquirido.
Autoevaluación 8
10. ( ) Se ha señalado que el modelo de Rasch es el único que conduce a una auténtica
medición en psicología.
11. ( ) Una de las ventajas de la TRI es que proporciona un marco de referencia unificado,
para interpretar los sesgos en el nivel de los ítems.
13. ( ) Toda medición, cualquiera sea el campo científico en que se implemente, conlleva
errores.
15. ( ) La psicometría hace uso de modelos formales que le permiten lograr esa estimación
de la puntuación verdadera de un individuo en un rasgo con el menor error posible.
7. Solucionario
PRIMER BIMESTRE
UNIDAD 1
Pregunta Respuesta
1. V
2. F
3. V
4. V
5. V
6. F
7. V
8. F
9. F
10. V
UNIDAD 2
Pregunta Respuesta
1. V
2. V
3. V
4. V
5. F
6. V
7. F
8. V
9. V
10. V
UNIDAD 3
Pregunta Respuesta
1. V
2. V
3. F
4. V
5. V
6. V
7. V
8. V
9. F
10. V
UNIDAD 4
Pregunta Respuesta
1. V
2. V
3. F
4. V
5. V
6. F
7. F
8. V
9. V
10. V
UNIDAD 5
Pregunta Respuesta
1. V
2. V
3. V
4. F
5. F
6. V
7. V
8. V
9. V
10. F
SEGUNDO BIMESTRE
UNIDAD 6
Pregunta Respuesta
1. V
2. F
3. V
4. V
5. V
6. F
7. F
8. V
9. F
10. V
UNIDAD 7
Pregunta Respuesta
1. F
2. V
3. F
4. V
5. V
6. V
7. V
8. V
9. V
10. F
11. V
12. V
13. V
14. V
15. V
UNIDAD 8
Pregunta Respuesta
1. V
2. V
3. V
4. F
5. V
6. V
7. V
8. V
9. V
10. V
11. V
12. V
13. V
14. F
15. V
8. Glosario
amplitud: distancia entre los valores extremos de un fenómeno registrado de manera permanente en
un determinado período temporal. Constituye un parámetro que define un ritmo.
análisis de reactivos: proceso de evaluar las preguntas de opción múltiple utilizando el nivel de dificultad
y la capacidad de la pregunta para discriminar o diferenciar entre el desempeño de grupos.
análisis factorial: técnica estadística avanzada que permite reducir las variables que representan un
constructo especifico y que luego utiliza las calificaciones de factores como variables dependientes.
atención: actividad mediante la que aumenta la eficacia de la persona para percibir, recordar, etc.
azar: la explicación, sin suponer nada, de las diferencias entre grupos que implica que las diferencias se
debe a variables distintas de las que se están estudiando.
centil (percentil): cada uno de los valores de un carácter cuantitativo que comparten la extensión de los
valores en 100 subconjuntos de frecuencias iguales.
coeficiente de correlación: índice de la fortaleza de una relación entre dos variables. su valor varía entre
-1.00 y +1.00 y puede ser positivo o negativo.
cognitiva (psicología): enfoque psicológico que estudia los procesos y las estructuras de la cognición.
cognitiva (terapia): tratamiento psicológico dirigido a que el paciente tome conciencia de la distorsión
con la que percibe e interpreta los sucesos desdichados de su existencia.
constructo (validez de): en qué medida una observación es congruente con la teoría.
contenido (validez de): naturaleza y relevancia de las preguntas de un test cuando constituyen un
muestreo representativo de lo que el test trata de explorar.
correlación: índice sobre el grado de relación entre dos variables que varía entre -1 y +1 pasando por 0. el
valor o indica ausencia de relación, mientras que +1 indica una relación perfecta entre las dos variables.
correlación intraclásica: medida de semejanza entre pares de, por ejemplo, gemelos.
covariación (entre dos variables): los cambios de una variable están sintonizados con los cambios de la
otra variable.
covarianza: parámetro asociado a una distribución de dos variables que permite apreciar el grado de la
relación.
definición operativa: una variable se define para que se pueda observar y medir.
dependiente (variable): variable que se observa o mide para poner en evidencia los efectos que ejercen
sobre ella un cambio en las condiciones de observación o de medida.
descriptiva (estadística): métodos estadísticos para resumir una serie de observaciones, sin generalizar
los resultados a la población de la que se extrajeron las observaciones.
desviación: característica de dispersión de una distribución. distancia que separa un determinado valor
de un origen que suele ser la media de la población.
diagnóstico psicológico: es el factor determinante para la selección, después que el niño ha sido
identificado por el procedimiento que fuere. En el diagnóstico se han de tener en cuenta y evaluar, al
menos, tres aspectos: la inteligencia, la creatividad o inventiva y la personalidad.
distribución: relación entre las modalidades o los valores de un carácter y sus efectivos o sus frecuencias.
distribución bimodal: una distribución de frecuencias en la que las puntuaciones se agrupan en los dos
extremos.
distribución normal: una distribución de frecuencias en la que las puntuaciones se agrupan alrededor
del punto medio. En inglés también se denomina the bell curve, la curva en campana.
edad mental: nivel de desarrollo intelectual definido, mediante un test compuesto por una serie de
pruebas de dificultad creciente, por las respuestas observadas como promedio en la población de niños
de una determinada edad cronológica.
educción de correlatos: percepción de un carácter a partir del conocimiento de su relación con otro
carácter ya conocido.
educción de relaciones: percepción de la relación que une dos caracteres a partir del conocimiento de
ambos caracteres.
elección (tiempo de reacción de): tiempo de reacción donde las respuestas a diferentes estímulos
deben ser diferentes.
encuesta: método de investigación que se usa cuando se estudian muchas variables en un contexto que
el investigador no puede alterar.
equivalentes de un test (formas): formas de un test que suministran medidas intercambiables de una
misma variable hipotética.
estabilidad: calidad de un test que se valora a través de la correlación observada entre los resultados
que proporciona en el transcurso de dos aplicaciones sucesivas en los mismos sujetos.
estimación: a partir de n observaciones suministradas por una prueba, la estimación es el juicio sobre el
valor de un parámetro de la población.
estructura factorial: matriz de correlaciones entre las variables y los factores. ésta suele ser la matriz de
mayor interés psicológico.
evaluación (escala de): instrumento de medida que permite cuantificar aspectos de la conducta.
factor: variable hipotética capaz de dar cuenta de las correlaciones entre variables observadas (factores
comunes) o de las propias medidas (factores específicos asociados a los factores comunes o componen
tes principales). Cualquier combinación lineal de variables puede ser un factor. estas combinaciones se
toman como constructos, dimensiones o vectores que pueden dar cuenta en términos matemáticos
de las correlaciones presentes en una matriz de correlaciones. Existen tres tipos de factores: a) general:
presente en todos los test de una matriz de correlaciones; b) de grupo: presente en grupos de test, y c)
específicos: de un test en concreto.
factorial (análisis): métodos para el análisis de datos que tratan de representar de un modo sintético un
gran número de datos.
fiabilidad: característica de un test que proporciona resultados coherentes sobre los individuos a los que
se les administra. Coherencia de resultados observados en momentos distintos. Resultados obtenidos
en dos partes de un test o en las formas paralelas de un test. Resultados obtenidos por dos examinadores
diferentes.
habilidad (intelectual): destreza al realizar una determinada acción que exige una conducta inteligente.
Las habilidades intelectuales constituyen la aptitud efectiva de la que es capaz la persona a partir de su
aptitud básica.
heredabilidad (h2): índice que resulta de calcular la influencia del genotipo en los caracteres humanos
a nivel poblacional.
independiente (variable): variable que describe los cambios impuestos por el investigador en las
condiciones de observación o de medida de una conducta para contrastar una hipótesis, según la cual
estos cambios tendrán un efecto sobre la conducta descrita a modo de variable dependiente.
indicador: característica de una conducta que permite inferir una determinada estructura o proceso
psicológico.
inferencia (estadística): métodos para formular juicios sobre una población, a partir de los resultados
observados sobre una muestra extraída al azar.
intervalo: cada grupo de valores que ocupan una fila en una distribución de frecuencias.
intervalo (escala de): escala de medida ordinal en la que está definida la igualdad de dos intervalos
entre diferentes medidas.
ítem: elemento de un test que constituye una situación particular y que cumple el papel de un estímulo
ante el que el sujeto solo puede dar una respuesta entre las dos o más respuestas previstas.
media: característica de tendencia central de una distribución de valores sobre una escala de intervalos.
mediana: característica de tendencia central que, en la distribución de una variable ordinal, es superada
por el 50 por 100 de los casos.
metaanálisis: estudio estadístico que resume los hallazgos de un gran número de investigaciones.
moda: valor o clase de una distribución que presenta el efectivo más elevado.
norma: datos característicos de una población, para una tarea y un determinado material. Se suele usar
en la construcción de material de experimentación.
normal (distribución): distribución de una variable, que tiene forma de campana y es simétrica. la media,
la mediana y la moda deben coincidir para que se cumpla la distribución normal.
normalización: transformación de una serie de valores para adaptarlos a una distribución normal.
normalizada (variable): variables en las que las desviaciones respecto a la media se expresan tomando
como unidad la desviación típica.
primario (factor): en un análisis factorial, factor localizado en la intersección de los planos que en una
estructura simple contiene los vectores que representan las variables observadas.
proceso: unidad elemental del funcionamiento mental que, según un modelo, puede agregarse a otras
para dar lugar a una unidad superior (por ejemplo, una estrategia).
prueba (test): situación estandarizada en la que se sitúa a los individuos para poder observar su conducta
y sus resultados.
puntuación factorial: puntuaciones de los sujetos en los factores, es decir, en la combinación lineal de
una serie de variables.
rasgo: se puede describir como la probabilidad de que se pueda reaccionar de una determinada manera
en respuesta a ciertas situaciones. El rasgo supone que: a) la conducta del individuo es consistente, es
decir, tiende a presentar la misma reacción habitual dentro de un campo similar de situaciones; b) los
individuos varían en el grado o frecuencia de cualquier tipo de conducta, y c) las personalidades tienen
una estabilidad significativa.
relaciones (escala de): escala de medidas en las que estarían definidas el origen y la unidad, y que se
construyen pidiendo al sujeto que forme, iguale o compare relaciones entre estímulos.
rendimiento: actuación de un individuo en una determinada situación natural o artificial en la que existe
algún criterio de éxito.
representación mental: entidad de naturaleza cognitiva que refleja en el sistema mental del individuo
una fracción del universo exterior a ese sistema.
representatividad: cualidad que posee la muestra que presenta las mismas características que la
población de la que fue extraída y que permite una generalización a esa población de las observaciones
hechas sobre la muestra.
rotación factorial: en el análisis factorial supone una transformación de un sistema de pesos o cargas
factoriales que permite dar cuenta de un conjunto de correlaciones observadas en otro sistema de pesos
que presenta esa misma propiedad.
sesgo: error sistemático que suscita estimaciones superiores o inferiores en relación a la media del valor
del parámetro en la población.
screning: es una fase del proceso de identificación que tiene como objetivo encontrar niños
potencialmente superdotados que puedan requerir una intervención educativa distinta o especial.
(alonso y benito, 2004)
típicas (puntuaciones): puntuaciones con media de 0 y con varianza y desviación típica igual a 1.
tipo: representación elegida para proporcionar un marco de referencia al describir a individuos concretos.
tipología: sistema de clasificación de individuos en tipos físicos y psicológicos en los que casi siempre
hay correspondencias entre los tipos físicos y psicológicos, de quienes se espera que los primeros
determinen a los segundos.
validación: método para probar la validez de una teoría, un modelo, una hipótesis, un concepto o un
test, a partir de los datos empíricos disponibles.
validez externa: los datos de un experimento de laboratorio se pueden generalizar a las condiciones de
la vida real.
validez interna: los cambios en la variable dependiente se pueden atribuir a los cambios en la variable
independiente.
9. Anexos
DI CTI ONARY
TH ESA UR US
El presente material ha sido reproducido con fines netamente didácticos, cuyo
objetivo es brindar al estudiante mayores elementos de juicio para la comprensión
de la materia, por lo tanto no tiene fin comercial.
Anexo 1
Sin lugar a dudas que la aplicación de un test requiere que el examinador sea un profesional calificado,
sobre todo en los test individuales. Los test no pueden elegirse al azar y mucho peor aplicarse por alguien
que no esté calificado para hacerlo.
Debemos frenar los abusos o malas interpretaciones que se dan a los instrumentos de medición
psicológica que lo único que están haciendo al aplicarse mal es lastimar al individuo, por lo tanto el
examinador debe ser un profesional calificado, con experiencia, para que cualquier instrumento
científico o herramienta sea eficaz en la vida del ser humano.
La ignorancia, es atrevida dirán muchos y es verdad, un test solo lo puede aplicar un profesional
calificado que nos garantice que los resultados se emplearán apropiadamente y que está familiarizado
con el trabajo que se necesita y cuidado que existen usuarios inescrupulosos o mal intencionados que
pueden causar un grave daño.
Anexo 2
RERO/pch/Loja, Ecuador/01-07-2011/72
cll/2014-06-19
kvv/2015-03-17