You are on page 1of 2

Pasos para construir escalas conductuales

Como es sabido, la medición es una apreciación cuantitativa de ciertas


propiedades de una totalidad o sistema (Tabella, 1964). En este sentido, toda escala de
medición debe cumplir ciertos requisitos:
1) Establecer un criterio indicativo de lo que se quiere medir (por ejemplo las
habilidades asertivas).
2) Seleccionar el contenido en base a situaciones, problemas, tareas, preguntas,
etc.; que tengan que ver con el criterio escogido.
3) Decidir la clase y el número de items más adecuados para medir el criterio
escogido (generalmente entre 30 y 40 para ir descartando después unos cuantos en base
al proceso de validación).
4) Decidir la forma de los items: preguntas o afirmaciones (por ejemplo: “Cuando
me equivoco, me cuesta reconocerlo ante los demás”).
5) Decidir el tipo de puntaje que se va a otorgar a cada item en función dicotómica
(0-1), o multicotómica (tipo Likert o Dunn-Rankin, véase Arce, 1994; caps. 2 y 3).
6) Seleccionar aquellos items de similar nivel de dificultad (posibles de ser
respondidos por el 50% de los evaluados en una prueba de sondeo).
7) Verificar en el análisis de datos del sondeo que: a) cada item tenga un grado
de correlación baja con los demás, pues debe medir aspectos diferentes del mismo
criterio; y b) que haya un alto grado de correlación respecto al puntaje final, lo que
garantiza su apego al criterio elegido.
8) Ordenar los items en base a su grado de dificultad. Los que fueron respondidos
“correctamente” por mayor porcentaje de sujetos deben ir primero, y así en orden
decreciente.
9) Escoger una muestra estratificada y proporcional para aplicar la escala.
10) Sobre los resultados, calcular la media aritmética de todos los sujetos
participantes y la desviación estándar de esos puntajes. Eso permite comparar el nivel de
preparación de cada sujeto con el resto de la población. Los datos conseguidos también
deben permitir revisar la validez de los items, su confiabilidad y error de medición.
Puede ayudar más el conocimiento de un ejemplo real: Ida Alarcón (1993), para la
construcción de su Lista de chequeo conductual de la ansiedad en niños, llevó adelante
el siguiente procedimiento: primero consideró una lista de 31 items con los
componentes representativos de los niveles fisiológico, emocional, motor y cognitivo.
Luego estableció la validez de constructo mediante el método de cinco jueces a quienes
se entregó la lista y una definición de la ansiedad, encontrándose acuerdo total en 30
items y 70 por ciento de acuerdo en uno, que se descartó. Seguidamente seleccionó al
azar cien niños entre 8 y 10 años de ambos sexos y de clase económica baja,
aplicándoles la lista de acuerdo con categorías de respuesta como “nunca” (0 pts.),
“algunas veces” (1 pto.) y “frecuentemente” (2 pts.).
Los resultados validaron sólo 26 items en base al ratio Producto-Momento de
Pearson. Nuevamente seleccionó una muestra similar y volvió a aplicar la lista de 26
items. Al final hizo la verificación de confiabilidad test-retest y la de mitades, así como
el producto-momento, y estableció la validez concurrente mediante el test de Eysenck
para niños. Evaluando a 336 sujetos de 6-12 años de los cuatro estratos
socioeconómicos, obtuvo medidas de tendencia central y de dispersión para cada sub-
grupo de edad, y utilizó la técnica de stanones para reagrupar los datos en las categorías
de diagnóstico “normal” (0-7 pts.), “leve” (8-15 pts.) y “marcada” (16-52 pts.).
Si urge evaluar a alguien y no se tiene el tiempo de validar una escala, el cálculo
de las puntuaciones de registros indirectos más informales puede hacerse aplicando una
regla de tres simple. Si tenemos, por ejemplo, una escala de veinte ítems con respuestas
asignadas con 0-1, es obvio que el puntaje total por alcanzar en el caso de una ejecución
ideal sería de veinte puntos. Si el sujeto sólo contesta “correctamente” 12 de las
preguntas, la operación que fija el porcentaje alcanzado por él sería obtenido a través de
la operación:
100 x 12
= 60 %
20

Para verificar en qué nivel de ejecución está el sujeto que ha respondido


aceptablemente en un 60 por ciento únicamente habría que dividir en cinco partes los
ítems, ordenándolos en jerarquía de, por ejemplo, “Muy bueno” (90-100%) a “Muy
malo” (0-20%). Con esa referencia, la persona evaluada estaría en el rango de “regular”
(50-60%), pero eso sólo sería una medida relativa.
Eso no debe preocupar demasiado. En cualquier caso, sigue tratándose la
conducta reflejada por esos datos únicamente como una muestra aproximativa de la
verdadera interacción.

You might also like