Professional Documents
Culture Documents
DEL APRENDIZAJE
Use of the normal distribution in evaluating the learning process
Resumen
En los usos habituales de la evaluacin del aprendizaje, se suele considerar al modelo
normal de distribucin de notas como ligado permanentemente al tipo de evaluacin
conocido como por norma y aparte, tambin de un modo definitivo, del tipo de
evaluacin conocido como por criterios. Es frecuente pensar, adems, que la
evaluacin por norma corresponde a un tipo tradicional de evaluacin, mientras que
la evaluacin por criterios representa el punto de vista actualizado. Sin embargo, el
entender estos asuntos de un modo tan simple es peligroso y puede llevar a los
usuarios que no son especialistas en evaluacin a caer en gruesos errores.
En este trabajo intentamos adentrarnos en una mejor comprensin del tema.
Abstract
Talking about subjects related to assessing the learning process, it is frequent to refer
to the normal model of distribution of grades, linking it always with the type of
evaluation known as by norm and taking it aside in a definite way from the
evaluation known as by criteria. In addition, it is usually maintained that the first
evaluation method is traditional, whereas the second is a modern one. However, such
an oversimplification is dangerous and may lead users who are not specialists in
evaluation to make serious mistakes.
In this article we attempt to achieve a better understanding of the topic.
1. INTRODUCCION
Es frecuente que, tratndose de temas relacionados con la evaluacin del aprendizaje,
se haga referencia al modelo normal de distribucin de calificaciones asocindolo de un
modo indisoluble al tipo de evaluacin conocido como por norma y apartndolo,
tambin de un modo tajante y definitivo, del tipo de evaluacin conocido como por
criterios. Se suele decir, tambin, que la evaluacin por norma corresponde a un tipo
tradicional de evaluacin, mientras que la evaluacin por criterios corresponde a un
punto de vista actualizado. Ms an, suele afirmarse que no sera lgico que la
distribucin de las calificaciones pudiese corresponder a un modelo probabilstico tras
un perodo dedicado a la enseanza-aprendizaje; supuestamente, el azar no tendra
cabida cuando ha existido un esfuerzo sistemtico (no aleatorio) por mejorar los
niveles del conocimiento. En cambio, s podra tener cabida antes de que ese esfuerzo
se hubiese realizado. Algunos libros dedicados a los temas generales de evaluacin
educacional (que, naturalmente, no profundizan en los fundamentos tericos
subyacentes en algunos de sus procedimientos) han contribuido a difundir los puntos
de vista que hemos sealado.
Entendidas las cosas de esa manera, el modelo normal slo sera aplicable en aquellos
casos en que las calificaciones deben responder a la necesidad de ordenar a un
determinado grupo de individuos de mejor a peor, para elegir de entre ellos a los
mejores, sin que en esta eleccin exista referencia alguna a determinados objetivos
de aprendizaje previamente sealados como metas que deberan estar cumplidas. No
sera aplicable, en cambio, en aquellos otros casos en que las calificaciones deben
reflejar el grado de concordancia entre el rendimiento de cada individuo y los objetivos
previstos que ste debe alcanzar, independientemente de lo que ocurra con el resto de
los individuos calificados.
Las puntualizaciones anteriores describen formas de posicionamiento que estn
bastante difundidas entre evaluadores del aprendizaje y que en una primera
aproximacin parecen razonables. Sin embargo, el entender estos asuntos de un modo
tan simple es peligroso y puede llevar a los usuarios que no son especialistas en
evaluacin a caer en gruesos errores.
En este trabajo intentamos adentrarnos en una mejor comprensin del tema.
Procuraremos aclarar, hasta donde las dificultades tericas lo permitan, las zonas ms
oscuras de toda esta situacin, comenzando por explicar cul es el uso general del
modelo probabilstico normal; veremos, a continuacin, en qu circunstancias ste es
aplicable a la evaluacin educacional y, finalmente, examinaremos sus posibles
relaciones con los tipos de evaluacin por criterios y por norma.
i.
Una variable es una caracterstica observable en cada uno de los elementos que
conforman una poblacin en estudio, cuya forma natural de expresin es un
nmero (el trmino variable se suele usar con un significado ms amplio, que
abarca caractersticas no numricas, tales como: estado civil, nacionalidad,
sexo, etc.; sin embargo, en este contexto slo usaremos el sentido ms
restrictivo que aqu se seala). Generalmente, el valor de una variable proviene
de una medicin hecha en el elemento observado. Por su parte, el trmino
aleatorio significa dependiente del azar; sin embargo, en el contexto
estadstico, tambin se entiende como aleatorio el efecto resultante de una o
ms variables no controladas, sean stas conocidas o desconocidas, aun cuando
nada tengan que ver con el azar. Lo esencial en el concepto de aleatorio es
que, en un caso particular cualquiera, el nmero resultante de la observacin
sea impredecible. As pues, una variable aleatoria es una caracterstica que se
expresa mediante un nmero cuyo valor, en un caso particular dado, es
impredecible (aun cuando se sepa que dicho valor debe permanecer dentro de
ciertos lmites preestablecidos).
Por ejemplo, cuando tomamos una prueba escrita en un curso, no sabemos de
antemano cul podr ser exactamente la nota promedio de esa prueba, aunque
s sabemos que tendr que ser un nmero comprendido entre 1 y 7.
Obviamente, el nivel de los conocimientos alcanzados por los alumnos durante
su preparacin para la prueba ser determinante en los resultados y su
conocimiento nos permitir predecir ms o menos lo que podra ocurrir con las
notas, pero la certeza absoluta se nos escurrir de las manos ante la influencia
inevitable de otras variables que podran escapar a nuestro control, tales como:
validez y confiabilidad del instrumento utilizado, eleccin de los temes
especficos considerados y no considerados en l; estado circunstancial de:
salud, capacidad de concentracin, motivacin particular de cada alumno, etc.
Esa nota promedio es, pues, una variable aleatoria; tambin lo son las notas
particulares de cada uno de los alumnos.
Si quisiramos ir un poco ms lejos, podramos afirmar que el resultado de
cualquier medicin (de cualquier ndole) que no se pueda lograr con absoluta
exactitud (y esto ocurre en la mayora de los casos), es una variable aleatoria.
ii.
Tabla 1
Notas
Frec.
1.0-2.49
02.50
2.5-3.99
15.00
4.00-5.49
21
52.50
5.5-7.00
12
30.00
40
100.00
Naturalmente, lo que efectivamente resulte una vez tomada la prueba podra ser
diferente de lo que indica el modelo anterior. De ser as, y en la medida que esas
diferencias sean importantes, ello significa que nuestra prediccin ha sido equivocada.
Contrariamente a esto, un buen modelo probabilstico se debe caracterizar por su
capacidad para predecir lo que se puede esperar que resulte regularmente cada vez
que ocurra el fenmeno que el modelo representa, con aproximacin suficiente para
satisfacer cualquier finalidad prctica. Al decir regularmente queremos significar que
muy rara vez un modelo probabilstico, por muy bueno que sea, describe exactamente
lo que ocurre en cada oportunidad particular en que el fenmeno sucede
(evidentemente, si una variable se comportara siempre de un modo predecible, ella no
sera aleatoria). Sin embargo, las discrepancias que se den entre un buen modelo
probabilstico y las realizaciones del fenmeno que l representa, nunca deberan ser
demasiado grandes ni, menos an, sistemticas.
Es mediante el uso de buenos modelos probabilsticos que, por ejemplo, un casino o
una compaa de seguros pueden planificar con suficiente aproximacin sus ingresos y
gastos a largo plazo aun cuando, quizs, no puedan hacerlo da a da.
Con un modelo probabilstico como el que se muestra en la tabla siguiente, que est
referido al nmero de incendios en instalaciones industriales que se producen
semanalmente en una determinada ciudad, una compaa de seguros podra planificar
sus finanzas a (por ejemplo) un ao plazo. En este ejemplo, la variable aleatoria es el
nmero de incendios producidos en una semana. Esta variable se ha denotado con la
letra X.
Tabla 2
x = N de incendios que
ocurren en una semana
6o
ms
12
17
13
Ilustracin N 1
Su forma simtrica, con una parte central (donde se acumula la mayora de las
observaciones posibles) y dos largas colas en descenso perpetuo (all se arrinconan,
por uno y otro lado, los casos ms excepcionales), son algunos de sus rasgos ms
notorios.
La curva, de forma tan caracterstica, representa una distribucin de probabilidades, es
decir, un modelo que permite explicar el comportamiento de numerosas variables
aleatorias. Este modelo tiene dos parmetros (que son nmeros fijos que determinan
completamente al modelo): uno de posicin, que marca el lugar central de la curva y
corresponde al valor esperado (que puede ser cualquier nmero), y otro de dispersin,
que determina tanto el ancho como el alto de la curva y corresponde a la varianza
esperada (que slo puede tomar valores positivos). Diferentes combinaciones de estos
dos parmetros posibilitan la existencia de infinitas curvas normales que difieren entre
s en cuanto a su posicin, a su forma, o a ambos aspectos (ver la Ilustracin N 2).
Aunque en todos los casos ambas colas de la curva son infinitamente largas, la gran
mayora de las observaciones se encontrarn alrededor del valor esperado, a una
distancia no mayor que tres desviaciones estndar. Si X es una variable aleatoria
normal tal que E(X) = 0 y v(x) = 1, entonces decimos que ella es una variable normal
estndar. Esta distribucin es nica (como cualquiera que tenga fijos sus parmetros) y
se puede encontrar tabulada en cualquier libro de estadstica.
ninguna de ellas puede explicar o ser explicada por una (o ms) de las otras, bajo
ninguna circunstancia. Aunque en la prctica sta es una condicin difcil de establecer
fehacientemente, lo usual, sin embargo, es suponer tal independencia cada vez que
ello parezca suficientemente aceptable por el sentido comn. Por ejemplo, si tomamos
una vez ms los ejemplos que hemos utilizado, podemos suponer que el resultado de
nuestra prueba es independiente del nmero semanal de incendios que se declaren en
la ciudad. Nadie podra probar si esas variables son realmente independientes, pero
hasta que no sea hallada la relacin entre ambas bien podemos suponer que s lo son.
Consideremos otro ejemplo: si lanzamos varias veces un dado bien equilibrado, no nos
ser posible predecir el nmero que resulte en cada lanzamiento, aun cuando
conozcamos todos los nmeros obtenidos en lanzamientos anteriores. Si efectivamente
es as, diremos que estos resultados son independientes unos de otros y que
constituyen, por lo tanto, un conjunto de variables aleatorias independientes.
A partir de las explicaciones anteriores, estamos en condiciones de dar un enunciado
del Teorema Central del Lmite:
Teorema central del lmite. Si se tiene un conjunto numeroso de variables aleatorias
independientes, digamos: X1, X2, X3, Xn, entonces la suma de todas ellas es una
variable aleatoria, S, que sigue una distribucin aproximadamente normal, cuyo valor
esperado y cuya varianza son, respectivamente:
As, por ejemplo, si en nuestro curso de 40 alumnos pudisemos suponer que las notas
obtenidas en una prueba son independientes unas de otras, de modo tal que la nota
obtenida por un alumno no tenga relacin alguna con la nota obtenida por otro alumno
cualquiera, entonces la suma de todas esas notas ser una variable aleatoria normal.
Como consecuencia de esto, el promedio de esas notas (que es la suma de ellas
dividida por 40) ser tambin una variable aleatoria normal.
Notemos que en este ejemplo no estamos haciendo ninguna referencia a que la prueba
se pueda tomar a comienzos o a fines del ao; no sabemos si se trata de un pretest o
se trata del examen final del curso. Los grficos de la Ilustracin N 2 podran
corresponder a modelos aptos para representar la distribucin del promedio de notas
en un pretest y en un examen final, respectivamente. En el primer caso se ha previsto
(como ejemplo) un valor esperado igual a 1.75, con desviacin estndar esperada igual
a 0.25; en el otro, un valor esperado igual a 5.5, con desviacin estndar esperada
igual a 0.50. Ntese que no se hace ninguna referencia a la forma de evaluacin
utilizada: no sabemos si esas notas provendrn de interrogaciones escritas u orales, si
de pruebas de seleccin mltiple o de ensayo, si de trabajos de investigacin,
disertaciones, pasos prcticos, etc. Es posible suponer que se den simultneamente
cualesquiera de esas alternativas, y tambin suponer que esas notas corresponden a
evaluaciones por criterios, sin que nada de ello pueda anular el hecho de que stas
son distribuciones normales.
En el ejemplo que hemos dado nos referimos al promedio de notas en un curso del que
hemos supuesto dos premisas: que el curso es numeroso (de 40 alumnos) y que las
(40) notas son todas independientes entre s. Esas son las condiciones, establecidas en
el Teorema Central del Lmite, que nos aseguran que ese promedio debe ser una
variable aleatoria normal, sea cual sea la forma de obtencin de cada una de las notas
en particular y sea cual sea el destino o interpretacin que esas notas tengan.
Veamos ahora otro ejemplo. Consideremos como variable aleatoria la (nica) nota que
un solo alumno puede obtener en una prueba determinada. Supongamos que sta es
una prueba de seleccin mltiple, en la que el alumno suma puntaje a su favor por
cada respuesta correcta y disminuye puntaje por cada error. Una vez ms pensemos
en dos premisas: que el nmero de preguntas de la prueba es bastante grande (por
ejemplo, 60) y que el acierto o fracaso en cualquiera de las preguntas no influye en el
acierto o fracaso en cualquier otra. A partir de esas premisas, que son las del Teorema
Central del Lmite, debemos concluir que el puntaje final acumulado por el alumno en
la prueba (y, en consecuencia, su nota final) debe ser una variable aleatoria normal. Y
nuevamente podemos observar que es irrelevante si esa nota corresponde, o no, a
criterios de logro preestablecidos y tambin es irrelevante que la nota se use para
seleccionar personas, o para eliminarlas, o para cualquier otra finalidad.
Ilustracin N 2
Ilustracin N 3
No obstante lo anterior, tambin debemos tener claro que el Teorema Central del
Lmite slo nos provee de un modelo aproximado para explicar el comportamiento de
las variables que nos interesen (y esto es as tanto si evaluamos por criterios como si
lo hacemos de otro modo). Es, pues, perfectamente posible concebir otros modelos,
diferentes del normal, que tambin ofrezcan la posibilidad de darnos buenas
descripciones (tambin aproximadas, como con cualquier modelo terico) del
comportamiento de nuestras variables. Ellos pueden ser usados alternativamente,
sobre todo en aquellos casos en que las referidas condiciones del Teorema Central del
Lmite no se den o parezcan dudosas. En relacin con este punto, se ha propuesto
(Fernndez 1987) un modelo probabilstico, llamado Modelo Edumtrico, especialmente
concebido para ser aplicado a distribuciones de notas en un contexto de evaluaciones
por criterios. A modo de ejemplo, en la Ilustracin N 3 se puede ver una distribucin
edumtrica de notas cuyo valor esperado es 5.5 y cuya desviacin estndar es 0.90
(en escala de 1 a 7). En lnea de puntos ms suaves se insina la distribucin normal
con igual valor esperado e igual desviacin estndar. Obsrvese que una parte de la
cola derecha de la curva normal queda fuera del cuadro, es decir, se sale del rango de
las notas, lo que es ciertamente no deseable, ya que el modelo supone la existencia de
notas all donde no las puede haber.
En sntesis, diremos que cuando se evala por criterios la distribucin de notas puede
ser convenientemente explicada mediante un modelo normal o no serlo, dependiendo
esto de que se den, o no, las condiciones del Teorema Central del Lmite. Si no se dan
estas condiciones, el modelo adecuado podra ser algn otro diferente del normal, por
ejemplo el modelo edumtrico.
94,
88,
82,
79,
74,
71,
65,
64,
62,
61,
58,
57,
55,
54,
29,
15,
50,
29,
14,
44,
28,
14,
43,
28,
13,
41,
25,
13,
40,
24,
12,
38,
24,
11,
36,
23,
10,
34,
23,
10,
34,
20,
7,
34,
18,
7,
31,
18,
5,
30,
15,
2
Est claro que los postulantes seleccionados deben ser aquellos cuyos puntajes fueron:
94, 88, 82, 79, 74, 71, 65 y 64. Sin embargo, qu notas les corresponden?
El mecanismo usual para responder a la pregunta anterior comienza por calcular el
promedio y la desviacin estndar de todos los puntajes. En el presente caso esos
estadgrafos son 35.7 y 23.2, respectivamente. Ellos permiten estandarizar los
puntajes, o sea, restar el promedio a cada puntaje y luego dividir la diferencia
obtenida, por la desviacin estndar. En este caso, a cada nota se le deber restar
35.7 y la diferencia deber dividirse por 23.2. En el ejemplo, los puntajes
estandarizados son:
2.51, 2.25, 2.00, 1.87, 1.65, 1.52, 1.26, 1.22, 1.13, 1.09, 0.96,
0.92, 0.83, 0.79, 0.62, 0.36, 0.32, 0.23, 0.19, 0.10, 0.01,
-0.07,
-0.07, -0.07, -0.20, -0.25, -0.29, -0.29, -0.33, -0.33, -0.46,
-0.50, -0.50, -0.55, -0.55, -0.68, -0.76, -0.76, -0.89, -0.89,
-0.94, -0.94, -0.98, -0.98, -1.02, -1.06, -1.11, -1.15, -1.24,
-1.24, -1.32, -1.45
Una vez estandarizados los puntajes, stos son convertidos a notas definitivas
adecundolos a la escala que se quiera utilizar. En nuestro caso, ello se logra
simplemente sumando 4 puntos a cada puntaje estandarizado. Hecho eso, las notas
finales resultan ser:
6.51
4.92
3.93
3.45
2.98
6.25
4.83
3.93
3.45
2.94
6.00
4.79
3.80
3.32
2.89
5.87
4.62
3.75
3.24
2.85
5.65
4.36
3.71
3.24
2.76
5.52
4.31
3.71
3.11
2.76
5.26
4.23
3.67
3.11
2.68
5.22
4.19
3.67
3.06
2.55
5.13
4.10
3.54
3.06
5.09
4.01
3.50
3.02
4.96,
3.93
3.50
3.02
99.74% de ellos) deben encontrarse entre los valores -3, por la izquierda, y +3, por la
derecha.
Sin embargo, si la distribucin original no es normal entonces la distribucin de las
notas estandarizadas y, en consecuencia, la distribucin de las notas finales, no tienen
por qu ser normales.
La Ilustracin N 4, que representa grficamente a la tabla anterior, expresa mejor lo
dicho en relacin con ella. Debe ponerse atencin a los nmeros puestos en su parte
inferior, que representan a las tres principales marcas de clase.
Tabla 3
1
2.50 - 2.99
3.00 - 3.49
13
3.50 - 3.99
10
4.00 - 4.49
4.50 - 4.99
5.00 - 5.49
5.50 - 5.99
6.00 - 6.49
6.50 - 7.00
Ilustracin N 4
Comparemos el perfil anterior con los que corresponden a una distribucin normal (en
lnea punteada) y a una distribucin edumtrica (en lnea gruesa):
La distribucin normal dibujada tiene el mismo promedio (4) y la misma varianza (1)
que el conjunto de notas finales. Por su parte, la distribucin edumtrica, que se
caracteriza por tener un nico parmetro, llamado t (tiempo), en este caso se ha
tomado con el valor t = 2.2. Los valores paramtricos sealados, tanto los del modelo
normal como el del modelo edumtrico, son los que mejor se ajustan a los datos del
ejemplo.
A simple vista, ninguno de los dos modelos parece representar muy bien al conjunto de
datos. Sin embargo, la prueba de bondad de ajuste de Kolmogorov-Smirnov (Canavos
1988) permite aceptar ambos modelos como vlidos, con un nivel de significacin
a = 0.20. En lo que se refiere al conjunto original de datos (o sea los puntajes antes de
ser estandarizados), tambin resultan aceptables los modelos normal y edumtrico
respectivos.
En sntesis, queremos afirmar una vez ms que no basta estandarizar los puntajes, o
utilizarlos para discriminar a los mejores entre un grupo de alumnos sometidos a una
misma prueba, para que el modelo normal sea automticamente la mejor herramienta
disponible. No depende de la estandarizacin el que las notas finales resulten
ajustadas, o no, a un modelo normal. Todava ms, es posible que otros modelos sean
tan vlidos como el normal, o aun mejores, incluso cuando se est evaluando por
norma, como en el caso del ejemplo.
Ilustracin N 5
6. CONCLUSION
En este trabajo hemos intentado establecer dos ideas:
7. BIBLIOGRAFIA
AHUMADA, P. 1983. Principios y procedimientos de evaluacin educacional. Ediciones
Universitarias de Valparaso, Chile.
[ Links ]
CANAVOS, G.C. 1988. Probabilidad y estadstica. Aplicaciones y mtodos. Mc Graw-Hill,
Mxico.
[ Links ]
FERNANDEZ V., A. 1987. Medicin y uso del tiempo en un contexto de aprendizaje
para el dominio, Estudios Pedaggicos 13: 15-27. Universidad Austral, Valdivia,
Chile.
[ Links ]
KENDALL & BUCKLAND. 1980. Diccionario de estadstica. Ediciones Pirmide,
Madrid.
[ Links ]
MEZA, OLIVARES y PASCUAL. 1986. Evaluacin educacional. Manual para educadores.
Instituto de Servicio Educacional Chile.
[ Links ]