You are on page 1of 14

USO DE LA DISTRIBUCION NORMAL EN LA EVALUACION

DEL APRENDIZAJE
Use of the normal distribution in evaluating the learning process

Prof. Aquiles Fernndez V.

Resumen
En los usos habituales de la evaluacin del aprendizaje, se suele considerar al modelo
normal de distribucin de notas como ligado permanentemente al tipo de evaluacin
conocido como por norma y aparte, tambin de un modo definitivo, del tipo de
evaluacin conocido como por criterios. Es frecuente pensar, adems, que la
evaluacin por norma corresponde a un tipo tradicional de evaluacin, mientras que
la evaluacin por criterios representa el punto de vista actualizado. Sin embargo, el
entender estos asuntos de un modo tan simple es peligroso y puede llevar a los
usuarios que no son especialistas en evaluacin a caer en gruesos errores.
En este trabajo intentamos adentrarnos en una mejor comprensin del tema.
Abstract
Talking about subjects related to assessing the learning process, it is frequent to refer
to the normal model of distribution of grades, linking it always with the type of
evaluation known as by norm and taking it aside in a definite way from the
evaluation known as by criteria. In addition, it is usually maintained that the first
evaluation method is traditional, whereas the second is a modern one. However, such
an oversimplification is dangerous and may lead users who are not specialists in
evaluation to make serious mistakes.
In this article we attempt to achieve a better understanding of the topic.

1. INTRODUCCION
Es frecuente que, tratndose de temas relacionados con la evaluacin del aprendizaje,
se haga referencia al modelo normal de distribucin de calificaciones asocindolo de un
modo indisoluble al tipo de evaluacin conocido como por norma y apartndolo,
tambin de un modo tajante y definitivo, del tipo de evaluacin conocido como por
criterios. Se suele decir, tambin, que la evaluacin por norma corresponde a un tipo
tradicional de evaluacin, mientras que la evaluacin por criterios corresponde a un
punto de vista actualizado. Ms an, suele afirmarse que no sera lgico que la
distribucin de las calificaciones pudiese corresponder a un modelo probabilstico tras
un perodo dedicado a la enseanza-aprendizaje; supuestamente, el azar no tendra

cabida cuando ha existido un esfuerzo sistemtico (no aleatorio) por mejorar los
niveles del conocimiento. En cambio, s podra tener cabida antes de que ese esfuerzo
se hubiese realizado. Algunos libros dedicados a los temas generales de evaluacin
educacional (que, naturalmente, no profundizan en los fundamentos tericos
subyacentes en algunos de sus procedimientos) han contribuido a difundir los puntos
de vista que hemos sealado.
Entendidas las cosas de esa manera, el modelo normal slo sera aplicable en aquellos
casos en que las calificaciones deben responder a la necesidad de ordenar a un
determinado grupo de individuos de mejor a peor, para elegir de entre ellos a los
mejores, sin que en esta eleccin exista referencia alguna a determinados objetivos
de aprendizaje previamente sealados como metas que deberan estar cumplidas. No
sera aplicable, en cambio, en aquellos otros casos en que las calificaciones deben
reflejar el grado de concordancia entre el rendimiento de cada individuo y los objetivos
previstos que ste debe alcanzar, independientemente de lo que ocurra con el resto de
los individuos calificados.
Las puntualizaciones anteriores describen formas de posicionamiento que estn
bastante difundidas entre evaluadores del aprendizaje y que en una primera
aproximacin parecen razonables. Sin embargo, el entender estos asuntos de un modo
tan simple es peligroso y puede llevar a los usuarios que no son especialistas en
evaluacin a caer en gruesos errores.
En este trabajo intentamos adentrarnos en una mejor comprensin del tema.
Procuraremos aclarar, hasta donde las dificultades tericas lo permitan, las zonas ms
oscuras de toda esta situacin, comenzando por explicar cul es el uso general del
modelo probabilstico normal; veremos, a continuacin, en qu circunstancias ste es
aplicable a la evaluacin educacional y, finalmente, examinaremos sus posibles
relaciones con los tipos de evaluacin por criterios y por norma.

2. USO DE LA DISTRIBUCION NORMAL


El Teorema Central del Lmite (que hace referencia explcita al modelo normal) es,
quizs, el resultado ms importante de toda la teora estadstica desarrollada hasta
ahora. Descubierto por De Moivre en 1733 y estudiado posteriormente por Laplace y
Gauss, su forma definitiva slo fue alcanzada a comienzos del presente siglo (Kendall
1980). Aunque su importancia terica es muy grande, su inters radica tambin en la
enorme cantidad de aplicaciones prcticas que su generalidad permite. Son,
precisamente, estas aplicaciones las que han contribuido a popularizar el modelo
normal hasta hacer que su conocimiento sea universal entre los usuarios de la
estadstica. Tanto es as que el trmino normal ha llegado a entenderse
(equivocadamente, en el contexto de la teora estadstica) como sinnimo de natural
o acostumbrado. Es cierto que ste puede ser el modelo habitual o adecuado en
muchas circunstancias, pero tambin es cierto que no lo es, en muchas otras. Por ello,
antes de querer aplicarlo o dejarlo de lado a priori, sera necesario verificar si las
circunstancias de su correcta aplicacin, en cada caso, estn dadas o no lo estn.
Enunciaremos este teorema del modo ms simple que podamos, pero antes, para una
mejor comprensin del mismo, daremos explicaciones breves de lo que es el modelo
normal y del significado de algunos de los trminos tcnicos que (inevitablemente)
tendremos que utilizar en el enunciado.

i.

Una variable es una caracterstica observable en cada uno de los elementos que
conforman una poblacin en estudio, cuya forma natural de expresin es un
nmero (el trmino variable se suele usar con un significado ms amplio, que
abarca caractersticas no numricas, tales como: estado civil, nacionalidad,
sexo, etc.; sin embargo, en este contexto slo usaremos el sentido ms
restrictivo que aqu se seala). Generalmente, el valor de una variable proviene
de una medicin hecha en el elemento observado. Por su parte, el trmino
aleatorio significa dependiente del azar; sin embargo, en el contexto
estadstico, tambin se entiende como aleatorio el efecto resultante de una o
ms variables no controladas, sean stas conocidas o desconocidas, aun cuando
nada tengan que ver con el azar. Lo esencial en el concepto de aleatorio es
que, en un caso particular cualquiera, el nmero resultante de la observacin
sea impredecible. As pues, una variable aleatoria es una caracterstica que se
expresa mediante un nmero cuyo valor, en un caso particular dado, es
impredecible (aun cuando se sepa que dicho valor debe permanecer dentro de
ciertos lmites preestablecidos).
Por ejemplo, cuando tomamos una prueba escrita en un curso, no sabemos de
antemano cul podr ser exactamente la nota promedio de esa prueba, aunque
s sabemos que tendr que ser un nmero comprendido entre 1 y 7.
Obviamente, el nivel de los conocimientos alcanzados por los alumnos durante
su preparacin para la prueba ser determinante en los resultados y su
conocimiento nos permitir predecir ms o menos lo que podra ocurrir con las
notas, pero la certeza absoluta se nos escurrir de las manos ante la influencia
inevitable de otras variables que podran escapar a nuestro control, tales como:
validez y confiabilidad del instrumento utilizado, eleccin de los temes
especficos considerados y no considerados en l; estado circunstancial de:
salud, capacidad de concentracin, motivacin particular de cada alumno, etc.
Esa nota promedio es, pues, una variable aleatoria; tambin lo son las notas
particulares de cada uno de los alumnos.
Si quisiramos ir un poco ms lejos, podramos afirmar que el resultado de
cualquier medicin (de cualquier ndole) que no se pueda lograr con absoluta
exactitud (y esto ocurre en la mayora de los casos), es una variable aleatoria.

ii.

Una distribucin probabilstica o modelo probabilstico es una proposicin


concreta y anticipada del comportamiento de una variable aleatoria, en
trminos de su posible distribucin. En el ejemplo que hemos considerado, y
suponiendo que nuestro curso tiene 40 alumnos, podramos basarnos en
nuestra experiencia docente y predecir una distribucin de notas como la
siguiente:

Tabla 1
Notas

Frec.

1.0-2.49

02.50

2.5-3.99

15.00

4.00-5.49

21

52.50

5.5-7.00

12

30.00

40

100.00

Mientras la tabla adyacente sea una prediccin


de lo que eventualmente podra ocurrir en el
futuro y no una descripcin de lo que ya
ocurri, ella constituye un modelo
probabilstico para la variable aleatoria
descrita.

Naturalmente, lo que efectivamente resulte una vez tomada la prueba podra ser
diferente de lo que indica el modelo anterior. De ser as, y en la medida que esas
diferencias sean importantes, ello significa que nuestra prediccin ha sido equivocada.
Contrariamente a esto, un buen modelo probabilstico se debe caracterizar por su
capacidad para predecir lo que se puede esperar que resulte regularmente cada vez
que ocurra el fenmeno que el modelo representa, con aproximacin suficiente para
satisfacer cualquier finalidad prctica. Al decir regularmente queremos significar que
muy rara vez un modelo probabilstico, por muy bueno que sea, describe exactamente
lo que ocurre en cada oportunidad particular en que el fenmeno sucede
(evidentemente, si una variable se comportara siempre de un modo predecible, ella no
sera aleatoria). Sin embargo, las discrepancias que se den entre un buen modelo
probabilstico y las realizaciones del fenmeno que l representa, nunca deberan ser
demasiado grandes ni, menos an, sistemticas.
Es mediante el uso de buenos modelos probabilsticos que, por ejemplo, un casino o
una compaa de seguros pueden planificar con suficiente aproximacin sus ingresos y
gastos a largo plazo aun cuando, quizs, no puedan hacerlo da a da.
Con un modelo probabilstico como el que se muestra en la tabla siguiente, que est
referido al nmero de incendios en instalaciones industriales que se producen
semanalmente en una determinada ciudad, una compaa de seguros podra planificar
sus finanzas a (por ejemplo) un ao plazo. En este ejemplo, la variable aleatoria es el
nmero de incendios producidos en una semana. Esta variable se ha denotado con la
letra X.

Tabla 2

x = N de incendios que
ocurren en una semana

n(X) = N de sem. en que


ocurren X incendios

6o
ms

12

17

13

Un modelo como este (suponiendo que sea el adecuado) permite saber


anticipadamente, por ejemplo, que en un ao se producirn aproximadamente 77
siniestros. O saber que en una semana regular cabra esperar que ocurran uno o dos
incendios de este tipo, ya que el promedio semanal, calculado de la tabla anterior, es
igual a 1.48.
Informaciones como las anteriores u otras de igual valor prctico que tambin son
deducibles del mismo modelo probabilstico, son perfectamente utilizables con fines de
previsin y planificacin, dada su alta regularidad a largo plazo, aun cuando ellas no
constituyan verdades absolutas e irrevocables, menos an tratndose de lo que pueda

ocurrir (o no ocurrir) en un caso particular dado. Del mismo modo, el director de un


establecimiento educacional (que siempre planifica su trabajo y que usa buenos
modelos probabilsticos para tomar sus decisiones) puede saber anticipadamente, por
ejemplo, el nmero de alumnos que sern reprobados en cada una de las asignaturas
de los distintos niveles de estudio, aun cuando no sepa exactamente qu alumnos
sern sos; tambin sabr el nmero de horas de clase perdidas por diferentes
motivos, la cantidad de alumnos que alcanzarn niveles de excelencia, el gasto
originado por el uso de gimnasios y laboratorios, etc.
1. El valor esperado de una variable aleatoria (que sigue un modelo probabilstico
determinado) es el promedio que esta variable toma dentro del modelo. Por
ejemplo, en el caso de los incendios, dijimos que el promedio es 1.48. Es decir,
el valor esperado del nmero semanal de incendios es 1.48. En el ejemplo de la
distribucin de notas, se puede comprobar, haciendo los clculos respectivos,
que el valor esperado de las notas es 4.875. No hay que olvidar, sin embargo,
que una vez que la prueba haya sido efectivamente tomada y evaluada, el
promedio real de las notas casi seguramente ser algo diferente del valor
esperado del modelo.
Si la variable aleatoria se denota por X, entonces su valor esperado se denota
por E(X). Puesto que la existencia de un modelo probabilstico es independiente
y anterior a cualquier observacin real de la variable (X) involucrada, se puede
decir que E(X) es el promedio a priori de dicha variable, supuesto un gran
nmero de observaciones.
2. As como en un modelo dado es posible calcular el promedio (a priori) de la
variable pertinente (x), tambin es posible calcular a priori, en relacin con la
misma variable, cualquier otro de los estadgrafos conocidos, tales como la
mediana, la moda, la desviacin estndar, etc. En particular, llamaremos
varianza esperada a la varianza calculada a partir de la distribucin dada por el
modelo y la denotaremos por V(X). En los ejemplos dados es posible calcular
que la varianza esperada de las notas es 1.397 y la varianza esperada del
nmero semanal de incendios es 1.442. (Recordemos que la varianza se calcula
como el cuadrado de la desviacin estndar y que es una medida de la
dispersin de los valores que toma la variable).
3. Ahora estamos en condiciones de recordar brevemente qu es el modelo
normal. En la Ilustracin N 1 podemos ver un dibujo que representa a nuestra
conocida campana.

Ilustracin N 1

Su forma simtrica, con una parte central (donde se acumula la mayora de las
observaciones posibles) y dos largas colas en descenso perpetuo (all se arrinconan,
por uno y otro lado, los casos ms excepcionales), son algunos de sus rasgos ms
notorios.
La curva, de forma tan caracterstica, representa una distribucin de probabilidades, es
decir, un modelo que permite explicar el comportamiento de numerosas variables
aleatorias. Este modelo tiene dos parmetros (que son nmeros fijos que determinan
completamente al modelo): uno de posicin, que marca el lugar central de la curva y
corresponde al valor esperado (que puede ser cualquier nmero), y otro de dispersin,
que determina tanto el ancho como el alto de la curva y corresponde a la varianza
esperada (que slo puede tomar valores positivos). Diferentes combinaciones de estos
dos parmetros posibilitan la existencia de infinitas curvas normales que difieren entre
s en cuanto a su posicin, a su forma, o a ambos aspectos (ver la Ilustracin N 2).
Aunque en todos los casos ambas colas de la curva son infinitamente largas, la gran
mayora de las observaciones se encontrarn alrededor del valor esperado, a una
distancia no mayor que tres desviaciones estndar. Si X es una variable aleatoria
normal tal que E(X) = 0 y v(x) = 1, entonces decimos que ella es una variable normal
estndar. Esta distribucin es nica (como cualquiera que tenga fijos sus parmetros) y
se puede encontrar tabulada en cualquier libro de estadstica.

Finalmente, diremos que dos o ms variables aleatorias son independientes si

ninguna de ellas puede explicar o ser explicada por una (o ms) de las otras, bajo
ninguna circunstancia. Aunque en la prctica sta es una condicin difcil de establecer
fehacientemente, lo usual, sin embargo, es suponer tal independencia cada vez que
ello parezca suficientemente aceptable por el sentido comn. Por ejemplo, si tomamos
una vez ms los ejemplos que hemos utilizado, podemos suponer que el resultado de
nuestra prueba es independiente del nmero semanal de incendios que se declaren en
la ciudad. Nadie podra probar si esas variables son realmente independientes, pero
hasta que no sea hallada la relacin entre ambas bien podemos suponer que s lo son.
Consideremos otro ejemplo: si lanzamos varias veces un dado bien equilibrado, no nos
ser posible predecir el nmero que resulte en cada lanzamiento, aun cuando
conozcamos todos los nmeros obtenidos en lanzamientos anteriores. Si efectivamente
es as, diremos que estos resultados son independientes unos de otros y que
constituyen, por lo tanto, un conjunto de variables aleatorias independientes.
A partir de las explicaciones anteriores, estamos en condiciones de dar un enunciado
del Teorema Central del Lmite:
Teorema central del lmite. Si se tiene un conjunto numeroso de variables aleatorias
independientes, digamos: X1, X2, X3, Xn, entonces la suma de todas ellas es una
variable aleatoria, S, que sigue una distribucin aproximadamente normal, cuyo valor
esperado y cuya varianza son, respectivamente:

E(S) = E(X1) + E(X2) + E(X3) + ... + E(Xn)


V(S) = v(X1) + v(X2) + v(X3) + ... + V(Xn)

La aproximacin al modelo normal es tanto mejor cuanto ms numeroso sea el


conjunto de variables sumadas. El teorema se llama del lmite porque si el nmero
de variables sumadas fuese infinito, entonces el modelo resultante sera exactamente
normal.
No obstante lo anterior, para cualquier finalidad prctica, la aproximacin al modelo
normal es bastante buena a partir, ms o menos, de 40 sumandos (esto depende de
cada caso particular). Por el contrario, dicha aproximacin es tanto peor cuanto menor
sea el nmero de variables que se sumen (excepto si esas variables sumadas son,
cada una de ellas, normales). Por ejemplo, si lanzamos 5 dados (independientes) y
sumamos los nmeros obtenidos, la variable resultante no es una variable aleatoria
normal. Pero si lanzamos 50 dados y sumamos los nmeros obtenidos, la variable
aleatoria resultante s quedara explicada por un modelo normal, con un valor esperado
y una varianza esperada perfectamente calculables. Es decir, el comportamiento
probabilstico de esta variable (la suma de los nmeros obtenidos en 50 lanzamientos
de un dado) sera suficientemente conocido y manejable por medio del modelo normal
correspondiente.
El principal mrito y utilidad de este teorema radica en el hecho de que no hace ningn
supuesto sobre las variables sumadas, aparte de que deban ser independientes y
deban tener, cada una de ellas, un valor esperado y una varianza que sean sumables
con todos los dems valores esperados y varianzas. Las variables involucradas pueden
ser de las ms diversas ndoles: grandes o pequeas, discretas o continuas, conocidas
o desconocidas, parecidas entre s o por completo diferentes, etc. Todo esto hace que
el Teorema Central del Lmite sea una herramienta sumamente poderosa, ya que
permite pronosticar el comportamiento de cualquier variable aleatoria cada vez que
sta pueda ser concebida como una suma de muchas otras variables aleatorias
independientes. Si se piensa en ello cuidadosamente, se ver que esta situacin es
ms frecuente de lo que parece ser a primera vista. El ejemplo que sigue puede
ayudarnos a comprender mejor los alcances de este famoso y poderoso teorema.
En una ciudad, los consumos de electricidad de los clientes de la Compaa Elctrica
local son variables aleatorias. Tenemos as muchas variables aleatorias cuyo
comportamiento puede ser previsible, o no, para cada cliente en particular; en
realidad, no estamos en condiciones de decir qu modelos podran seguir estas
variables (si es que tales modelos existen). Pero suponiendo que las cuentas de
electricidad son muchas y que, adems, todas ellas son independientes entre s,
podemos asegurar que el total de electricidad que la Compaa debe suministrar a sus
clientes (o sea, la suma de todos los consumos individuales) es, indudablemente, una
variable aleatoria que sigue un modelo normal.

3. APLICACIONES A LA EVALUACION EDUCACIONAL


Digamos, una vez ms, que la afirmacin fundamental contenida en el Teorema Central
del Lmite es que si sumamos muchas variables aleatorias independientes, el resultado
de esa adicin debe ser una variable aleatoria normal, sin importar cmo hayan podido
originarse o qu signifiquen las diferentes variables sumadas. No obstante esta gran
generalidad, que la teora avala plenamente, lo usual en las aplicaciones (en especial
las educacionales) es que la suma se obtenga a partir de una misma variable que es
medida varias veces en forma independiente. Debe entenderse que es la suma (y no
cada una de las variables sumadas) la nica variable que el teorema identifica como
normal.

As, por ejemplo, si en nuestro curso de 40 alumnos pudisemos suponer que las notas
obtenidas en una prueba son independientes unas de otras, de modo tal que la nota
obtenida por un alumno no tenga relacin alguna con la nota obtenida por otro alumno
cualquiera, entonces la suma de todas esas notas ser una variable aleatoria normal.
Como consecuencia de esto, el promedio de esas notas (que es la suma de ellas
dividida por 40) ser tambin una variable aleatoria normal.
Notemos que en este ejemplo no estamos haciendo ninguna referencia a que la prueba
se pueda tomar a comienzos o a fines del ao; no sabemos si se trata de un pretest o
se trata del examen final del curso. Los grficos de la Ilustracin N 2 podran
corresponder a modelos aptos para representar la distribucin del promedio de notas
en un pretest y en un examen final, respectivamente. En el primer caso se ha previsto
(como ejemplo) un valor esperado igual a 1.75, con desviacin estndar esperada igual
a 0.25; en el otro, un valor esperado igual a 5.5, con desviacin estndar esperada
igual a 0.50. Ntese que no se hace ninguna referencia a la forma de evaluacin
utilizada: no sabemos si esas notas provendrn de interrogaciones escritas u orales, si
de pruebas de seleccin mltiple o de ensayo, si de trabajos de investigacin,
disertaciones, pasos prcticos, etc. Es posible suponer que se den simultneamente
cualesquiera de esas alternativas, y tambin suponer que esas notas corresponden a
evaluaciones por criterios, sin que nada de ello pueda anular el hecho de que stas
son distribuciones normales.
En el ejemplo que hemos dado nos referimos al promedio de notas en un curso del que
hemos supuesto dos premisas: que el curso es numeroso (de 40 alumnos) y que las
(40) notas son todas independientes entre s. Esas son las condiciones, establecidas en
el Teorema Central del Lmite, que nos aseguran que ese promedio debe ser una
variable aleatoria normal, sea cual sea la forma de obtencin de cada una de las notas
en particular y sea cual sea el destino o interpretacin que esas notas tengan.
Veamos ahora otro ejemplo. Consideremos como variable aleatoria la (nica) nota que
un solo alumno puede obtener en una prueba determinada. Supongamos que sta es
una prueba de seleccin mltiple, en la que el alumno suma puntaje a su favor por
cada respuesta correcta y disminuye puntaje por cada error. Una vez ms pensemos
en dos premisas: que el nmero de preguntas de la prueba es bastante grande (por
ejemplo, 60) y que el acierto o fracaso en cualquiera de las preguntas no influye en el
acierto o fracaso en cualquier otra. A partir de esas premisas, que son las del Teorema
Central del Lmite, debemos concluir que el puntaje final acumulado por el alumno en
la prueba (y, en consecuencia, su nota final) debe ser una variable aleatoria normal. Y
nuevamente podemos observar que es irrelevante si esa nota corresponde, o no, a
criterios de logro preestablecidos y tambin es irrelevante que la nota se use para
seleccionar personas, o para eliminarlas, o para cualquier otra finalidad.

Ilustracin N 2

Ilustracin N 3

4. EL MODELO NORMAL Y LA EVALUACION POR CRITERIOS


De acuerdo con los ejemplos que hemos desarrollado, ya debera estar claro para el
lector que el hecho de que evaluemos por criterios, es decir, fijando claramente los
estndares de rendimiento preestablecidos para asignar las notas correspondientes, no
es en absoluto un motivo para descartar de antemano la posibilidad de que tales notas,
o sus promedios, puedan tener una distribucin normal. Ms an, si se dan
exactamente las condiciones que establece el Teorema Central del Lmite, tales
variables sern inevitablemente normales.

No obstante lo anterior, tambin debemos tener claro que el Teorema Central del
Lmite slo nos provee de un modelo aproximado para explicar el comportamiento de
las variables que nos interesen (y esto es as tanto si evaluamos por criterios como si
lo hacemos de otro modo). Es, pues, perfectamente posible concebir otros modelos,
diferentes del normal, que tambin ofrezcan la posibilidad de darnos buenas
descripciones (tambin aproximadas, como con cualquier modelo terico) del
comportamiento de nuestras variables. Ellos pueden ser usados alternativamente,
sobre todo en aquellos casos en que las referidas condiciones del Teorema Central del
Lmite no se den o parezcan dudosas. En relacin con este punto, se ha propuesto
(Fernndez 1987) un modelo probabilstico, llamado Modelo Edumtrico, especialmente
concebido para ser aplicado a distribuciones de notas en un contexto de evaluaciones
por criterios. A modo de ejemplo, en la Ilustracin N 3 se puede ver una distribucin
edumtrica de notas cuyo valor esperado es 5.5 y cuya desviacin estndar es 0.90
(en escala de 1 a 7). En lnea de puntos ms suaves se insina la distribucin normal
con igual valor esperado e igual desviacin estndar. Obsrvese que una parte de la
cola derecha de la curva normal queda fuera del cuadro, es decir, se sale del rango de
las notas, lo que es ciertamente no deseable, ya que el modelo supone la existencia de
notas all donde no las puede haber.
En sntesis, diremos que cuando se evala por criterios la distribucin de notas puede
ser convenientemente explicada mediante un modelo normal o no serlo, dependiendo
esto de que se den, o no, las condiciones del Teorema Central del Lmite. Si no se dan
estas condiciones, el modelo adecuado podra ser algn otro diferente del normal, por
ejemplo el modelo edumtrico.

5. EL MODELO NORMAL Y LA EVALUACION POR NORMA


Como sabemos, la caracterstica esencial de la evaluacin por norma consiste en
relativizar la escala de calificaciones, ajustndola convenientemente de acuerdo con los
resultados obtenidos por un grupo (relativamente numeroso) de alumnos sometidos a
una misma prueba. En este contexto no interesa tanto que los alumnos evaluados
demuestren dominio de ciertos objetivos predeterminados, sino que interesa hacer una
seleccin de los alumnos que, en relacin con el grupo evaluado, demuestren ser los
mejores.
Como es obvio, lo ms simple para el propsito anterior es ordenar todos los puntajes
obtenidos, de mayor a menor o viceversa, y hacer un corte en el lugar que convenga a
los propsitos de la seleccin. Sin embargo, si queremos presentar los resultados como
notas (por ejemplo, en escala de l a 7) y de modo tal que slo los alumnos de
rendimiento igual o superior al promedio del grupo tengan una nota igual o superior a
la nota de aprobacin (por ejemplo, 4.0), entonces el problema es algo ms
complicado.
Consideremos un ejemplo. Para llenar 8 vacantes en cierto trabajo, han rendido un
examen escrito de suficiencia 52 postulantes. Supongamos que la prueba se ha
diseado para medir el porcentaje de logro de ciertos objetivos predeterminados
(criterios) y que sus resultados se expresan en un puntaje comprendido entre 0 y 100
puntos. Los siguientes son los resultados, ya ordenados, obtenidos por los postulantes:

94,

88,

82,

79,

74,

71,

65,

64,

62,

61,

58,

57,

55,

54,
29,
15,

50,
29,
14,

44,
28,
14,

43,
28,
13,

41,
25,
13,

40,
24,
12,

38,
24,
11,

36,
23,
10,

34,
23,
10,

34,
20,
7,

34,
18,
7,

31,
18,
5,

30,
15,
2

Est claro que los postulantes seleccionados deben ser aquellos cuyos puntajes fueron:
94, 88, 82, 79, 74, 71, 65 y 64. Sin embargo, qu notas les corresponden?
El mecanismo usual para responder a la pregunta anterior comienza por calcular el
promedio y la desviacin estndar de todos los puntajes. En el presente caso esos
estadgrafos son 35.7 y 23.2, respectivamente. Ellos permiten estandarizar los
puntajes, o sea, restar el promedio a cada puntaje y luego dividir la diferencia
obtenida, por la desviacin estndar. En este caso, a cada nota se le deber restar
35.7 y la diferencia deber dividirse por 23.2. En el ejemplo, los puntajes
estandarizados son:

2.51, 2.25, 2.00, 1.87, 1.65, 1.52, 1.26, 1.22, 1.13, 1.09, 0.96,
0.92, 0.83, 0.79, 0.62, 0.36, 0.32, 0.23, 0.19, 0.10, 0.01,
-0.07,
-0.07, -0.07, -0.20, -0.25, -0.29, -0.29, -0.33, -0.33, -0.46,
-0.50, -0.50, -0.55, -0.55, -0.68, -0.76, -0.76, -0.89, -0.89,
-0.94, -0.94, -0.98, -0.98, -1.02, -1.06, -1.11, -1.15, -1.24,
-1.24, -1.32, -1.45

Una vez estandarizados los puntajes, stos son convertidos a notas definitivas
adecundolos a la escala que se quiera utilizar. En nuestro caso, ello se logra
simplemente sumando 4 puntos a cada puntaje estandarizado. Hecho eso, las notas
finales resultan ser:

6.51
4.92
3.93
3.45
2.98

6.25
4.83
3.93
3.45
2.94

6.00
4.79
3.80
3.32
2.89

5.87
4.62
3.75
3.24
2.85

5.65
4.36
3.71
3.24
2.76

5.52
4.31
3.71
3.11
2.76

5.26
4.23
3.67
3.11
2.68

5.22
4.19
3.67
3.06
2.55

5.13
4.10
3.54
3.06

5.09
4.01
3.50
3.02

4.96,
3.93
3.50
3.02

El promedio de estas notas es 4.0 y la varianza es 1.


Es un teorema de la teora estadstica que si la distribucin de los puntajes originales
es normal, entonces la distribucin de los puntajes estandarizados debe ser una
normal estndar. Ya hemos dicho que as se llama el modelo normal cuyo valor
esperado vale 0 y cuya varianza vale 1. La forma de este modelo es la de la Ilustracin
N 1, en la que debe entenderse que casi todos los datos (aproximadamente el

99.74% de ellos) deben encontrarse entre los valores -3, por la izquierda, y +3, por la
derecha.
Sin embargo, si la distribucin original no es normal entonces la distribucin de las
notas estandarizadas y, en consecuencia, la distribucin de las notas finales, no tienen
por qu ser normales.
La Ilustracin N 4, que representa grficamente a la tabla anterior, expresa mejor lo
dicho en relacin con ella. Debe ponerse atencin a los nmeros puestos en su parte
inferior, que representan a las tres principales marcas de clase.

Tabla 3
1

2.50 - 2.99

3.00 - 3.49

13

3.50 - 3.99

10

4.00 - 4.49

4.50 - 4.99

5.00 - 5.49

5.50 - 5.99

6.00 - 6.49

6.50 - 7.00

En la tabla adyacente hemos agrupado las notas finales del ejemplo


en nueve clases de igual tamao, a fin de observar la forma
aproximada de la destribucin de estas notas.
A simple vista puede apreciarse que esta distribucin no es simtrica,
como debiera serlo si se tratase de una distribucin normal.
Si esta distribucin fuese normal, las clases 3 y 4, que son adyacentes
al valor promedio, debieran ser de igual tamao. Tambin las clases 2
y 5, 1 y 6. Se ve que las notas altas estn ms repartidas.

Ilustracin N 4

Comparemos el perfil anterior con los que corresponden a una distribucin normal (en
lnea punteada) y a una distribucin edumtrica (en lnea gruesa):
La distribucin normal dibujada tiene el mismo promedio (4) y la misma varianza (1)
que el conjunto de notas finales. Por su parte, la distribucin edumtrica, que se
caracteriza por tener un nico parmetro, llamado t (tiempo), en este caso se ha
tomado con el valor t = 2.2. Los valores paramtricos sealados, tanto los del modelo
normal como el del modelo edumtrico, son los que mejor se ajustan a los datos del
ejemplo.
A simple vista, ninguno de los dos modelos parece representar muy bien al conjunto de
datos. Sin embargo, la prueba de bondad de ajuste de Kolmogorov-Smirnov (Canavos
1988) permite aceptar ambos modelos como vlidos, con un nivel de significacin
a = 0.20. En lo que se refiere al conjunto original de datos (o sea los puntajes antes de
ser estandarizados), tambin resultan aceptables los modelos normal y edumtrico
respectivos.
En sntesis, queremos afirmar una vez ms que no basta estandarizar los puntajes, o
utilizarlos para discriminar a los mejores entre un grupo de alumnos sometidos a una
misma prueba, para que el modelo normal sea automticamente la mejor herramienta
disponible. No depende de la estandarizacin el que las notas finales resulten
ajustadas, o no, a un modelo normal. Todava ms, es posible que otros modelos sean
tan vlidos como el normal, o aun mejores, incluso cuando se est evaluando por
norma, como en el caso del ejemplo.

Ilustracin N 5

6. CONCLUSION
En este trabajo hemos intentado establecer dos ideas:

i) Existen dos formas de evaluacin, que sirven a propsitos diferentes, denominadas


por criterios y por norma, respectivamente. Ambas formas de evaluar son actuales
y ambas son vlidas en su respectivo contexto.
ii) Existen varios modelos probabilsticos que son aplicables a la evaluacin del
aprendizaje; entre ellos se cuenta el modelo normal. El correcto uso del modelo normal
no est sujeto a la forma de evaluacin a la que se le quiera aplicar; su aplicabilidad
depende de otras premisas, independientes del tipo de evaluacin que se use.

Av. J.P. Alessandri N 1701-J


uoa, Santiago, Chile

7. BIBLIOGRAFIA
AHUMADA, P. 1983. Principios y procedimientos de evaluacin educacional. Ediciones
Universitarias de Valparaso, Chile.
[ Links ]
CANAVOS, G.C. 1988. Probabilidad y estadstica. Aplicaciones y mtodos. Mc Graw-Hill,
Mxico.
[ Links ]
FERNANDEZ V., A. 1987. Medicin y uso del tiempo en un contexto de aprendizaje
para el dominio, Estudios Pedaggicos 13: 15-27. Universidad Austral, Valdivia,
Chile.
[ Links ]
KENDALL & BUCKLAND. 1980. Diccionario de estadstica. Ediciones Pirmide,
Madrid.
[ Links ]
MEZA, OLIVARES y PASCUAL. 1986. Evaluacin educacional. Manual para educadores.
Instituto de Servicio Educacional Chile.
[ Links ]

You might also like