Professional Documents
Culture Documents
Como ocurre con todo término muy utilizado, la palabra evaluación es empleada con diferentes
significados en circunstancias muy diversas, contribuyendo a una cierta confusión cuando se emplea
en el campo educacional y, sobre todo, aplicada al proceso enseñanza-aprendizaje. Así, con
frecuencia los profesores emplean el término evaluación cuando, en realidad, deberían utilizar la
palabra medición.
MEDICION
Cuando, después de medir una puerta, se concluye que ésta tiene dos metros de largo, un metro de
ancho y ochenta centímetros de alto, tal conclusión es producto de una medición. En cambio, si
sobre la base de los mismos datos cuantitativos se dice que esa puerta es muy grande para entrar
por un espacio determinado, tal conclusión es producto de una evaluación. Medición implica
cuantificación. La evaluación interpreta los datos ofrecidos por la medición y presupone un juicio de
valor. Por ejemplo, al analizar los resultados de una medición sobre un aprendizaje determinado, se
debe juzgar si se aceptan o no esos resultados como una indicación de que el alumno alcanzó el
aprendizaje que se esperaba de él.
EVALUACION
En primer lugar, la evaluación solo tendrá sentido si los objetivos han sido previa y claramente
definidos. Es imposible evaluar si antes no se ha establecido que es lo que se pretende del alumno
logre. Por lo tanto, la evaluación es funcional puesto que se realiza en base a objetivos de
aprendizajes.
En tercer lugar, la evaluación debe ser continua. No es algo que se realiza solo al final de un
determinado período escolar o académico, sino que debe ser algo que se efectúa a lo largo de todo
Por último, la evaluación tiene que ser integral ya que debe considerarse al alumno como un todo,
juzgando no solo los aspectos cognoscitivos (dimensión del saber y el hacer), sino también los
aspectos socioafectivos-valóricos (dimensión del ser y convivir). Hoy, además del interés por
conocer lo que los alumnos saben, también importa indagar lo que el alumno hace con lo que sabe.
Por ejemplo, los conocimientos adquiridos por los educandos ¿les permiten una vida mejor, ¿lo
hacen más feliz?, ¿lo convierten en un hombre realmente útil para la comunidad en que vive?.
Además, la evaluación ha ampliado sus agentes de estudio. Hasta hace poco tiempo, solo el
profesor era el encargado de evaluar. Sin embargo, a medida que el alumno se va haciendo más
activo en su proceso de aprendizaje, también va tomando otro carisma, lo que hace activo y
participativo el proceso de evaluación. Lo que confiere una importancia cada vez mayor a las
técnicas de autoevaluación y a los instrumentos que permitan al alumno un autocontrol de sus
propios progresos, como también el proceso de coevaluación, en el cual, el juicio que puedan emitir
los pares es fundamental.
Por otra parte, no debe olvidarse que los padres y apoderados son personas interesadas en el
progreso de sus pupilos y que deben ser Incluidos también en este proceso, si se desea que la
evaluación sea un proceso efectivamente cooperativo.
empresa en la cual, desde sus roles respectivos, participasen todos los agentes involucrados en el
proceso educativo con el fin de orientarlo hacia el logro de las metas que se hayan considerado y
propuesto como adecuadas.
Para lograr este conocimiento, es necesario aplicar instrumentos que permitan inferir en que medida
está presente en los sujetos, la cualidad o atributo que se desea investigar.
La forma de obtener la información requerida puede ser distinta según se trabaje bajo un enfoque
psicométrico (Medida que refleja diferencias inter-individuales) o edumétrico (Medida que refleja el
crecimiento intra-individual) de la medición. Ello significa que, según sea el enfoque, las etapas o
procesos serán diferentes, tanto en el diseño y elaboración del instrumento como en el análisis e
interpretación de la información obtenida con él.
"Cuando se habla de enfoque edumétrico, lo que interesa es que el instrumento proporcione una
información que permita establecer, para cada individuo, si posee o no el atributo estudiado en la
dimensión considerada. En cambio, en las perspectivas psicométricas lo que se pretende es
discriminar entre los sujetos de un mismo grupo, respecto del atributo medido. La discriminación es
fundamental en procesos de selección, pero no lo es tanto en el proceso enseñanza-aprendizaje".
Mediciones físicas más complejas, como la audición, visión y otros, sin embargo requieren de
formulaciones explícitas y detalladas de reglas o procedimientos que deben seguirse para que
todas las observaciones de la misma característica sean cuantificadas de las misma manera.
Por atributo o propiedad, se entiende una característica reconocida en la cual los objetos o sujetos
de un conjunto pueden variar. A cada objeto del conjunto puede asignársele un valor específico
del atributo.
La medición puede ser "directa" si está referida a características físicas de los objetos o sujetos,
como por ejemplo; longitud, peso, espacio, tiempo, etc.,donde los resultados se dan en
centímetros, gramos, decilitros o segundos. Por lo general no se presentan problemas en este tipo
de mediciones.
La situación es diferente cuando se quiere medir variables psicológicas. Una variable psicológica
puede ser definida "como una propiedad o característica que poseen diferentes individuos en
cantidades distintas". La medición de variables como independencia, neurotismo, capacidad de
pensamiento lógico, aptitudes para el aprendizaje u otras características efectivas, presentan
problemas de precisión y escalamiento muy complejos. La falta de precisión en estas mediciones
se debe por lo general al hecho de que estos rasgos o atributos deben medirse de manera
"indirecta", por ejemplo, a través de la observación de la conducta visible de los individuos o por
medio de test que son también procedimientos indirectos de medición.
Robert L. Ebel señala: "Hoy no sabemos como medir con precisión todos los resultados
educacionales que son importantes. Pero, en principio, todos los resultados importantes de la
educación son mensurables".
El mismo autor agrega: "Para ser importante un resultado de la educación debe ser algo que
produzca una diferencia observable".
b) Determinar un conjunto de situaciones en las cuales el atributo que se quiere medir puede
manifestarse y hacerse perceptible.
c) Establecer un conjunto de procedimientos o definiciones para traducir las observaciones
realizadas a enunciados cuantitativos de grado o cantidad.
Ya se estableció anteriormente que nunca medimos una cosa o una persona en forma directa. Lo
que medimos es siempre una cualidad o atributo de la cosa o de la persona que nos interesa.
Antes de llegar a una definición del atributo, tenemos que decidir cuáles serán los atributos que
hayamos de medir; esta decisión se basa fundamentalmente en su importancia y pertinencia. Si
no elegimos acertadamente los atributos que se medirán, la descripción que hagamos
posteriormente de éstos puede carecer de valor para la necesidad que tengamos.
Luego de seleccionar los atributos se debe llegar a una definición clara, precisa y aceptada de
ellos, sin ambigüedad y en términos operacionales si ello es posible. Esto que puede parecer
relativamente fácil, requiere de cierta práctica y de flexibilidad ya que para algo tan sencillo como la
destreza de lectura podemos obtener toda una gama de definiciones.
Pensemos por ejemplo, en la "responsabilidad" como rasgo a medir ¿Qué es lo que se puede
entender por responsabilidad en un niño de Básica? ¿Hasta qué punto podremos ponernos de
acuerdo en su definición?, y una vez que hayamos tratado de definirla, ¿cuáles serán los
procedimientos u operaciones que podremos utilizar para estimar su presencia o inexistencia?.
Esta definición hecha sobre la base de comportamientos u operaciones que debe realizar la
persona se denomina "definición operacional".
Una vez que se haya aceptado un conjunto de operaciones para poner de manifiesto un atributo se
deberá expresar el resultado de sus operaciones en términos cuantitativos. Para esto, deberemos
recurrir a alguna definición que nos proporcione unidades para la cuantificación. Normalmente se
usan o se elaboran escalas para cuantificar. Estas escalas, en educación, tienen desde el punto de
vista de la medición una serie de deficiencias: unidades que no son iguales, los resultados son
propios del instrumento, etc.
¿Son realmente necesarios los instrumentos para medir aspectos del proceso enseñanza-
aprendizaje?, ¿Qué es lo que debiera medirse con mayor frecuencia o qué es lo más importante
para medir en el proceso enseñanza-aprendizaje?, ¿Qué hace que un instrumento para medir
rendimiento sea bueno o de calidad?.
Estas preguntas preocupan tanto a docentes como alumnos cuando tienen que enfrentarse a una
prueba; los primeros preocupados por su elaboración, los segundos por su significado y ambos por
su utilidad.
El proceso enseñanza-aprendizaje requiere, como todo proceso, de una evaluación continua para ir
mejorando cada vez más su efectividad y con ello el rendimiento de los alumnos.
El profesor tiene la gran responsabilidad de planificar el proceso, de manera que responda tanto a
las necesidades e intereses de los alumnos como a los avances del conocimiento y a los
requerimientos que la sociedad le plantea a la escuela, ya sea en forma explícita o implícita.
Además, el profesor debe organizar todo el proceso, debe asignar responsabilidades, tiene que
motivar y estimular a los alumnos en el logro de los aprendizajes propuestos y debe, también,
identificar dificultades y deficiencias que se producen en el proceso de aprendizaje de los alumnos,
para luego señalarles nuevas estrategias de trabajo o nuevas actividades de aprendizaje que les
permitan superar dichas deficiencias.
Todo lo anterior implica un gran número de decisiones que debe tomar el docente. Estas decisiones
varían en cuanto al tiempo en que deben tomarse, pero son todas ellas fundamentales para el éxito
de su labor profesional y para el éxito de los alumnos que él tiene bajo su responsabilidad. Por ello,
las decisiones deben basarse en informaciones muy oportunas, confiables, válidas, objetivas e
interpretabas.
Es cierto que podemos apoyarnos en una opinión, que alguien nos diga "todo va marchando muy
bien" o "los alumnos, están aprendiendo muy bien"; pero, sin que la persona que nos da la opinión
se lo proponga, el juicio puede estar basado en algunas observaciones muy informales o
conversaciones aisladas. Por las implicancias que tienen las decisiones a que nos hemos referido,
es fundamental que el profesor y los alumnos tengan antecedentes muy precisos para poder tomar
decisiones adecuadas.
Los procedimientos seleccionados o elaborados para evaluar, y por lo tanto medir un sistema o
proceso de enseñanza-aprendizaje son tan importantes como los procedimientos para desarrollar
dicho proceso.
Sin la retroalimentación que produce la evaluación durante el desarrollo, es muy posible que el
proceso se implemente sin identificar los elementos que necesitan ser modificados para alcanzar
efectivamente los objetivos. Un error bastante común en educación ha sido asignarle poca
importancia a la evaluación formativa, tanto de los aprendizajes de los alumnos como del proceso de
enseñanza-aprendizaje en general.
En este contexto, los instrumentos de medición son de una importancia crítica, ya que ellos
proporcionan los antecedentes, los datos objetivos que pueden quedar abiertos a la inspección de
quienes participan directa o indirectamente en el proceso enseñanza-aprendizaje; datos o
antecedentes que están relativamente libres de los puntos de vista personales del docente o
evaluador.
Por último, es importante señalar que la medición de aspectos tales como, habilidades,
conocimientos, intereses y actitudes, son muy difíciles de medir y además no son estáticos; cambian
de un momento a otro. Siempre resulta necesario definir, tanto la naturaleza del rasgo que se quiere
medir como la manera en que se medirá.
Para enfocar una respuesta a la pregunta formulada, es útil clasificar las mediciones en un sentido
muy amplio, de acuerdo con lo que queremos hacer.
En el primer caso se habla de medición del estatus y, en el segundo de medición del cambio.
Estos dos tipos de decisiones pueden representarse gráficamente en una matriz de dos por dos, tal
como se ilustra a continuación:
MEDICION MEDICION
DEL ESTATUS DEL CAMBIO
MEDICION I II
REFERIDA A NORMA
MEDICION III IV
REFERIDA A CRITERIO
La celda I tiene gran importancia cuando se desea seleccionar entre personas (ingreso a la
universidad o a un establecimiento, identificar a los más capaces, etc.).
La celda II tiene mucha relevancia en situaciones en las que se desea comparar dos o más
programas experimentales de trabajo.
Para la tarea del docente son las celdas III y IV las más pertinentes, en especial la última, ya que el
docente está comprometido con el proceso de cambio de sus alumnos en la dirección de los
objetivos establecidos. La III tiene una relación directa con el proceso de ubicación del alumno en
el momento en que se comienza el proceso enseñanza-aprendizaje.
Son muchos los aspectos de interés que en el proceso enseñanza-aprendizaje y que requieren de
alguna forma de medición. Algunos están directamente bajo la responsabilidad del docente, otros
corresponden a grupos de docentes, a evaluadores de la institución o a la institución en general. A
modo de ejemplo se señalan algunos aspectos que requieren de medición.
1 . Aprendizajes.
¿Cómo perciben el proceso enseñanza-aprendizaje los alumnos, los padres (les gusta, es
difícil, es organizado, es confuso, etc)?
¿Qué actitudes se están desarrollando en los alumnos, en los docentes, en los padres,
como resultado de las estrategias de trabajo?
3. Problemas
4. Costo.
5. Características del medio en que está la carrera y de los alumnos que participan en ella.
¿Cuáles son los intereses predominantes en todos y en cada uno de los alumnos?,
Para realizar estas mediciones se han ideado diferentes tipos de procedimientos. Según el método
para obtener la información, los procedimientos se han clasificado como procedimientos de:
a) Pruebas o test: En ellos se da al sujeto una serie de tareas que deberá realizar y se
observa, ya sea el proceso que sigue en su realización o bien los resultados o productos obtenidos
derivados de la ejecución de la tarea.
Muchos son los tipos de pruebas que se pueden utilizar: pruebas verbales, no verbales y de
ejecución. Pruebas colectivas. individuales, pruebas de velocidad y de dominio, pruebas
estandarizadas y pruebas no estandarizadas, de análisis de contenido, etc.
Dentro de este tipo de procedimientos se pueden señalar los siguientes: registros anecdóticos, listas
de comprobación, pautas de observación.
Como se ha visto, con un instrumento de medición se desea recolectar información útil para evaluar
y tomar decisiones. La información generalmente es una muestra de conductas, opiniones o
actuaciones de personas y esta muestra deber ser representativa de la característica o rasgo que se
desea medir. Esto no siempre es fácil y muchas veces la información que se reúne no es todo lo útil
que se quisiera. Por ello debemos también evaluar la calidad de un instrumento.
Para realizar esta evaluación requerimos, al igual que en toda evaluación, de algunos criterios para
determinar si el instrumento es apropiado o no. Los siguientes criterios serán los que
consideraremos para evaluar la calidad de un instrumento de medición:
Validez
¿Podemos afirmar con seguridad que si un alumno obtiene puntajes más altos en un instrumento
que mide actitud hacia la asignatura, le gusta más la asignatura respecto de los otros que obtuvieron
puntajes más bajos?. Para responder a esta pregunta tenemos que considerar tres puntos de
referencia para evaluar los resultados del instrumento: el pasado, el presente y el futuro.
Otros instrumentos tienen su punto de referencia en el futuro. Ellos tienen como. propósito
determinar la presencia de cualidades en la persona, que predicen su conducta futura. La prueba de
aptitud académica que se exige para ingresar a la universidad es un ejemplo de este tipo de
instrumentos. Con ella se desea determinar, o mejor dicho predecir, el éxito del estudiante en sus
estudios futuros Aún cuando este tipo de instrumentos también se basa en las experiencias
pasadas del alumno, su objetivo principal es predecir el éxito futuro.
Por último, otro tipo de instrumentos tiene su punto de referencia en el presente, centrándose en la
concurrencia de otras cualidades que presumiblemente están relacionadas con lo que se quiere
medir. Como ejemplo se pueden citar los inventarios de intereses, las escalas de actitudes que
determinan la predisposición de una persona para actuar de una manera determinada.
Para el docente el tipo de validez más relevante en los instrumentos que él utiliza frecuentemente,
es el que se refiere a determinar el grado en que los instrumentos
miden el logro en los objetivos que él ha propuesto para sus alumnos, tanto en el dominio
cognoscitivo como en el afectivo y psicomotor. Algunos autores denominan esta validez con el
nombre de validez de contenidos, otros se refieren a ella como instrumento apropiado.
Como se puede apreciar, para determinar si un instrumento es apropiado se debe disponer tanto
del instrumento completo como de los objetivos que pretende medir.
Confiabilidad
Un instrumento que es confiable ofrece una medida estable de lo que se ha medido. En términos
simples se puede afirmar que una prueba que es bastante completa en cuanto a número de
ítemes por objetivos, originará resultados más estables, más confiables que una prueba con
menos ítemes. A modo de ejemplo, se puede señalar que si presentamos a un alumno un
problema de porcentaje el resultado es menos confiable que si le presentáramos diez problemas
de porcentaje. Dentro de ciertos límites, las pruebas más largas generalmente determinan
puntajes más estables.
Muchos son los factores que pueden afectar la estabilidad de los resultados. Ellos deben se
identificados por el docente y controlados en la medida que sea posible. 'Los que más afectan la
confiabilidad de los resultados son los siguientes: condiciones de administración, la inestabilidad
del rasgo que se quiere medir, los errores al hacer la muestra de ítemes que se incluirán en el
instrumento, errores en la asignación de puntajes del test.
Objetividad
Es frecuente que la pregunta puede haber estado muy clara en la mente de quien redactó
el ítem, pero su expresión escrita resultó defectuosa.
Como orientación práctica para revisar la objetividad se sugiere que por lo menos dos
especialistas que no hayan participado en la elaboración del instrumento, respondan a las
preguntas incluidas en él. Cuanto más altos son los puntajes obtenidos por estos especialistas,
la objetividad es mejor. Quizás si un 90% debiera lograr cada de ellos como mínimo. En caso
que el logro sea inferior debería revisarse la prueba.
La interpretación se refiere al significado que se le puede atribuir a los puntajes logrados por
quienes responden la prueba o instrumento. No tan sólo un instrumento debe medir lo que
queremos, sino que también debe proporcionar resultados en una forma que se puedan
interpretar y usar. Si un alumno obtuvo 30 puntos en una prueba de Química General, ¿Qué nos
dice ello?, ¿Puede aprobar la asignatura?, ¿Es bueno?, ¿Es adecuado?. Si el instrumento no
nos proporciona una base para interpretar los resultados, un punto de referencia, no nos será útil.
Dos son los puntos de referencia que normalmente se consideran. Uno de ellos es el
rendimiento logrado por el grupo curso o grupo de personas que responde el instrumento. El
segundo es un punto de referencia externo, un nivel mínimo de aceptación que se establece
previamente, con todos los antecedentes de que se dispone.
1. En cuanto a interpretación
2. En cuanto al uso
Digamos para terminar, que aún cuando la evaluación de un test sea positiva,
siempre será más conveniente utilizar diferentes tipos de instrumentos para medir el mismo rasgo,
ya que la medición en las ciencias de la conducta no tiene la misma precisión de las ciencias físicas.
De este modo la decisión que tomará el docente estará basada sobre más antecedentes. Si dichos
antecedentes tienden a coincidir, podremos estar muy tranquilos; en caso contrario tendríamos que
hacer más mediciones.
Muchas veces el "grupo que determina la norma" no es nada más que una muestra más amplia de
individuos que han respondido previamente la prueba. Lo fundamental en este tipo de pruebas es
que, para que cumpla su función principal que es comparar la actuación de los individuos entre sí y
con la "norma", los resultados tengan una varianza considerable. Si la variación en los puntajes es
pequeña entonces es muy difícil hacer comparaciones. Para ilustrar esto, supongamos que una
prueba de rendimiento fuera muy fácil, tan fácil que cada uno de los alumnos que la rindió obtuvo un
puntaje muy próximo al mejor. En este caso no habría posibilidad de comparar entre ellos.
Consecuentemente con lo anterior, al elaborar una prueba referida a norma, es fundamental que los
ítemes que se incluyan en ella permitan distribuir los resultados de las personas en un amplio rango
y así facilitar la comparación. Los ítemes que son muy fáciles o muy difíciles no ayudan a originar
esta distribución de amplia varianza. Para que estas pruebas referidas a norma sean útiles deben
incluir situaciones de evaluación que tengan una dificultad media y un índice de discriminación alto y
positivo.
el 27% superior y el 27% inferior del grupo que rinde la prueba para determinar la dificultad y la
discriminación de los ítemes.
La dificultad se determina sumando el número de respuestas correctas dadas por el grupo superior
con el número de respuestas correctas dadas por el grupo inferior, para el ítem que se considera, y
esto se transforma en porcentaje. Por ejemplo, si el grupo inferior y el superior está compuesto por
20 personas cada uno y el ítem fue respondido correctamente por 14 personas del grupo superior. y
7 del grupo inferior, entonces la dificultad correspondería a:
14 + 7 = 21
21/40 = 0,52 (40 corresponde a la suma de los dos grupos, el superior y el inferior).
Este ítem es de una dificultad mediana y por lo tanto es adecuado para una prueba referida a
norma.
En cuanto a la discriminación, ella debe determinarse usando los mismos datos de ambos
grupos, el superior y el inferior correspondiente al 27% del total en cada caso. Pero a diferencia
de la dificultad, para determinar la discriminación se hace la sustracción entre las respuestas
correctas del grupo superior y las respuestas del grupo inferior. En el caso anterior, la
discriminación sería la siguiente:
14 -7= 7
7+20=0,35 (En este caso no se toma la suma de ambos grupos sino que el total de uno de los
dos grupos).
Como referencia se puede señalar que un índice de discriminación para pruebas referidas a
norma es adecuado cuando es 0,30 o más, estimándose que es bastante bueno si es superior a
0,40. Fácilmente se puede deducir que un índice de discriminación puede ser negativo. Ello
ocurre cuando es mayor el número de personas del grupo inferior que responde correctamente
el ítem que el del grupo superior.
que ellos alcancen los objetivos propuestos al nivel que sea adecuado a cada uno, pero no se
ven ventajas de comparar los resultados de uno con los resultados del resto.
Por otra parte, los tests referidos a norma no siempre se basan en un conjunto bien definido
de objetivos de aprendizaje con lo cual su interpretación en cuanto al nivel de aprendizajes que
realmente ha alcanzado cada uno de los alumnos se hace prácticamente imposible. Todo esto ha
llevado a enfatizar otro tipo de test que se conoce con el nombre de "tests referidos a criterios". El
criterio genéricamente está determinado en forma muy precisa en los objetivos de aprendizaje, que
sirven de base a la elaboración de este tipo de pruebas.
No hay mayores diferencias en cuanto a presentación entre un test referido a norma y un test
referido a criterio. Pero sí hay importantes diferencias en cuanto a la manera como se elaboran y a
la forma como se analizan e interpretan los resultados.
En el caso de los tests referidos a criterio se usan para determinar el status del alumno con
respecto a un conjunto bien definido de conductas, las que forman el dominio. En la práctica, una
de las formas más frecuentes de definir el dominio de conductas que interesa es mediante los
objetivos de aprendizaje.
En este tipo de pruebas no interesa tanto la variación de las respuestas sino más bien que sea lo
más descriptivo posible. Esto no quiere decir que en un test referido a criterio no deba darse
variabilidad. Ello puede suceder, sobre todo si el proceso enseñanza aprendizaje ha sido uniforme
para todos los alumnos que conforman el grupo curso. Pero, si no se da variabilidad y el test
describe bien los conocimientos y habilidades de los alumnos, el test es útil ya que no nos interesa
comparar.
Para el docente, no hay duda que el test que mayor utilidad le reporta es el test referido a criterio
ya que le permite más antecedentes para poder ayudar al alumno en su proceso de aprendizaje y
más antecedentes también para mejorar la calidad del proceso enseñanza, de los materiales
didácticos, de las situaciones de aprendizaje y de las situaciones de evaluación.
Los tests referidos a criterio son especialmente útiles cuando se desea responder a preguntas del
siguiente tipo: ¿cuán bueno es el nivel de actuación o de desempeño del alumno para realizar una
tarea específica?, ¿conoce o puede hacer lo que se requiere que haga el alumno o para lo que ha
sido preparado?
Para poder responder a este tipo de preguntas es fundamental que la elaboración del test referido
a criterio se base en el conjunto de objetivos en función de los cuales se ha estado trabajando y
que el nivel de aceptación mínimo deseable sea definido con anterioridad a su administración.
Este último punto señala un aspecto particularmente relevante para el centro escolar y para cada
uno de los docentes que trabaja en él. Este aspecto se refiere a acumular la experiencia de los
años pasados en cuanto a rendimiento logrado realmente por los estudiantes y los niveles de
aceptación propuestos para cada uno de los objetivos en función de los cuales se trabajó. Todo
este conjunto de antecedentes le permitirá al docente estar más seguro del nivel de aceptación que
él establecerá para cada objetivo o tarea en el futuro.
Elaborado en esta forma, un test referido a criterio permite con bastante seguridad separar a Ios
alumnos que han alcanzado el nivel adecuado de aquellos que aún no lo han logrado.
Lo fundamental en un test referido a criterio es que cada ítem esté estrechamente relacionado a
alguno de los objetivos que conforman el dominio. Dicho en otros términos, no interesa tanto ni la
discriminación ni la dificultad del ítem, cuando se elabora el test, sino que lo que interesa es la
validez de contenido o la congruencia entre el ítem y el objetivo que con él se mide.
Cada vez que sea necesario construir un instrumento de medición referido a las características
de los sujetos involucrados en un proceso educativo, es indispensable precisar con antelación:
Además es indispensable considerar los recursos, tanto humanos como materiales, con que se
cuenta para decidir acerca del tipo de instrumento que se va a construir.
Contestadas las interrogantes planteadas anteriormente, es necesario llevar a cabo otras
etapas que tiendan a asegurar que la información que se recoja, cuando se aplique el
instrumento, sea objetiva, confiable y válida.
Estas etapas serán distintas según sea el área en que se desea realizar la medición:
A. Cuando se desea construir instrumentos que permitan detectar en los alumnos aprendizajes
que enfatizan el ámbito intelectual, se debe cumplir con las siguientes etapas:
Una vez establecido lo anterior se debe proceder a la construcción del instrumento que, en estos
casos, corresponde a la lista de cotejo, la cual deberá ser llenada por el observador mientras el
examinado realiza la ejecución.
Definir el concepto, una vez que se ha decidido lo que se quiere medir. Esta definición debe
ser clara y precisa.
Someter a un proceso de validación (por jueces), los indicadores a fin de establecer si ellos
son propios de la variable que se quiere medir.
Si los indicadores fueron considerados válidos, decidir el tipo de ítem que se debe elaborar.
Elaborar los ítemes (escalas, preguntas, etc.)
Construir el borrador del instrumento con las instrucciones correspondientes y los ítemes
elaborados.
Someter a criterio de jueces, a fin de recoger antecedentes para el proceso de validación,
especialmente de contenido y también para determinar la validez aparente de él. De aquí
surgen datos para una primera optimización.
Sucesivas optimizaciones se logran mediante la aplicación a pequeños grupos que
constituyen muestras representativas de la población a que está destinado el instrumento de
medición.
Las modernas teorías de enseñanza y de aprendizaje han provocado grandes modificaciones en los
procedimientos evaluativos utilizados en el ámbito educacional. Una de las mayores influencias en
este sentido proviene del modelo de aprendizaje para el dominio sustentado por Carroll y adoptado e
implementado por Bloom.
Ese modelo considera Cinco variables, tres de las cuales son inherentes al alumno y las otras dos
son derivadas de¡ proceso enseñanza-aprendizaje y, por tanto, posibles de ser modificadas y
adaptadas por el profesor a las características de dicho proceso. Ellas son, respectivamente:
a) Aptitud: Cantidad de tiempo que un alumno necesita para lograr un aprendizaje óptimo.
También se le denomina ritmo o velocidad de aprendizaje.
C) Perseverancia: Tiempo que el alumno está realmente dispuesto a emplear para adquirir un
aprendizaje.
e) Tiempo destinado a la enseñanza: Este lapso debe estar determinado por el tiempo que
cada alumno necesita para aprender una materia dada. A su vez, el tiempo que el alumno
necesite podría depender de su aptitud, su habilidad verbal, la calidad de la enseñanza
recibida en la clase y la ayuda que obtenga fuera de ésta.
Este modelo postula que aun cuando los estudiantes inician un proceso de enseñanza aprendizaje
en condiciones muy disímiles, pues cada uno demora más o demora menos que otros para aprender
una misma materia o materias diferentes, es posible que al término. de dicho proceso educativo se
pueda lograr que la mayoría del alumnado -90% o más- alcance los aprendizajes propuestos en los
objetivos si se le proporciona el tiempo, las estrategias de enseñanza y las actividades de
aprendizaje acordes a las características de cada alumno.
Desde la perspectiva del Modelo de Aprendizaje para el Dominio la tarea de¡ profesor es, entonces,
establecer lo que debería entenderse por "dominio de un aprendizaje dado", identificar y utilizar
métodos y materiales que lleven al mayor número de alumnos a ese dominio, planificar y utilizar
instrumentos de evaluación que comprueben si el alumno ya alcanzó el dominio preestablecido.
Una enseñanza planificada y desarrollada bajo esta concepción es muy útil por varios motivos:
1.- Cuando se pretende entregar aprendizajes a todos los individuos dentro de determinados
niveles de escolaridad, es inconveniente darse el lujo de mantener a un alumno en la
escuela años y años, fracasando continuamente.
2.- El fracaso constante es un factor negativo para el desarrollo personal del alumno pues
pierde la confianza en sí mismo, piensa que no es capaz de aprender y tiende a abandonar
la escuela y a evitar cualquier actividad que implique aprendizaje, impidiendo que pueda
convertirse en un individuo útil para la sociedad.
3.- Países en desarrollo como el nuestro necesitan una fuerza de trabajo calificada para las
diferentes tareas y ocupaciones, y no se pueden satisfacer o no podrán ser satisfechas si
sólo una minoría logra altos niveles de preparación para ello.
De lo anterior se infiere que no basta con dar enseñanzas a todos. Es necesario dar a todos una
buena enseñanza.
Bloom y sus colaboradores proponen tres tipos de evaluación para que pueda llevarse a buen
término cualquier estrategia de aprendizaje para el dominio: evaluación diagnóstico, evaluación
formativa y evaluación sumativa.
EVALUACION DIAGNOSTICA
La evaluación como diagnóstico permite satisfacer varios objetivos y se usa en distintos momentos
de¡ proceso enseñanza-aprendizaje.
Es así como, antes de iniciar un proceso de enseñanza aprendizaje, puede servir para ubicar al
alumno en el punto de partida óptimo para un curso o una unidad de estudio-, es decir, mide su
comportamiento de entrada. Puede suceder que el alumno no posea las habilidades necesarias
para lo que se va a enseñar y necesite adquirirlas antes de comenzar esta nueva fase de¡
aprendizaje. Imagínese el caso de un profesor que recibe! un grupo curso y que se propone, como
uno de sus objetivos, que el alumno sea capaz de dividir. Para que sus alumnos puedan tener éxito
en esa tarea, el profesor deberá estar seguro que saben restar y multiplicar. En este caso, una
prueba con fines diagnósticos deberá proponer situaciones en las que sea necesario restar y
multiplicar. Es posible que un grupo de alumnos, necesite refuerzos en la multiplicación, otro,
todavía necesite aprender a restar y, sólo un pequeño grupo se encuentre ya en condiciones de
aprender a dividir. Este ejemplo ilustra tres puntos de partida distintos para un nuevo aprendizaje
dentro de un mismo grupo curso. Si en este caso el profesor no hubiera hecho diagnóstico de las
conductas de entrada antes de iniciar las enseñanzas propuestas, tal vez habría partido del mismo
punto para todos los educandos, llevando al fracaso a gran parte de ellos pues, al faltar las
habilidades para restar y multiplicar, seria difícil o no podrían aprender a dividir.
Antes del proceso enseñanza-aprendizaje, la evaluación como diagnóstico sirve también para
comprobar si el alumno ya posee los comportamientos que debería adquirir. Supóngase que, en el
ejemplo anterior, algunos alumnos ya supiesen dividir. Sería inútil y los llevaría al desinterés hacer
que pasasen por toda la serie de actividades necesarias para adquirir tal habilidad. En cambio, si en
la prueba diagnóstico se introducen algunas situaciones que exigen la división, se podría detectar a
los alumnos que, ya poseen esta habilidad y que quedarían libres para otras tareas.
Por lo tanto, la evaluación como diagnóstico, utilizada antes de la enseñanza, satisface dos
finalidades:
2.- Identificar a los alumnos que ya han alcanzado los objetivos de enseñanza propuestos y
que, al quedar libres de esas tareas, puedan dedicarse ya sea, a profundizar en el tema objeto de
estudio, avanzar hacia el logro de otros objetivos, o bien servir de ayudantes o monitores de los
condiscípulos que lo necesiten.
La evaluación como función diagnostica también puede ser utilizada durante el proceso enseñanza-
aprendizaje. Cuando, durante el desarrollo del proceso instruccional, el profesor descubre que el
alumno está encontrando dificultades para avanzar, seguramente tratará de ayudarle, modificando
sus técnicas de enseñanza, empleando material diferente, dándole un tratamiento individualizado.
Empero, no es infrecuente que el profesor compruebe que esta ayuda no surta efecto: el alumno
continúa con dificultades y no logra aprender lo que se desea. En este momento y situación se hace
necesaria una evaluación diagnostica para identificar las causas de los repetidos fracasos en el
aprendizaje. Las causas pueden no deberse a los métodos o materiales empleados por el profesor
sino a problemas de tipo físico, emocional, social y/o cultural propios del alumno. En estos casos, la
evaluación como diagnóstico puede servir de fuente de información para emprender acciones que
escapan al quehacer del profesor, quien deberá pedir la cooperación de otros especialistas tales
como médicos, orientadores, sicólogos, asistentes sociales, etc.
EVALUACION FORMATIVA
Cuando la evaluación formativa se emplea con frecuencia, ayuda al alumno a establecer su propio
ritmo de estudio. Informa al alumno acerca de la eficiencia de su trabajo y de la necesidad de
dedicar más tiempo o de modificar la organización de sus estudios.
La evaluación formativo, además, se convierte en fuente de motivación para los alumnos. Aquellos
que comprueban que están aprendiendo, se sienten estimulados a continuar con sus estudios.
Aquellos alumnos que tienen dificultades para aprender no se sienten irremediablemente fracasados
pues, la evaluación formativo, al ser frecuente, cubre uno o unos pocos objetivos y al alumno le
resulta fácil subsanar sus deficiencias, cosa que no sucede cuando el fracaso es comprobado por el
alumno después de largos períodos de enseñanza-aprendízaje.
Bloom sostiene que la evaluación formativa proporciona mejores resultados cuando en ella no se
asignan calificaciones. Si en una prueba se asignan notas y un alumno fracasa y obtiene una
calificación inferior a la mínima de aprobación (en Chile nota 3,9 o menos, dentro de la escala de 1 a
7), aunque ese alumno se esfuerce al máximo en una segunda prueba y logre un 7, se quedaría con
una calificación promedio nunca superior a 5.5. En consecuencia, el alumno no tendría mucho
incentivo para estudiar, pues aunque domine completamente la materia, no podrá pasar de la nota
promedio recién aludida, para este caso. En cambio, si en la primera prueba no se otorga
calificación al alumno sino que sólo se le indica cuáles son los aspectos en los cuales ha incurrido en
error, éste se sentirá estimulado para superarse, pues sabe que si logra el dominio esperado podrá
obtener la nota máxima de aprobación (nota 7), al momento de una comprobación final de
aprendizaje.
Para que las informaciones recogidas por cualquier medio evaluativo posean un carácter formativo,
deben ser entregadas a los alumnos con el máximo de detalle. Por ejemplo, los tests formativos
deben informar al alumno tanto acerca de los ítemes bien respondidos como de aquellos omitidos o
mal respondidos -para estos últimos es útil señalar ¡as causas de¡ error- para que el alumno oriente
sus estudios. Así, en lugar que el profesor, frente al resultado de una prueba sobre ortografía diga a
un alumno: "de 25 palabras, te has equivocado en 5", sería mejor decir “de 25 palabras, te has
equivocado en las 5 que se escribían con z y s". Esta segunda manera de informar al alumno le
orientará más para su futuro trabajo de recuperación.
Una consecuencia inmediata de la evaluación formativa será la pronta superación de los obstáculos
detectados durante los procesos de enseñanza-aprendizaje. Al ser continua, la evaluación formativa
señala las deficiencias y errores en el momento que ocurren y da al profesor, y alumnos la
oportunidad de hacer las correcciones que a cada uno correspondan.
El uso de la evaluación formativa testimonia que ésta puede ser empleada como recurso de
enseñanza y como fuente de motivación positiva hacia los procesos de aprendizaje.
EVALUACION SUMATIVA
La principal característica de este tipo de evaluación es que se efectúa con el fin de proporcionar
una calificación que testimonie el juicio valorativo del profesor sobre el desempeño final observado
en el alumno al concluir un período lectivo de una duración determinada (curso, año, semestre,
trimestre, un mes, unidad, sub unidad de enseñanza, etc.). Una prueba con fines sumativos pretende
comprobar el producto del aprendizaje; lo que resultó del trabajo, tanto del alumno como del
profesor. A veces se tiende a utilizar los resultados de evaluaciones sumativas con fines
diagnósticos. Esto debe hacerse con cuidado pues puede llevar al profesor a conclusiones erradas.
Por ejemplo, un profesor, al comienzo de un curso, puede emplear como diagnóstico el resultado de
la evaluación sumativa final del curso anterior. Sin embargo, como ésta generalmente se traduce en
una sola nota, podría ser escasa, obsoleta 0 no pertinente para fines de diagnóstico.
Imagínese que el profesor aludido -en el párrafo anterior comprueba que dos alumnos tuvieron un 6
como nota final en matemática el año anterior, y parte de la base que los dos poseen el mismo nivel
de dominio sobre esa asignatura. Pero, si hubiera analizado la prueba sumativa de esos alumnos se
habría dado cuenta que, a pesar de tener la misma calificación, estaban en condiciones muy
diferentes: mientras que uno de sus alumnos tenía deficiencias en operatorias con fracciones el otro
se había equivocado en resolución de problemas. En consecuencia, los resultados de evaluaciones
sumativa, sólo deben ser utilizados para fines diagnósticos cuando se disponga de evidencias
concretas y detalladas (en este caso de las pruebas respectivas) para analizarlas e interpretarlas
con real provecho.
Por ello, aun cuando la evaluación sumativa posea una función importante en la enseñanza y e¡
aprendizaje, poco puede contribuir para corregir las deficiencias de esos procesos, pues se realiza al
final de¡ mismo y sus resultados, en consecuencia, sólo podrán ser útiles en grupos-cursos
posteriores, pues el curso al cual se refiere, ya terminó.
RESUMEN
El profesor que desee adoptar una estrategia de aprendizaje para el dominio tal como se presentó al
comienzo de este capítulo, debería utilizar los tres tipos de evaluación ya descritos. Antes de iniciar
el proceso enseñanza aprendizaje, utilizará la evaluación como diagnóstico para verificar sí el
alumno posee los prerrequisitos necesarios para comenzar nuevos aprendizajes; o si puede seguir
adelante por haber alcanzado ya lo que se espera de él. De este modo, se ubicará a cada alumno
en el punto adecuado para iniciar su aprendizaje. 0 bien, para detectar problemas no instruccionales
y referir su tratamiento a los especialistas que corresponda.
distintos momentos del proceso enseñanza aprendizaje. Por tanto, son acciones complementarias
que sólo difieren en cuanto a las funciones o circunstancias en que se enfatiza su utilización.
Con la práctica de esta evaluación inicial del curso pretendemos recabar información respecto al
grado de conocimientos previos y la práctica que usted tiene sobre conceptos, modelos, metodología
y procedimientos para evaluar los aprendizajes. Por lo tanto, su respuesta sincera será útil para
nosotros y usted, en el sentido de orientar el ejercicio de la acción docente y evaluativa en la
educación.
A usted le interesa que sus estudiantes obtengan las más altas calificaciones
S F AV N
Usted recompensa, con notas, a los estudiantes que asisten regularmente a sus clases
S F AV N
Toda vez que debe elaborar una prueba, usted tiene en cuenta los Objetivos y Contenidos
previstos en la programación de la Unidad Didáctica
S F AV N
Durante el desarrollo de sus clases, usted está evaluando los aprendizajes de sus estudiantes
S F AV N
Para calificar los trabajos prácticos utiliza instrumentos de evaluación extraídos de textos
S F AV N
S F AV N
Permite que sus estudiantes realicen autoevaluaciones de sus trabajos, teniendo en cuenta
sus opiniones para la posterior calificación
S F AV N
S F AV N
T A L L E R Nº 1
EVALUACION
Aprendizaje
Calificación
Clasificación
Comparación
Comprobación
Control
Diagnóstico
Diálogo
Discriminación
Jerarquización
Medición
Mejora
Reorientación
Selección
¿QUÉ HABRÍA QUE HACER PARA QUE LAS FUNCIONES IDEALES SE TRANSFORMARAN EN
REALES: EN LOS ALUMNOS, LOS PROFESORES Y LAS INSTITUCIONES?
PRIMERA PARTE
Que usted determine los procedimientos evaluativos que más se adecuen a la evaluación
de los diferentes tipos de contenidos de aprendizaje
Que usted valore / enjuicie la propuesta de un Modelo de Congruencia que relaciona los
tipos de contenidos con los distintos momentos del proceso de enseñanza-aprendizaje.
Estos saberes culturales han sido recientemente tipificados en cuatro grupos de contenidos:
declarativos, procedimentales, actitudinales y estratégicos. Esta nueva forma de visualizar los
contenidos resulta plenamente favorable para orientar el aprendizaje hacia la globalización e
interdisciplinariedad, de modo que hagan posible la concurrencia de diversas asignaturas en el
desarrollo de un problema general.
Con el fin de relacionar los contenidos con los diferentes momentos de un proceso de
enseñanza y aprendizaje, presento a continuación un esquema o modelo de congruencia que
permite interrelacionar los diversos momentos de un proceso de enseñanza-aprendizaje (diseño,
ejecución y evaluación) con los diferentes tipos de contenidos.
Esta forma de concebir los contenidos ha llevado a revisar los planes y programas
de estudio universitarios, encontrando en ellos un alto porcentaje de contenidos declarativos,
especialmente de hechos específicos y terminologías, lo que justificaría plenamente el uso por parte
de los profesores de técnicas expositivas de carácter discursivo y el abuso de aprendizaje
memorístico de parte de los estudiantes.
En su propio programa de curso u otro que usted elija, seleccione los diferentes tipos
de contenidos a los que alude.
Estime los porcentajes de cada uno de los tipos de contenidos.
Según Monereo (1997) se denominan estrategias de aprendizaje a una toma de decisiones consciente respecto
a los conocimientos que deben activarse para ajustarse a las condiciones de una situación educativa y alcanzar
un determinado objetivo.
La tipología que se muestra a continuación es de gran utilidad para el docente de modo que
estas habilidades comiencen a ser consideradas como contenidos que se enseñan.
HABILIDADES PROCEDIMIENTOS
COGNITIVAS DE APRENDIZAJE
Por ejemplo, los hechos son conocimientos acabados y por lo general unívocos, mientras
que los conceptos son conocimientos que están siempre en desarrollo y evolución, por lo que la
metodología para explicar los primeros resultan siempre de mucha simpleza, no así la de los
conceptos cuyos aprendizajes deberán ser más sostenidos y perdurables en el tiempo, lo que obliga
a emplear diferentes métodos.
Por otra parte, para aprender los hechos sólo basta memorizarlos, en cambio para aprender
conceptos, será necesario que el estudiante alcance diferentes niveles de aprendizaje que le
permitan lograr comprensión, aplicación y análisis de lo que aprende.
Algunas recomendaciones metodológicas para el aprendizaje de hechos específicos:
1.- Recordar que sólo debe exigirse memorización cuando el hecho pueda ser relevante para
explicar otros hechos o situaciones.
2.- Procurar contextualizar las situaciones en que se aprenden hechos como una manera de facilitar
su evocación o recuerdo.
3.- Desconocer que los hechos den origen a situaciones intermedias o de aproximación.
Pruebas de verdadero-falso.
Se denominan algoritmos a procedimientos que especifican de forma muy precisa la secuencia de acciones y
decisiones que deben respetarse para resolver un determinado problema, mientras que los heurísticos orientan
de manera general la secuencia a respetar y no dice exacta o completamente como se debe actuar.
Usted como docente ¿ha guiado su enseñanza hacia algún contenido procedimental, en
particular (algorítmico o heurístico)?
Sin olvidar que una actitud involucra tres tipos diferentes de componentes:
cognitivo (conocimientos y creencias),
afectivo (sentimientos y preferencias) y
Los autores reconocen que las formas utilizadas hasta hoy para evaluar estos contenidos
afectivos han estado fuertemente limitadas por la creencia que todas ellas se presentan en un
mismo momento y de una misma forma a todos los componentes de un grupo, esta falacia ha
permitido que se utilicen procedimientos de tipo encuesta (entrevistas colectivas, cuestionarios
masivos, etc.) y pautas de observación rígidas (escalas de calificación) que suponen reacciones
iguales de todos los sujetos frente a un determinado estímulo.
Una nueva línea de situaciones evaluativas en que se expresen verbalmente o por escrito
las intenciones y que el sujeto reconozca determinados comportamientos, no sólo en el ámbito de
estudio, sino que en el contexto profesional, son intentos importantes en la evaluación actitudinal.
También se ha centrado el proceso evaluativo actitudinal en la institución educativa, como una forma
de determinar si se están dando las posibilidades para que los estudiantes aprehendan un valor,
asuman el cumplimiento de normas o ocurran en ellos cambios actitudinales significativos. Esto
último es lo que hoy se conoce con el nombre de "acreditación".
En todo caso ha quedado demostrado que “el uso reflexivo de los procedimientos que se
utilizan para realizar una determinada tarea supone la utilización de estrategias de
aprendizaje ” (Monereo et al. 1994).
2.- Es conveniente partir de los conocimientos y competencias cognitivas del alumno de acuerdo a
su edad, su madurez y sus aprendizajes anteriores.
3.- Determinar si el alumno domina algunos procedimientos anteriores para desarrollar uno de mayor
complejidad que incluya a los aprendidos.
Lo invito que intente elaborar algunos de los procedimientos evaluativos que se sugieren para la
determinación de la presencia o ausencia de una determinada estrategia evaluativa.
A MODO DE SINTESIS
´1.- César Coll (1994) “Los contenidos en la educación: hacia una diferenciación de los contenidos
de aprendizaje” (pag.9 a 18) (En: Coll, C. y otros “ Los Contenidos de la Reforma. Concepto,
Procedimentos y Actitudes”, Editorial Aula XXI, Madrid).
2.- Antoni Zabala (1996) “Los enfoques didácticos” (pág.125-142) (En: Coll, C. y otros “ El
constructivismo en el aula”, Editorial Grao, Barcelona).
3.- Joseph Novak (1998) “Aprendizaje significativo para la capacitación” (Pág. 39 a 56) (En: Novak,
J. “Conocimiento y Aprendizaje: los mapas conceptuales como herramientas faciltadoras para
escuelas y empresas”. Alianza Editorial S.A. Madrid).
Taller Grupal
Realice un análisis de los desempeño de los profesores destacados con los planteamientos
del Modelo de Congruencia Didáctica.