Los sistemas nacionales de evaluación que se han
desarrollado en los países latinoamericanos desde los años ‘90 vienen prestando
una atención especial a la medición de los logros conseguidos por los alumnos.
Los instrumentos que se aplican con esa finalidad son las genéricamente
denominadas pruebas nacionales, que merecen una mirada especial por la
importancia que han llegado a adquirir.
Las pruebas nacionales presentan bastantes diferencias de
unos países a otros, aunque también ofrecen algunas similitudes. Entre sus
elementos comunes, quizás el más destacado sea la preocupación prácticamente
universal que demuestran por evaluar el rendimiento alcanzado en Lenguaje y
Matemáticas. No obstante, aunque se trata de dos áreas especialmente atendidas
por los sistemas de evaluación, no hay que pensar que sean los únicos dominios
evaluados. En efecto, la medición de los logros en ambas áreas suele ir
acompañada por la evaluación de otras áreas curriculares complementarias (entre
las que sobresalen las Ciencias, la Historia o las Lenguas extranjeras) o de
otras capacidades de tipo transversal, no ligadas necesariamente a áreas
específicas (como el autoconcepto, algunas estrategias de aprendizaje o ciertas
actitudes).
Las pruebas nacionales suelen aplicarse preferentemente en
los grados terminales de las principales etapas educativas (sobre todo, al
final de la enseñanza primaria y de la secundaria). No obstante, también se
aplican a veces en otros grados que tienen un especial interés desde el punto
de vista diagnóstico (por ejemplo, el final de ciertos ciclos), aunque la
identificación de tales puntos focales varíe de unos sistemas educativos a
otros. El reciente desarrollo de algunos estudios internacionales ligados a la
edad de los evaluados y no al grado que cursan, como es el caso del proyecto
PISA de la OCDE, aún no ha encontrado traducción directa en los sistemas
nacionales de evaluación latinoamericanos, ni es previsible que lo haga a corto
plazo. El interés que despierta la valoración de los logros conseguidos al
final de determinadas etapas supera hoy en la región al que suscita la
valoración del nivel de formación a ciertas edades. La participación en
aquellos proyectos internacionales parece satisfacer suficientemente las
preguntas que puedan plantearse en este último sentido.
Dependiendo del propósito que guía a la evaluación, las
pruebas se aplican en ocasiones a poblaciones o cohortes estudiantiles
completas, mientras que en otros casos se limitan a muestras representativas de
estudiantes. La primera decisión permite hacer un uso más singularizado de los
datos obtenidos, tal como comparar el rendimiento de diversas escuelas o
estudiantes, mientras que la segunda es más adecuada para usos diagnósticos.
Por otra parte, hay países en que las pruebas se aplican cada año, aunque es
más frecuente que se adopten ciclos plurianuales, de distinta duración.
Las pruebas nacionales parecen satisfacer ampliamente a las
autoridades educativas, a la vista del uso tan extenso que se hace de ellas. No
obstante, en un análisis más profundo también presentan insuficiencias y
problemas, que requieren una consideración más atenta.
Tres son las principales insuficiencias de las pruebas
nacionales de logros que han subrayado los especialistas. La primera consiste
en la existencia de algunas debilidades técnicas en los procesos de desarrollo
y validación de los instrumentos de medición. La segunda se refiere a la
insuficiente calidad y capacidad que las pruebas ofrecen para evaluar
aprendizajes complejos. La tercera tiene que ver con el insuficiente
aprovechamiento que suele hacerse de la información obtenida.
Los problemas a los que se ha hecho alusión son de distinto
tipo. Para comenzar, habría que señalar algunos relativos al diseño y
confección de los instrumentos de evaluación:
• Un primer problema tiene que ver con el contenido de las
pruebas, asunto que plantea dos tipos de dificultades. La primera se refiere a
la relación que debe existir entre las pruebas y los objetivos educativos. Lo
deseable es que las pruebas estén referidas a los objetivos establecidos en el
sistema educativo, de manera que permitan valorar el grado en que se alcanzan
las metas previstas. Aunque este planteamiento resulta lógico y plausible,
plantea dificultades cuando no existen objetivos explícitos (lo que sucede en
muchos casos), o cuando los objetivos de cada curso o etapa se formulan de
manera poco concreta. Cuando no se pueden determinar los objetivos de forma
precisa, resulta sin duda más difícil elaborar las pruebas. La segunda
dificultad se refiere al tratamiento de la diversidad curricular existente
entre diferentes regiones, distritos o escuelas. La mayoría de los modelos
curriculares aplicados en América Latina conceden cierto grado de autonomía a
las autoridades regionales o distritales o a las propias escuelas para definir
el currículo. En consecuencia, no resulta sencillo hacer pruebas que abarquen
todas las enseñanzas efectivamente impartidas en todo el sistema educativo. Las
soluciones posibles son dos: elaborar pruebas de mínimos, lo que implica
reducir el campo de evaluación, o elaborar pruebas comunes a partir de un
consenso profesional o técnico. Ambas soluciones son utilizadas en la región,
sin que quepa conceder prioridad a una de ellas sobre la otra.
• Un segundo problema tiene que ver con algunas disyuntivas
que se plantean en relación con el diseño y la confección de las pruebas. La
primera disyuntiva se refiere al enfoque de las pruebas, que pueden estar centradas
en los conocimientos adquiridos por los alumnos o abarcar también el desarrollo
de actitudes. Las pruebas que miden unos y otras no son iguales, ni siquiera
plantean las mismas exigencias técnicas, lo que obliga a decidir su enfoque.
Una segunda disyuntiva se refiere al carácter de las pruebas, pudiéndose optar
por la elaboración de pruebas referidas a criterios de logro o por la
confección de pruebas de tipo normativo, adaptadas a una distribución de
resultados estadísticamente normal. La tercera disyuntiva se refiere a la
delimitación de la población sujeta a evaluación, que permite optar por pruebas
de aplicación censal (dirigidas a toda la población estudiantil de un
determinado grado o edad) o de tipo muestral (dirigidas a muestras representativas
de población).
Otro grupo importante de problemas están relacionados con la
explicación de los resultados conseguidos. La mayoría de los sistemas
nacionales de evaluación no suelen contentarse con medir los logros alcanzados
por los estudiantes, sino que también pretenden explicar por qué se producen
tales resultados. Sin embargo, dicho intento de explicación tropieza con varios
problemas y dificultades:
• Un primer problema tiene que ver con el grado de
coherencia realmente existente entre la evaluación y el currículo. Como se
señalaba al comienzo del trabajo, el desarrollo de los sistemas nacionales de
evaluación ha ido generalmente asociado a otros procesos de reforma curricular.
No obstante, esa simultaneidad no ha asegurado siempre la existencia de una
adecuada coherencia entre ambos aspectos. En los casos más extremos, puede
incluso decirse que ambos procesos se han desarrollado en direcciones
divergentes. Cuanto más importancia se ha concedido a las pruebas, mayor ha
sido su impacto sobre el desarrollo curricular.
• Un segundo problema, menos complejo pero no menos
influyente, está relacionado con el tipo de interpretación que permiten los
diversos modelos de pruebas. Como se señalaba más arriba, dos son los modelos
de pruebas utilizados más habitualmente: criteriales y normativas. Las pruebas
de tipo criterial proporcionan una base sólida para valorar la suficiencia de
los logros conseguidos, ya que se apoyan en una definición operativa de los
objetivos que deben alcanzarse. Por el contrario, las pruebas de tipo normativo
exigen alguna operación adicional para poder valorar la suficiencia de los
logros alcanzados, dado que se refieren a situaciones de normalidad
estadística. La existencia de estos dos modelos alternativos obliga a
considerar cuidadosamente qué usos se quieren hacer de las pruebas, antes de
decidir el que conviene aplicar.
• Un tercer problema se refiere a las dificultades
conceptuales y técnicas que se plantean a la hora de buscar explicaciones. Por
una parte, hay que reconocer la debilidad teórica de los modelos habituales de
producción educativa, que en buena parte deriva del problema que plantea la
causalidad en educación. Esa debilidad influye en la selección de los factores
que se consideran asociados al rendimiento, pocos de los cuales cuentan con
confirmación empírica sólida. Además, la explicación de los resultados se ha
basado tradicionalmente en la distinción de dos tipos de variables, unas
extrínsecas y otras intrínsecas. Mientras que las primeras (nivel
socioeconómico y cultural, recursos destinados a la educación) han sido objeto
de análisis abundantes, las segundas (organización del sistema educativo,
procesos institucionales, procesos de aula) vienen resultando menos
concluyentes y aún requieren investigaciones adicionales.
• Un cuarto problema tiene que ver con la voluntad que a
veces existe de buscar muchas vías de explicación de los resultados obtenidos,
que puede traducirse en un exceso de datos recogidos. Cuando ese exceso de
datos va unido, como ocurre en ocasiones, con una insuficiente delimitación
conceptual de las variables seleccionadas y con limitaciones en el análisis
estadístico de los datos, la situación puede llegar a resultar inmanejable. La
consecuencia suele ser una evidente infrautilización de los datos y una
ineficiencia en el uso de los recursos disponibles.
• Un último grupo de problemas que plantean las pruebas de
logros están relacionados con el uso que se hace de las mismas y con las
interpretaciones a que dan pie:
• Un primer problema tiene que ver con los distintos tipos
de uso que pueden hacerse de la información. Los resultados de la evaluación
pueden utilizarse con una finalidad formativa, orientada al desarrollo
institucional y profesional de los agentes implicados, para fomentar la
competición, e incluso para impulsar políticas de mercado en el ámbito
educativo. Obviamente, las interpretaciones que permiten tales posibilidades
son diferentes y persiguen distintos efectos. Es necesario señalar que, si bien
esos son los extremos de un continuo de posibilidades de uso, existen otras
opciones intermedias en que dichos propósitos pueden combinarse en diferente
proporción. La decisión sobre el tipo de uso que se pretende hacer de los datos
de la evaluación condiciona en buena medida el diseño de la evaluación.
• Un segundo problema tiene que ver con la existencia de
diversas posibilidades de comparación (con una norma o criterio, con otras
realidades semejantes, consigo mismo a lo largo del tiempo), cada una de las
cuales plantea sus propias exigencias y ofrece diferentes posibilidades. El uso
de la comparación plantea un problema complicado, que tiene que ver con la
justicia de la
comparación. El intento de dar respuesta a esa cuestión ha
impulsado el desarrollo de técnicas de cálculo del denominado valor añadido.
• Un tercer problema consiste en el excesivo reduccionismo
en que a veces se cae cuando se pretende interpretar los resultados de la evaluación. Ese
defecto puede venir originado por una excesiva limitación del contenido de las
pruebas, que no permite llegar a conclusiones razonables sobre el logro de los
objetivos propuestos, o por una interpretación poco rigurosa de los datos, que
puede incluso llegar a distorsionar las interpretaciones.
A la vista del análisis que acaba de hacerse de las pruebas
nacionales de logros, se llega a la conclusión de que constituyen la práctica
de evaluación más habitual en la región, encontrándose bastante asentadas en la actualidad. No
obstante, como se ha puesto de manifiesto, presentan algunas deficiencias y
problemas que deberán solventarse en el futuro, si se quiere asegurar su
credibilidad y se pretende que contribuyan a mejorar la educación.
Extraído de
¿Qué pretendemos evaluar, qué evaluamos y qué conclusiones
podemos extraer de la evaluación?
Alejandro Tiana Ferrer
En: Evaluar las
evaluaciones
Una mirada política acerca de las evaluaciones de Calidad
Educativa
IIPE UNESCO
En la sección “Biblioteca” hay un link hacia el PDF completo
No hay comentarios:
Publicar un comentario