Criterios de evaluación educativa: bases y perspectivas

La evaluación del aprendizaje es una práctica de suma importancia en el ámbito educativo a la que, sin embargo, se le ha dado poco espacio en la reflexión de los estudiosos de este tema en nuestro país.

El estado de conocimiento sobre la evaluación del aprendizaje en el II Congreso Nacional de Investigación Educativa (Martínez y cols., 1993) señala que son muy pocos los trabajos realizados sobre este aspecto de la evaluación educativa a lo largo de la década comprendida de 1982 a 1992 (se encontraron únicamente 81 estudios, tesis y artículos, en revisión exhaustiva). Ya García Cortés en 1979 señalaba el problema de la «realización paupérrima de estudios de evaluación educativa en nuestro medio».

La falta de interés teórico por el tema y el consiguiente poco espacio dedicado a su análisis en las instituciones formadoras de maestros ha llevado a la generalización de prácticas evaluativas del logro escolar con las siguientes características:

a) Falta de reflexión sobre las razones por las cuales se evalúa, dando prioridad al cumplimiento administrativo sobre la utilidad real de la información.

b) Procedimientos e instrumentos de evaluación poco planeados y mal estructurados.

c) Escaso análisis de lo obtenido en las evaluaciones, priorizando los intereses crediticios («aprobé o no», «quince alumnos reprobaron», etcétera) por sobre los logros académicos («he aprendido al cien por ciento este contenido», «ya hay un conocimiento generalizado de esta materia o no», etcétera).

Por todo lo anterior, es importante regresar siempre a las bases, a las razones por las cuales se hace la evaluación educativa.

El objetivo del presente trabajo es analizar algunas cuestiones de fondo acerca de la teoría de la evaluación, en su relación específica con la evaluación del aprendizaje, con la intención de mostrar a los partidarios de las posturas extremistas que las prácticas evaluativas en el aula, en la escuela y en el sistema educativo no tienen por qué ser ciegas recetas que inventó un técnico, y que debe haber una reflexión seria sobre la manera de abordar la tarea de evaluación y de extraer el significado de cada dato obtenido.

La evaluación educativa es una estrategia de recolección de información sobre los diferentes momentos, actores y auxiliares del proceso enseñanza-aprendizaje.

Si bien es indispensable que cada profesor haga evaluaciones particulares y a profundidad de estos elementos al interior de su espacio de trabajo, es también necesario contar con perspectivas más generales de la labor académica que sirvan de monitor a la totalidad de la comunidad de las escuelas.

Por tanto, la evaluación masiva de estudiantes, la evaluación reflexiva entre los maestros y la evaluación institucional se presentan como prácticas útiles en el acopio de datos globales sobre la situación escolar.

Múltiples circunstancias han hecho que en algunas ocasiones la evaluación general se lleve a cabo con una perspectiva de conteo y control que recaba datos con instrumentos que no han sido depurados, asigna calificativos por simple tradición numérica,1 y genera listados llenos de cifras a los que no se da un uso en el perfeccionamiento del esquema educativo.

La intención de quienes realizan el proceso de evaluación y quienes lo promueven es decisiva en el énfasis que se va a dar a unos u otros elementos del sistema de evaluación que se genere.

Así, ante el único interés de cumplir de la manera más eficiente posible con una exigencia administrativa o estatutaria, los evaluadores prefieren hacer instrumentos que estén listos para ser aplicados en muy poco tiempo, que sean lo más económicos posible en tiempo, dinero y esfuerzo, así como que el análisis de los datos resultantes de las aplicaciones sea rápido y no evidencie las carencias de sus instrumentos, aunque este análisis no tenga un uso fuera de los expedientes.

En cambio, ante el interés de obtener información útil en el análisis de la situación educativa, las preferencias tienden a desarrollar instrumentos con un nivel suficiente de validez, confiabilidad y pertinencia que lleven a obtener datos adecuados para el propósito de conocer los resultados escolares, permitiéndose así hacer mayores inversiones de recursos que en otros modelos.

Varios puntos de decisión se plantean en este proceso: ¿quién debe decidir las áreas a evaluar, los contenidos de las áreas a evaluar y los métodos de evaluación?, ¿quién debe crear los instrumentos de evaluación?, ¿qué características deben tener los ítemes de los instrumentos y/o métodos de evaluación?, ¿en qué momento se pueden considerar adecuados los instrumentos y/o métodos de evaluación?, ¿qué criterios deben tomarse en cuenta para analizar la información obtenida?, ¿qué segmentos y agrupaciones de la información obtenida son más útiles, y para quién?

Existe una serie de cuestiones con respecto a la forma de abordar el trabajo de la evaluación masiva que ha sido resuelta con base en criterios poco claros, e incluso sin siquiera considerar los problemas teóricos y de aplicación, planteando las decisiones en términos meramente técnicos y/o administrativos. García Cortés (1979) explica la gran importancia que tiene determinar, para cada caso específico, las respuestas a para qué evaluar y qué evaluar.

Responder estas dos preguntas señala criterios que generalmente sirven de gran ayuda para tomar decisiones sobre la manera de operar un programa de evaluación.

Es conocido el hecho de que un instrumento y/o método de evaluación (desde una regla hasta un electroencefalógrafo) que va a ser utilizado en repetidas ocasiones, para sacar conclusiones al hacer comparaciones debe cumplir ciertos criterios de confiabilidad y validez, así como ser pertinente.

Sabemos que las condiciones y cualidades de los actores educativos son dinámicas, así que esta primera definición no parece ser muy útil en el ámbito de la escuela.

Una definición que nos parece más viable para la tarea que nos ocupa es la de considerar semejante a lo que es semejante, y diferente a lo que lo es, lo cual acerca la noción cuantitativa de confiabilidad a la noción cualitativa de imparcialidad (Fernández Ríos, 1994).

Los estándares para la evaluación educativa y psicológica por medio de pruebas (apa, 1985) señalan que «la validez es la consideración más importante en la evaluación por medio de pruebas. Es muy difundida la definición básica de validez en instrumentos de evaluación que indica que éstos son válidos cuando miden lo que pretenden medir (Magnusson, 1975).

Sin embargo, este concepto de validez aparentemente tan simple se encuentra en el centro de una polémica que aún actualmente se lleva a cabo. Cureton (1951) provee una definición similar: la cuestión esencial de la validez en las pruebas es qué tan bien realizan la tarea para la cual se les está usando.

La validez es definida entonces en términos de la correlación entre los puntajes de una prueba y los «verdaderos» puntajes del criterio. La perdurable definición de Anastasi (usada desde 1954 hasta 1997), «la validez es qué mide una prueba y qué tan bien lo hace», es también citada ampliamente. cit.; Tourón, 1989; Burns, 1996; gao, 1991) reportan al menos tres tipos «clásicos» de validez, actualmente existe una tendencia a considerar un tipo único de validez (Gray, op. cit., quienes incluso sugieren que el concepto de confiabilidad también es mucho más cercano al de validez de lo que se ha pensado), del cual, eso sí, se obtienen distintos tipos de evidencias:

Se ha sugerido que la validez de constructo abarca tanto a la validez de criterio como a la de contenido. Anastasi (1986) coincide en que la validez de constructo subsume los requisitos de la validez de contenido y de criterio. (Stapleton, 1997)

Existen tres puntos de especial importancia en cuanto a la pertinencia de un procedimiento de evaluación:

– Que el tipo de información arrojada sea realmente un indicador útil sobre los conocimientos y/o habilidades de la población. Que existan criterios fundamentados para interpretar las cifras obtenidas en la examinación masiva.

De lo anterior se desarrollan los siguientes puntos:

– Que el tipo de información arrojada sea realmente un indicador útil sobre los conocimientos y/o habilidades de la población. Existe una discusión importante con respecto a los instrumentos de evaluación que se utilizan en educación.

lgunos autores, como Díaz Barriga (1982), señalan que la evaluación no debe hacer uso de la tecnología de medición generada por la psicometría y perfeccionada constantemente pues «se minimiza tanto el proceso mismo de la evaluación del aprendizaje como la noción de aprendizaje y la de docencia.»; otros plantean problemas técnicos en el uso de ciertos tipos de evaluación «objetiva», por ejemplo que sólo se mide lo que el alumno memoriza, o la posibilidad de acertar por azar (Fermín, 1971); finalmente, otros autores, reconociendo los problemas de «el hiato indudable entre la medida y lo que pretendemos medir» y «el uso de la medición en la evaluación educativa» (Tourón, 1989) confían, sin embargo, en el uso del método científico para la valoración escolar y generan estrategias cada vez más refinadas para salvar los problemas mencionados (Tourón, 1989; Tirado y Serrano, 1989; Rodríguez y García, 1982). Consideramos importante rescatar nociones de cada uno de estos planteamientos, que equilibren una práctica evaluativa eficaz, eficiente y útil.

– Que existan criterios fundamentados para interpretar las cifras obtenidas en la examinación masiva. Una problemática común entre los que atacan el problema de la evaluación desde un punto de vista social y/o filosófico, que en cambio es poco tocado por quienes tienen el punto de vista únicamente técnico, es el criterio de pase-reprobación en el caso de evaluaciones con fines de acreditación, o el criterio de «aceptabilidad-inaceptabilidad» en el de evaluaciones para la toma de decisiones.

En efecto, no hay una estandarización en la dificultad que deben tener este tipo de pruebas, ni normas o consejos de uso generalizado para establecer los criterios. Por todo ello, el conjunto de la sociedad escolar debe dedicar tiempo a la reflexión de este problema, aterrizándolo en programas concretos en los que se trabaje, y tomando decisiones con respecto a los criterios a emplear en ellos.

Cada sociedad escolar debe definir los propios. Estos términos, llevados a la evaluación educativa, implican el compromiso y la reflexión de todos los participantes en el proceso de la educación.

El último problema que planteamos para reflexionar en cuanto a la pertinencia de la evaluación, es el de decidir la manera de presentar la información obtenida y el análisis realizado con base en la aplicación de los métodos e instrumentos, así como los modos e instancias de distribución de estos datos. También consideramos útil consignar el proceso de búsqueda de las mejores estrategias en escritos que puedan ser de utilidad a otros en su práctica evaluativa.

Autor de esta obra:
Andrés Sánchez Moguel – http://educacion.jalisco.gob.mx/consulta/educar/