Pruebas de criterio

Introducción

Cuando el objetivo de la evaluación es la toma de una decisión (la competencia, ¿está o no dominada, eventualmente a qué nivel?), la objetividad de la decisión queda reforzada si se apoya sobre criterios bien explicitados y actualizados por indicadores.

Los criterios

Los criterios debieran ser pertinentes, independientes y poco numerosos; además, deberían estar jerarquizados.
Los criterios son pertinentes si miden componentes esenciales de la tarea o de la familia de tareas.

Así, refiriéndonos una vez más al ejemplo tomado de la biología, de allí resulta que si el alumno, a partir de esquemas, debe redactar un texto cuyo objetivo es hacer comprender el funcionamiento del sistema inmunológico a un no especialista, la selección y la exactitud de la información recordada constituyen, en todos los casos, criterios pertinentes.

Por lo contrario, los errores del lenguaje no lo son. Lo constituirían si la tarea exigida fuese componer un texto destinado a comentar el esquema en un artículo científico o en un manual de biología. Los criterios son independientes entre sí si el fracaso de un criterio no entraña, automáticamente, el fracaso de otro.

Consideremos la tarea relativa a las cualidades ambientales de los tres carburantes, GLP, gasolina y diesel. Dado que la resolución del problema exige escribir ecuaciones químicas de combustión de los hidrocarburos constitutivos de esos carburantes, y realizar cálculos estequiométricos, se toman en consideración dos criterios de evaluación, a saber: la utilización de modelos (las ecuaciones químicas, el concepto de mol), así como la utilización de las herramientas matemáticas y la corrección de los cálculos.

Por fin, un último criterio de evaluación se funda en la coherencia de la elección del combustible menos contaminante: las conclusiones en cuanto a esa elección, ¿tienen coherencia con los datos que pudieron averiguarse en las fuentes apropiadas, determinadas experimentalmente o por cálculo? Puede suponerse que el alumno cometa un error en una de las ecuaciones de combustión, error que repercutirá sobre los valores numéricos calculados.

También podría haber fallado en los cálculos. Tanto en un caso como en el otro, serán falsos los datos comparativos sobre los que tendrá que fundar su elección. Sobre la base de estos, podría llegar a la conclusión de que el GLP expulsa más dióxido de carbono (CO2) que la gasolina (que es lo opuesto, en realidad).

Es claro que el alumno no ha cumplido con una, con otra o, incluso, con las dos primeras normas. ¿Habrá que concluir, sin embargo, que no ha cumplido con la tercera norma? Si su elección es coherente respecto a los datos (desgraciadamente incorrectos) de que disponía. Para fundar su decisión, deberemos considerar que el alumno si ha cumplido con ese criterio de coherencia.

Muy distinta sería la sanción si, sobre la base de esos mismos datos incorrectos, el alumno efectuara, a pesar de todo, una correcta clasificación (porque “sabe” por experiencia o porque ha “oído decir” que el GLP era un combustible menos contaminante) sin subrayar el carácter paradójico de su respuesta.

La situación que acabamos de describir muestra la independencia de que se beneficia este último criterio respecto a los dos primeros. De igual manera, es patente la independencia de los dos primeros criterios: unas ecuaciones químicas erróneas no causan automáticamente la falla del criterio relacionado con la corrección de los cálculos que se deriven.

Por último, los criterios serán poco numerosos. La limitación del número de criterios permitirá no solamente evitar que se “diluya” la evaluación de la competencia global en una multiplicación de criterios parciales, sino que también permitirá construir una red de evaluación practicable en las clases. Pues, recordémoslo, toda reforma triunfa o fracasa según la practicabilidad que le reconozcan los docentes.

Ejemplos aplicados en las pruebas de criterio

Tomemos un ejemplo de las lenguas germánicas para mostrar esas tres características:

En una investigación-acción que se está haciendo sobre la utilización de las estrategias de comunicación en lengua extranjera,4 se ha aplicado la siguiente red experimental de la evaluación de la expresión oral (situación: después de un choque, el automovilista A y el automovilista B presentan su versión a la policía, requerida después de que no pudieron ponerse de acuerdo):

Respecto de la tarea (10 puntos)

a) Comunicación de información pertinente 7 infos = 7 puntos)

b) Coherencia de la presentación (3 puntos)
– Cronología del relato (1 punto)
– Presencia de nexos lógicos entre los informes, (2 puntos)

Respecto de la situación de comunicación (4 puntos)

a) El alumno tendrá cuidado de hacer comprensible su mensaje (mímica que utiliza, actitud comunicativa, claridad del discurso…) (2 puntos)

b) El alumno verifica si su interlocutor lo comprende (2 puntos)
– Por vía del lenguaje verbal (1 punto)
– Por vía del lenguaje no verbal (1 punto)

Idioma (6 puntos)

a) Riqueza (2 puntos)
– Variedad de las construcciones (1 punto)
– Riqueza de vocabulario (1 punto)

b) Fluidez y supervisión (2 puntos)

– El alumno se expresa de manera fluida (1 punto)
– El alumno se corrige cuando toma conciencia de un error de idioma (1 punto)

c) Corrección (2 puntos)

– Errores que dificultan la comprensión (1 punto)
– Otros errores (1 punto)

Conclusión

Es fácil reconocer la PERTINENCIA de los criterios: retomando, en sustancia, las exigencias de calidad de la expresión oral tales como se anuncian en las Competencias terminales, la red aporta las interpretaciones y los matices relacionados con el tipo de situación de interacción.

Su INDEPENDENCIA es manifiesta y el equipo de investigación ha realizado un esfuerzo notable en ese sentido. Observemos que en comunicación siempre habrá un nexo entre el resultado de la comunicación y otros factores como la riqueza y la corrección lingüística. Pero esto se debe a la naturaleza de las cosas y no a la red de evaluación propuesta. Lo más difícil era, sin duda, la noción de pocos criterios.

En lo concerniente a los puntos atribuidos, hay tres criterios globales, subdividido cada uno en componentes significativos y estos también, a veces, en subcomponentes. Esta estructura de diferenciación, en forma de árbol genealógico, si no desemboca aún en un número muy limitado de aspectos que deben observarse, al menos ofrece un sentido bien organizado a la observación, haciendo que esta sea mucho menos difícil que si se hubiese tratado de una simple lista. Nos parece que representa un acuerdo, el cual forma una base interesante para la practica.

Señalemos, para completar, que la red abarca igualmente la utilización de estrategias de comunicación, pero esta parte no participa en el balance cifrado.