¿Existe alguna alternativa a los exámenes tradicionales?

Parece que el modelo de examen tradicional (dos parciales al 30% y uno final al 40% de la nota, libro cerrado) falla. Por ejemplo:

  1. A los estudiantes no se les permite acceder a los recursos, cuando en realidad lo harían
  2. Los estudiantes obtienen solo unos minutos por pregunta, mientras que en realidad obtendrían días
  3. A los estudiantes no se les permite colaborar, cuando en realidad lo harían
  4. Los estudiantes se preparan para el examen el día anterior y olvidan lo que aprendieron después de que termina el curso.
  5. Los estudiantes se enfocan en el examen en detrimento de aprender el material y comprender las aplicaciones del mundo real.
  6. Es difícil afirmar que la calificación del examen demuestra el dominio del material del curso en contextos que no sean un examen.

Pero en la práctica, ¿es posible mejorar estos defectos sin introducir grandes aumentos en la carga de trabajo del instructor? ¿Existe algún sistema de evaluación del desempeño de los estudiantes en un curso de pregrado que sea una mejora con respecto a un enfoque de examen tradicional?

Un argumento en contra de algunos de esos puntos es que los exámenes están destinados a evaluar el conocimiento, no la capacidad (la diferencia es que no tengo idea de lo que hizo Henry III, pero puedo buscarlo fácilmente: me están evaluando si soy o no). puedo decirle personalmente algo sobre Enrique III, no mi capacidad para escribir Enrique III en Google).
Esto depende completamente de la naturaleza del tema. El español elemental es diferente del cálculo. Un curso de historia de la división superior es diferente de cualquiera de estos.
@ waiwai933: Supongo que te refieres a "dominio, no conocimiento".
@BenCrowell No es muy raro que incluso los cursos de división superior y de posgrado se califiquen con una rúbrica similar, donde el "conocimiento" (según el ejemplo de waiwai933) es un factor significativo (o, a menudo, el más importante).
"Los estudiantes se preparan para el examen el día anterior y olvidan lo que aprendieron después de que termina el curso" - Así es, pero la próxima vez que necesiten el conocimiento, el proceso de reaprendizaje será mucho más rápido que el aprendizaje inicial. Tal es la naturaleza de todo aprendizaje, no solo para los exámenes.
Preocuparse por el "en la realidad, lo harían" parece indicar que estaría interesado en el aprendizaje auténtico . Proporciono algunas referencias en mi respuesta a esta pregunta relacionada
Por eso también hay encargos.
La colaboración plantea un problema. ¿Qué pasa si solo hay - estudiante tomando el curso? ¿O los estudiantes solo estudian a distancia? En realidad, el examen parcial es extraño para mí. Todas las materias en las que me he matriculado y también he enseñado han tenido 2-3 tareas y 1 examen final.
Exámenes para llevar a casa que prueban la capacidad del estudiante para aplicar el material del curso a un pequeño conjunto de problemas reales. El examen dura unos días, no unas pocas horas. Los estudiantes pueden acceder a los recursos, los estudiantes pueden estudiar mientras el examen está en su poder. Simplemente limitar claramente la colaboración entre estudiantes (plagio). He encontrado que esto es más efectivo para las clases de nivel superior, donde los estudiantes generalmente son honestos y se preocupan por el material del curso.
En mi universidad, la mayoría de los cursos eran tareas grupales impulsadas por proyectos que tomaban todo el semestre (a veces incluso dos o tres semestres) junto con algunas pruebas orales personalizadas para cada grupo sobre de qué se trataba su proyecto en una charla informal y libre con el maestro. donde tenías que explicar qué hizo tu proyecto y cuál fue tu parte en él. Claro, eran cosas de CompSci, pero esos cursos se me pegaron como pegamento. El formato fue mucho más intenso y productivo que las pruebas regulares.

Respuestas (4)

Una alternativa que ha cobrado impulso en el uso real en el aula es la calificación basada en estándares (SBG): http://www.fwps.org/teaching/sbe/grading-system/

En SBG, el instructor establece una lista de hitos que se espera que los estudiantes alcancen a lo largo del curso. Luego, los estudiantes pueden proporcionar evidencia de cualquier tipo, dentro de los parámetros establecidos por el instructor, que prueban que han cumplido con el estándar. La evidencia del logro de un estándar por parte del estudiante se marca en una escala generalmente de 0 a 4 (inaceptable, novato, progresando, aceptable y dominio, o algo así) y las calificaciones se asignan al final del semestre en función de la cantidad de los hitos se han cumplido en el nivel "Aceptable" o superior.

Por ejemplo, en cálculo, un estándar podría ser "Tomar la derivada de un polinomio de segundo grado usando la definición de límite". Un estudiante puede demostrar que sabe esto al resolver un problema en una prueba cronometrada estándar. Pero tal vez no lo dominaron tan bien como deberían, y en la prueba su trabajo está marcado como 2 de 4 (progresando; tal vez entendieron bien la definición pero hicieron mal parte del álgebra resultante). Este no es el final de la historia. Más adelante en el curso, el estudiante puede mostrar nuevamente evidencia de que ha aprendido lo que necesita aprender; por ejemplo, puede programar tiempo en el horario de oficina para venir a trabajar en un problema o dos para demostrarle que ha cumplido con el estándar. O tal vez tomar una breve prueba en clase, o resolver un problema durante el tiempo de trabajo en grupo no estructurado en las reuniones de clase, o cualquier vía que permita el instructor.

El objetivo de SBG es que queremos evaluar a los estudiantes en función de lo que saben y brindarles múltiples formas de demostrar que lo saben. Por lo tanto, SBG puede ser un superconjunto de pruebas cronometradas tradicionales: los estudiantes que obtienen buenos resultados en situaciones cronometradas lo harán bien en SBG, pero los estudiantes que luchan con las pruebas cronometradas pueden tener múltiples oportunidades para actuar juntos, y siempre que puedan demostrar que He dominado el material al final del curso, eso es lo que importa.

Personalmente no practico SBG pero me gustaría. Sugeriría esta publicación de blog de mi colega Jon Hasenbank, quien es un gran defensor de SBG: http://profjonh.blogspot.com/2014/02/sbg-mia14.html

+1 Esta es la única respuesta hasta ahora que detalla una alternativa a los exámenes tradicionales, como se solicita en la pregunta.
+1. Esto es lo que me impulsa a aprender como estudiante. No podría importarme menos mi valor medido basado en una prueba de 1-2 horas. Lo que logro es realmente importante para mí, y los exámenes nunca han sido una medida precisa de lo que he logrado personalmente . Siento que trabajar hacia una meta (finalización de un proyecto, demostración de principios en la práctica, etc.) vale mucho más que responder preguntas en un examen. Si bien los exámenes son una "forma objetiva de evaluar el desempeño", también lo son los proyectos personales/(trabajo en general) que demuestran el conocimiento obtenido.
Creo que esta respuesta necesita algunas actualizaciones. ;) Después de todo, el último párrafo está muy desactualizado.

Aunque los exámenes tienen las fallas que describiste, también hay muchos aspectos positivos que no has discutido:

  • Los exámenes son en realidad una forma objetiva de evaluar el rendimiento, en un entorno "difícil de copiar". Aunque uno puede estar en desacuerdo con lo que realmente se está probando, la objetividad generalmente no se cuestiona.
  • Ellos son rápidos. Se necesitan de 3 a 4 horas para evaluar a cientos de estudiantes.
  • Son de uso universal y la mayoría de los estudiantes están acostumbrados a ellos.
  • Es una excelente manera de preparar a los estudiantes para desempeñarse bajo estrés, una habilidad que es extremadamente útil en cualquier ambiente de trabajo. Todos los trabajos/habilidades tienen algún tipo de prueba (por ejemplo, presentaciones, entrevistas). Incluso obtener su licencia de conducir requiere pruebas. Por lo tanto, aprender a rendir bien en los exámenes es una habilidad crucial en la vida real.

La única herramienta complementaria (pero no lo suficientemente buena para reemplazar completamente los exámenes) que se me ocurre es la asignación de proyectos. Especialmente en CS, los proyectos son una herramienta muy efectiva para preparar a los estudiantes para tareas de trabajo real. Pero no son un método lo suficientemente bueno por sí solos sin algún tipo de examen escrito personal. Permiten demasiada colaboración, copia y, por lo general, cuando se realizan en equipos, los buenos estudiantes hacen la mayor parte del trabajo mientras que otros holgazanean. Si bien un profesor puede tomar medidas para minimizar esto, es imposible evitarlo al 100%.

Por lo tanto, no creo que haya una forma universalmente mejor de evaluar el desempeño de los estudiantes que los exámenes escritos. Uno puede complementarlo con proyectos, tareas, exámenes orales, pero en la mayoría de los casos, abandonarlo por completo es probablemente un error.

La objetividad puede ser cuestionable cuando el examen no es bueno, algo que como estudiante me pareció injusto muchas veces.
@Davidmh ¿Los exámenes no fueron objetivos o no evaluaron las habilidades adecuadas? La mayoría de los malos exámenes (escritos) fallan en la segunda categoría, pero no creo que muchos exámenes sean realmente subjetivos en el sentido de la palabra.
Un ejemplo de QFT: "Pregunta 1 (20 %), aplique este teorema levemente oscuro para obtener una cantidad clásica en esta situación. Pregunta 2 (80 %): exprese la solución del ejemplo 1 en términos de operadores de creación y destrucción". Puedes decir que es objetivo (o sabes cómo aplicar ese teorema o no), pero realmente no obtienes una sensación objetiva del conocimiento del estudiante. Supongo que es principalmente una cuestión de terminología.
Otros están mal redactados. Cuando me preguntaron "significado histórico y evidencia experimental de las ecuaciones de Maxwell", expliqué los experimentos y hitos más importantes, hasta el tensor de Einsten; obtuvo una calificación baja porque estaban buscando "$\nabla \cdot \vec B = 0$ significa que no hay monopolos magnéticos". Otros fueron "la definición es correcta, pero no dio un ejemplo, como debería haber entendido implícitamente de la pregunta, puntos medios". [Pero tiendo a despotricar aquí].
@David: una vez tomé un curso universitario llamado Pruebas y medidas , un semestre completo dedicado al arte y la ciencia de construir pruebas justas que miden con precisión la comprensión de los objetivos del curso por parte de los estudiantes. Fue uno de los mejores (y más útiles) cursos que he tomado en mi vida, y abordó dificultades como la que mencionas aquí. El curso fue diseñado para educadores K-12, pero creo que muchos profesores podrían haberse beneficiado del material de ese libro de texto. Su comentario inicial es acertado: como herramienta de medición, no todos los exámenes son igualmente precisos y algunos pueden ser completamente malos.
@JR suena como un curso muy interesante. ¿Hay material publicado? Debo decir que, como estudiante, me sentía muy bien cuando sacaba un examen bien hecho, independientemente de mi rendimiento real (un suspenso merecido no es tan amargo).
@xLeitix Research muestra que muchos lo son, en el siguiente sentido: para la misma respuesta escrita, diferentes evaluadores asignarán calificaciones muy diferentes.
Esta respuesta se centra principalmente en defender el statu quo y no parece abordar la pregunta.
@ user11596: vale la pena señalar que aproximadamente el 75% de esta pregunta está dando golpes al status quo, por lo que defender el status quo no es irrelevante, pero es pertinente para el asunto planteado por el OP. Hay más en esta pregunta que el fondo. pregunta de linea
@JR Veo cómo este preámbulo podría molestar a las personas y por qué muchos parecen sentir la necesidad de objetar o expresar su desacuerdo votando a favor de estos comentarios extensos, pero esa no es la pregunta que se hace.
@user11596 - ¿Existe algún sistema para evaluar el desempeño de los estudiantes en un curso de pregrado que sea una mejora con respecto al enfoque de examen tradicional? Respuesta: Sí, complementando los exámenes con proyectos y tareas. ¿Es posible mejorar estos defectos, sin introducir grandes aumentos en la carga de trabajo del instructor? Respuesta: No, no creo que haya una manera universalmente mejor de evaluar el desempeño de los estudiantes que los exámenes escritos. ¿Cómo NO responde esto a las preguntas planteadas por el OP? (¿O solo estás mirando la pregunta en el título?)
@JR Como dije, se centra principalmente en defender el statu quo. Hay algunas partes relevantes, pero ni siquiera están tan claramente establecidas como en su último comentario. Simplemente necesitaría más de las cosas relevantes y menos comentarios irrelevantes (y, para mí, egoístas y poco convincentes) para considerar que esta respuesta responde de manera útil a la pregunta y la vota a favor. Véase, por ejemplo, la respuesta de Robert Talbert.
@David: el libro de texto que usamos en ese curso fue Medición y evaluación en la enseñanza de Norman E. Gronlund. Cada capítulo está repleto de ejemplos y listas de verificación, y hay sugerencias para lecturas adicionales al final de cada capítulo. (Si no le importa comprar usados, noté que puede obtener ediciones más nuevas que mi copia impresa por unos pocos dólares en Amazon).
@ user11596: también dijo que esta respuesta "no parece abordar la pregunta". Supongo que tendremos que estar en desacuerdo con eso. De todos modos, creo que tienes un hacha para moler.
@JR Tal vez podría haber agregado un adverbio allí, ¿realmente hace tanta diferencia? Creo que ya di muchos comentarios sobre lo que creo que falta, lo que es irrelevante y cómo podría ser una buena respuesta (que es de lo que se supone que tratan los comentarios). ¿Qué no está claro sobre eso?

A los estudiantes no se les permite acceder a los recursos, cuando en realidad lo harían

  • No necesariamente así. Los instructores pueden permitir "hojas de trucos" o permitir exámenes de libro abierto.

Los estudiantes obtienen solo unos minutos por pregunta, mientras que en realidad obtendrían días

  • No necesariamente cierto. Mi jefe a menudo me hace preguntas y espera que le dé respuestas rápidas. No siempre tengo el lujo de pedir unos días para investigar algo. Si estamos en una reunión de alto riesgo con clientes de fuera de la ciudad, la eficacia de mi organización bien podría depender de mi capacidad para hacer o responder preguntas inteligentes sobre la marcha.

A los estudiantes no se les permite colaborar, cuando en realidad lo harían

  • Cierto, pero los exámenes están diseñados para medir la capacidad y el rendimiento individuales, no la capacidad de alguien para contribuir dentro de un grupo o lograr algún objetivo como grupo.

Los estudiantes se preparan para el examen el día anterior y olvidan lo que aprendieron después de que termina el curso; los estudiantes también se enfocan en el examen en detrimento de aprender el material y comprender las aplicaciones del mundo real

  • Tal vez sea así, pero eso es lo que obtenemos cuando probamos las minucias y lo trivial, en lugar de probar la síntesis de conceptos de alto nivel (más sobre esto más adelante).

Es difícil afirmar que la calificación del examen demuestra el dominio del material del curso en contextos que no sean un examen.

  • Tal vez sea así, pero no es difícil afirmar que, como regla general, si a los estudiantes se les dan exámenes idénticos, los estudiantes que obtienen calificaciones por encima de la mediana probablemente comprendan mejor los conceptos del curso que aquellos que obtuvieron calificaciones por debajo de la mediana (con algunas posibles excepciones, debido a factores como la ansiedad ante los exámenes y tal vez incluso un poco de suerte).

En resumen, menciona algunas posibles deficiencias con lo que llama "el modelo de examen tradicional", pero puede abordar algunas de ellas simplemente redefiniendo sus parámetros. En lugar de dos exámenes con libro cerrado que cuenten para el 70 % de la calificación del estudiante, administre tres exámenes con libro abierto que cuenten para el 50 % de la calificación del estudiante. Haga que uno de ellos sea un examen para llevar a casa, y al menos hará mella en el problema de "pocos minutos por pregunta". Al reducir el porcentaje del examen del 70 % al 50 %, tiene un 20 % extra para jugar, así que asigne un proyecto de grupo que valga el 20 % de la calificación, y así abordar el problema de colaboración que menciona.

En cuanto a abarrotar y concentrarse en las cosas equivocadas, eso es lo que harán los estudiantes si estructura un examen que requiere que comprometan una gran cantidad de conocimientos insignificantes en la memoria a corto plazo. Me esfuerzo mucho para que las preguntas de mi examen aborden conceptos de nivel superior, en lugar de hechos nitnoide. Les pido que expliquen estos conceptos, a menudo interviniendo en debates hipotéticos. (A veces, estos debates ni siquiera son hipotéticos; busco un hilo de discusión en línea donde hay un debate, luego lo pego en mi examen y les pido que participen). En otras palabras, en la medida de lo posible, pruebo lo que quiero que recuerden dentro de cinco años. Si quiero que resuelvan un problema, pero no me importa si han memorizado una fórmula requerida (porque podrán buscarla de todos modos), simplemente incluiré la fórmula en el examen.

Pero en la práctica, ¿es posible mejorar estos defectos sin introducir grandes aumentos en la carga de trabajo del instructor?

Ah, ahora, ahí está el problema. Si seguiste mis sugerencias aquí, ¡mira lo que he hecho! Hay tres exámenes para calificar, no dos. Estos exámenes no tienen muchas preguntas de opción múltiple, y luego está ese nuevo proyecto de grupo que mencioné (que debe redactarse, asignarse y calificarse).

Es difícil conseguir algo a cambio de nada; la mayoría de las mejoras significativas tendrán algún costo.

El primer punto es importante: permita que los estudiantes traigan material pero hagan preguntas más difíciles, en particular no solo preguntas de recitación de conocimientos. Es difícil tener éxito en los exámenes que requieren un pensamiento independiente por "abarrotar".
En su mayor parte, esta respuesta no parece abordar la pregunta, sino que se centra en racionalizaciones poco convincentes.
@ user11596: le garantizo que mi respuesta aquí se centra más en la premisa de la pregunta que en la pregunta en sí. Sin embargo, si la premisa no representa una historia completamente precisa, creo que hay algún beneficio en abordar eso.

En los cursos que se enfocan más en la habilidad práctica del mundo real, las asignaciones (como crear un proyecto, software, etc.) son una alternativa adecuada. Se puede hacer durante más tiempo, utilizando literatura y, si se prefiere, en un grupo pequeño.

Un estudiante aún necesita defender una tarea (demostrar que funciona y responder suficientes preguntas para asegurarse de que el trabajo no haya sido copiado de algún lado).