Evaluación académica con inteligencia artificial: comparación entre docentes y ChatGPT en Trabajos de Fin de Máster

Autores/as

  • Sonia Eusebio-Hermira
  • Rocío Cuberos-Vicente
  • Anna Doquin de Saint-Preux

DOI:

https://doi.org/10.35869/reined.v24i2.6942

Palabras clave:

Evaluación Académica, Inteligencia Artificial, Rúbricas de Evaluación, Educación Superior, Trabajos de Fin de Máster

Resumen

La expansión de la inteligencia artificial ha reconfigurado los modos de enseñar, aprender y evaluar, planteando nuevos retos. Este estudio examina la correspondencia entre las evaluaciones realizadas por docentes universitarios y las generadas por un sistema de inteligencia artificial (ChatGPT) en el contexto de Trabajos de Fin de Máster. Se adopta una metodología mixta, cuantitativa y cualitativa. A partir del análisis de 45 trabajos evaluados por ambos agentes utilizando una rúbrica común, se analizan las diferencias. Los resultados muestran una correlación global moderada y estadísticamente significativa entre ambas formas de evaluación, aunque se detectan discrepancias en los ítems relacionados con la estructura formal y la redacción académica, donde la IA tiende a ser más rigurosa. El análisis cualitativo revela diferencias sustanciales en el enfoque y el contenido de los comentarios: mientras que los docentes priorizan la profundidad conceptual y ofrecen retroalimentación contextualizada, la IA se enfoca en aspectos formales con observaciones más genéricas. Estos hallazgos sugieren que la IA puede ser una herramienta útil en procesos evaluativos, siempre que se complemente con el juicio pedagógico humano. Se discuten las implicaciones de estos resultados para el diseño de sistemas de evaluación mixtos y la formación docente en el uso de tecnologías emergentes.

Descargas

Los datos de descargas todavía no están disponibles.

Descargas

Publicado

2026-05-03

Número

Sección

Artículos