An n-gram based approach to the automatic classification of schoolchildren’s writing
DOI:
https://doi.org/10.35869/vial.v0i16.93Palabras clave:
escritura, n-gramas, educación primaria, categorías morfológicas, clasificación automáticaResumen
Este artículo trata del análisis de la escritura de los escolares (a lo largo de la educación primaria) utilizando un conjunto de etiquetas morfológicas (n-gramas). Se han analizado un conjunto de bigramas y trigramas de un conjunto de textos literarios escritos por escolares catalanes con el objetivo de identificar qué bigramas y trigramas pueden discriminar los textos según los ciclos en los que se divide la educación primaria en España: el ciclo inicial (6 y 7 años), medio (8 y 9 años) y superior (10 y 11 años). Los resultados muestran cerca del 70% de clasificaciones correctas (el 77,5% en bigramas y el 68,6% en trigramas), lo que permite afirmar que la técnica es útil para la clasificación automática de los documentos según la edad.
Descargas
Descargas
Publicado
Número
Sección
Licencia
Revistas_UVigo es el portal de publicación en acceso abierto de las revistas de la Universidade de Vigo. La puesta a disposición y comunicación pública de las obras en el portal se efectúa bajo licencias Creative Commons (CC).
Para cuestiones de responsabilidades, propiedad intelectual y protección de datos consulte el aviso legal de la Universidade de Vigo.