Título: Minería de datos aplicada a rendimientos estudiantiles
Autor: Paola Zuliani
Director: Dra. Alejandra Cechich
Carrera: Licenciatura en Ciencias de la Computación
Fecha de defensa: 29 de marzo de 2001
Resumen del Trabajo
El presente trabajo estudiará la herramienta de software C4.5 [8], uno de los métodos más populares de aprendizaje inductivo desarrollado por Quinlan para la generación de árboles de decisión.
Describiremos detalladamente la herramienta, el proceso de la minería de datos –la preparación de los datos, búsqueda de patrones,evaluación del conocimiento, y refinamiento– explorando los datos suministrados por la Unidad Académica de esta Universidad (aproximadamente 16.000 registros) con el fin de encontrar patrones que permitan predecir tanto variables socioeconómicas como académicas. Por ejemplo, dado un alumno particular, se buscarán patrones para predecir si tendrá o no un promedio mayor o igual que siete. En este ejemplo, la clase de la variable dependiente es la formada por los alumnos cuyos promedios son mayores o iguales a siete. Nuestro objetivo será buscar patrones en los datos para predecir los miembros de una clase a partir de una o más variables predictoras.
En el Capítulo 2 de la Disertación introduciremos los conceptos básicos del proceso de búsqueda de patrones y de la minería de datos. En el Capítulo 3 resumiremos distintas técnicas para realizar minería de datos. En el Capítulo 4 presentaremos la herramienta de software utilizada en el presente trabajo y mostraremos el caso analizado con los resultados obtenidos. Finalmente, las conclusiones serán presentadas en el Capítulo 5.