Abstract
The aim of this study was to determine the most important variables for predicting student dropout from the General Mathematics course (MAT001) of the Universidad Nacional de Costa Rica (UNA), considering the types of students and the time at which dropout takes place. Six predictive models were constructed (two student groups at three different times) and three supervised learning algorithms were implemented in each model: Logistic Regression (LR), Random Forest (RF) and XGBoost (XGB). The total sample was split into training files containing data on students who enrolled in the course during the years 2017 and 2018, and test files with data corresponding to students who enrolled in the year 2019. Once the hyperparameters were fitted (10-fold validation), the main variables associated with student dropout (SD) in the General Mathematics course of each model were identified based on the Gini importance measure; performance of the algorithms ranged from F1-Scores of 0.6251 to 0.7300. In addition, the predictive power of the algorithms in each model were compared by means of a repeated-measures ANOVA with 10-fold cross-validation, and no significant differences were found between the three algorithms in any of the proposed models. The main variables associated with student dropout (SD) were academic, such as grades on the academic attitude test (AAT), high school education grades, and grades on MAT001 tests, student attributes as sex and age at enrollment, economic factors such as scholarships and the Social Development Index (SDI), and institutional factors such as high school educational opportunities that students were exposed to, and the ages and specializations of the teaching staff. Based on the results of this analysis, it is recommended that teachers specialized in Educational Mathematics be assigned to teach initial courses, and to propose designs for decision making about actions that increase permanence.
References
Aguilar-Fernández, E., Zamora-Araya, J. A. y Rodríguez-Pineda, M. (2024). Análisis de correspondencia simple para estudiar la relación entre factores del abandono escolar y el estrato del colegio de procedencia en la Universidad Nacional de Costa Rica. Revista Educación, 48(2), 1-20. https://doi.org/10.15517/revedu.v48i2.58519
Albreiki, B., Zaki, N. y Alashwal, H. (2021). Una revisión sistemática de la literatura sobre la predicción del rendimiento de los estudiantes utilizando técnicas de aprendizaje automático. Ciencias de la Educación, 11(9), 1-27. https://doi.org/10.3390/educsci11090552
Alvarado, O. y Zambrano, S. M. (2020). Modelo predictivo para determinar el fracaso de matemáticas en grado 11 usando machine learning [Proyecto de grado, Universidad Distrital Francisco José Caldas]. Repositorio Institucional Universidad Distrital - RIUD. https://repository.udistrital.edu.co/bitstream/handle/11349/25365/OmarAlvaradoSantosZambrano2020.pdf?sequence=1&isAllowed=y
Asamblea Legislativa. (2011). Ley 8968 Protección de la persona frente al tratamiento de sus datos personales. http://www.pgrweb.go.cr/scij/Busqueda/Normativa/Normas/nrm_texto_completo.aspx?param1=NRTC&nValor1=1&nValor2=70975&nValor3=85989
Bäulke, L., Grunschel, C. y Dresel, M. (2022). Deserción estudiantil en la universidad: Una visión por fases sobre el abandono de los estudios y el cambio de carrera. Revista Europea de Psicología de la Educación, 37(3), 853-876. https://doi.org/10.1007/s10212-021-00557-x
Behr, A., Giese, M., Teguim-Kamdjou, H. D. y Theune, K. (2020). Abandono de la universidad: una revisión de la literatura. Revista de Educación, 8(2), 614-652. https://doi.org/10.1002/rev3.3202
Cabrera, J. T., Álvarez, P. y González, M. (2006). El problema del abandono de los estudios universitarios. RELIEVE. Revista Electrónica de Investigación y Evaluación Educativa, 12(2), 171-203. https://doi.org/10.7203/relieve.12.2.4226
Calva, K., Flores, M., Porras, H. y Cabezas-Martínez, A. (2021). Modelo de predicción del rendimiento académico para el curso de nivelación de la escuela politécnica nacional a partir de un modelo de aprendizaje supervisado. Latin-American Journal of Computing, 8(2), 58-71. https://doi.org/10.5281/zenodo.5770905
Castaño, E., Gallón, S., Gómez, K. y Vásquez, J. (2004). Deserción estudiantil universitaria: Una aplicación de modelos de duración. Lecturas de Economía, (60), 39-65. https://doi.org/10.17533/udea.le.n60a2707
Castillo-Sánchez, M., Gamboa-Araya, R. y Hidalgo-Mora, R. (2020). Factores que influyen en la deserción y reprobación de estudiantes de un curso universitario de matemáticas. Uniciencia, 34(1), 219-245. http://dx.doi.org/10.15359/ru.34-1.13
Guzmán, A., Barragán, S. y Cala Vitery, F. (2021). Deserción escolar en la educación superior rural: una revisión sistemática. Fronteras de la educación, 6, 1-14. https://doi.org/10.3389/feduc.2021.727833
Hernández, R., Fernández, C. y Batista, M. P. (2014). Metodología de la investigación (6ta ed.). Mc Graw Hill.
Khan, A. y Ghosh, S. K. (2021). Análisis y predicción del rendimiento de los estudiantes en el aprendizaje en el aula: una revisión de los estudios de minería de datos educativos. Educación y Tecnologías de la Información, 26, 205-240. https://doi.org/10.1007/s10639-020-10230-3
Khoushehgir, F. y Sulaimany, S. (2023). Negative link prediction to reduce dropout in massive open online courses [Predicción de enlaces negativos para reducir la deserción en cursos masivos abiertos en línea]. Education and Information Technologies, 1-20. https://doi.org/10.1007/s10639-023-11597-9
Kilian, P., Loose, F. y Kelava, A. (2020). Predecir el éxito de los estudiantes de matemáticas en la fase inicial de la universidad con información dispersa utilizando enfoques de aprendizaje estadístico. Fronteras de la Educación, 5, 1-16. https://doi.org/10.3389/feduc.2020.502698
Lázaro, N., Callejas, Z. y Griol, D. (2020). Factores que inciden en la deserción estudiantil en carreras de perfil ingeniería informática. Revista Fuentes, 22(1), 105-126. https://hdl.handle.net/11162/200868
López-Zambrano, J., Lara-Torralbo, J. A. y Romero-Morales, C. (2021). Predicción temprana del rendimiento del aprendizaje de los estudiantes a través de la minería de datos: una revisión sistemática. Psicotema, 33(3), 456-465. https://reunido.uniovi.es/index.php/PST/article/view/17117
Mora, Y. (2016). Estudio longitudinal de la deserción universitaria en el Instituto Tecnológico de Costa Rica [Tesis de maestría, Universidad de Costa Rica]. Repositorio SIBDI. https://repositorio.sibdi.ucr.ac.cr/handle/123456789/22144
Munizaga, F., Cifuentes, M. B. y Beltrán, A. (2018). Retención y abandono estudiantil en la educación superior universitaria en América Latina y el caribe: Una revisión sistemática. Education Policy Analysis Archives, 26(61), 1-36. http://dx.doi.org/10.14507/epaa.26.3348
Muñoz-Camacho, S. V., Gallardo, T., Muñoz-Bravo, M. y Muñoz-Bravo, C. A. (2018). Probabilidad de deserción estudiantil en cursos de matemáticas básicas en programas profesionales de la Universidad de los Andes-Venezuela. Formación Universitaria, 11(4), 33-42. http://dx.doi.org/10.4067/S0718-50062018000400033
Opazo, D., Moreno, S., Álvarez-Miranda, E. y Pereira, J. (2021). Análisis de la deserción universitaria de primer año a través de modelos de aprendizaje automático: Una comparación entre universidades. Matemáticas, 9(20), 1-27. https://doi.org/10.3390/math9202599
Pascua-Cantero, P. M. (2016). Factores relacionados con la deserción en el primer y segundo año de estudio en la carrera de Enseñanza de la Matemática de la Universidad Nacional de Costa Rica. Revista Electrónica Educare, 20(1), 96-118. http://dx.doi.org/10.15359/ree.20-1.5
Proyecto ALFA-GUÍA. (2013). Marco conceptual sobre el abandono. Hacia la gestión colectiva de un marco conceptual para analizar, predecir, evaluar y atender el abandono estudiantil en la educación superior. https://www.scribd.com/document/261888622/Marco-Conceptual-sobre-el-Abandono-pdf
Rodríguez-Pineda, M. y Zamora-Araya, J. A. (2014). Análisis de la deserción en la Universidad Nacional desde una perspectiva longitudinal. Quinto informe estado de la educación. Programa Estado de la Nación. https://doi.org/10.13140/RG.2.2.30416.66569
Román, M. (2017). Capítulo 5: La evolución de la educación superior. En Sexto informe estado de la educación (pp. 241-308). Programa Estado de la Nación. https://hdl.handle.net/20.500.12337/1181
Shin, D. y Shim, J. (2021). A systematic review on data mining for mathematics and science education [Una revisión sistemática sobre minería de datos para la educación en matemáticas y ciencias]. International Journal of Science and Mathematics Education, 19, 639-659. https://doi.org/10.1007/s10763-020-10085-7
Solís, M., Moreira, T., González, R., Fernández, T. y Hernández, M. (2018). Perspectives to predict dropout in university students with Machine Learning [Perspectivas para predecir la deserción escolar en estudiantes universitarios con Machine Learning]. IEEE International Work Conference on Bioinspired Intelligence (IWOBI), 1-6. https://doi.org/10.1109/IWOBI.2018.8464191
Tinto, V. (1982). Definición de abandono escolar: una cuestión de perspectiva. Nuevas Direcciones para la Investigación Institucional, 1982(36), 3-15. https://doi.org/10.1002/ir.37019823603
Tinto, V. (1989). Definir la deserción: Una cuestión de perspectiva. Revista de Educación Superior, 71(18), 1-9. http://publicaciones.anuies.mx/pdfs/revista/Revista71_S1A3ES.pdf
Valencia, L. I., Guzmán, A. y Barragán, S. (2024). Deserción en programas de posgrado: un fenómeno poco explorado: una revisión exploratoria. Educación Cogent, 11(1), 1-20. https://doi.org/10.1080/2331186X.2024.2326705
Wang, W., Zhao, Y., Wu, Y. J. y Goh, M. (2023). Factores de abandono de los MOOCs: Una revisión bibliométrica. Biblioteca Hi Tech, 41(2), 432-453. https://doi.org/10.1108/LHT-06-2022-0306
Xu, C., Zhu, G., Ye, J. y Shu, J. (2022). Minería de datos educativos: Predicción de abandono en los MOOCs de XuetangX. Cartas de Procesamiento Neuronal, 54(4), 2885-2900. https://doi.org/10.1007/s11063-022-10745-5
Zamora-Araya, J. A. (2023a). Modelo de un sistema de alerta temprana para reducir el abandono en el curso de Matemática General en la Universidad Nacional, Costa Rica [Tesis de doctorado, Universidad Estatal a Distancia]. https://catalogosiidca.csuca.org/Record/UNED.000099829
Zamora-Araya, J. A. (2023b, noviembre). Predicción del abandono temprano en estudiantes de nuevo ingreso en el curso de Matemática General utilizando algoritmos de aprendizaje supervisado [Ponencia]. Congreso Latinoamericano sobre Abandono en Educación Superior (CLABES), Temuco, Chile. https://clabes.uct.cl/wp-content/uploads/2024/06/Acta-XII-CLABES-Revision-final.pdf
Zamora-Araya, J. A., Aguilar-Fernández, E. y Rodríguez-Pineda, M. (2023). ¿Cuándo el abandono universitario se convierte en exclusión educativa? Revista Innovaciones Educativas, 25(38), 97-115. http://dx.doi.org/10.22458/ie.v25i38.4212
Zamora-Araya, J. A., Gamboa, R., Hidalgo, R. y Castillo, M. (2020). Permanencia estudiantil en el curso de Matemática General de la Universidad Nacional, Costa Rica. Actualidades Investigativas en Educación, 20(1), 1-23. https://doi.org/10.15517/aie.v20i1.39815
##plugins.facebook.comentarios##
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 3.0 Unported License.
Copyright (c) 2025 Revista Educación - Journal of Education