Resumen
Se presenta una variante en los métodos de clasificación: un algoritmo genético para clasificación automática utilizando las herramientas del análisis simbólico de datos; esta implementación permite solventar los problemas de los métodos clásicos de clasificación: obtención de mı́nimos locales y dependencia de los tipos de datos con los cuales trabajan: continuos. El método fue programado en MatLab©R y usa un operador interesante de codificación. Se comparan clases por su inercia intra-clases. Se usaron las siguientes medidas para datos del tipo simbólico: medida de disimilitud de Ichino-Yaguchi, medida de disimilitud de Gowda-Diday, diatancia Euclídea y distancia de Hausdorff.
Citas
Arroyo, J; Maté, C. (2009) “Descriptive distance-based statistics for histogram data”, in: 11th Conference of the International Federation of Classification Societies, March 13–18, Dresden: 105–106.
Billard, L.; Diday, E. (2006) Symbolic Data Analysis: Conceptual Statistics And Data Mining. Wiley, New York.
Castillo, W.; González, J.; Trejos, J. (2009) Análisis Multivariado de Datos. Manuscrito en preparación.
Larrañaga, P.; Lozado, J. (2002) Estimation of Distribution Algorithms. Kluwer Academic Publishers, Dordrecht.
MacQueen, J. (1967) “Some methods for classification and analysis of multivariate observations”, Proc. Fifth Berkeley Symp. on Math. Statist. and Prob., Vol. 1, University of California Press, Berkeley: 281–297.
Pham, D.T.; Karaboga, D. (2000) Intelligent Optimization Techniques. Springer, London.