Resumen
El presente trabajo aborda el tema relacionado con el procesamiento estadístico de variables categóricas. Se explican los fundamentos matemáticos del análisis de Componentes Principales y del an´alisis de Regresión para datos categóricos. La unión de estas técnicas puede utilizarse para resolver problemas de clasificación.
Debido a que estos son métodos relativamente nuevos, se decide utilizar otra técnica más conocida (´arboles de clasificación siguiendo criterios chi cuadrado) para realizar comparaciones de sus los resultados, con ayuda de la teoría de las curvas ROC. En la aplicación desarrollada se estudiaron pacientes supuestamente sanos del municipio de Santa Clara, Cuba, diagnosticados como hipertensos, prehipertensos y normotensos por un Comité de Expertos Médicos altamente calificados. La regresión categórica unida al análisis de Componentes Principales como m´etodo de selección de variables, resultó ser la mejor técnica ara resolver el problema de clasificación.
Citas
Agresti, A. (2002) Categorical Data Analysis, Second ed.. John Wiley & Sons, New York.
SPSS 10 para Windows. Manual de usuarios. Caṕıtulo 12, SPSS Soft.
Vicéns Otero, J.; Medina Moral, E. (2005) “Análisis de datos cualitativos”, en: www.uam.es/personal pdi/economicas/eva/pdf/tab conting.pdf, consultado el 22-Sep-2007, 9:30 a.m.
Grau, R. (2000) “Independencia de variables y medidas de asociación”, Capítulo 3. Segunda parte. Preprint, Universidad Central de las Villas, Cuba.
Hair, J.F. et al. (1999) Análisis Multivariante, 5a ed. Prentice Hall, Madrid.
Johnson, R.A.; Wichern, D.W. (2002) Applied Multivariate Statistical Analysis, Fifth edition. Pearson Education International, United States of America.
Linting, M. (2007) Nonparametric Inference in Nonlinear Principal Components Analysis: exploration and beyond. Doctoral Thesis, Leiden University.
Meulman, J.J.; Heiser, W.J. (2004) SPSS Categories 13.0.
Stanton, J.M., et al. (2001) “A brief history of linear regression for statistics instructors”, Journal of Statistics Education 9(3).
Draper, N.R.; Smith, H. (1980) Applied Regression Analysis. Editorial Pueblo y Educación.
Haber, L. (2001) “Categorical regression analysis of toxicity data”, Comments on toxicology 7(5-6): 437–452.
Van der Kooij, A.J. (2007) Prediction Accuracy and Stability of Regression with Optimal Scaling Transformations. Doctoral Thesis, Leiden University.
Ramsay, J.O.; Monotone, Wichern. (1988) “Regression splines in action”, en:
http://www.fon.hum.uva.nl/praat/manual/spline.html, consultada 28-Ene-2008, 10:15 a.m.
“Tuotromedico: Hipertensión Arterial”, en: http://www.tuotromedico.com/temas/hipertension, consultada 20-Mar-2008, 1:18 p.m.
Microsoft ©R Encarta ©R 2006, ©c 1993-2005 Microsoft Corporation. Reservados todos los derechos.
Aron, A.; Aron, E. (2002) Statistics for the Behavioral and Social Sciences, Second edition. Prentice Hall.
Navarro Céspedes, J.M. (2008) Análisis de Componentes Principales y Análisis de Regresión para datos categóricos. Aplicación en HTA. Tesis de Maestría, Universidad Central de las Villas, Santa Clara,
Cuba.
Calero, A. (1998) Estadística II. Pueblo y Educación, La Habana, Cuba.
Swets, A.J. (1988) “Measuring the accuracy of diagnostic systems”, Science 240: 1285–1293.
Spackman, K.A. (1989) ”Signal detection theory: Valuable tools for evaluating inductive learning”, Sixth International Workshop on Machine Learning, San Mateo, CA.
Fawcett, T. (2004) “ROC graphs: notes and practical considerations for researchers, en: home.comcast.net/˜tom.fawcett/public html/papers/ROC101.pdf, consultado 5-May-2008, 3:58 p.m.
Comentarios
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Derechos de autor 2010 Juan M. Navarro Céspedes, Gladys M. Casas Cardoso, Emilio González Rodríguez