Revista de Matemática: Teoría y Aplicaciones ISSN Impreso: 1409-2433 ISSN electrónico: 2215-3373

Análisis de componentes principales y análisis de regresión para datos categóricos. Aplicación en la hipertensión arterial
PDF (Español (España))


categorical regression
arterial hypertension
ROC curves
: regresión categórica
hipertensión arterial
curvas ROC

How to Cite

Navarro Céspedes, J. M., Casas Cardoso, G. M., & González Rodríguez, E. (2010). Análisis de componentes principales y análisis de regresión para datos categóricos. Aplicación en la hipertensión arterial. Revista De Matemática: Teoría Y Aplicaciones, 17(2), 199–230.


The present work is about the statistical processing of categorical data. The mathematical details of the Categorical Principal Components and the Categorical Regression Analysis are explained. The combination of both techniques can be used to solve classification problems. Because these techniques are relatively new, we decided to use another technique (classification trees following the chi squared criteria) to make a comparison of their results, with the help of the theory of ROC curves.

In the application, supposedly healthy patients of Santa Clara, Cuba, were diagnosed as hypertensive, pre hypertensive and no hypertensive by a Committee of Medical Experts. Categorical Component Analysis and Categorical Regression Analysis were applied in order to successfully solve the classification problem.
PDF (Español (España))


Agresti, A. (2002) Categorical Data Analysis, Second ed.. John Wiley & Sons, New York.

SPSS 10 para Windows. Manual de usuarios. Caṕıtulo 12, SPSS Soft.

Vicéns Otero, J.; Medina Moral, E. (2005) “Análisis de datos cualitativos”, en: pdi/economicas/eva/pdf/tab conting.pdf, consultado el 22-Sep-2007, 9:30 a.m.

Grau, R. (2000) “Independencia de variables y medidas de asociación”, Capítulo 3. Segunda parte. Preprint, Universidad Central de las Villas, Cuba.

Hair, J.F. et al. (1999) Análisis Multivariante, 5a ed. Prentice Hall, Madrid.

Johnson, R.A.; Wichern, D.W. (2002) Applied Multivariate Statistical Analysis, Fifth edition. Pearson Education International, United States of America.

Linting, M. (2007) Nonparametric Inference in Nonlinear Principal Components Analysis: exploration and beyond. Doctoral Thesis, Leiden University.

Meulman, J.J.; Heiser, W.J. (2004) SPSS Categories 13.0.

Stanton, J.M., et al. (2001) “A brief history of linear regression for statistics instructors”, Journal of Statistics Education 9(3).

Draper, N.R.; Smith, H. (1980) Applied Regression Analysis. Editorial Pueblo y Educación.

Haber, L. (2001) “Categorical regression analysis of toxicity data”, Comments on toxicology 7(5-6): 437–452.

Van der Kooij, A.J. (2007) Prediction Accuracy and Stability of Regression with Optimal Scaling Transformations. Doctoral Thesis, Leiden University.

Ramsay, J.O.; Monotone, Wichern. (1988) “Regression splines in action”, en:, consultada 28-Ene-2008, 10:15 a.m.

“Tuotromedico: Hipertensión Arterial”, en:, consultada 20-Mar-2008, 1:18 p.m.

Microsoft ©R Encarta ©R 2006, ©c 1993-2005 Microsoft Corporation. Reservados todos los derechos.

Aron, A.; Aron, E. (2002) Statistics for the Behavioral and Social Sciences, Second edition. Prentice Hall.

Navarro Céspedes, J.M. (2008) Análisis de Componentes Principales y Análisis de Regresión para datos categóricos. Aplicación en HTA. Tesis de Maestría, Universidad Central de las Villas, Santa Clara,


Calero, A. (1998) Estadística II. Pueblo y Educación, La Habana, Cuba.

Swets, A.J. (1988) “Measuring the accuracy of diagnostic systems”, Science 240: 1285–1293.

Spackman, K.A. (1989) ”Signal detection theory: Valuable tools for evaluating inductive learning”, Sixth International Workshop on Machine Learning, San Mateo, CA.

Fawcett, T. (2004) “ROC graphs: notes and practical considerations for researchers, en:˜tom.fawcett/public html/papers/ROC101.pdf, consultado 5-May-2008, 3:58 p.m.


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Copyright (c) 2010 Juan M. Navarro Céspedes, Gladys M. Casas Cardoso, Emilio González Rodríguez


Download data is not yet available.