Revista de Matemática: Teoría y Aplicaciones ISSN Impreso: 1409-2433 ISSN electrónico: 2215-3373

OAI: https://revistas.ucr.ac.cr/index.php/matematica/oai
Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación
PDF

Palabras clave

statistical classification
area under the ROC curve
nearest neighbours
condensation
Monte Carlo
clasificación estadística
área bajo la curva ROC
modelo binormal
vecinos cercanos
condensación
Monte Carlo

Cómo citar

Jiménez-Padilla, R., & Cuevas-Covarrubias, C. (2011). Curvas ROC y vecinos cercanos, propuesta de un nuevo algoritmo de condensación. Revista De Matemática: Teoría Y Aplicaciones, 18(1), 21–32. https://doi.org/10.15517/rmta.v18i1.2112

Resumen

Los criterios k-NN son algoritmos no paramétricos de clasificación estadística. Son precisos, versátiles y libres de distirbución. Sin embargo su costo computacional puede ser demasiado alto; especialmente con tamaños de muestra grandes. Presentamos un nuevo algoritmo de condensación que, basado en el modelo Binormal para curvas ROC, permite transformar la base de entrenamiento en un conjunto pequeño de vectores de baja dimensión. A diferencia de otras técnicas escritas en la literatura, nuestra propuesta permite controlar el intercambio de precisión por reducción de la base de entrenamiento. Un estudio de Monte Carlo muestra que el desempeño del método popuesto puede ser muy competente, superando en diversos escenarios realistas al de otros métodos frecuentemente utilizados.

https://doi.org/10.15517/rmta.v18i1.2112
PDF

Citas

Bamber, D. (1975) “The area above the ordinal dominance graph and the area below the receiver operating characteristic graph”, Journal of Mathematical and Statistical Psicology 12(4): 387–415.

Cuevas-Covarrubias, C. (2003) Statistical Inference for ROC Curves. Tesis de Doctorado, Departamento de Estadística, Universidad de Warwick, Coventry, Reino Unido.

Cuevas-Covarrubias, C.; Monroy, V.; Ortega, V. (2008) “Aplicación de un algoritmo k -NN para la gestión del capital humano. Predicción del desempeño y detección de competencias críticas en el desarrollo del personal”, Preprint, Up-Pharma, Ciudad de México, México.

Dorfman, D.D.; Alf, E. Jr. (1969) “Maximum likelihood estimation of parameters of signal-detection theory and determination of confidence intervals-rating-method data”, Journal of Mathematical Psychology

(3): 487–496.

Guo, G.; Wang, H.; Bell, D.; Bi, Y.; Greer, K. (2003) “KNN model-based approach in classification”, in: On The Move to Meaningful Internet Systems 2003: CoopIS, DOA, and ODBASE, Lecture Notes in Computer Science, Volume 2888, Springer, Berlin: 986–996.

Hand, D.J. (1994) “Assessing classification rules”, Journal of Applied Statistics 21: 3–16.

Hanley, J.A.; McNeil, B.J. (1982) “The meaning and use of the area under the under a receiver operating characteristic (ROC) curve”, Radiology 143: 29–36.

Henley, W.E.; Hand, D.J. (1996) “A k-nearest-neighbour classifier for assessing consumer credit risk”, The Statistician, 45(1): 77–95.

Krzanowski, W.J.; Hand, D.J. (2009) ROC Curves for Continuous Data. Chapman & Hall/CRC, Londres, Reino Unido.

Zweig, M.H.; Campbell, G. (1993) “Receiver operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine”, Clin. Chem., 39(4): 561–577.

Comentarios

Descargas

Los datos de descargas todavía no están disponibles.