Revista de Matemática: Teoría y Aplicaciones ISSN Impreso: 1409-2433 ISSN electrónico: 2215-3373

OAI: https://revistas.ucr.ac.cr/index.php/matematica/oai
Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas
PDF

Palabras clave

missing data
quality control
autoregressive filters
principal component analysis
free software applications
datos faltantes
control de calidad
filtros auto regresivos
análisis de componentes principales
aplicaciones de software libre

Cómo citar

Alfaro, E. J., & Soley, F. J. (2009). Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas. Revista De Matemática: Teoría Y Aplicaciones, 16(1), 60–75. https://doi.org/10.15517/rmta.v16i1.1419

Resumen

Se presentan dos metodologías para el rellenado de datos ausentes, enfocadas hacia su uso en series de tiempo geofísicas. La primera se basa en la descomposición en componentes principales de la matriz de correlación de datos de una misma variable entre estaciones cercanas y en periodos de tiempo comunes. Este método multivariable permite incorporar en los valores rellenados los fenómenos de mayor escala a partir de la información de las estaciones cercanas. El segundo método es para ser utilizado cuando no hay estaciones cercanas y el rellenado se debe hacer con la información de la misma estación. Consiste en ajustar un modelo autoregresivo a la serie de tiempo y utilizar ese modelo como estimador de los datos ausentes. Se evaluaron dos algoritmos para calcular los coeficientes autoregresivos: el estimador de Burg y el propuesto por Ulrych y Clayton. El primero es apropiado para procesos estocásticos y el segundo para series determinísticas. Las dos metodologías descritos en este trabajo son recursivas: se hace una primera estimación a los datos ausentes corriendo el algoritmo ignorando los datos ausentes si es posible ó aproximándolos de forma grosera. El algoritmo se continúa ejecutando con los nuevos valores sustituyendo los valores estimados en la corrida anterior. La ejecución termina cuando la diferencia máxima de los valores estimados entre dos corridas sucesivas es menor que un valor fijado de antemano por el usuario. Los datos rellenados conservan la media y la desviación estándar original de la serie de tiempo. Estos algoritmos se adaptaron y modificaron, por medio del uso de Interfaces Gráficas con el usuario, para su uso en SCILAB, que es una plataforma   similar a MATLAB pero de fuente abierta y que corre indistintamente en Windows y Linux. Ellos fueron elaborados como una actividad de extensión de la Universidad de Costa Rica.

https://doi.org/10.15517/rmta.v16i1.1419
PDF

Citas

Alfaro, E.; Cid, L. (1999) “Ajuste de un modelo VARMA para los campos de anomalías de precipitación en Centroamérica y los índices de los océanos Pacífico y Atlántico Tropical”, Atmósfera, 12(4): 205–222.

Ebisuzaki, W. (1997) “A method to estimate the statistical significance of a correlation when the data are serially correlated”, J. Climate 10: 2147–2153.

Kay, S.M.; Marple, S.L. (1981) “Spectrum analysis – A modern perspective”, Proc. IEEE, 69: 1380–1419.

Magaña, V.; Amador, J.; Medina, S. (1999) “The midsummer drougth over Mexico and Central America”, Journal of Climate 12: 1577-1588.

North, G.R.; Bell, T.L.; Cahalan, R.F.; Moeng, F.J. (1982) “Sampling errors in the estimation of empirical orthogonal functions”, Mon. Wea. Rev. 110: 699–706.

Press, W.H.; Teukolsky, S.A.; Vetterling, W.A.; Flannery, B.P. (1992) Numerical Recipes in C: the Art of Scientific Computing. Cambridge University Press, Cambridge.

Sciremammano, F. (1979) “A suggestion for the presentation of correlations and their significance levels”, J. Phys. Oceanogr. 9: 1273–1276.

Soley, F.J. (2003) Análisis en Componentes Principales. Notas de clase del curso SP-5906, Métodos Digitales de Análisis de Secuencias Temporales. Programa de Posgrado en Ciencias de la Atmósfera. Sistema de Estudios de Posgrado Universidad de Costa Rica (Accesible en http://fjsoley.com).

Soley, F.J. (2005) Sistemas lineales ARMM(p,q) con p + q ≤ 4. Primera Parte: Sistemas lineales AR (p ≤ 4). Notas de clase del curso SP-5906, Métodos Digitales de Análisis de Secuencias Temporales. Programa de Posgrado en Ciencias de la Atmósfera. Sistema de Estudios de Posgrado. Universidad de Costa Rica (Accesible en http://fjsoley.com).

Soley, F.J.; Alfaro, E. (1999) “Aplicación de análisis multivariado al campo de anomalías de precipitación en Centroamérica”, Tóp. Meteor. Oceanog. 6(2): 71–93.

Tabony, R.C. (1983) “The Estimation of Missing Climatological Data”, Journal of Climatology 3: 297–314.

Ulrych T.J.; Bishop, T.N. (1975) “Maximum Spectral Analysis and Autoregressive Decomposition”, Reviews of Geophysics and Space Physics 13(1): 183–200.

Ulrych T.J.; Clayton, R.W. (1976) “Time Series Modeling and Maximum Entropy”, Physics of the Earth and Planetary Interiors 12: 188–200.

Wilks, D. (1995) Statistical Methods in the Atmospheric Sciences. Academic Press, New York.

##plugins.facebook.comentarios##

Descargas

Los datos de descargas todavía no están disponibles.