Resumen

Se presentan dos metodologías para el rellenado de datos ausentes, enfocadas hacia su uso en series de tiempo geofísicas. La primera se basa en la descomposición en componentes principales de la matriz de correlación de datos de una misma variable entre estaciones cercanas y en periodos de tiempo comunes. Este método multivariable permite incorporar en los valores rellenados los fenómenos de mayor escala a partir de la información de las estaciones cercanas. El segundo método es para ser utilizado cuando no hay estaciones cercanas y el rellenado se debe hacer con la información de la misma estación. Consiste en ajustar un modelo autoregresivo a la serie de tiempo y utilizar ese modelo como estimador de los datos ausentes. Se evaluaron dos algoritmos para calcular los coeficientes autoregresivos: el estimador de Burg y el propuesto por Ulrych y Clayton. El primero es apropiado para procesos estocásticos y el segundo para series determinísticas. Las dos metodologías descritos en este trabajo son recursivas: se hace una primera estimación a los datos ausentes corriendo el algoritmo ignorando los datos ausentes si es posible ó aproximándolos de forma grosera. El algoritmo se continúa ejecutando con los nuevos valores sustituyendo los valores estimados en la corrida anterior. La ejecución termina cuando la diferencia máxima de los valores estimados entre dos corridas sucesivas es menor que un valor fijado de antemano por el usuario. Los datos rellenados conservan la media y la desviación estándar original de la serie de tiempo. Estos algoritmos se adaptaron y modificaron, por medio del uso de Interfaces Gráficas con el usuario, para su uso en SCILAB, que es una plataforma   similar a MATLAB pero de fuente abierta y que corre indistintamente en Windows y Linux. Ellos fueron elaborados como una actividad de extensión de la Universidad de Costa Rica.

Palabras clave: datos faltantes, control de calidad, filtros auto regresivos, análisis de componentes principales, aplicaciones de software libre