Propuesta de carta de control multivariada utilizando la media winsorizada basada en la Carta |S|

Proposed multivariate control chart using winsorized Mean based on the |S| chart

Angelys P. Ariza Guerrero,
Universidad del Atlántico, Colombia
Estudiante de Ingeniería Industrial
apaolaariza@mail.uniatlantico.edu.co

Rister J. Barreto Pombo,
Universidad del Atlántico, Colombia
Estudiante de Ingeniería Industrial
rjbarreto@mail.uniatlantico.edu.co

Roberto J. Herrera Acosta,
Universidad del Atlántico, Colombia
Magister en Ciencias Estadísticas
robertojoseherrera@gmail.com

Recibido: 23 de agosto 2018 Aceptado: 1 de noviembre 2018

_________________________________________________

Resumen

El monitoreo global de la calidad de un producto está sujeto a la evaluación simultánea de varias de sus características; es necesario, bajo estas condiciones, la implementación de las cartas de control tipo multivariadas. La variabilidad, en este caso la matriz de varianza covarianza, es sin duda el más importante de los estadísticos desde la perspectiva multivariada, que puede ser monitoreada con distintas cartas. Entre éstas se encuentran: las cartas Shewhart, CUSUM y EWMA. En este el presente artículo se desarrolla una metodología de implementación de la Media Winsorizada en la carta de control multivariada de varianza efectiva |S|, encontrando una gran utilidad en procesos con valores extremos. El estudio muestra, además, una comparación entre la carta de control tradicional multivariante |S| y la carta propuesta, la cual presenta una mayor sensibilidad.

Palabras clave:

Variabilidad, sensibilidad, calidad, determinantes, extremos.

Abstract

The global quality of a product is often subject to the simultaneous evaluation of several of its features; under these circumstances, it becomes necessary to implement a multivariate analysis. The variance-covariance matrix is one of the most important quality control statistics in multivariate settings and it can be monitored using different methods, such as the Shewhart, CUSUM and EWMA charts. In this article, a construction method for the multivariate control chart |S| is proposed using the Winsorized Mean as the mean vector estimator. It was demonstrated that this modification was more efficient when the sampled data hat outliers. This study shows a comparison between the traditional multivariate control chart and the proposed chart, which was found to have more sensitivity.

Keywords:

Variability, quality, sensibility, determinants, outliers.

1. INTRODUCCIÓN

El control de la calidad tiene gran importancia a nivel empresarial e industrial debido a que, mediante sus múltiples herramientas, permite analizar y controlar el desempeño de los productos de empresas e instituciones (Vladiviviezo, 2009). Además, permite a estas organizaciones encontrar oportunidades de mejora para sus productos o servicios, garantizando que se eneren ventajas competitivas sostenibles a largo plazo. En muchas ocasiones, el control de la calidad no es sólo un valor añadido, sino que busca cumplir con los requerimientos del cliente para satisfacer sus necesidades.

Por otra parte, los procesos reales que se llevan a cabo en las empresas están sujetos a la variabilidad inherente a la naturaleza de los mismos. No obstante, cuando esta variabilidad presenta señales de alarma en el campo multivariado, es indispensable realizar ajustes a la variable o variables que influyen en el comportamiento del proceso. Por esta razón, es necesaria la aplicación de herramientas como análisis de componentes principales o, en su defecto, cartas de control univariadas para cada una de las variables con el propósito de evidenciar la característica de calidad que está afectando el comportamiento de la variabilidad total del producto en ese momento.

En términos más concretos, cuando el resultado de un proceso se ve influenciado por varias características de calidad, se suelen utilizar cartas de control univariadas tipo Shewhart para analizar cada una de ellas de manera independiente. Para hacer esto, es necsario que las características sigan una distribución normal y su grado de asociación sea mínimo.

Sin embargo, algunos procesos contienen características cuya variabilidad influye directamente en las demás, lo que hace al segundo criterio inválido para éstos. En caso de que sea necesario monitorear dos variables simultáneamente, se deben usar cartas tipo multivariantes para el control de la variabilidad (Zertuche y Cantú, 2008), las cuales permiten analizar el alto grado de asociación de las variables para determinar los efectos de su variabilidad sobre el comportamiento de los procesos.

Las cartas de control multivariadas tienen una gran cantidad de aplicaciones, principalmente en el sector industrial donde es más común encontrar que los procesos tienen medidas de control de varias variables en lugar de sólo una (Herrera, 2005). El uso de cartas de este tipo en el entorno industrial, permite evaluar la efectividad de los procesos y apoya la toma de decisiones con base en evidencias estadísticas para optimizar el desempeño de los mismos.

Con límites definidos apropiadamente, una carta de control puede distinguir el cambio entre calidad satisfactoria y defectos en el proceso (Liu, 1995). Además de los límites, es necesario ajustar los demás parámetros de las cartas para garantizar que los resultados sean fieles a las condiciones reales de operación. Es decir, se deben tener en cuenta las medidas de tendencia central y variabilidad utilizadas, así como características de la distribución de los datos de la muesta que puedan afectar su estabilidad estadística.

La implementación del control de calidad multivariado requiere la consideración de las siguientes etapas, descritas por Flury y Barbiero (2001):

La importancia de las cartas de control de tipo multivariado radica en analizar las relaciones entre el comportamiento de varias medidas, lo que permite un mejor estudio del proceso como un todo. En la actualidad, existen muchas propuestas que permiten hacer este tipo de análisis multivariado utilizando diferentes parámetros, siendo posible encontrar algunas más precisas o más adecuadas que otros para el análisis de determinada situación. En este artículo, se presentará una modificación de la propuesta de Vargas (2003) para el control de la variabilidad y se estudiará si esta modificación resulta más efectiva que la propuesta original.

2. JUSTIFICACIÓN

La evaluación de la calidad de un producto es siempre la prioridad de un cliente exigente; anteriormente, esta calidad solo era monitoreada por cartas univariadas de control. Actualmente, se recomienda el uso de cartas multivariadas, puesto que representan mejor el desempeño del proceso y también miden la asociación entre las variables. Este estudio muestra las condiciones que deben considerar los ingenieros a la hora de implementar las cartas de control multivariadas para la dispersión, así como las aplicaciones que ésta ha tenido desde hace varios años. Existe una gran variedad de propuestas de carta multivariada que pueden adaptarse a las características del proceso que se pretende evaluar. Una de ellas es la carta de varianza efectiva |S|, presentada por Vargas (2003) que hace uso de las matrices de varianza-covarianza y determinantes de las variables de estudio para establecer el estadístico de control. La media aritmética es utilizada para encontrar los límites de control; no obstante, cuando se presenta una alta variabilidad debido a la existencia de valores extremos en la muestra, el resultado es de una carta con límites estimados no representativos de los datos. Por tanto, esta investigación propone utilizar la Media Winsorizada como una medida de tendencia central, con el propósito de obtener una carta más robusta ante valores extremos.

3. METODOLOGÍA

Para este estudio se seleccionó como medida de tendencia central robusta la Media Winsorizada aplicada a la carta de varianza efectiva |S|, tal como la propuso Vargas (2003). La Media Winsorizada es un procedimiento de estimación de la media donde se censura el mismo número de observaciones en ambos extremos de la muestra, usando para cada observación censurada la misma magnitud de su vecino más cercano. Según Dixon (1960), para a observaciones censuradas en cada extremo, el estimador de la media es

(1)

El monitoreo de la variabilidad de un proceso normal multivariado con p características de calidad para la detección de cambios en la matriz de covarianza está basado en la varianza efectiva |S|. Donde S es la matriz de muestra de varianza covarianza p×p. Si se tiene una muestra de tamaño n (X1,X2,X3…,Xn) con distribución normal multivariada donde el i-ésimo vector de muestra Xi contiene observaciones de cada característica p, entonces el valor |S| se calcula como (Lee y Khoo, 2016):

(2)

donde el promedio del vector de muestra es,

(3)

En la carta de control para |S| se usa la media y la varianza de |S| como E(|S|) y V(|S|) y se tiene en cuenta la propiedad que indica que el intervalo E|S|±3√(V(|S|)) contiene la mayor parte de la distribución de |S| (Montgomery, 2009). De acuerdo con Levinson (2011), se puede demostrar que el determinante esperado y la línea central de la carta es

(4)

y la varianza del determinante está dada como,

(5)

Los límites de control se definen, entonces, para esta carta como

(6)

(7)

donde,

(8)

y

(9)

No obstante, cuando no se conoce Σ0, se puede tomar como un estimador, definido como el promedio de los determinantes Si obtenidos en cada punto del muestreo. En ese caso, los límites de control cambian y se definen como (Morales y Vargas, 2008):

(10)

(11)

(12)

Teniendo en cuenta estas consideraciones, se procedió a construir las cartas de tal forma que se pudiera comparar el desempeño de la carta de control |S| tradicional, frente al que se obtiene utilizando la Media Winsorizada en lugar de la media aritmética. Con este propósito, se elaboraron cuatro cartas que se presentan a continuación. Para empezar, se decidió construir la carta |S| propuesta por Vargas sin modificar la medida de tendencia central utilizada originalmente. Esta carta se presenta con el objetivo de tenerla como punto de referencia en cuanto al comportamiento que presenten aquellas en las que sí se modificó el procedimiento.

4. CONSTRUCCIÓN DE LAS CARTAS DE CONTROL

Para efectos de esta investigación, se generaron las observaciones normalmente distribuidas con una media y desviación conocida en Fase II por medio de un programa estadístico; se definieron i = 20 subgrupos, conformados por n = 20 observaciones para cada una de las p = 2 características de calidad que se evaluaron. Los datos generados siguen para esta carta en particular una distribución normal multivariante con una desviación estándar de 0,5 y 0,7 para la característica p1 y p2 respectivamente.

A. Carta multivariada |S|

Utilizando la ecuación (2), se calcularon las matrices de varianza-covarianza |Si| para cada subgrupo i con sus respectivos determinantes Si. En este caso, se consideró la Σ0 como desconocida, por lo que se utilizó el estimador definido para la carta. Luego, se utilizaron las ecuaciones (10) y (12) para encontrar los límites superior e inferior de la carta respectivamente, teniendo en cuenta los valores obtenidos para las constantes b1y b2 con las ecuaciones (8) y (9). Finalmente, se graficaron los determinantes Si con los límites calculados y se estudió el comportamiento de las observaciones de la muestra.

Una vez construida la carta de control con el procedimiento de la propuesta original, se procedió a comparar cómo funcionaba cuando se implementaba la Media Winsorizada en la construcción de la nueva carta. Es importante señalar que la implementación de la nueva media se refiere estrictamente a la substitución de la media aritmética en el procedimiento, lo que involucra una modificación en la forma de calcular las matrices de varianza covarianza de cada subgrupo, así como el valor obtenido para el promedio de los determinantes Si.

B. Carta multivariada |S| con media winsorizada

Para esta carta se usaron los mismos datos generados para la carta original y los parámetros fueron definidos de la misma manera, esto con el fin de comparar las cartas habiendo usado como base las mismas observaciones. En este caso, las matrices de covarianza se hallaron usando la ecuación (2), donde se reemplazó por el cálculo del estimador descrito en la ecuación (1). El uso de técnicas de recorte de datos en una muestra ha sido aplicado anteriormente, y de manera exitosa, en cartas de control univariadas. Sin embargo, la generalización de estos métodos para el caso de cartas tipo multivariadas no ha sido concreto (Vargas, 2003). En este caso en particular, no se usó una técnica de exclusión directa de datos, si no que se reemplazaron los valores extremos encontrados por la magnitud de la observación más cercana. Este ajuste se hizo con un 20% del total de las observaciones de cada subgrupo, lo que quiere decir, para subgrupos de tamaño 10, se reemplazaron las dos observaciones con magnitud más alta y las dos más bajas. Para el cálculo del límite central, se aplicó la Media Winsorizada en el cálculo del promedio de los determinantes Si, lo que censuró aquellos determinantes que resultaron con valores muy altos o muy bajos. Las ecuaciones (8) y (9) se usaron nuevamente para encontrar las constantes b1y b2, aunque se puede observar que mientras no cambie el número de características evaluadas y la cantidad de observaciones en cada subgrupo, estos parámetros permanecerán invariables. Por último, se calcularon los límites de control y se construyó la gráfica con los valores de los determinantes Si. Por su parte, los resultados de ambas cartas se tabularon para realizar un estudio de las principales diferencias y similitudes entre lo propuesto en esta investigación y la carta original de Vargas.

C. Carta multivariada |S| con observaciones atípicas

En segundo lugar, se necesitó evaluar el comportamiento de la carta |S| cuando existen datos extremos o atípicos en cada subgrupo de la muestra. De igual forma, se realizó una comparación entre los resultados obtenidos con la propuesta original de Vargas (2003) y los de la carta propuesta con la Media Winsorizada. Para la construcción de estas cartas, se usaron los mismos números generados en el caso anterior; no obstante, se introdujeron en cada subgrupo valores distantes del promedio del resto de los datos, que también siguen una distribución normal.

Para empezar, siguiendo el procedimiento descrito por Vargas (2003), se halló el promedio de cada subgrupo de datos, viéndose este valor afectado por los datos atípicos y haciendo que los valores de cada subgrupo parecieran más altos (o más bajos) de lo que realmente eran. Seguidamente, se hallaron las diferencias entre cada dato de los i subgrupos y su correspondiente promedio, lo que llevó a generar las matrices de varianzas y covarianzas para cada subgrupo, como se indica en la ecuación (2), y su respectivo determinante. Asimismo, se halló el promedio de todos los determinantes, es decir ||, y es este valor el usado para hallar los límites de control de la carta de varianza efectiva, indicados en las ecuaciones (10) y (12), y será la línea central de la misma, como lo indica la ecuación (11). Construida la carta, se graficarán los determinantes de cada subgrupo para interpretar el comportamiento general de los datos considerando los valores atípicos que los conforman.

D. Carta multivariada |S| con observaciones atípicas usando la media winsorizada

Para la construcción de la carta de varianza efectiva usando la Media Winsorizada se siguió el mismo procedimiento descrito anteriormente. Las únicas variaciones consisten en la organización en orden descendente de los datos de cada subgrupo y el reemplazo de cierto porcentaje de sus valores en cada extremo, en este caso 20%, por los valores más próximos de los mismos. Se hallan las diferencias correspondientes y se construyen las matrices de varianzas y covarianzas de cada subgrupo con su respectivo determinante. Una vez obtenidos todos los determinantes de cada subgrupo, se organizan en orden descendente y se reemplaza el mismo porcentaje en cada extremo de los datos, obteniendo de esta manera la Media Winsorizada de los determinantes y fue ésta, la usada para encontrar los límites de control de la carta, como se describe en las ecuaciones (10) y (12). Cabe resaltar que, en los dos procedimientos anteriores, no existe modificación alguna en el valor de las constantes b1 y b2 hallados anteriormente, debido a que éstas son dependientes del conjunto de datos evaluados previamente. Una vez graficadas estas cartas, se procedió a realizar un análisis del comportamiento de cada una en los casos anteriores buscando similitudes y diferencias y comprobar la sensibilidad de la Media Winsorizada como medida de tendencia central en la construcción de la carta de varianza efectiva.

5. RESULTADOS

A continuación se presentan los determinantes Si encontrados en cada uno de los escenarios analizados en esta investigación, así como las cartas de control resultantes para cada caso.

Tabla 1. Determinantes de los i subgrupos para las cartas.

Determinantes Si

Subgrupo

Carta |S| con

Carta |S| con mw

1

0,1768

0,1776

2

0,1550

0,1557

3

0,1260

0,1261

4

0,1118

0,1125

5

0,0708

0,0716

6

0,1842

0,1850

7

0,1599

0,1600

8

0,1302

0,1315

9

0,2537

0,2565

10

0,0818

0,0820

11

0,1496

0,1533

12

0,0914

0,0917

13

0,1952

0,1953

14

0,2039

0,2039

15

0,0974

0,0977

16

0,1088

0,1089

17

0,0478

0,0479

18

0,1371

0,1374

19

0,1566

0,1573

20

0,0618

0,0618


Los valores de b1 y b2 obtenidos para todos los casos estudiados fueron 0,9474 y 0,2047 respectivamente. Para la Carta |S| original, los valores de los límites de control son aproximadamente 0,3283 para el superior; 0,1350 para el límite central, que es igual a y 0,000 para el límite inferior. Por su parte, para la Carta |S| con Media Winsorizada los límites de control superior, central e inferior obtenidos fueron 0,3257; 0,1339 y 0,0000 respectivamente. Se observa que hubo un ligero aumento en los valores de los determinantes de la carta con Media Winsorizada, debido al aumento en las diferencias calculadas para la hallar la matriz de covarianza, como se indica en la ecuación (2).

Figura 1. Carta |S| Original de Vargas (2003).

Figura 2. Carta S usando Media Winsorizada.

Se observa que las Figuras 1 y 2 muestran un comportamiento similar, indicando que no hay una diferencia signficativa en la medida de tendencia central evaluada mediante un contraste de hipótesis con un valor P de 0,926008. Además, se observa que todos los puntos están dentro de los límites de control con una tendencia principalmente estable, con excepción del determinante S9 que tiene un valor de 0,2537 para la carta original y 0,2565 para la carta propuesta y están considerablemente alejados de la media de los datos. De igual manera, los determinantes S17 con valor de 0,048 aproximadamente para ambas cartas, son los puntos más alejados de la media hacia el límite inferior. En términos generales, hubo un aumento del 0,07% en los valores de los determinantes, pero se presentó una disminución en el rango de los límites de control en la carta propuesta.

Tabla 2. Determinantes de los i subgrupos para las cartas
con observaciones atípicas.

Determinantes Si

Subgrupo

Carta |S| con (×104)

Carta |S| con mw(×104)

1

2,0584

2,5229

2

5,8144

7,1897

3

1,9354

2,3840

4

1,7759

2,1852

5

4,5806

5,2826

6

2,8441

3,4811

7

3,2338

3,9518

8

1,5506

1,7733

9

3,2429

3,9748

10

3,2103

3,9746

11

2,4543

3,0227

12

2,9983

3,6841

13

3,3454

3,9805

14

2,9417

3,6414

15

2,2301

2,2301

16

3,0628

3,7792

17

7,8160

9,3273

18

3,0982

3,8459

19

3,0664

3,7824

20

3,0610

3,5132


La Tabla 2 muestra los Si encontrados para cada subgrupo cuando estos incluyen valores atípicos o extremos en su composición. Además, también puede observarse los valores de estos determinantes en la construcción de la carta || usando tanto la media aritmética como la Media Winsorizada para el cálculo de las matrices de varianzas y covarianzas. Los límites de control encontrados, siguiendo las ecuaciones (10), (11) y (12), corresponden a 7,8237; 3,2160 y 0,0000 para los valores de límite superior, central e inferior respectivamente, cuando se sigue el procedimiento descrito por Vargas (2003). Análogamente, los límites de control para la carta construida con la Media Winsorizada fueron 8,7671; 3,6038 y 0,0000. Puede observarse un claro contraste en los límites calculados en los diferentes casos, pues se encontró que con el uso de la Media Winsorizada se generan valores más altos en los determinantes, el valor P es de 0,0039 en la prueba de hipótesis de la diferencia de medias.

Figura 3. Carta |S| Original de Vargas con Valores Atípicos.

Figura 4. Carta |S| utilizando Media Winsorizada con Observaciones Atípicas.

En la Figura 3 puede observarse que no hay datos fuera de los límites o señal de alarma, por lo que puede decirse que el proceso está estadísticamente bajo control. Sin embargo, se aprecia un punto que se encuentra considerablemente cerca del límite de control superior y corresponde al determinante del subgrupo 17 de la carta de Vargas, es decir S17. No obstante, en la Tabla 2 puede observarse que el valor del determinante correspondiente a este subgrupo es 7,8159 y, como se mencionó anteriormente, el límite de control superior es 7,8237, por lo que la diferencia entre estos dos valores es 0,0078. En lo que respecta a los otros puntos, a pesar de que la gráfica muestra alta variabilidad, ninguno de estos puntos es mayor (o menor) que los límites de control previamente descritos. Se afirma, entonces, que no existen puntos fuera de los límites de control y que con respecto a éstos, los determinantes hallados poseen un margen de diferencia considerable.

De manera análoga, la Figura 4 muestra que el comportamiento de los determinantes, cuando se usa la Media Winsorizada, es bastante similar al que presenta la carta propuesta por Vargas, radicando las diferencias encontradas en que los valores que éstos toman son más altos y, aunque los límites de control de la nueva carta también aumentaron de manera proporcional, el valor tomado por el determinante del subgrupo 17 es mucho mayor que el límite de control superior de la carta, por lo que este punto queda por fuera de los límites de control. La diferencia encontrada entre estos dos valores es de 0,5602 que es considerablemente más alta que la diferencia encontrada entre estos mismos valores en la carta original. Empero, el determinante que corresponde al subgrupo 15 no difiere en la carta propuesta, pues los valores atípicos en este subgrupo no eran tan diferentes del resto del conjunto de datos que lo conformaban. De igual manera, los otros determinantes que, en la carta original de Vargas (2003) quedaban debajo de la línea central de la misma, en esta nueva carta quedan mucho más cerca de la media de los determinantes, lo que indica que la Media Winsorizada es una representación más fiel al promedio de los datos de los diferentes subgrupos y que proporciona mayor estabilidad en la construcción de esta carta.

6. CONCLUSIONES

Este artículo ha revisado cuatro escenarios del uso de la Carta |S| para analizar su desempeño frente a diferentes conjuntos de observaciones. Se elaboró la Carta |S| tal como la propuso Vargas, seguida por la propuesta usando la Media Winsorizada. Posteriormente, se elaboró la carta original, pero teniendo observaciones atípicas en la muestra. Por último, se realizó la carta usando Media Winsorizada con valores atípicos en los datos. De acuerdo con lo anterior, se pueden resumir los logros obtenidos mediante las conclusiones presentadas a continuación:

Por medio de las diferentes pruebas con distintos grupos de datos se observó que el uso de la Media Winsorizada en esta carta, resulta de mayor utilidad cuando los subgrupos poseen valores atípicos que modifican la media aritmética. Sin la presencia de extremos, la carta funciona de manera muy similar con cualquiera de las dos medidas de tendencia central, tal como lo muestran las Figuras 1 y 2.

REFERENCIAS

Bersimis, S., Psaraskis, S., Panaretos, J. (2006). Multivariate Statistical Process Control Chart: An Overview. Quality and Reliability Engineering International, 23(5), 517-543.

Dixon, W. J. (1960). Simplified Estimation from Censored Normal Samples. The Annals of Mathematical Statistics, 31(2), 385-391.

Flury, M. I. y Barbiero, C. (2001). Aplicación de técnicas de control multivariado en procesos industriales. Rosario, Argentina.: Rep Hip UNR. Recuperado de https://rephip.unr.edu.ar/bitstream/handle/2133/8275/Flury%2CBarbiero_aplicacion%20de%20tecnicas.pdf?sequence=3

Herrera R. (2005). Graficos de Control Multivariado Aplicando la Tecnica de Hotelling. Colombia Prospectiva, 3, 33-36.

Lee, M. H. y Khoo, M. B. C. (2016). Optimal Designs of Multivariate Synthetic |S| Control Chart based on Median Run Length. Comunications in Statistics – Theory and Methods, 46(6), 3034-3053.

Levinson, W. A. (2011). Statistical Process Control for Real-World Applications. Nueva York: Taylor & Francis Group, LLC.

Liu, R. Y. (1995). Control Charts for Multivariate Processes. Journal of the American Statistical Association. 90 (432), 1380-1387.

Montgomery, D. C. (2009). Introduction to Statistical Quality Control. (6ta Ed. en inglés). Arizona: Wiley.

Morales, V. H. y Vargas, J. A. (2008). Carta EWMA con varianza efectiva para monitorear variabilidad en procesos de control de calidad multivariados. Revista Colombiana de Estadística, 31(1), 131-143.

Vargas, J. A. (2003). Robust Estimation in Multivariate Control Charts for Individual Observations. Journal of Quality Technology, 35(4), 367-376.

Vladiviviezo, J. S. (2009). Control estadístico de procesos multivariantes en la industria alimentaria: Implementación a través del Estadístico T2- Hotelling. Alimentaria, 15 (18), 1-3.

Zertuche, F. y Cantú, M. (2008). Una comparación del desempeño de las cartas de control T2 de Hotelling y de clasificación por rangos. Ingeniería, Investigación y Tecnología, 9 (3). Recuperado de http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S1405-77432008000300002