Download - Traduccion Control

Transcript

Ao de la unin nacional frente a la crisis externaUNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Per, DECANA DE AMERICA)

FACULTAD DE INGENIERIA INDUSTRIALGRAFICAS DE CONTROL MULTIVARIADO PARA OBSERVACIONES INDIVIDUALES CURSO: CONTROL DE CALIDAD

PROFESOR: ING. CEVALLOS AMPUERO, JUAN MANUEL

GRAFICAS DE CONTROL MULTIVARIADO PARA OBSERVACIONES INDIVIDUALES

NOLA D. TRACY, JOHN C. YOUNGMcNeeseStateUniversity, Lake Charles, LA70609-2340ROBERT L. MASONSouthwest Research Institute, San Antonio, TX78228-0510Cuando p caractersticas del proceso de correlacin se estn midiendo al mismo tiempo, frecuentemente las observaciones individuales son inicialmente recogidas. Los datos de proceso se controlan y las causas especiales de variacin son identificadas con el fin de establecer el control y para obtener una muestra de referencia "limpia", para usar como base en la determinacin de los lmites de control para futuras observaciones. Un mtodo comn de construir graficas de control multivariable se basa en el estadstico T2 de Hotelling. En la actualidad, cuando un proceso est en la etapa de puesta en marcha y slo las observaciones individuales estn disponibles, se utilizarn distribuciones F y chi-cuadrado aproximados para la construccin de los lmites de control multivariables necesarias. Estas aproximaciones son conservadoras en esta situacin. Este artculo presenta un mtodo exacto, sobre la base de la distribucin beta, para la construccin de lmites de control multivariable en la etapa de puesta en marcha. Un ejemplo de la industria qumica ilustra que este procedimiento es una mejora sobre tcnicas aproximadas, especialmente cuando el nmero de subgrupos es pequeo.

INTRODUCCINLa calidad de la salida de un proceso de produccin frecuentemente se mide por el nivel de articulacin de varias caractersticas correlacionadas. Por ejemplo, un proceso qumico puede estar en funcin de la temperatura y la presin, los cuales deben ser supervisados cuidadosamente, de un grado particular de la madera podra depender caractersticas de correlacin como rigidez y resistencia a la flexin.Hawkins (1974) se refiere a un proceso en geoqumica de la minera del carbn en la que cada observacin se compone de 14 caractersticas correlacionadas. En estos tipos de situaciones, grficos de control univariados independientes para cada caracterstica se utilizan a menudo la detectar cambios inherentes a la variabilidad del proceso. Cuando estas caractersticas estn mutuamente correlacionadas, algunas veces, los grficos de control univariado no son tan sensibles como los mtodos multivariables que aprovechan la correlacin. Mientras Hotelling (19 47) fue uno de los primeros en notar los inconvenientes en la correlacin de variables mediante grficos de control univariados independientes, muchos libros de control de calidad de ese entonces (por ejemplo, Ryan (1989)) contenan ejemplos de procesos multivariables donde el uso de grficas individuales separadas no detectaba condiciones fuera de control.Muchos de los conceptos de control de calidad multivariable se deben a Hotelling (1947). Excelentes resmenes y discusiones de estas tcnicas se encuentran en el Alt (1985), Jackson (1980, 1981a, 1981b, 1985, 1991), Ryan (1989), y Montgomery (1991). Los valores trazados en grficos de control multivariables estn generalmente sobre la base estadstica de su distribucin T2 conocida (Hotelling (1931)). Esta distribucin es la contraparte multivariable a la distribucin t de Student. La tabla T2 es particularmente apropiada cuando se correlacionan caractersticas de inters.Hay dos fases diferentes en la construccin de grficos de control (por ejemplo, vase Alt (1982)). La primera fase ofrece una visin retrospectiva, implica comprobar si el proceso estaba en control cuando los datos iniciales individuales o datos de subgrupos se recogieron en el proceso. El subgrupo representa una muestra de observaciones tomadas en un cierto punto del proceso, tal como una muestra tomada durante un perodo de tiempo especificado. Esta fase es a menudo denominada la fase de puesta en marcha del proceso ya que el propsito es obtener un conjunto de datos (una muestra de referencia) para establecer los lmites de control para la supervisin. El objetivo de la primera etapa es establecer el control estadstico (Es decir, un proceso "limpio") y encontrar los lmites de control precisos para la etapa dos. La segunda fase consiste en la utilizacin el grfico de control para mantener el control, es decir, detectar cualquier desviacin del proceso estndar as como graficar futuros subgrupos.El estadstico multivariable T2 con frecuencia se utiliza como grafica estadstica para ambas fases de la construccin de grficas de control. En la primera fase, de subgrupos con tamaos mayor que uno, y en la segunda fase, donde la preocupacin es en el mantenimiento de control de un proceso, los limites de control se determinan utilizando el hecho de que el estadstico T2 sigue una distribucin F exacta. En la etapa de puesta en marcha con los datos individuales, sin embargo, los lmites de control se calculan utilizando una aproximacin basada en la distribucin F o chi-cuadrado. El grado de error asociado con la aproximacin es desconocido.El propsito de este trabajo es abordar este problema mediante la presentacin de un mtodo exacto para la construccin de un grfico de control multivariable cuando las observaciones individuales se recogen en la etapa de puesta en marcha etapa. Los resultados se ilustran utilizando un ejemplo de datos reales tomados de la industria qumica.

ESTABLECIMIENTO DEL CONTROL EN LA ETAPA DE PUESTA EN MARCHAConsidere el caso en el que p caractersticas correlacionados estn siendo medidas al mismo tiempo y se encuentran en necesidad de control. Se supone que estas caractersticas siguen una p- distribucin dimensional normal multivariable con un vector de medias = (1, 2, ..., p) y la matriz covarianza , donde i es la media para la i-sima caracterstica y es una matriz de p x p que contiene a las varianzas y covarianzas de las caractersticas p. La distribucin normal multivariable es el anlogo de una distribucin normal p-dimensional univariado asumido para cada caracterstica. Tenga en cuenta que si un proceso tcnicamente no est en control estadstico, como en la situacin de puesta en marcha supone aqu, entonces no hay distribucin estable para los datos. La asuncin de normalidad multivariable es que se hace con el nico fin de derivar los lmites de control. Despus de que el control ha sido establecido, suponemos que los datos siguen una distribucin normal razonable. Nuestros resultados dependen de la validez de este supuesto, al igual que la validez de los lmites de control habituales para un grfico de control univariado para individuos requiere el supuesto de normalidad. El supuesto de normalidad multivariable se puede comprobar mediante una apropiada prueba de bondad de ajuste normal multivariable (por ejemplo, vase Gnanadesikan (1977)).Supongamos que el control del proceso est en el inicio etapa y una muestra de los subgrupos de los datos m del pasado estn disponibles para estimar los parmetros de y . En algunas situaciones puede que no sea posible tomar subgrupos de tamao ms grande que uno. Esto puede ocurrir ya sea cuando la tasa de produccin es demasiado lenta para permitir convenientemente tamaos de subgrupos mayores que uno, o cuando mediciones repetidas difieren slo a causa de anlisis de errores, al igual que en muchos procesos qumicos.Para propsitos de notacin, se representa el individuo de la observacin i-sima de las p caractersticas de la referente muestra con el vector

El vector medio estimado, cuyos componentes es la media de cada caracterstica, es

Donde

y la matriz de covarianza estimada es

Para construir una grfica de control multivariable basado en el estadstico T2 de Hotelling, para la observacin Xi uno utiliza la formula estadstica

La distribucin de Qi no es ampliamente conocida, y por lo tanto el control multivariable traza grficas aproximadas (vase ejemplos en Jackson (1985) o Ryan (1989)) con una distribucin chi-cuadrado o una distribucin F para obtener los lmites del grfico de control.Si se supone que las estimaciones de Xm y Sm son la poblacin verdadera de valor y , respectivamente, entonces Seber (1984) ha demostrado que la estadstica Qi se distribuye como una variable aleatoria chi-cuadrado con p grados de la libertad. En ese caso, el lmite de control inferior es

y el lmite de control superior es

donde X2 (alfa; p) es 1 un alfa percentil de la distribucin F con p grados de libertad. Si se supone que la observacin Xi es independiente tanto de Xm y Sm, entonces la estadstica Qi sigue una distribucin F con p y m-p grados de libertad (vase el Apndice para ms detalles). En ese caso, el lmite inferior de control es

y el lmite de control superior es

donde F (a, p, m-p) es el 1-un percentil de la distribucin F con p y m-p grados de libertad.Como ninguno de los supuestos anteriores es vlido en la etapa de puesta en marcha descritas aqu, las aproximaciones sugeridas para la distribucin de la estadstica de grficos Qi tiene algunos inconvenientes. Por ejemplo, a menos que p sea pequeo, se requiere una muestra grande para encajar la distribucin chi-cuadrado (vase Hawkins (1981)). Afortunadamente, estos problemas pueden ser evitados ya que es posible derivar la distribucin exacta de Qi. Gnanadesikan y Kettenring (1972), basndose en un resultado de Wilks (1962), han demostrado que el Qi tiene una distribucin beta.

Especficamente,

La distribucin en (4) es correcta slo cuando Xi observaciones individuales son recogidos en la fase de puesta en marcha del proceso de (es decir, que se utiliza para calcular los lmites de control) son comprobados para ver si entran dentro de los lmites de control. En contrario, cuando las futuras observaciones se toman en el "proceso limpio" y se comprueba con los lmites de control calculados a partir de los datos de la puesta en marcha, los estadsticos que se forman son independientes de Xm y Sm y siguen una distribucin F exacta. Esto se discutir en ms detalle ms adelante.El conocimiento de la distribucin correcta de Qi, es necesario para la construccin de los lmites de control. El control inferior lmite viene dado por

y el lmite de control superior est dada por

donde B (alfa; p / 2, (m-p -1) / 2) es el 1-un percentil de la distribucin beta con parmetros p / 2 y (m-p -1) / 2. Si las tablas de la distribucin beta no estn fcilmente disponibles, la relacin

entre variables aleatorias con distribuciones beta y F puede ser utilizadas. La aplicacin de esta relacin da los lmites

y

en trminos de percentiles de la distribucin F. En muchas situaciones, el LCL se establece en cero. La razn para esto es que cualquier cambio en la media dar lugar a un aumento en el estadstico de Qi, y por lo tanto puede ser la LCL ignorado. Sin embargo, Qi es sensible no slo a los cambios en el vector medio, sino tambin a los cambios en la covarianza matriz de los datos. Si la matriz de covarianza fuera a cambiar, podra dar lugar a valores anormalmente pequeos de Qi. Por lo tanto, para detectar los cambios hemos optado por utilizar un LCL distinto de cero. Cabe sealar que los valores grandes de Qi tambin pueden ser causados por los cambios en la matriz de covarianza y no slo por los cambios en el vector medio (vase Hawkins (1991)).Las lneas centrales se muestran normalmente en las grficas de control univariadas. Esta prctica sera especialmente til en los grficos de control multivariables desde los lmites superiores y los lmites inferiores que no estn espaciadas simtricamente alrededor de la media. Una lnea central razonable para este tipo de grfico multivariable se puede obtener usando la ecuacin (6) con alfa = 1 (es decir, utilizando el percentil 50 i-esimo de la distribucin F).

EJEMPLO

Tenga en cuenta el conjunto de datos dan en la Tabla 1, que representa datos reales tomados en una fase de puesta en marcha de un proceso industrial qumico. La aplicacin y los datos se han disfrazado para proteger la informacin confidencial.Al igual que muchos procesos qumicos, este ejemplo implica la medicin simultnea de tres variables: porcentaje de impurezas (X1), temperatura (X 2 ) y la concentracin de fuerza (X3) de una sustancia en particular. Las pruebas preliminares no proporcionaron razn para dudar de que los datos sigan una distribucin normal multivariable.En este ejemplo, hay 14 observaciones sobre tres variables, as que m = 14 y p = 3. El vector de la muestra es

y la matriz de covarianza de la muestra es

La matriz de correlacin de la muestra Rm se compone de elementos rij que representan el coeficiente de correlacin por pares entre Xi y Xj, es decir, el elemento en la fila i y la columna j de Rm est dada por

donde sij es el elemento de la fila i-sima y la columna j de la matriz de covarianza de la muestra Sm. Para este ejemplo, la matriz de correlacin R14 es

Aunque los datos recogidos son de la etapa de puesta en marcha y no representan necesariamente un proceso en control, podemos ver que los elementos fuera de la diagonal de la matriz de correlacin en este punto son pares correlacionados. Por lo tanto, un grfico de control multivariable es apropiado.Se necesitan lmites de control y tablas estadsticas para construir un grfico de control multivariable. Utilizando la ecuacin (1), se dan los valores de la tabla estadstica Qi en la Tabla 1. Los lmites de control correspondientes utilizados en las ecuaciones (5) y (6) con alfa = 0,01 son

La Figura 1 muestra el grfico de control multivariable correspondiente. Las observaciones 1 y 5 se encuentran fuera de los lmites de control. Estas observaciones fueron examinadas individualmente para determinar una posible causa asignable. Se determin que el nivel excepcionalmente bajo de impurezas para la observacin 1 fue el resultado de un error de muestreo. Por lo tanto, este punto fue retirado de la muestra. Dado que sta causa asignable podra estar asociada con la observacin 5, se retiene la muestra.

En general, la interpretacin de un grfico de control multivariable no simplemente se deduce como una modificacin de las tablas univariantes para las variables originales. Se deduce de la definicin de Qi en la ecuacin (1), que los puntos fuera de los lmites de control multivariable son el resultado de uno o ms componentes principales que estn fuera de control. Una correcta interpretacin requiere la consideracin de estos componentes principales (vase Jackson (1991)).

Se extrae la observacin 1 y se vuelve a calcular los parmetros estimados con , el nuevo vector de medias estimadas:

As como una nueva matriz de covarianza estimada:

Y una nueva matriz de correlacin muestral:

En RI3 las tres variables permanecen correlacionados, pero las correlaciones entre XI y X2 y entre XI y X3 se invierten los signos. Este es un resultado directo de la eliminacin de la observacin 1, que tena inusualmente una lectura baja XI, del porcentaje de impurezas.

Los valores recalculados Qi se indican en la ltima columna de la Tabla 1. Los lmites de control correspondientes para esta muestra (ahora de tamao 13) son relacionados con estos valores Qi, se observa en la Figura 2 que ninguna de las observaciones estn fuera de los lmites de control. El control estadstico se ha establecido mediante la eliminacin de la causa especial de variacin, es decir, el punto aberrante causado por un error de muestreo. Ahora tenemos una muestra de referencia que se puede utilizar para calcular los lmites de control para la segunda etapa. Es interesante observar que la observacin 5, que estaba por debajo del LCL con la muestra completa (m = 14), ahora est dentro del lmite control. La dependencia Qi contribuye a esto.

MANTENER EL CONTROL CON LOS VALORES FUTUROS

La segunda fase en la construccin de grficos de control multivariable consiste en probar para ver si el proceso (restante) permanece en el control como futuros subgrupos como estn dibujndose.

En esta etapa el vector promedio y la matriz de covarianza obtenido en la etapa inicial (fase de puesta en marcha) son utilizados para calcular los lmites de control, que sern utilizados para probar las futuras observaciones. As, una futura observacin es independiente de y . Nosotros utilizamos Hotellings statistic.

Donde denota el vector dimensional p de las observaciones futuras de las p caractersticas, es el vector promedio dimensional p de las m observaciones en la muestra de referencia "limpio", y es la matriz de covarianza asociada con estas observaciones.

Si el tamao de la muestra inicial es grande, un enfoque comn es asumir la estimacin y a partir de la fase de inicio son "standards" y de la misma forma para los parmetros de poblacin real y . El estadstico tendra la siguiente forma.

Y luego seguira una distribucin chi-cuadrado con grados de libertad. Los resultados superior e inferior de los lmites de control multivariable son los mismos que en las ecuaciones (2) y (3). Sin embargo estas aproximaciones desde y no son parmetros de poblacin sino son variables aleatorias.

Para realizar la aproximacin del chi-cuadrado no es necesario partir de la distribucin exacta de sino puede ser obtenida de esta manera

As, los lmites de control exacto son:

Para los datos de la tabla 1 los lmites de control serian:

Para el vector futuro de las observaciones

. Si este valor se encuentra dentro de los lmites de control, entonces el proceso de esta observacin estara en control.

Ahora bien, usando el mtodo exacto, la UCL para el mantenimiento del control con futuras observaciones es cuatro veces ms grande que las UCL obtenidas en el establecimiento del control en la fase inicial. As, tratando al vector promedio de las muestras iniciales y la matriz de covariancia como si estos fueran independientes de las observaciones, lo cual lleva a una buena UCL conservada cuando haya un pequeo nmero de subgrupos. En cambio, la aproximacin de chi-cuadrada en la ecuacin (3) dara UCL=12.84 para ambas situaciones. Esto estara conservado para los datos inicio pero liberal para los datos futuros.

COMPARACIN DE LOS MTODOS EXACTOS Y APROXIMADOS

Una simple comparacin de las distribuciones exactas y aproximadas sugeridas para el establecimiento del control en la fase inicial de los procesos pueden ser realizados mediante la comparacin de valores de los lmites de control superior. La tabla 2 da el lmite de control superior para un grfico de control multivariable usando la distribucin exacta (beta) y la aproximacin (F y chi-cuadrado) con y . Note que para un nmero pequeo de subgrupos, tal como , con el F aproximado de UCL es 35.72, el chi-cuadrado aproximado de UCL es 16.7, y el UCL exacto es 12.01. Con la aproximacin de F es, la aproximacin del chi-cuadrado es , y el UCL exacto es 15.83. Esto muestra el error conservativo que resulta a partir del uso de UCL aproximado en la fase de inicio. Cuando el nmero de variables aumenta, la diferencia entre UCL aproximados llegan a ser ms evidentes. Fcilmente pueden hacerse estas comparaciones para cualquier valor de m, p o usando las tablas de distribucin F, chi-cuadrado, y beta.Si los mtodos de aproximacin discutidos anteriormente para la fase inicial han sido empleados en nuestros datos de ejemplo, los lmites de control calculados con el set de datos completos habran sido diferentes. El uso de la distribucin F da un LCL aproximado de0.082 y un UCL aproximado de 29.65. Mientras que el LCL exactamente el mismo, el UCL es ms grande que el valor exacto de 8.55.El uso de la aproximacin del chi-cuadrado resulta en un LCL = 0.072 y un UCL=12.84. Nuevamente, ambas aproximaciones nos dan estimados de UCL conservados.

CONCLUSIN:

El anlisis mediante grficos de control multivariable puede ser una poderosa herramienta en situaciones de control de procesos que involucran mediciones simultneas de varias caractersticas. Una muestra de referencia representativa es esencial; es importante basar los lmites de control construidos en estimaciones precisas de los parmetros. Durante la fase inicial, cuando se usan subgrupos estos consisten en observaciones individuales (es decir, subgrupos de tamao 1) con las variables de medicin, la distribucin beta debe ser utilizado para obtener los lmites de control para el estadstico de (es decir, el Qi 's).El uso de esta distribucin exacta es mejor que emplear las distribuciones de aproximacin de F y chi-cuadrada, especialmente cuando el nmero de subgrupos es pequeo, una condicin apta para ser frecuente en situaciones de puesta en marcha.Agradecimientos

Los autores desean agradecer a Dr John Cornell, el Dr. Peter Nelson, y los rbitros por sus muchos comentarios y sugerencias que mejoraron en gran medida este trabajo. Dr. Tracy fue apoyado en parte por una subvencin del Fondo de Iniciativa de Investigacin Shearman.

Apndice

Teorema (Seber (1984, pp 30-31)): Que , donde , ), y son estadsticamente independientes. y son utilizados para denotar la dimensin normal d y la distribucin Wishart.

Usando la notacin de este documento, considere un conjunto de observaciones multivariables iniciales Xl, X2, .. . , Xm, y una futura observacin Xj, donde cada Xi es un vector de observaciones de p variables. Si

Luego:

Ahora supongamos que , y son independientes, como es el caso cuando y se calculan a partir de los datos iniciales y es una observacin futura. Entonces

Si se define el estadstico

Luego

Lo que conduce a:


Top Related