53951479 estadistica experimental
Post on 21-Jan-2016
226 Views
Preview:
TRANSCRIPT
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
1
ESTADÍSTESTADÍSTICACAEXPERIMENEXPERIMENTAL
Aplicada a ciencia eAplicada a ciencia e ingingenieríaniería
2
4
6
810
3
1
5
7
9
Edición Edición CONCCONCYTECTEC
PALACIOS C. PALACIOS C. SSEVEROVERO
Palacios C. Severo
ESTADÍSTICAEXPERIMENTALAplicada a ciencia e ingeniería
© PALACIOS C. SeveroCEO Proceso SEVEROespc02@yahoo.comespc01@hotmail.com(+511) 996696214, Lima – Perú(+5152) 952672846, Tacna – Perú(+505) 84566216 – Centro América
Primera edición:
ISBN: Hecho el Depósito Legal en la Biblioteca Nacional del Perú N°
© PALACIOS C. Severo – CONCYTEC en la presente ediciónTiraje: 1000 ejemplares
Subvención CONCYTEC N°
Consejo Nacional de Ciencia, Tecnología e Innovación Tecnológica-CONCYTEC
Presidente: Dr. Augusto Mellano MéndezAv. Del Aire 485, San Borja, Lima – PerúTelefax: (51) 01-2251150www.concytec.gob.pe
Impreso por:
Derechos Reservados. Prohibida la reproducción de esta publicación por cualquier sistema conocido sin la autorización escrita del autor; y del editor en la presente edición.
2
EIR
L
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
La presente obra esta dedicada a la Memoria de:
Juan de la Cruz Palacios AvendañoAdelaida Calisaya Flores
Luz Lucila Zeballos ArgandoñaCamila Palacios Zeballos
Ceferina Chambilla ChambillaGustavo Vallenas Casaverde
“Con mucho amor a quienes amor nos dio, que Dios lo tenga en su gloria y nosotros en nuestro corazón”
3
Palacios C. Severo
Un reconocimiento muy especial al Rector de la Universidad Nacional Micaela Bastidas de Abancay
Dr. Leoncio Carnero Carnero
4
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
CONTENIDO
CONTENIDO Página
§1I.II.III.IV.V.VI.VII.VIII.IX.
X.XI.XII.
XIII.XIV.XV.XVI.XVII.XVIII.XIX.
§2I.II.III.IV.V.VI.VII.VIII.IX.
PrólogoIntroducciónEstadística básicaIntroducciónRecopilación de datosCuestionario como fuente de datosPresentación de datosAnálisis de datosDistribución de frecuenciaCriterios de distribución de frecuenciaMedias de tendencia centralMedidas de disepersiónProblemasEstimación de parámetrosDiferencias significativasDispersión de los datos problemasProblemasDistribucionesIntervalos de confianzaMuestreoMétodos de muestreoToma de decisionesPrincipios para la toma de decisiónPlanificaciónProblemasAnálisis de regresiónIntroducciónMétodos de mínimos cuadradosModelos de regresiónModelo de regresión lineal con k variablesRegresión lineal simpleRegresión lineal múltipleRegresión polinomialRegresión polinomial cuadráticaRegresión no linealCoeficiente de correlación múltiple R²
91113131415151617191926293939404350545555596262646767677070717374757677
5
Palacios C. Severo
X.XI.
§3I.II.III.IV.V.VI.VII.VIII.IX.X.XI.XII.XIII.XIV.
§4I.II.III.IV.a)b)c)
V.
VI.
VII.
VIII.
IX.X.
XI.XII.§5
Prueba de significancíaProblemasPrincipios de diseño experimentalIntroducciónTipo de experimentosUnidades experimentales y muéstralesFuente de variaciónControl de la variación del no tratamientoPropiedades del diseño estadísticoReplicaciónAleatorizaciónControl localClasificación de los diseñosEstrategia del diseñoDiseño de tratamientosDiseño de muestreoEstudio experimentalProblemasDiseño experimental aplicado a cienciasIntroducciónLimitacionesPredicciónDiseño experimentalDiseño aleatorizadoDiseño unifactorial con n nivelesDiseño de parcelas divididasProblemasDiseño totalmente aleatorizadoProblemasDiseño de bloques aleatorizadosProblemasDiseño cuadrado latinoProblemasDiseño cuadrado greco – latinoProblemasPrueba de intervalos múltiples de DuncanDiseño doble reversoProblemasEstimación de parámetros del modeloPolinomio ortogonalMétodos de análisisIntroducción
778183838486879092969799101103104105106110111111111112113113114118121129131134141143147151153154154157158159161161
6
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
I.II.III.IV.V.VI.
§6I.
II.III.IV.
V.VI.VII
VIII.
IX.
X.XI.XII.XIII.XIV.XV.
XVI.XVII.XVIII.
XIX.
XX.
XXI.XXII.A.B.
Métodos no paramétricosPrueba U de Mann – WhitneyPrueba H de Kruskal – WallisMétodos multivariablesCorrelación de SpearmanProblemasDiseños experimentales aplicado a ingenieríaIntroducciónProblemasDiseños bifactorialesComparación múltipleDiseño anidadoProblemasDiseños factorialesDiseño factorial 2n
Diseño factorial 2²ProblemasDiseño factorial 2³ProblemasDiseño factorial 2k replicadoProblemasDiseño 2k con pruebas centralesDiseño confundidoDiseño factorial 2k con dos bloquesDiseño factorial 2k con cuatro bloquesDiseño factorial 2k con bloques replicadosAlgoritmo de YatesProblemasDiseño factorial fraccionadoMedio fraccionado del diseño 2k
Cuarto fraccionado del diseño 2k
ProblemasDiseño Plackett – BurmanProblemasDiseños factoriales 3n
ProblemasDiseños rotablesDiseños rotables con dos factoresDiseño trigonalDiseño pentagonalDiseño hexagonalProblemas
162162165166168171173173176177180182184186188189195205221225228231233233235236237239244245247250258263266270275275275276276280
7
Palacios C. Severo
C.
D.E.
F.G.
§7I.II.III.IV.V.VI:VII:VIII:IX.X.XI.XII.XIII.
Diseño octogonalDiseño compuesto centradoProblemasDiseño experimental comercial – EXCODiseño SeveroDiseño factorial centrado de dos factoresDiseño Factorial centrado de tres factoresDiseño rotable centrado de n factoresProblemasSuperficie respuestaIntroducciónSuperficie respuestaPolinomio de primer ordenPrueba de significanciaPrueba de falta de ajusteMáxima pendiente ascendentePolinomio de segundo ordenCaracterización de la superficie respuestaDiseño de superficie respuesta cuadráticoSuperficie de respuesta cuadráticaExploración de superficie respuestaPunto estacionarioCriterio de formas cuadráticasAnexoReferencias
281282291295298300305308311323323323324325326328331333340350354367368387393
8
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
PRÓLOGO
El objetivo primordial del presente libro es presentar los conceptos para diferentes situaciones reales que se ven a diario en el campo social, industrial y experimental. Se ha concebido primordialmente como un texto introductorio en planificación y control de operaciones a nivel laboratorio, bach e industrial. También se ha proyectado como un libro de referencia para agronomomos, alimentarios, pesqueros, biologos, medicos, civiles, geógrafos, ambientalistas, mecánicos, mineros, metalurgistas y químicos de Pre, Postgrado y Maestría, practicantes y científicos encargados de la planificación y operación de sistemas productivos tanto en la ciencia como en la ingeniería.
El libro es el resultado de conferencias ofrecidas en diferentes centros académicos latinoamericanos. Se ha intentado resaltar los conceptos técnicos y afirmando sin duda y sin excusas que la presentación es exactamente fidedigna. Se presentan los conceptos que considero pueden contribuir más a la comprensión de los principios, con referencia a los que pueden realizarse con los conocimientos básicos y las posibilidades e instrumentos de la tecnología actual.
Se ha intentado presentar un marco conceptual que estimule la habilidad del lector de las diversas ramas del saber (Biología, Medicina, Ciencias Sociales, Economía, Administración, Ingenierías y áreas Técnicas) para entender la manera en que los factores (variables) interactúan en un sistema real de trabajo.
La orientación del libro, no esta matemáticamente sofisticado. Los conocimientos previos necesarios como el cálculo, probabilidades y estadística descriptiva. En algunas secciones se realiza el uso de operaciones elementales de matrices.
El libro está diseñado como un manual dividido en partes con capítulos para su mejor comprensión. Se propone servir como fuente de referencia para tratar casos específic0s de los lectores.
Los ejemplos resueltos (fueron desarrollados aplicando los programas estadísticos Statgraphics Centurion y ESPC elaborado para el
9
Palacios C. Severo
presente libro), sirven para ilustrar y ampliar las teorías, sin lo cual el lector sentiría un vació. Las demostraciones de procesos industriales se incluyen en ello. Los problemas suplementarios completan la revisión del material tratado en cada tema.
El material cubre un curso habitual con el fin de flexibilizar, ampliar y mejorar los sistemas curriculares, siendo este un libro de consulta para interés de otros temas.
No deseo finalizar sin agradecer a mi amigo Luis Solórzano Espinola por la revisión minuciosa y detallada de la presente edición del presente libro, su tiempo y esfuerzo es un aporte a la ciencia y tecnolgía como él siempre viene desarrollando en las aulas con los estudiantes de pre grado.
Finalmente deseo agradecer a CONCYTEC por tan importante aporte a la educación a nivel de nuestro país, así mismo estoy en deuda con muchas universidades latinoamericanas gubernamentales como privadas por la cooperación para la elaboración del presente, de igual manera con prestigiosos colegas por su colaboración para la culminación de tan importante tema.
Palacios C. SeveroCEO Proceso SEVEROMóvil: (+511) 996696214espc02@yahoo.com
10
EIR
L
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
INTRODUCCIÓN
Si su trabajo tiene que ver con la investigación científica – tecnológica (ciencias e ingeniería). Probablemente se ha dado cuenta que la mayoría de los libros de estadística (básica y avanzada) son abstractos y no ayudan mucho en el tratamiento de la base de datos, pero usted sabe que el proceso al cual estudia funciona (de manera eficiente y sin problemas), es por ello que se tuvo que realizar el esfuerzo a fin de brindar al amable lector un texto con características nuevas a fin de poder llenar muchos vacíos, los cuales son parte de la experiencia.
Lo que desea saber el investigador es como analizar e interpretar los datos de un proceso para tomar una decisión sobre los rangos óptimos, pero necesita saber cómo llevar a cabo una prueba experimental (laboratorio, bach e industrial); sabe que la estadística experimental le ayudara a seleccionar los rangos (niveles) y variables (factores) significativas del procesos innovativo, pero requiere ideas sobre como seleccionar estos. En la presente obra le explicaremos y despejaremos sus dudas.
La palabra estadística se origina, en las técnicas de recolección, organización, conservación, y tratamiento de las diversas bases de datos propios, con que los antiguos gobernantes controlaban sus súbditos y dominios económicos. Estas técnicas evolucionaron a la par con el desarrollo de las matemáticas utilizando sus herramientas en el proceso del análisis e interpretación de la información.
Estadística Experimental aplicada a ciencia e Ingeniería, el libro que en esta ocasión presento a los lectores de habla hispana, es un importante aporte. Por lo útil y por la novedad de su enfoque, a la falta de bibliografía. Para comprender los beneficios que pueden derivarse de la utilización de los conceptos (fundamentos) presentados, conviene tener presente la complejidad creciente de nuestras industrias (automatización), impuesta por los diferentes factores que están incidiendo en el cambio vertiginoso que caracteriza a nuestra época (competitividad) y que, en mayor o menor grado, con mayor o menor velocidad, llega a todas las regiones y países del mundo. Veamos algunos de los factores de complejidad en operaciones
11
Palacios C. Severo
industriales. La planta recibe órdenes de producción que deban ser procesados y cumplidos en un lapso determinado, utilizando recursos internos y externos casi siempre escasos.
La importancia de los resultados, anticipado en la toma de decisiones, empieza a buscar respuestas a otro tipo de preguntas ¿Qué es lo mejor? ¿Cómo optimizar un determinado conjunto de variables para alcanzar un fin específico? Que significan nuestros datos y que grado de confianza podemos tener en ello visto una predicción.
El mundo actual requiere otras herramientas analíticas, aquellas que nos permitan crear modelos (lenguaje de comunicación) y definir relaciones entre diversos factores (interacciones). Esto requiere entre otras cosas que podamos guardar conjuntos particulares de datos aparte de las rutinas de análisis (numérico y sostenible) que se realicen en base a ella.
El presente texto no pretende teorizar el saber estadístico, desde luego, no es un libro para estadísticos, ya que, adrede se obvia el rigor científico de lo expuesto en beneficio de la sencillez necesaria para el neófito; con un lenguaje coloquial se conduce al lector a través del contenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados.
El avance tecnológico en la informática ha contribuido enormemente al desarrollo de la estadística, sobre todo en la manipulación de la información, pues en el mercado existen paquetes estadísticos de excelente calidad, como el SAS, SPSS, SCA, Statgraphics, amén de otros, que corren en un ordenador sin mayores exigencias técnicas, permitiendo el manejo de grandes volúmenes de información y de variables.
12
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
§1ESTADÍSTICA BÁSICA
(...) Conseguimos obtener así la fórmula estadística para conocer aproximadamente la posición de un electrón en un instante determinado. Pero, personalmente, no creo que Dios juegue a los dados.
Albert Einstein
I. INTRODUCCIÓN
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de incursionar en la totalidad de las ciencias e ingeniería; inclusive, en la lingüística se aplican técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más relevantes de un idioma.
La estadística es una ciencia auxiliar para todas las ramas del saber humano; su utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre y la estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de confianza.
Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa que sucede en la naturaleza, lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los métodos estadísticos. Sin embargo muchos investigadores tendenciosos han cometido abusos con la estadística, elaborando investigaciones de intención, teniendo previamente los resultados que les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que conducen al rotundo fracaso de sus investigaciones.
13
Palacios C. Severo
A veces nuestras vidas parecen estar controladas por estadísticas. De informes sobre el tiempo, lectura de las presiones sanguíneas, todos tenemos que ver rutinariamente con una amplia variedad de medidas estadísticas.El análisis estadístico es útil para la investigación (tecnológica y científica), pues ayuda a resumir e interpretar el gran volumen de cifras que resultan aún en la encuesta más pequeña. Los principios estadísticos que se usan en la investigación provienen en gran escala de las ciencias sociales, economía e ingeniería.
Como resultado hay gran cantidad de libros enteros sobre estadística, probablemente más que sobre cualquier otro aspecto de la investigación.
El propósito de la presente obra es darle a usted una visión panorámica de los tipos de medidas estadísticas más importantes que se usan. Si usted requiere información más detallada, consulte algunos de los muchos libros buenos en estadística que están disponibles1.
Aunque existen centenares de medidas y pruebas estadísticas que pueden utilizar los investigadores, nosotros estudiaremos los de amplia aplicación para desarrollar los trabajos prácticos.
II. RECOPILACIÓN DE DATOS
El primer paso para describir un fenómeno natural es reunir los datos estadísticos necesarios. La fuente de los datos puede clasificarse como internas o externas.
Los datos internos incluyen estadísticas sobre las operaciones de la empresa, tales como estadísticas de producción, comercialización, transformación, etc.
Los datos estadísticos no vinculados con el funcionamiento de la empresa propiamente dicha se llaman datos externos.
La gerencia de producción de una fábrica de fundición puede necesitar información sobre la cantidad de cierto metal en el mercado nacional, con el propósito de estimar las ventas a 10 años plazo.
1 Ver referencias bibliográficas
14
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Hay enormes cantidades de datos comerciales, empresariales, farmacéuticos, que pueden consultarse en las bibliotecas públicas y en las universidades.
El gobierno es el mayor editor de estadísticas anuales, mensuales, semanales, diarias. Una publicación anual del Instituto Nacional de Estadística contiene más de mil páginas de datos sobre precios, educación, producción y otros puntos, que son de utilidad para los que procesan datos: economistas, analistas y demás profesionales.
III. CUESTIONARIO COMO FUENTE DE DATOS
Los datos estadísticos relativos a la opinión corriente de los consumidores sobre determinados programas de televisión, nuevos productos, candidatos políticos y otros, no pueden hallarse en publicaciones. Por ello, este tipo de información debe reunirse a través de la entrevista personal, por cuestionarios o algún otro medio. La ventaja de ello es el alto porcentaje de respuestas posibles. Sin embargo, es por regla general más costosa que enviar cuestionarios por correo.
Las firmas de analistas y consultores saben que es inconveniente el formulario postal como instrumento para recopilar datos por ser relativamente bajo el porcentaje de respuestas a ciertos cuestionarios.
La conveniencia principal del cuestionario como técnica de recopilación de datos es sus costos relativamente bajo.
IV. PRESENTACIÓN DE DATOS
Gráfica de líneas simples y de barras simples. Cualquiera de estos dos tipos de gráfico puede utilizarse ventajosamente para representar la tendencia general de la producción.
El cúmulo de datos estadísticos dentro de una empresa, de fuentes publicadas, o recopilados por entrevistas personales, no está usualmente apta para un análisis. Los datos deben organizarse y presentarse en una tabla o gráfico, antes de efectuar ningún análisis ni interpretación. Si se necesitan cifras exactas de un informe convendría presentar los datos en una tabla. En caso contrario, es preferible un gráfico para atraer la atención del lector.
15
Palacios C. Severo
Gráfico de líneas múltiples y de barras múltiples. La tendencia o movimiento de las exportaciones de dos comercializadoras se pueden representar gráficamente.
Gráfico de barras de componentes. El gerente de ventas de una embotelladora desea graficar el total de ventas en tres años y también la variedad de los productos en relación con el total. Podría utilizar un gráfico de líneas o un gráfico de barras.Gráfico de barras bi direccionales. Para indicar los cambios porcentuales puede utilizarse un gráfico bi direccional, que también es útil para ilustrar ganancias y pérdidas, producción o ventas cobre lo normal o bajo lo normal de un período a otro. Por ejemplo, se representan los cambios porcentuales de ventas correspondientes a cinco años de ventas:
SucursalesVentas Cambio
Porcentual2005 2010Mercado Central 10 8 -20Mercado Sur 5 7 +40Mercado Norte 2 4 +100Mercado Este 6 3 -50Mercado Oeste 10 11 +10
V. ANÁLISIS DE DATOS
Un análisis de datos suele seguir los siguientes pasos:
Análisis exploratorio de datos: Estadística descriptiva de cada variable por separado. Se obtienen medidas de tendencia central, variabilidad, representación gráfica, etc. Se pretende conocer cada variable así como detectar errores, valores extremos.
Estadística Bivariable: Estudia las relaciones entre pares de variables, utilizando estadísticos como el coeficiente de correlación Chi–cuadrado, t de Student, etc. y representaciones gráficas diversas.
Análisis Multivariante: Analiza simultáneamente dos o más variables. Los métodos pueden ser predictivos cuando existe una variable criterio o independiente que se explica o identifica por un conjunto de variables independientes, predoctoras o explicativas (Regresión lineal, Regresión cuadrática, análisis discriminante, análisis de varianza) o reductivos cuando se estudian las relaciones entre un conjunto de variables o casos sin que exista una variable a
16
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
identificar (componentes principales, análisis factorial, correspondencia binaria, correspondencia múltiple).
Usos de variables en el análisis
Las variables pueden ser definidas para medir una determinada salida o respuesta o bien para explicar por que se obtiene una determinada salida. Por ejemplo en el estudio de una enfermedad, las variables edad, antecedentes, severidad del estado, tratamiento son variables explicativas o independientes. Las variables discretas sana/no sana es la variable dependiente.
En ciertos análisis exploratorios todas las variables se usan como un único conjunto, sin distinción entre independientes y dependientes.
Análisis apropiado de datos
Son dos motivos por lo que resulta difícil la elección de la técnica estadística adecuada para un investigador con datos reales.
El primero es que los libros de estadística y los cursos curriculares se presentan en un orden lógico desde el punto de vista de la enseñanza de las materias, pero desde el punto de vista del proceso del análisis de datos.
La segunda es que los datos reales contienen mezcla de tipos de datos que hacen la elección del análisis arbitrario.
Una buena estrategia consiste en aplicar diferentes análisis al mismo conjunto de datos, lo que nos proporcionará información variada sobre el fenómeno en estudio.
Para decidir el análisis apropiado se clasifican las variables como:
Independiente frente a dependientesNominal u ordinaria frente intervalos
VI. DISTRIBUCIÓN DE FRECUENCIA
Los problemas industriales abarcan una gran masa de datos cuantitativos a los que deben darse ciertas formas significativas antes de poder efectuar ningún análisis e interpretación. Una forma de uso
17
Palacios C. Severo
corriente es la distribución de frecuencia. Existen dos tipos de variables, a saber: discretas y continuas. El análisis de la distribución de frecuencia se refiere a datos continuos.
Ordenamiento
Los datos que se haya sin agrupar son difíciles de analizar. Sea, por ejemplo, determinar los ingresos bajos y los elevados y un punto central de concentración, si lo hubiere.Por lo tanto es esencial, para analizar las entradas, organizar los datos que están sin agrupar en una forma agrupada llamada distribución de frecuencia.
Según la naturaleza de la variable estudiada las distribuciones de frecuencias pueden ser:
Datos no agrupados: se presentan cuando el número de valores que puede presentar la variable no es muy elevado, y en ese caso podemos observar todos los valores de esa variable. Este caso se presenta cuando la variable es discreta y continua no presenta excesivos valores.
Datos en intervalos: se presenta cuando la variable es continua o cuando es discreta pero con elevado número de valores. En esta situación se agrupan dichos valores en intervalos o clases. Los intervalos se notan: ii ee −−1 es intervalo i-ésimo. Se llama amplitud del intervalo a la distancia que existe entre los extremos.
1−−= iii eea
Se llama marca de clase al punto medio de un intervalo. Este punto es importante porque es el representante del intervalo.
211 +− +
= ii
i
eex
Se llama densidad de frecuencia de un intervalo a la frecuencia correspondiente a cada unidad de la variable en dicho intervalo.
18
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
i
ii a
nd =
Los intervalos se suelen tomar abiertos por la izquierda y cerrados por la derecha, salvo el primero que se toma cerrado por los dos lados. En este tipo de distribuciones se pierde parte de la información al agruparlas en intervalos, ya no se puede hablar de valores concretos sino de intervalos.
Cuanto mayor sea la amplitud de los intervalos menos intervalos habrá, y por tanto menos precisión tendremos. En cambio, cuanto menor sea la amplitud de los intervalos menos intervalos habrá, y mayor será la precisión, sin embargo la distribución será mas grande y más difícil de manejar.
Intervalo de clase
Con el propósito de preparar una distribución de frecuencia a partir del ordenamiento y el apuntado, los ingresos podrían agruparse arbitrariamente en clases con un intervalo digamos 250 dólares. Este valor se denomina amplitud de clase. El intervalo de clase es, sencillo, la amplitud de los ingresos mensuales para cada clase. Una manera conveniente de determinarlo es encontrar la diferencia entre los límites inferiores de dos clases adyacentes o la diferencia entre las marcas de clase adyacente.
VII. CRITERIOS DE DISTRIBUCIÓN DE FRECUENCIA
En la práctica, la cantidad total de clases varía usualmente de un mínimo de 5 a un máximo de 20. El hecho de que sean muy pocas o muchas clases no nos aclara la característica esencial de los datos. Por ejemplo, si organizamos los ingresos de los operadores de computadoras solamente en dos clases:
Ingreso Mensual (US$) Cantidad de operariosDe 250 a 400De 400 a 600
2523
Un análisis de distribución de frecuencia no revelaría mucho acerca de la estructura de los ingresos de los operarios.
19
Palacios C. Severo
Siempre que sea posible, el intervalo entre todas las clases se la distribución de frecuencia deberá ser igual. Los intervalos desiguales originan problemas al graficar y al calcular promedios y otras medias estadística.
VIII. MEDIDAS DE TENDENCIA CENTRAL
Una medida de tendencia central es un número que representa el valor central de un conjunto de valores. Habitualmente, estas medidas se llaman promedios. He aquí algunos ejemplos: el ingreso promedio de una familia, es de US$ 1500 por año; para el peso promedio de 60 fardos de fibra de llama utilizados para el tejido de alfombras y un diámetro promedio de pistones maquinados durante un jornal.
En el presente se consideran las herramientas estadísticas que más comúnmente se usan:
Media aritmética
Generalmente se le llama media o promedio. La media es simplemente la suma de una serie de datos numéricos dividida por el número total de ellos.
Es apropiado usar la media cuando los resultados son simétricos y tienen una distribución normal. Pero existen casos que estudiaremos a continuación:
Datos no agrupados: Si los datos no están agrupados la media aritmética se calcula tomando todas las mediciones y dividiendo la suma por el número de éstos.
Datos agrupados: La resistencia a la tracción de varios filamentos son 6, 6, 7, 7, 8, 8, y 9,4. Estos valores se agrupan en una distribución de frecuencia.
El punto medio de cada clase se usa para representar la clase. El punto medio de la clase se multiplica entonces por el número de frecuencia en esa clase. La suma de estos productos se divide por la cantidad total de datos para obtener la media aritmética.
Ejemplo 1.1
20
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
La tabla 1.1 muestra los puntajes de tres artículos en una prueba de degustación, usando preguntas cualitativas de escalas, a fin de cuantificar los valores.
Todos los productos probados tienen la misma media. La media de 20 es esta escala es bastante descriptiva de la distribución normal del producto 1, pero sería engañoso si se usara para describir el producto 2 ó el producto 3. La mayoría de los resultados en una investigación tienen una distribución normal (es decir, en forma de campana alrededor de un punto medio) pero otras distribuciones son lo bastante comunes como para que se deba verificar siempre, antes de usar la media, si ésta es en realidad descriptiva.
n
XX i∑= ni ,...2,1=
La media tiene otra debilidad sobre la que se debe estar alerta: se ve afectada por las observaciones extremas.
Tabla 1.1 Puntaje de tres productos en preguntas de degustaciónNivel de
degustaciónProducto
1 2 354321
105
705
10
2020202020
0505000
Media 20 20 20
Ejemplo 1.2Si los ingresos de dos profesionales se promedian con los ingresos de diez peones, el ingreso para todos los doce será de más de US$ 250, que obviamente es una cifra engañosa, si se evita usar la media para datos que no tengan una distribución normal o para datos que incluyan observaciones extremas, ésta es la medida estadística más útil para describir el promedio.
Tabla 1.2 Mano de obra por día para cada producto
Personal Jornal (US$)
Producto 1 Producto 2
CalificadoSemi calificadoNo calificado
20105
853
852
Media aritmética ponderada
21
Palacios C. Severo
Permite calcular un promedio que toma en cuenta la importancia o el factor que tiene cada valor sobre el total. Todas las medias aritméticas son ponderadas. Si no se dan factores específicos a todos y cada uno de los valores de la serie.
∑∑=
i
ii
m
mXX
Ejemplo 1.3Una empresa desea contratar tres tipos de personal: calificado, semi calificado y no calificado, para la producción de ciertos artefactos. La gerencia desea conocer el costo promedio de mano de obra por día para cada producto.
El promedio aritmético simple es:
21 0160,0661,1644,0 XXY ++=
El costo de mano de obra promedio del producto 1 es,
( ) $72,18735867,11 US=++
Y para una unidad del producto 2 es,
++ +↓→+ 222 FeAgOFeAg
El análisis de esta manera es incorrecto, ya que no se toma en cuenta que se trabaja con diferente personal.
Ejemplo 1.4Se compra material de construcción a tres empresas comercializadoras siendo sus costos: 80 kilo a 0,5 dólares por kilo, 20 kilo a 0,7 dólares y 10 kilos a 0,9 dólares.
Determine el precio promedio por kilos de alambrón.
Tabla 1,3 Precio por kilo de alambrónPrecio por kilo (Xi) Kilo comprado (mi)
0,50,70,9
802010
Total 110
22
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Aplicando la fórmula
∑∑=
i
ii
m
mXX
( ) ( )[ ] ( ) ( )[ ] kiloUSX /$5727,0110/10...110/80/110/109,0...110/8,05,0 =++++=
Comparando con el promedio simple
[ ] 10/9001 −= XX
( ) ( ) ( ) ( ) ( ) ( )[ ] k i l oU SX /$5 7 2 7,01 1 0/1 09,02 07,08 05,0 =++=
Media armónica
Es el inverso del valor medio, se la utiliza con frecuencia para la medición y análisis de flujos volumétricos.
∑=iX
nH1
Ejemplo 1.5Calcular el flujo volumétrico medio (FVM) de dos bombas que entregan combustible 10000 litros a razón de 500 litros por minuto y 10000 litros a razón de 100 litros por minuto, n = 2
min/7,166100/1500/1
12 litrosH =
+=
El resultado también puede obtenerse calculando el tiempo necesario para bombear 10000 litros con los dos flujos volumétricos y dividiendo el resultado por el número total de litros bombeados, es decir:
r1 = 10000/500 = 20 minr2 = 10000/100 = 100 minFVM = (10000 + 10000)/120 = 166,7 l/min
23
Palacios C. Severo
Obsérvese que el valor medio es de 300 litros por minuto, casi el doble de la media armónica.
Media geométrica
La media geométrica Xg es la n-raíz de los productos de la n observaciones medidas, de amplia utilidad en economía.
nig XX ∑=
En forma logarítmica
∑∑=
n
n L o g XXL o g i
g
Una aplicación importante es determinar el incremento porcentual promedio en ventas, producción u otras variables correspondientes a un lapso dado.Una modificación de la fórmula es:
1Pr1
1 −
−=
Lapsoimer
LapsoÚltimoLog
nXLog g
Ejemplo 1.6Supongamos que durante cinco años de una economía inflacionaria, las entidades crediticias pagan tasas altas de interés de 10, 20, 25, 30 y 40 por ciento.
Hallar la tasa de interés promedio anual de un depósito de 1000 dólares.
Tabla 1.4 Economía inflacionariaAño Tasa de interés Factor de crecimiento Ahorro al final de año (US$)
12345
1020253040
23
3,545
1000*2 = 20002000*3 = 6000
6000*3,5 = 2100021000*4 = 84000
84000*5 = 420000
El factor de crecimiento anual, será:
[ ] a ñ oc a d av e c e sX 5,35/545,332 =++++=
Pero 3,5 = 1 + 25/10
24
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Corresponde a una tasa de interés promedio de 20% anual.
Entonces, el depósito de 1000 dólares crecerá en cinco años:
( ) ( ) 75,216/1584/41394137 22222 =−+++=columnaSC
Este es un valor excedente al real en más de US$ 10521 - 8,75 un error muy considerable.
Usando la media geométrica, el factor de crecimiento promedio Anual corresponde a una tasa de interés promedio de 235% anual o 3,35 = 1 + 235/100 entonces el depósito de 1000 dólares crecerá en cinco años a:
( ) ( ) 25,9416/1584/36563135 22222 =−+++=ootratamientSC
Siendo está la media más apropiada para el caso.
Media cuadrática
De un conjunto de números Xn es denotado por la raíz cuadrada de la media cuadrática y es definida como:
n
XX q
∑=2
Ejemplo 1.7Evalué los datos que se muestran a continuación 1, 5, 7 y 9
2 4,6=qX
Mediana
Se llama mediana de una variable estadística a aquel valor de la variable tal que el número de observaciones menores que él es igual que el número de observaciones mayores. Se nota Me y se puede considerar como el punto de abscisas cuya ordenada en la curva vale ½.
25
Palacios C. Severo
Ni
N/2
Ni-1
ei-1 Me e
C
C”B”A
B
ii
iie
i
i
i
ie an
NNeM
n
a
NN
eM
CC
AC
BB
AB
−+=⇒=−−⇒= −
−−
− 11
1
1 2/
2/´
´
´
´
Datos no agrupados: La mediana es el valor correspondiente a un punto de una escala con respecto al cual la mitad superior agrupa igual cantidad de valores que la mitad inferior. Para determinar la mediana de datos no agrupados se ordenan, en primer lugar, de menor a mayor.Datos agrupados: Ordenar algunas observaciones no agrupadas de menor a mayor y elegir el valor central representa poco trabajo. Sin embargo, si son muchas las observaciones siempre es un problema ordenarla y encontrar el punto medio. En cambio, en datos cuantitativos es posible clasificarla directamente en clases y hallar una aproximación de la mediana en función de la distribución de frecuencia resultante.
La mediana se puede clasificar con la fórmula siguiente:
if
FnLM e d i a n a
−+= 2/
Donde:
L Límite inferior de la clase en que se ubica la medianan Cantidad de datosF Frecuencia acumulativa para la clase inmediata inferiorf Frecuencia en la clase mediai Amplitud del intervalo de clase
Ejemplo 1.8
26
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Ordene los valores por su magnitud, obtenga la mediana. 92,3 92,6 92,5 92,8 92,4.
Resulta ser la mediana 92,5
Moda
La moda es la única medida que se puede definir para caracteres cualitativos. Se define la moda de una distribución como aquel valor que se ha presentado más veces, es decir, es aquel que su frecuencia absoluta es máxima.
Si la distribución es agrupada en intervalos se habla de intervalo modal.
Una moda en una distribución no tiene por qué ser única, puede haber más de una en una misma distribución, y entonces se habla de distribuciones bimodales, trimodales, o en general plurimodales.
Datos no agrupados: El modo se define como el valor de la observación que aparece con mayor frecuencia. Cuando existe solo un modo, la distribución se llama unimodal, si existen dos valores que aparecen con frecuencia, la distribución recibe la denominación bimodal.
Datos agrupados: El modo observado para datos agrupados en una distribución de frecuencia es el punto medio de la clase en donde se encuentra el mayor número de frecuencia.
IX. MEDIDAS DE DISPERSIÓN
Las medidas de dispersión nos van a informar sobre el grado de esparcimiento de la distribución, es decir, nos van a decir si los valores que aparecen están más o menos concentrados. Por tanto, nos van informar también sobre el grado de representatividad de la medida de posición, pues cuanto más concentrados estén los valores que toma la variable mejor representará un solo valor a toda la distribución.
Varianza
La varianza es una medida de dispersión que mide el grado de esparcimiento de una distribución alrededor de la media aritmética.
27
Palacios C. Severo
Cuanto más grande sea la varianza más esparcidos estarán los valores de la variable. La varianza se suele notar σ2 y se calcula:
( ) ( ) iiii fXX
N
nXX²
²² ∑∑ −=
−=σ
Al igual que en la media aritmética los Xi representan a los valores de la variable si es una distribución no agrupada y a las marcas de clase si es una distribución agrupada en intervalos.
La varianza es la suma de las desviaciones de los valores de la variable sobre la media aritmética ponderada por las frecuencias. Por lo tanto, cuanto menor sea la varianza más agrupada estará la distribución en torno a su media aritmética. La varianza viene expresada en las mismas unidades que la variable pero al cuadrado.
Desviación típica
La desviación típica se define para obtener una medida de dispersión que venga expresada en las mismas unidades que la variable. Se define como la raíz cuadrada de la varianza.
²σσ =
Coeficiente de variación
Tanto la varianza como la desviación típica son medidas de dispersión absoluta, es decir, nos hablan de la dispersión de la variable que estamos estudiando, pero no nos permiten comparar la dispersión de dos distribuciones distintas.
El coeficiente de variación es una medida de dispersión relativa que nos va permitir comparar dos distribuciones distintas, se define como el cociente entre la desviación típica y la media aritmética.
XCV
σ=
El coeficiente de variación es un coeficiente adimensional y solo se puede definir cuando la media aritmética es distinta de cero.
28
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Para comparar la dispersión de dos distribuciones basta con comparar sus coeficientes de variación, aquella que su coeficiente de variación sea menor es la que esta más concentrada en torno a su media aritmética.
Problemas
(1) Un operario que trabaja a jornal gana por mes US$ 150, otro mes US$ 120 y otro mes US$ 140.¿Cuánto gana en promedio mensualmente?
(2) Los ingresos sobre ventas en una tienda comercial se evalúan cada semestre. Los siguientes datos representan, los ingresos (en dólares) por cada mes: 300, 280, 350, 320, 290 y 325Determine el ingreso medio de la muestra.
(3) Durante dos semanas se ha observado la temperatura en °C al medio día, siendo los resultados:
12 10 14 18 9 8 108 9 11 10 11 10 11
Determine la temperatura media de la muestra.(4) Calcular la media de los datos agrupados:
Y 40 41 42 43 44 45 46 47 48 49 50n 3 4 6 2 2 3 1 1 2 2 4
(5) Un grupo de micro empresarios, trabajan con obreros eventuales. Ciertos días trabajan con seis, ocho y cuatro.
29
Palacios C. Severo
En la mayoría de las veces trabajan con siete obreros, siendo en total ocho micro empresas.Cuál es el promedio de obreros por micro empresa
(6) Supongamos que se han registrado 50 observaciones referentes a los pesos de 50 garrafas de gas licuado, la muestra fue obtenida de la producción por hora y las unidades están dadas en kilogramo9.8 9.3 9,5 9,2 9,4 9,2 9,3 9,3 9,5 9,49,2 9,3 9,5 9,3 9,4 9,3 9,2 9,1 9,3 9,39,4 9,5 9,4 9,4 9,2 9,4 9,6, 9,6 9,3 9,19,4 9,2 9,5 9,3 9,2 9,3 9,2 9,3 9,4 9,69,4 9,3 9,4 9,3 9,4 9,3 9,3 9,4 9,2 9,4
Calcule el peso promedio de las garrafasSi el peso estándar es de 10 kilos cuanto de gas falta en promedio
(7) La temperatura registrada en un vivero, a cierta hora de un día cualquiera, en grados centígrados, fueron 30, 32, 39, 32, 33, 31, 38, 37, 32 y 31.Determine la media en grados Fahrenheit.
(8) Un proyecto económico muestra que el consumo de alimentos de un barrio marginal de 350 personas es en promedio de US$ 120 mensuales. Halle la media del gasto diario en alimentación.
(9) El ingreso percapite mensual en un país es US$ 250. El sector del magisterio constituye el 60% de la población que percibe el 2/5 del ingreso total. Calcule el ingreso medio por habitante del sector.
(10) Una empresa A tiene 80 empleados con un sueldo promedio mensual de 180 dólares por empleado. La empresa B tiene 120 empleados con un sueldo promedio mensual por empleado de 200 dólares por empleado, calcular:Cuál es el sueldo promedio mensual de las dos empresas en conjuntoSe agrega una tercera empresa con 40 empleados y un sueldo promedio mensual de 250 dólares por empleado.¿Cuál es el sueldo promedio de las tres empresas en conjunto?
(11) Se compran 100 kilos de carne de res a 2,3 dólares por kilo, 50 kilos de carne de cerdo a 2,8 dólares por kilo y 20 kilos de carne de cordero a 1,8 dólares por kilo. Un plato de Buffet tiene un costo de 8 dólares en donde se incluyen los tres tipos de carnes a razón de 1:0,5:0,2 respectivamente.¿Determine el promedio de platos Buffet que podrán prepararse y cuanto de carne sobra?
30
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
(12) Una empresa industrial fabrica azulejos a 60 dólares por metro cuadrado, jarrones a 20 dólares la unidad y floreros a 5 dólares por unidad. Un decorador desea adquirir dichos productos pero cuenta tan sólo con 500 dólares y tiene un ambiente de 20 metros cuadrados.¿Determine el promedio de cada producto para la decoración del ambiente?
(13) Un proyecto minero posee cuatro ingenios auríferos. El ingenio A tiene una ley de cabeza de 8 gramos por tonelada y trabajan 20 mineros. El ingenio B tiene una ley de cabeza de 4 gramos por tonelada y trabajan 12 mineros. El ingenio C tiene una ley de cabeza de 12 gramos por tonelada y trabajan 25 mineros. El ingenio D tiene una ley 2 gramos por tonelada y trabajan 25 mineros.¿Determine la media aritmética y la media geométrica de la ley de cabeza?Si el costo real del oro es de 30,2 dólares por gramo.¿Evalué el costo de mano de obra, siend0 la relación de producción de A=2B, C=5D, A=3D en cada ingenio?¿En que ingenio se trabaja a perdida?
(14) Se tiene sospecha de que en las aguas subterráneas las concentraciones de nitritos superan las normas establecidas para la crianza de peces, dicha concentración es de 0,03 mg NO2/l. Para tratar de verificar la sospecha, se midieron los niveles de nitritos en diez puntos aleatorios del acuífero y se obtuvieron los siguientes datos.
0,02 0,05 0,03 0,05 0,04 0,06 0,07 0,03 0,04 0,03Estime el nivel de confianza al 90% que las concentraciones de nitritos superan las normas establecidas para que sea factible la existencia de vida piscícola en la zona.
(15) Los datos obtenidos de una muestra aleatoria simple de tamaño 30 de la distribución X, porcentaje de incremento del contenido de alcohol en la sangre de una persona, después de ingerir cuatro cervezas es.
2,41=X 1,2=sCalcular un intervalo de confianza del 90% para el porcentaje medio de alcohol en la sangre de una persona, después de tomar cuatro cervezas.Si se calcula un intervalo de confianza del 95%, cual será el de mayor o menor amplitud.
31
Palacios C. Severo
(16) El 2000 se reforestaron más de 3 millones de acres con dos mil millones de plantas de viveros. Una grave sequía durante las siguientes estaciones mató a muchas de estas plantas. Se obtuvo una muestra de 1000 plantas y se descubrió que 300 estaban muertas. Obtener un intervalo de confianza del 90% de la proporción de plantas del vivero muertas. Utilizar dicha información para estimar el número de plantas muertas en la población.
(17) La capacidad de los equipos de vidrio producido en una determinada empresa de vidrio tiene una distribución normal. Una muestra aleatoria de 7 de ellas dio como resultado un varianza de 62 mililitros. Dar una estimación, mediante un intervalo de confianza del 95% de la varianza de la capacidad del equipo de vidrio que fabrica dicha empresa.
(18) Se quiere estudiar la eficacia de un tratamiento para eliminar una bacteria de un pino. En una muestra aleatoria de 150 pinos sometidos al tratamiento, 118 resultaron sanos. En otra muestra aleatoria de 130 pinos no tratados, los pinos sanos fueron 91.Construir un intervalo de confianza del 95% para la diferencia en la taza de pinos sanos entre los tratados y los no tratados.A que conclusión llega respecto a la efectividad del tratamiento.
(19) Para estudiar el rendimiento de dos tipos de cereales se hacen 20 determinaciones en parcelas donde se ha sembrado cereal del tipo A y 18 determinaciones en parcelas con cereales tipo B con los resultados siguientes.
áreaKgX A /5,14= áreaKgsA /23,3=áreaKgX B /3,15= áreaKgsB /85,1=
Son igualmente efectivos para el cultivo los cereales A y B al nivel de confianza del 90%
(20) Se realizó un estudio para comparar en lácteos el contenido de sodio en el plasma y en leche. Se obtuvieron las siguientes observaciones sobre el contenido de sodio (mili moles por litro de leche), en 10 envases aleatoriamente seleccionadas.
Envase 1 2 3 4 5 6 7 8 9 10LechePlasma
93147
104157
95142
81141
95142
95147
76148
80144
79144
87146
Hallar un intervalo de confianza del 95% de la diferencia media de los niveles de sodio en los fluidos del lácteo
(21) En el departamento de control de calidad de una empresa, se quiere determinar si ha habido un descenso significativo de la
32
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
calidad de su producto entre las producciones de dos semanas consecutivas a consecuencia de un incidente ocurrido durante el fin de semana. Deciden tomar una muestra de la producción de cada semana, si la calidad de cada artículo se mide en una escala de 100, obtienen los resultados siguientes:
Semana I 93 86 90 90 94 91 92 96Semana II 93 87 97 90 88 87 84 93
Suponiendo que las varianzas de la puntuación en las dos producciones son iguales, construye un intervalo de confianza para la diferencia de medias al nivel de 95%. Interpreta los resultados obtenidos.
(22) Sospechamos que nuestro cromatógrafo está estropeado, y queremos determinar si los resultados que nos proporciona son lo suficientemente precisos. Para ello, realizamos una serie de 8 mediciones del contenido de una solución de referencia que, sabemos, contiene 90% de un determinado compuesto. Los resultados que obtenemos son:
93,3 86,8 90,4 90,1 94,9 91,6 92,3 96,5Construir un intervalo de confianza al nivel de 95% para la varianza poblacional. ¿Qué conclusiones podemos realizar?
(23) Se ha hecho un estudio sobre la proporción de enfermos de cáncer de pulmón detectados en hospital que fuman, obteniéndose que de 123 enfermos 41 de ellos eran fumadores. Obtener un intervalo de confianza para dicha proporción. Estudiar si dicha proporción puede considerarse igual a la proporción de fumadores en la población si ésta es de un 29%.
(24) Para estudiar la efectividad de un medicamento contra la diabetes se mide la cantidad de glucemia en sangre antes y después de la administración de dicho medicamento, obteniéndose los resultados siguientes:
Antes 7,2 7,3 6,5 4,2 3,1 5,3 5,6Después
5,2 5,4 5,3 4,7 4,1 5,4 4,9
Estimar la reducción producida por el medicamento.(25) Eres el encargado de un departamento de producción en una
fábrica y recibes un lote de 2000 piezas necesarias para la fabricación de un artículo. Tienes la responsabilidad de aceptar o rechazar el lote, si estimas que la calidad de éste no es suficiente. El fabricante te asegura que, en este lote, no hay más de 100 piezas defectuosas, pero decides tomar una muestra para estimar la proporción de las mismas.
33
Palacios C. Severo
a) ¿Cuántas piezas decides examinar para que, con un nivel de confianza del 95%, el error que cometas en la estimación de la proporción poblacional de defectuosas no sea mayor que 0.05?b) Si decides tomar una muestra de 100 artículos escogidos al azar en el lote y realizas el recuento de piezas defectuosas en esta muestra, encontrado 4 artículos defectuosos.Construye para la proporción de defectuosos en el lote, un intervalo de confianza al nivel de 95% de confianza. ¿Se debe rechazar el lote?
(26) Los tiempos de reacción, en mili segundos, de 17 sujetos frente a una matriz de 15 estímulos fueron los siguientes:
448
460
514 488
592 490
507 513 492
534 523 452 464
562 584
507 461
Suponiendo que el tiempo de reacción se distribuye Normalmente, determine un intervalo de confianza para la media a un nivel de confianza del 95%.
(27) Se considera una población representada por una variante ε, de suerte que la media poblacional es igual a 25 y la varianza poblacional es igual a 240. Supuesto extraídas muestras de tamaño 100, muestreo aleatorio simple, determinar la probabilidad de que el estadístico media muestral, Ax, este comprendido entre los valores 23; 55 y 28,1.
(28) La duración aleatoria de las unidades producidas de un artículo, se distribuye según la ley normal, con desviación típica igual a seis minutos. Elegidas al azar cien unidades, resulto ser la duración media de 14,35 minutos. Elaborar el intervalo de confianza del 99% para la duración media de las unidades producidas.
(29) Se estudiaron 40 muestras de aceite crudo de determinado proveedor con el fin de detectar la presencia del níquel mediante una prueba que nunca da un resultado erróneo. Si en 5 de dichas muestras se observo la presencia de níquel ¿podemos creer al proveedor cuando asegura que a lo sumo el 8% de las muestras contienen níquel?
(30) La resistividad eléctrica de ciertas barras de aleación de Cromo- molibdeno es una variable N(12,5; 4,1).Un investigador acaba de calibrar un aparato que mide dicha resistividad y para comprobar que lo ha hecho bien utiliza el sistema consistente en medir cuatro barras y aceptar que el calibrado es
34
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
bueno si encuentra al menos un valor inferior y otro superior a 12,5.Determinar el nivel de significación del contraste que esta llevando a cabo. ¿Es sensible el contraste a una mayor o menor dispersión de la variable resistividad?
(31) En una muestra de 65 sujetos las puntuaciones en una escala de extroversión tienen una media de 32,7 puntos y una desviación típica de 12,64.a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la población.b) Indique, con un nivel de confianza del 95%, cual sería el máximo error que podríamos cometer al tomar como media de la población el valor obtenido en la estimación puntual.
(32) En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas. Se obtiene 132=X mg/dl y s2=109. Construir el intervalo de confianza al 95%.
(33) Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se eligen 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la gripe. Construir un intervalo de confianza al 95% para la probabilidad de pasar la gripe si se esta vacunado. En los otros 100 pacientes sin vacunar la pasan 20. ¿Es eficaz la vacuna?
(34) Se analizan 9 zumos de fruta y se ha obtenido un contenido medio de fruta de 22 mg por 100 cc de zumo. La varianza poblacional es desconocida, por lo que se ha calculado la desviación típica de la muestra que ha resultado ser 6,3 mg de fruta por cada 100 cc de zumo. Suponiendo que el contenido de fruta del zumo es normal, estimar el contenido medio de fruta de los zumos tanto puntualmente como por intervalos al 95% de confianza.
(35) Una firma comercial encuesta a 100 individuos para conocer sus opiniones sobre la elección de dos productos alternativos A y B recientemente fabricados. El resultado de la encuesta arroja que el producto A lo han elegido 55 individuos y el producto B 45. Hallar un intervalo de confianza al 95% para la proporción de individuos que eligen cada producto.
(36) En un proceso de fabricación de pilas alcalinas se sabe que su duración media es de 1100 horas y que dicha duración sigue una distribución normal. El nuevo proceso busca reducir la dispersión de la duración de las pilas por lo que se hace
35
Palacios C. Severo
necesario construir intervalos de confianza para la citada dispersión con coeficientes de confianza 90% y 98%.Construir dichos intervalos a partir de una muestra de tamaño 20 cuya dispersión es 2240 horas.
(37) Se sabe que la longitud de los diámetros de los tornillos fabricados por una máquina sigue una distribución normal y se busca un intervalo en el cual se encuentre la variabilidad de las longitudes de los tornillos fabricados por la máquina con una probabilidad del 80%.Construir dicho intervalo sabiendo que una muestra de 16 tornillos presenta una variabilidad cuantificada en 30.
(38) Un granjero dispone de dos criaderos diferentes A y B con varias granjas cada una para la cría de pollos. Con el objetivo de estudiar la mortalidad de los pollos en las dos criaderos observa el número de pollos muertos tomando una muestra de 4 granjas en el criadero A y otras 4 granjas en el criadero B obteniendo los siguientes resultados:
Nº de pollos muertos en las granjas del criadero A: 16 14 13 17Nº de pollos muertos en las granjas del criadero B: 18 21 18 19
Suponiendo normalidad en los criaderos, se trata de estudiar si la mortalidad de los pollos puede considerarse diferente en los dos criaderos con un nivel de confianza del 95%.Resolver el problema bajo la hipótesis adicional de varianzas iguales en los criaderos.
(39) Al analizar 40 muestras de una aleación de bajo punto de fusión de tipo “babit” se ha detectado ausencia de cadmio en 12 de ellas. Determinar un intervalo de confianza para la proporción de muestras de dicha aleación que no contienen cadmio.
(40) La cantidad de azufre encontrado en plantas secas de mostaza sigue una distribución normal X. se ha observado una muestra de extensión 9 con los siguientes resultados
0,7 0,8 0,6 0,95 0,65 1 0,9 0,2 0,55.Si aceptamos como valor de σ el valor calculado de la desviación típica muestral S ,¿Cuál sería el tamaño mínimo de la muestra que habría de ser considerada para que el intervalo de confianza al 95% para el nivel medio de azufre tenga una longitud inferior a 0,1?
(41) La pérdida de peso de un determinado producto dietético en 16 individuos después de un mes fue (en kg):
3,2 2 2,5 3,3 5 4,3 2,9 4,1
36
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
3,6 2,7 3,5 4,2 2,8 4,4 3,3 3,1Determinar un intervalo de confianza para la varianza con nivel de confianza del 99%, si la pérdida de peso es aproximadamente normal.
(42) Se consideran lo siguientes tiempos de reacción de un producto químico, en segundos:
1,4 1,2 1,2 1,3 1,5 1,3 2,2 1,4 1,1Obtener un intervalo de confianza del 90% para el tiempo de reacción. Suponer la variable normal con desviación típica poblacional conocida σ = 0,4.
(43) El tiempo, en minutos, que esperan los clientes de un determinado banco hasta que son atendidos sigue distribución normal de media desconocida y desviación típica igual a 3. Los tiempos que esperaron diez clientes elegidos al azar fueron los siguientes:
1,5 2 2,5 3 1 5 5,5 4,5 3 3Determinar un intervalo de confianza de coeficiente de confianza 0,95, para el tiempo medio de espera.
(44) La duración en minutos de un determinado viaje es una variable aleatoria con distribución normal de media desconocida y desviación típica igual a 3. En una muestra tomada al azar de diez realizaciones del viaje en cuestión se obtuvieron los siguientes tiempos:
10,1 6,5 5,5 7,9 8,2 6,5 7,0 8,1 6,9 7,7a) Realizar la estimación de máxima verosimilitud de la duración media del viaje.b) Calcular la probabilidad de que, en valor absoluto, la diferencia entre media estimada la real sea menor que 1 minuto.
(45) Las velocidades de difusión del bióxido de carbono a través de la porosidad del suelo son distintas.
Arenoso 20
27 22 23 23 28
23 26 22 26 20
19 22
Arcilloso 19 30
32 28
15 26 35 18 25 35
Comprobar si se puede afirmar que las velocidades de difusión son distintas al nivel de confianza del 95%
(46) Una transformadora de productos lácteos recibe diariamente la leche de dos granjas. Se desea estudiar la calidad del producto acopiado, se extraen dos muestras al azar y se analiza el contenido en materia grasa, obteniéndose los siguientes resultados.
37
Palacios C. Severo
Granja A %7,8=AX 22 %02,1=As 33=An
Granja B %9,10=BX 22 %73,1=Bs 27=BnSe pide construir un intervalo de confianza del 95% para la diferencia del contenido medio en grasa de leche de ambas granjas.
(47) En una determinada raza de ganado vacuno los terneros incrementan 12 kg. de peso cada semana, en los primeros meses de vida. Para comprobar se sometió al pesado de ocho terneras al cumplir las cuatro semanas y posteriormente dos semanas.Ternero 1 2 3 4 5 6 7 8Peso 4 semanasPeso 6 semanas
130138
125140
128139
127141
129137
123137
131142
130142
Comprobar si la suposición es cierta calculando los intervalos de confianza al 95% para la diferencia media de peso.
(48) Se ha realizado un estudio sobre la tasa de supervivencia de pájaros adultos en trópico y en zonas templadas. Inicialmente se marcaron 500 pájaros adultos en las patas y se liberaron a una región tropical. Un año después, se volvió a capturar 445. Suponiendo que los no recuperados fueron victimas de un depredador, la tasa de supervivencia estimada de un año para los pájaros adultos en la región es 0,80. Un experimento similar en otra zona templada, dio como resultado de 252 de los 500 pájaros con una tasa de supervivencia estimada de 0,504.Hallar un intervalo de confianza del 90% de la diferencia en las tasas de supervivencia de un año para las dos zonas.
(49) Una muestra de tamaño 10 de una población de mujeres presenta una altura media de 172 cm. y una muestra de 12 varones de otra población presenta una altura media de 176,7 cm. Sabiendo que ambas poblaciones son normales con varianzas 225 y 256 respectivamente, se trata de analizar si con una probabilidad del 95% se puede asegurar que los varones son más altos en media que las mujeres o viceversa.
(50) Los responsables municipales de la salud miden la radiactividad en el agua de una fuente natural en una zona abundante en granito. Realizadas 12 mediciones en diferentes fechas del año se observó una media de 3,6 picocurios con una desviación típica de 0,82.Determinar, al 95% y al 99%, intervalos de confianza para la radiación media y para la varianza.
38
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
(51) En una muestra de 65 sujetos las puntuaciones en una escala de extroversión tienen una media de 32,7 puntos y una desviación típica de 12,64.a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la población.b) Indique, con un nivel de confianza del 95%, cual sería el máximo error que podríamos cometer al tomar como media de la población el valor obtenido en la estimación puntual.
(52) Los tiempos de reacción, en mili segundos, de 17 sujetos frente a una matriz de 15 estímulos fueron los siguientes:
448, 460, 514, 488, 592, 490, 507, 513, 492, 534, 523, 452, 464, 562, 584, 507, 461
Suponiendo que el tiempo de reacción se distribuye normalmente, determine un intervalo de confianza para la media a un nivel de confianza del 95%.
(53) De una población cuya distribución se desconoce se obtiene una muestra aleatoria de 2000 valores en que la media muestral resulta ser 225 y la desviación típica muestral 10.Suponiendo que la varianza muestral coincida con la de la población, estimar un intervalo para la media de la población con un nivel de confianza del 95%
(54) En una muestra de 100 personas de un barrio de Lima se ha observado una proporción de 0,18 personas que leen el periódico diariamente. ¿Puede ser que la verdadera proporción de personas que leen el periódico en ese barrio sea 0,20?
39
Palacios C. Severo
X. ESTIMACIÓN DE PARÁMETROS
Otra cosa que los investigadores tratan de hacer con frecuencia es obtener inferencias sobre la población con base en los resultados de una experiencia a partir de una muestra. El hecho de que 50 personas en una prueba prefieran el producto A al producto B por un margen de dos a tres, es importante solo en la medida en que le permita concluir en que la población como un todo también prefiere el producto A. Esto es se llama inferencia estadística, tomar una decisión sobre la población entera en base a las características de una muestra.
Para hacer una inferencia sobre la población, usted debe de aplicar un límite de confianza o un intervalo de confianza al resultado que encontró en el estudio.
Ejemplo 1.9En un estudio X se encontró que el 30% de los informantes tienen conocimiento del producto A, es poco factible que exactamente el 30% de la población entera tenga ese conocimiento del producto A, pero la cifra de la población deberá estar cerca del 30%. Sí la muestra es lo suficientemente grande y estuvo bien tomada. A la diferencia entre los resultados de la muestra y la población se la llama error muestral.
El intervalo que se conexa al resultado de la encuesta para estimar o inferir la cifra de la población se llama intervalo de confianza.
XI. DIFERENCIAS SIGNIFICATIVAS
A veces en un proyecto de investigación se propone comparar resultados entre dos muestras. Las comparaciones más comunes son:
Dos o más subgrupos dentro de una misma muestra
40
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
¿Tienen las personas con ingresos superiores de US$ 10000, opiniones diferentes de las que tienen las personas con ingresos por debajo de Sus 10000? ¿Son distintas las evaluaciones de productos confeccionados por los varones a las evaluaciones hechas por las mujeres?
Muestras tomadas en diferentes puntos en el tiempo
¿Aumentó el conocimiento del producto durante el año pasado? ¿Es la participación en las Universidades mayor de lo que era hace cinco años? Lo primero que usted hace, es observar los resultados en forma simple y directa.Si las respuestas de los hombres y mujeres son iguales, usted no necesita de una prueba estadística adicional. Si la participación en las Universidades no ha cambiado desde hace cinco años usted ya tiene una respuesta.
Pero si los resultados son distintos entre cualquiera de sus sub-grupos entonces usted tiene que confrontar dos preguntas básicas ¿Es la diferencia de los resultados tan pequeña como para sugerir que ésta probablemente ocurrió por azar? está si usted repite la prueba. ¿Hay una buena probabilidad de que el resultado sea el contrario? ¿Es el resultado lo bastante grande como para que probablemente sea el resultado de una verdadera diferencia? sí usted repite la prueba varias veces, ¿Es muy factible que ésta resulte igual cada vez?
Antes de hacer una prueba estadística, usted debe tener una hipótesis es decir una relación que usted querrá probar como verdadera o falsa. En estadística, usualmente se supone que dos poblaciones son iguales hasta que se pruebe lo contrario. Esto se llama hipótesis nula.
Empezamos con la hipótesis nula, si la diferencia entre dos muestras es lo bastante pequeña como para que fácilmente pudiera haber ocurrido por azar, entonces la hipótesis nula no puede ser rechazada y usted debe concluir que la diferencia entre las dos muestras no es estadísticamente significativa al nivel de significación del 95 por ciento (o cualquier nivel de, significación que usted elige). En cambio, si la diferencia en los resultados de la toma de datos es tan grande que no es factible que esto haya ocurrido por azar, usted rechaza la hipótesis nula y concluye que la diferencia entre las dos muestras es estadísticamente significativa al nivel de significación del 95 por ciento.
41
Palacios C. Severo
Además de estas medidas de la diferencia en dos muestras, hay otras pruebas estadísticas que son útiles para evaluar diversas clases de resultados.
XII. DISPERSIÓN DE LOS DATOS PROBLEMAS
La varianza mide la dispersión de los datos con respecto a la media aritmética y la desviación estándar es simplemente la raíz cuadrada positiva de la varianza. Daremos las definiciones para su aplicación.
Datos no agrupdos: La varianza también se basa en desviaciones a partir de medias. Para hallar la varianza a de un producto, se eleva al
cuadrado las desviaciones a partir de las medias ( )2
XX − , luego
también se suman ( )2
∑ −XX y se promedian dividiendo por el
número total de productos, o sea n.
( )n
XXi∑ −
=2
σ
Como la media verdadera no se conoce prácticamente, la desviación estándar verdadera es una magnitud teórica. Sin embargo a puede obtenerse aproximadamente a partir de la desviación estándar estimada S(X).
( ) ( )1
2
−∑ −
=n
XXXS i
En el análisis estadístico se utiliza una cantidad denominada grados de libertad que designaremos para el futuro como GL. Esta cantidad permite tener en cuenta y corregir, desde el punto de vista matemático, las restricciones impuestas a los valores. En este caso al calcular la desviación estándar, el número n de observaciones ésta fijado y la desviación estándar estimada se puede calcular a partir de la media. De la n observaciones sólo n-1 pueden variar, el último valor queda determinado por X y n. Por lo tanto al estimar la desviación estándar a partir de una muestra de la población de datos, solo hay n-1 grados de libertad. Elevando al cuadrado la desviación estándar
estimada se tiene la varianza estimada ( ) 2XS .
42
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Ejemplo 1.10Se han realizado cinco análisis de un producto para determinar la concentración de un componente X. Los resultados fueron: 98 97,7 87 96 y 93 32,94=X
( ) 54,45
6,4719396877,9798 222222
=−++++=XS
Datos agrupados: Para ilustrar el cálculo de la desviación estándar para datos agrupados veamos los siguientes jornales de obreros. En primer término se hallan los puntos medios ( )X de cada clase de
jornal. Luego se eleva al cuadrado las ( )2XX se multiplican por el
número adecuado de frecuencia de clase para dar 2Xf .
( ) 22
Xn
fXXS −∑=
Jornal (US$) Cantidad (f) X 2X
2Xf Xf
3 a 55 a 77 a 9
253
468
163664
32180192
83024
Total 10 404 62
( ) $4,110
62
10
4042
USXS =
−=
La desviación estándar puede emplearse como denominador común para colectar la dispersión de las dos distribuciones y la representatividad de las dos medias.
Otra aplicación es la desviación estándar como instrumento de análisis se da en su relación con la media de una distribución normal. Una relación se halla en función del porcentaje de observaciones dentro de una desviación estándar debajo de la media y una desviación estándar incluye un 95% de las observaciones. La
43
Palacios C. Severo
)(3 SX ± incluye
alrededor de 99,7% de las observaciones.
Desviación media
Otra medida de la dispersión de los valores es la desviación media real, se trata simplemente de la media aritmética de las desviaciones de las medias sin tener en cuenta lo siguiente:
∑ −= iXXmd
n
medianaX∑−
Para una desviación normal, la desviación estándar verdadera es aproximadamente igual 1,25 veces la desviación media.
Ejemplo 1.11Calcular la desviación media del ejemplo 1.10.
md = 3,456
La dispersión de los resultados será ±3,456Problemas
44
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
(55) Calcule el valor medio, mediana y moda de la siguiente distribución de datos:
X Y110 -119
100 – 10990 – 9980 – 8970 – 7960 – 6950 – 5940 – 4930 – 3920 – 2910 - 19
1025
101394501
(56) Se recibe materia! de dos fuentes de abastecimiento. Los análisis de muestras provienen de las dos fuentes que se indican a continuación. Se desea saber si se justifica que existe diferencia entre las dos fuentes.
Fuente 1 85 74 76 88 73 84 77Fuente 2 79 71 75 77 79 77 78
(57) El análisis de gas natural indica el siguiente concentrado de CO2 en volumen: 24,6 23,7 23,4 23,8 24,1 23,9 ¿Calcule el intervalo de confiabilidad de la media verdadera?
(58) En una refinería de plata, se analiza el contenido de plata en los residuos para establecer su concentración en los lingotes. Las muestras obtenidas durante dos turnos dieron los resultados.
Hora 1 2 3 4 5 6 7 8Turno 1 89 92 98 97 98 97 97 98Turno 2 87 87 97 97 97 98 97 97
Trate de saber si la diferencia entre los análisis de los dos turnos es significativa.
(59) La información obtenida de cuatro reactores químicos diferentes, acerca del efecto de la temperatura sobre cierta reacción es la siguiente:
Temperatura (°C)
Rendimiento del reactor1 2 3 4
800900980
10,410,912,1
12,910,811,6
11,710,612,8
13,513,510,2
Determinar mediante análisis de varianza de dos caminos, si la varianza entre los reactores y entre la temperatura es altamente significativo.
(60) Un fabricante de hipoclorito sabe que la cantidad de cloro contenido en su producto decrece con el tiempo y eventualmente
45
Palacios C. Severo
se estabiliza en torno al 0,3%. El fabricante desea estimar la cantidad de cloro en el hipoclorito para un tiempo dado, con el fin de informar a los vendedores y retirar el producto caducado. Para ello se analizan sobre los porcentajes de cloro disponible por unidad de producto restante de 8 a 42 semanas después de fabricado.
Semanas desde la fabricación
Cantidad disponible de cloro (%)
81012141618202224262830323436384042
0,490,480,460,450,440,460,420,410,420,410,410,40,410,400,410,400,390,39
0,490,470,460,430,430,450,420,410,400,400,400,400,40
0,380,40
0,480,450,430,43
0,430,400,400,41
0,38
0,470,43
Realizar el análisis de regresión y anotar la ecuación del modelo lineal, el coeficiente de correlación.
(61) Se sabe por experiencia, que el incremento de peso de los embriones de pollo al transcurrir el tiempo sigue la ley de tipo exponencial.En un experimento se obtuvieron los pesos (gramos) de un embrión desde el sexto día de su nacimiento hasta e decimosexto que aparecen a continuación.
Día 6 7 8 9 10 11 12 13 14 15 16Pes
o0,02
0,05
0,07
0,13
0,18
0,26
0,43
0,74
1,13
1,88
2,81
Crear una tabla con la variable días y peso con datos anteriores.Realizar un análisis de regresión para comprobar que valores siguen la ley exponencial.Gráfique los datos y la línea de regresión ajustada.Estime el peso de un pollo a los 7,5 a los 16 y a los 18 días de su nacimiento. Justificar si alguna de las estimaciones obtenidas es poco fiable.
(62) En la siguiente tabla se refiere al número Y de bacterias por unidad de volumen presentes en un cultivo después de X horas.
46
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
X 0 1 2 3 4 5 6Y 32 47 65 92 132 190 275
Ajustar los datos a una curva del tipo Y = aXb
Calcular los valores del coeficiente de correlaciónVisualizar la línea de regresión y los datos obtenidosEstimar el valor de Y para un valor de X = 3,5
(63) La tabla adjunta muestra cinco observaciones de un fenómeno cinético
U 103 102 10 1 0,1T 0 1 2 3 4
El investigador sugiere un modelo de ajuste del tipo U = ke-bT
Estimar los parámetros k y b.(64) La presión de un correspondiente a diferentes volúmenes V se
dan en la tabla.V (cm³) 50 60 70 90 100P (Kg/cm²) 60 54 46 24 10
Obtenga por regresión el coeficiente de correlación de los modelos lineales, exponenciales y cuadráticos.
(65) En una reunión medica se probo con una droga fue tomada por 14 personas, de las cuales 6 lo hacen por primera vez y 8 ya son habituales de ella. La droga produjo en el primer grupo sueños de duración 11, 12, 13, 16, 17 y 15 horas, mientras que en el segundo grupo 8, 7, 9, 10, 6, 7, 9 y 8 horas.a) Media y desviación típica de cada grupob) Formar el estadístico que se distribuye según una t de Student de 12 grados de libertad, sabiendo que las poblaciones tienen la misma media y desviación típica.
(66) Según una encuesta realizada sobre una muestra de 2500 personas elegidas al azar, el 80% está decidido a votar en las últimas elecciones.a) ¿Puede ser cierto que llegue a votar el 85% de la población?b) Con un 99% de nivel de confianza ente qué valores estará el porcentaje de los votantes de la población
(67) Suponga que de una población consistente en los valores 0, 2, 4, 6 y 8, se toman muestras de tamaño 2 con reemplazo.
X Frecuencia Frecuencia relativa02468
11111
1/5 = 0,21/5 = 0,21/5 = 0,21/5 = 0,21/5 = 0,2
47
Palacios C. Severo
Demostrar que es razonable aproximar la distribución muestral de por una distribución normal, una vez que se conoce la media y la desviación estándar de la distribución muestral.
(68) En un experimento de laboratorio se mide el tiempo de una reacción química. Se ha repetido el experimento 98 veces y se obtiene que la media de los 98 experimentos es de 5 segundos con una desviación de 0,05 segundos. ¿Cuál es la probabilidad de que la media poblacional m difiera de la media muestral en menos de 0,01 segundos?
(69) Se establece un control de calidad para un proceso de producción de balas. Se ha dispuesto que cuando el proceso está bajo control, el diámetro de las balas es de 1 cm., con una desviación típica de 0,003 cm. Cada hora se toman muestras de nueve balas y se miden sus diámetros. Los diámetros de media de diez muestras sucesivas, en centímetros, son:
1,0006 0,9997 0,9992 1,0012 1,00081,0012 1,0018 1,0016 1,0020 1,0022
Establecer cuáles son los límites de control y explicar qué concluyes sobre el proceso de producción en estos instantes.
(70) Un investigador quiere estimar la media de una población usando una muestra suficientemente grande para que la probabilidad de que la media muestral no difiera de la media poblacional en más del 25% de la desviación típica sea 0,95. Hallar el tamaño de muestra necesario.
(71) La efectividad en días de un determinado antibiótico, sigue una distribución normal de media 14 días y desviación típica desconocida. Fue administrada a 16 enfermos, obteniéndose una desviación típica muestral de 1,4 días. Determinar la probabilidad de que la efectividad media en la muestra no supere los 3 días, que es el tiempo mínimo de efectividad requerido.
(72) Se realiza un análisis de la duración de 40 pilas alcalinas obteniéndose los siguientes resultados:
Duración Xi Frecuencia absoluta nj
1,55 – 1,951,95 – 2,452,45 – 2,952,95 – 3,453,45 – 3,953,95 – 4,454,45 – 4,95
214151053
Ajustar las duraciones de las pilas alcalinas a una distribución normal con media 3,5 y desviación típica 0,7.
48
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
(73) Un estudio de genética con reses consistió en varios machos apareados con grupos separados de hembras.Cuando nacían terneros, se usaban en un estudio de pesos hereditarios. En la siguiente tabla se presentan los pesos al nacer de ocho terneros de cada uno de los cinco grupos de apareamiento.
Macho Peso al nacer177200201202203
6175585759
100102605646
56956067
120
1131035759115
99985758115
1031155912196
759854101105
6294
10010175
Escriba el modelo lineal, explique cada término, calcule el análisis de varianza y muestre los cuadrados medios esperados.Pruebe la hipótesis nula Ho: σ2 = 0 para los machos.
(74) Los datos del ejercicio 3.5 corresponden a las concentraciones de colesterol en análisis de laboratorio a 2 muestras de cada uno de 8 pacientes.Suponga un modelo aleatorio para el estudio. Escriba el modelo lineal, explique cada término, calcule el análisis de varianza y muestre los cuadrados medios esperados.Estime las componentes de la varianza para pacientes y muestras y determine intervalos de confianza medios al 90%.
(75) Un patólogo de plantas tomó cuatro muestras, de 3 libras cada una, de lotes de 50 toneladas de semilla de algodón acumulada en varias cosechas durante la temporada de limpia. Las muestras se analizaron en el laboratorio para buscar aflatoxin, que es una toxina producida por organismos asociados con las semillas.A continuación se proporcionan las concentraciones de aflatoxin en partes por billón para las muestras de ocho lotes.
Lote Afloxin (ppb)3469 – 723849 – 523721 – 243477 – 803669 – 723873 – 763777 – 803461 - 64
3956642938112310
571383556649011
6325882153345
23
6631715181102037
(76) Suponga que los lotes y sus muestras son efectos aleatorios. Escriba el modelo lineal para el estudio, explique los términos, calcule el análisis de varianza completo y muestre los cuadrados medios esperados.
49
Palacios C. Severo
(77) Piense en problemas de investigación en su área de interés que requieran muestras (u observaciones) de la unidad experimental debido a que no sea posible medir la unidad en su totalidad.Escriba un modelo lineal para su estudio; identifique los términos y bosqueje el análisis de varianza, muestre las fuentes de variación, los grados de libertad y los cuadrados medios esperados.
(78) Se realizó en conjunto un estudio sobre cartuchos para filtrado de partículas de alta energía, usados en respiradores comerciales para protección contra partículas de materia. Una prueba específica incluyó tres filtros elegidos al azar de cada uno de dos fabricantes, se hicieron tres réplicas de prueba independientes de cada filtro, las medidas fueron el porcentaje de penetración por medio de una prueba estándar de aerosol.
Fabricante I Fabricante IIFiltro 1 2 3 4 5 6
1,121,101,12
0,160,110,26
0,150,120,12
0,910,830,95
0,660,830,61
2,171,521,58
Escriba un modelo lineal para este estudio, explique los términos, calcule el análisis de varianza y muestre los cuadrados medios esperados.Pruebe la hipótesis de que no existen diferencias entre la penetración porcentual promedio de los filtros de los dos fabricantes.Calcule las medias, sus errores estándar y las estimaciones del intervalo de confianza de 95% para las medias de cada fabricante.
(79) Un científico de suelos estudió el crecimiento de plantas de cebada en tres niveles diferentes de salinidad en un medio controlado. Tenía dos contenedores réplica de cada tratamiento, en un diseño totalmente aleatorizado y midió tres plantas de cada réplica. Los pesos en seco de las plantas, en gramos, son los siguientes:
Salinidad Contenedor
Peso (g)
Control
6 barras
12 barras
123456
11,29
7,375,644,204,833,28
11,08
6,555,983,344,772,16
11,10
8,505,694,215,662,69
50
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Escriba un modelo lineal para un análisis de datos, explique los términos, calcule el análisis de varianza y muestre los cuadrados medios esperados.Pruebe la hipótesis de que no hay diferencia entre las medias de los niveles salinos.Calcule el error estándar de una media de nivel salino.Haga una partición de las sumas de cuadrados para la salinidad en dos sumas de cuadrados polinomiales ortogonales (lineal y cuadrática), cada una con 1 grado de libertad y pruebe la hipótesis nula de que no hay regresión lineal o cuadrática.
(80) El índice de porosidad es una medida usada por los científicos de suelos para ayudar en la predicción del movimiento, almacenamiento, disponibilidad del agua y las condiciones de oxigenación del subsuelo. Un científico de suelos usó un diseño de muestreo especial para tomar muestras del suelo de una de las granjas experimentales de la universidad para medir el índice de porosidad del suelo. Se hizo una partición de la granja en campos de aproximadamente 4 hectáreas, cada una con 8 secciones. El plan de muestreo incluyó una selección aleatoria de los campos dentro de las secciones. A continuación se presenta el índice de porosidad de cada sub muestra:Camp
oSecció
nPorosidad Camp
oSecció
nPorosidad
1
2
3
4
5
6
7
8
12345678910111213141516
3,8465,6295,0874,6214,4113,3573,9915,7665,6773,3334,3554,94
02,9834,3965,6033,683
3,7122,021
6,2924,810
9
10
11
12
13
14
15
1718192021222324252627282930
5,9425,0145,1434,0613,8354,5844,1934,1253,0743,4833,8674,2126,2474,730
2,9644,398
Suponga que todos los efectos son aleatorios. Escriba un modelo lineal para el estudio, explique cada término, calcule el análisis de varianza para los datos y muestre los cuadrados medios esperados.Estime las componentes de la varianza para campos, secciones y muestras.
51
Palacios C. Severo
XIII. DISTRIBUCIONES
Al tratar con grandes cantidades de datos, es conveniente ordenarlos de tal manera que la frecuencia de la aparición de rangos de valores dados, puedan ser tabuladas y graficadas.
Este ordenamiento se realiza estableciendo rangos llamados intervalos de clase la frecuencia relativa de los intervalos de clase se denomina distribución empírica y se utilizan para estimar las distribuciones teóricas.
Ensayos estadísticos
Existen varios tipos de ensayos estadísticos que se emplean para determinar si la diferencia entre dos conjuntos de valores es real y significativa o a errores azarísticos.
Ensayo t
La distribución t de Student aparece al comprobar la hipótesis de la media de una totalidad general de distribución normal siendo incógnita la varianza.
52
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
2
1
²1
2
2
1
)(
n
N
X
na
n
Xf
−
+
Γ
+Γ
=π
Ejemplo 1.12Consideremos los datos del ejemplo 1.10, se trata de saber si la diferencia entre el valor medio y el supuesto valor medio 96 es significativa.
( )( )
4
:
54,4
03,2
32,94
==
==
=
GL
Hipótesis
XS
XS
X
oµµ
( )82,0±=
−=XS
Xt oµ
El valor tabulado de t para un nivel de significación del 99% y 4 GL, es igual 3,75, como el valor calculado de t es inferior al valor tabulado, la hipótesis no es rechazada.
Chi-cuadrado
Esta prueba puede utilizarse para comparar los resultados de una encuesta con frecuencia teórica o esperada.
( )´
´ 2
2
f
ffX
∑ −=
Ejemplo 1.13La alimentación de flujo continuo que se realiza a cuatro reactores industriales que han sufrido un total de cuarenta fallas durante un año, la distribución de las fallas, por bombas fue:
Bomba 1: 16Bomba 2: 9Bomba 3: 6
53
Palacios C. Severo
Bomba 4: 9
El capataz de mantenimiento sostiene que la bomba 1 ha sufrido un número excesivo de fallas, en comparación con los resultados posteriores se trata de saber si esta afirmación es justificada.
Como hay cuatro categorías posibles de números y como el número total está dado, el número de GL es tres. Esto corresponde a un número de probabilidades aproximadamente igual a 0,25 e indica que, si todas las bombas operan en las mismas condiciones, el valor del Chi-cuadrado sería de 5,4 es decir una vez cada cuatro, por la sola acción del azar. Por lo tanto la probabilidad que la hipótesis de mantenimiento esta equivocado es del 25 por ciento en la población, La prueba puede usarse siempre que los resultados, las respuestas o los encuestadores se pueden organizar en varias categorías.
Distribución F
El análisis de varianza que se realiza mediante el ensayo F permite la separación de la varianza total de un proceso, en sus componentes.
Con el ensayo F el número de GL correspondiente a las dos varianzas no necesita ser idénticas.La mayoría de los textos de estadística tabulan valores de F para los niveles de probabilidad 0,05 y 0,01. El número de GL, con la varianza en el numerador, se indica normalmente en la parte superior de la tabla, mientras que el número de GL con la varianza en el denominador se encuentra en la columna de la izquierda.
Ejemplo 1.14Para un ensayo de laboratorio de rutina, se ha propuesto un procedimiento analítico simplificado. Es necesario determinar si el procedimiento propuesto arroja los mismos resultados que el convencional, es decir, si los valores medios de un ensayo por duplicado son iguales y si la precisión del ensayo propuesto es igual al antiguo.
Convencional Propuesto89,789,689,589,689,8
89,889,689,489,590,0
54
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
89,789,2
013,0)(
4
64,89
21
1
=
==
XS
GL
X
07,0)(
6
6,89
22
1
=
==
XS
GL
X
Los valores medios de las muestras con los dos métodos son similares pero la diferencia con la varianza es significativa al nivel del 0,05 de probabilidad. Consultado la tabla de valores F indica el valor de 6,2 para el nivel de probabilidad correspondiente y el número de GL existente.
Para determinar si los valores de varios conjuntos de medición, es necesario el cálculo de varianza de los valores medios de los conjuntos. Si la varianza de los valores medios es sólo normal resulta.
Ejemplo 1.15Tres reactores ubicados en diferentes lugares, que emplean sin embargo el mismo proceso. Se desea saber si los valores medios correspondientes a los tres reactores son similares.
Entre valores medios
( ) 825,32 =XS
Entre conjuntos
( ) 3988,02
=XS
( )( )
59,92
2
==XS
XSF
Reactor 1 2 310,410,011,811,2
11,612,412,911,9
9,8010,910,410,1
Suma de conjunto 43,4 48,8 41,2Media 10,85 12,2 10,3
∑ = 61,1490/2 KSC
∑ = 96,1482/2 KX
55
Palacios C. Severo
∑ = 2,14922X
La tabla F para los GL establecido indica los valores de 4,26 y 8,02 respectivamente. Como el valor calculado es mayor que el valor tabulado, se concluye que los valores medios de los tres reactores son significativamente diferentes.
Logaritmo normal
La distribución logarítmica normal es de amplio uso en la física estadística, geología estadística, estadística económica, biología.
Logística
La función de distribución se diferencia un poco de la función normal de distribución, se utiliza en las investigaciones médico-biológicas para analizar la eficiencia de diferentes medicamentos, nutrientes, venenos, etc.
Pareto
La distribución de Pareto encuentra amplia aplicación en los problemas de la estadística económica.
Weibull-Gnedenko
Se usa con frecuencia en la teoría de fiabilidad para describir el tiempo de funcionamiento sin fallo de los instrumentos.Pearson
Se usa ampliamente en la estadística matemática para suavizar las distribuciones de los datos empíricos.
XIV. INTERVALOS DE CONFIANZA
El desarrollo del análisis estadístico implica la determinación teórica de la distribución de ciertos valores, como el valor medio, la desviación estándar y la varianza, que se puede esperar si sólo actúa al azar. La teoría estadística constituye una herramienta poderosa, para determinar, en un grado razonable de certidumbre, si las diferencias observadas son debidas al azar. Por definición:
Reordenando Intervalo de
56
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
confianza
Xn
Z +±= σµn
XZ/σµ−=±
Por lo tanto, para un cierto nivel de probabilidad que determina el valor de Z, puede afirmarse que el intervalo de confiabilidad de µ estará dado por,
n
ZX
n
ZX
σµσ +<<−
Si no se conoce la desviación estándar verdadera, aún puede determinarse un intervalo de confiabilidad. Esta estimación utiliza la distribución t en lugar de la distribución Z porque el concepto t incluye la variación adicional introducida por la estimación de la desviación estándar, reordenando:
( ) ( )n
XtSX
n
XtSX +<<− µ
Ejemplo 1.16Establecer el intervalo de confiabilidad para la media verdadera de los datos del ejemplo 1.10.
( )
6,4
78,2
54,4
4
99,0
95,0
===
=
t
t
XS
GL
Nivel Intervalo
%95 ( )( ) 68,8896,995/54,478,232,94 −+=± y
%99 ( )( ) 94,8465,1035/54,460,432,94 −+=± y
Se observa que para un nivel de confiabilidad del 95% será más correcto afirmar el resultado del análisis como ± 5,64 por ciento en lugar de 94,32%.
XV. MUESTREO
57
Palacios C. Severo
Nadie necesita beber todo un vaso de leche dañada para poder decir que esta mala - una muestra es suficiente.
Realizar un muestreo es más barato y más rápido que hacer un censo de toda una población. Y en la mayoría de los casos, desde luego, tomar una muestra es la única alternativa factible para la investigación simplemente no es práctico pensar siquiera en encuestas a toda la población. Pero si la muestra se desarrolla con propiedad, ésta puede proporcionar suficiente precisión para propósitos de toma de decisiones.
El muestreo en la investigación requiere estas dos dimensiones:
a) Seleccionar las unidades de la población que se incluirá en el estudio.b) Interpretar los resultados del estudio con el fin de estimar los parámetros de la población a partir de los datos de la muestra y probar hipótesis, usualmente sobre la diferencia entre dos muestras o entre una muestra y un resultado esperado.
XVI. MÉTODOS DE MUESTREO
Hay dos grandes métodos de muestreo: Probabilístico y no probabilístico.
a) Muestreo probabilístico
Este es el tipo de muestreo más objetivo y científico. Un requisito del muestreo probabilístico es que cada unidad en la población tenga una probabilidad igual y conocida a ser seleccionada para la muestra. El criterio de investigador no debe influir en la selección de los informantes. Hay varias formas de muestreo:Muestreo simple al azar
Es el tipo más básico. Implica seleccionar informantes completamente al azar; es tal como si los nombres se sacarán de un sombrero. Obviamente, esto requiere un marco de muestreo perfecto; es decir, una lista completa de todas las unidades en el universo.
Muestreo estratificado al azar
58
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Implica primero agrupar la población en segmentos homogéneos y luego hacer el muestreo de datos de cada segmento o estrato.
Muestreo de agregados
Implica tomar muestras de grupos de entrevistados como unidad y no como elemento individual. Con el fin de lograr eficiencia en entrevistas de muestreo a muestreo.
Muestreo sistemático
Se incluye cada n-ésimo elemento de la población en la muestra. Este es un procedimiento común que se puede combinar con un muestreo de agregados y muestreo estratificado.
La ventaja principal del muestreo probabilística es su precisión. Es el mejor camino para desarrollar una muestra que sea perfectamente representativa de la población. El muestreo probabilística tiene varias desventajas importantes que resulta su utilización amplia:
a) Para seleccionar una muestra probabilística es necesario tener una lista o un marco de muestreo, correspondiente a toda la población.b) A pesar de los mejores intentos de muestreo, los errores de no respuesta pueden afectar la precisión del resultado.c) El muestreo probabilística es muy costoso de realizar, es especial para estudios de muestra a muestra.
Errores
Si bien es cierto que buenos métodos de muestreo pueden producir resultados muy costosos, ninguna muestra es absolutamente precisa.
Ejemplo 1.17Supongamos que una muestra probabilística local indica que el 40% de los hogares entrevistados se tiene un gato para erradicar las ratas transmisoras del virus Hanta. Es poco probable que un censo de todos los hogares revele que exactamente en el 40% de ellos haya un gato. Si la muestra original fue bien tomada, bien ejecutada y fue suficientemente grande hay una buena probabilidad de que el número
59
Palacios C. Severo
real de hogares con gatos, revelado al censo esté cerca del 40%; pero probablemente no será exacta mente esa cifra.
Estos errores o diferencias entre los resultados de la encuesta y las cifras comparables de la población, viene de dos fuentes: factor de muestreo y factor no muéstrales.
Error de muestreo
En el ejemplo 1.17 sobre posesión de gatos es posible medir el error muestral del estudio y anexar un límite de confianza a la cifra de la encuesta, a fin de estimar los datos de la población total.
Supongamos que el estudio sobre la posesión de gatos ha utilizado una muestra probabilística de 1000 hogares. En este caso la cifra de 40 por ciento de poseedores de gatos tendría un intervalo de más o menos 3 por ciento a un nivel de confianza del 95 por ciento. En otras palabras las probabilidades son 95 en 100 de que el intervalo de confianza incluya el verdadero porcentaje de hogares que poseen gatos, en la población total.
Eso es el error de muestreo: el intervalo que debe anexarse a cualquier resultado de una encuesta, debido a que proviene de una muestra.
Las muestras grandes tienen menos errores de muestreo que las muestras pequeñas.
Error no muestral
La importancia y el impacto del error no muestral generalmente son sub-estimados por los investigadores, Entre los errores no muéstrales se pueden mencionar lo siguiente:
a) Incapacidad de localizar informantes correctos.b) Negativa de los informantes a empezar la investigación.c) Terminación de la encuesta por los informantes durante la investigación porque consideran que es muy larga, muy tediosa.d) Mentiras intencionales de los informantes. e)Mala memoria, suposiciones insesgadas.f) Mal entendimiento del procedimiento.g) Manipulación por parte del investigador.
60
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
h) Sesgos introducidos por el investigador.i) Errores de anotación.j) Errores de codificación.
Es decir, la precisión de los mejores métodos de muestreo probabilístico pueden anularse por algún problema de alguna de estás áreas. Sin embargo, el impacto de estos errores potenciales no muéstrales en mayor parte se pasa por alto en todo muestreo. Para solucionar los errores muéstrales, consiste básicamente en una planeación cuidadosa y una atención estrecha a los detalles de realización del proyecto.
Error en la predicción
En un diagrama de dispersión en el que no todos los puntos caen en la línea de regresión. Si todos los puntos hubiesen caído sobre la recta y si la cantidad de observaciones hubiera sido lo suficientemente grande, no se habría dado error en la predicción del proceso. La predicción perfecta es prácticamente inexistente. Aún en los casos que nos ocupa, existen factores que no son de predicción perfecta, quizás se deba a causas de imperceptibilidad en la composición de los factores.
Lo que necesita, entonces, es una medida que pudiera indicar hasta qué punto es precisa la predicción de Y, basada en X, o viceversa, cuán imprecisa podría ser. Esta medida se llama error de estimación.
( )( )2
2
−∑ −
=N
YYS
p
yx
Syx representa la desviación estándar de las Y sobre la base de las X.
Esta medida de error es similar a la desviación estándar que mide la dispersión alrededor de un promedio; el error de la estimación mide la dispersión alrededor de una línea promedio, llamada línea de regresión.
b) Muestreo no probabilístico
Existen tres tipos de muestreo no probabilística:Muestreo por conveniencia
61
Palacios C. Severo
Deja la selección de los informantes primordialmente a los investigadores.
Muestreo por criterio
Implica seleccionar únicamente cierto tipo de informantes para participar en el estudio.
Muestreo por cuotas
Se estructura la muestra de tal modo que incluya números específicos de informantes con características que se sabe o se cree que afecta al tema de la investigación.
XVII. TOMA DE DECISIONES
Los ejecutivos de muchas empresas están empezando a tomar en serio la importancia de las aproximaciones cuantitativas en la toma de decisiones.
Este es un cambio importante. Así probablemente no es por puro accidente que el tema esté ganando importancia en la gestión empresarial - investigación - consultoría.
El énfasis se debe a las herramientas estadísticas que reducen la incertidumbre de la toma de decisiones, con problemas que pueden ser parcialmente estructuradas.
Estas herramientas intentan ir más allá que simplemente proporcionen información del que tome la decisión. El fin es el de ayuda a que se pueda alcanzar una decisión reconociendo, por supuesto, el juicio profesional.
Los problemas que se ajustan bien a los sistemas de toma de decisiones son aquellas en las que existe suficiente estructuración de forma que las ayudas analíticas sean de gran utilidad requiriendo siempre el juicio del profesional.
Un aspecto muy importante de toma de decisiones es que se da la efectividad más que la eficiencia. Entonces hay que aumentar el número de posibles soluciones para que el ejecutivo pueda mejorar la efectividad de una decisión.
62
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
El informe sobre evaluación de los distintos resultados para la toma de decisiones como un punto clave para la implementación de los grupos de trabajo que han de compartir la información. Distinguiendo especialmente las tareas administrativas - gestión de calendario - planificación - agenda.
Principios de decisión
Cuando existe una situación en el cual se pueden distinguir dos o más alternativos, una decisión consiste en seleccionar una de estas alternativas de acción excluyente el otro a los otros.
Con esta definición podemos proceder a examinar el proceso completo de toma de decisiones, el cual puede concebirse integrando por las siguientes etapas:
a) Recolección de datos.b) Establecimiento de alternativas.c) Asignación de medidas de utilidad para cada alternativa en relación con algún criterio de efectividad.d) Decisión (selección de una alternativa).e) Aplicación de la alternativa.
Este proceso de complemento general, podría descomponerse en decisión de diseño y operativo y para dicho propósito, decisiones personales.
Ejemplo 1.18Consideremos un proceso de una persona que está próximo a salir de su casa, para ir al trabajo un día cualquiera de agosto y desea determinar si ponerse abrigo y, en tal caso cual de ellos.
Recolección de datos
Nuestro individuo se asoma a la ventana y observa que el sol brilla pero a través de nubes espesas. A través del noticiero de su televisor se informa que la temperatura actual es de 8°C y que se predice alcanzará un máximo de 12°C. La oficina metereológica menciona un 40% de probabilidad de lluvia.
63
Palacios C. Severo
Sabe que ira y volverá en movilidad al trabajo y que tendrá que caminar dos cuadras entre la ruta y su oficina. No tiene paraguas para protegerse.
Establecimiento de alternativa
La alternativa del individuo basado en su disponibilidad de vestuario:
a) Usar un sobre todo.b) Usar un impermeable, yc)No usar ningún abrigo.
Asignación de medidas con algún criterio de efectividad
El criterio de efectividad del individuo, será en este caso el de comodidad personal, que es una medida subjetiva. El determinará a continuación, de alguna manera intuitiva, la utilidad de su comodidad personal para cada alternativa.
Decisión (selección de la alternativa)
Supongamos que el individuo, en camino al trabajo, ha asignado medidas de utilidad para cada alternativa, de tal manera que una de ellas posee una utilidad mayor que cualquiera de las otras, la decisión o selección de una alternativa, se tomará en favor de aquella que tenga la mayor medida de utilidad.
Si dos alternativas tienen igual medida de utilidad y esta es mayor que la de la tercera, se deberá emplear entonces algún método aleatorio de selección. En este caso el lanzamiento de una moneda podría servir.
Ejecución de la alternativa escogida
En nuestro ejemplo la ejecución es sencilla. El hombre toma el abrigo escogido de su armario o simplemente se va al trabajo si ha decidido no llevar abrigo.
Visto de esta manera el proceso de decisión entramos ahora a establecer algún principio general de utilidad en el diseño de la estructura de las decisiones en un sistema Montecarlo. Alguno de estos
64
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
principios puede aparecer obvios o triviales, y sin embargo no violados con frecuencia en el diseño.XVIII. PRINCIPIOS PARA LA TOMA DE DECISIONES
1. Los datos son base necesaria para la decisión. Sin algún dato es imposible establecer alternativas o asignar medidas de utilidad a las mismas.2. Los datos recolectados deben ser de dos clases: aquellos que sirven para establecer las alternativas y los que se pueden usara para fijar las medidas de utilidad.3. Los datos recolectados deben se directamente aplicables o tales que, mediante una transformación, puedan hacerse aplicables para el criterio de efectividad que se usan.4. Suponiendo que se ha establecido alternativas y asignado medidas de efectividad, los datos adicionales serán útiles que afectan las utilidades asignadas.5. La recolección de datos deberá tomarse antes de establecer alternativas y averiguar utilidades. Aunque este principio parece obvio, realce la exigencia frecuentemente escuchada acerca de la oportuna recolección de datos.6. La exactitud que se requiera en los datos en función de las técnicas utilizadas parece asignar medidas de utilidad a las alternativas. Este principio refuerza el análisis de la sensibilidad de los modelos matemáticos. Sin un modelo dado es relativamente sensible a un parámetro dado, o si este parámetro es ponderado ligeramente, se disminuye la exigencia de exactitud.7. Asumiendo que, para una decisión determinada, las cinco etapas del proceso de decisión están bien definidas y que esta decisión es de naturaleza repetitiva, la totalidad del proceso de decisión puede delegarse a un nivel más bajo de la organización. Nótese que en cada uno de estos casos debe tomarse una decisión de diseño. Las alternativas son: Retorne al proceso de decisión o delegarlo a un sistema automático. AL tomar la decisión, el diseñador del sistema deberá asignar medidas de utilidad a las alternativas.
XIX. PLANIFICACIÓN
65
Palacios C. Severo
La planificación de una operación propone asegurar que todos los recursos necesarios para producir, se encuentran y en las cantidades necesarias y, además, que el desperdicio de los recursos sea mínimo.
El plan de operaciones suministra solo el marco general dentro del cual las actividades específicas habrán de desarrollarse. En torno al plan de operaciones asigna recursos disponibles a los diferentes requerimientos de producciones.
Tipos de planificación
Existen diferentes categorías de planeamiento para diferentes períodos:
Planificación a largo plazo
Se relaciona con el mantenimiento de la línea apropiada por medio de la investigación y desarrollo, y en el suministro de las factibilidades para las actividades. El plan incluye planeamiento para al expansión, modernización.
Planificación intermedia
Se relaciona con la asignación de recursos a las necesidades del proyecto, tales como la adquisición de materiales, equipos y nuevos productos.
Planificación a largo plazo
Establece programas que asignan recursos, a los proyectos actuales. Este tipo de plan, que usualmente cubre seis meses a dos años, establece el nivel general de actividades.
66
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Problemas
(81) Calcular los valores tα correspondientes a una distribución t de Student en los siguientes casos:a) El área a la derecha de tα es 0,20 y n = 10b) El área a la izquierda de tα es 0,40 y n = 8c) El área a la derecha de tα es 0,05 y n = 50
(82) Calcular los valores de Fα correspondientes a una distribución F de Snédecor en los casos siguientes:a) α = 0,01 y (2,8) grados de libertadb) α = 0,05 y (7,3) grados de libertad
(83) Elegidas 26 personas al azar de una población y sometidas a un test de modernismo dan como media 40=X y 6=S . Se quiere saber si la verdadera media de la población puede ser tan alta como 44.
(84) El fabricante de una dieta de adelgazamiento dice que su producto permite una reducción media de peso de 3,5 kg. Con objetivo de investigar su eficacia, se seleccionaron al azar 40 personas, observando en ellas el peso antes de aplicar la dieta, X y el peso después de acabar el tratamiento, Y, lo que proporcionó una varianza para la diferencia de
( ) ( )[ ]∑ =−−−= 40
1
23 8,139
1YXYXS iid
Si suponemos que tanto X como Y siguen distribuciones normales, determinar la probabilidad de que los individuos de la muestra haya una reducción media de masa de 3 kg.
(85) La efectividad en días de un determinado antibiótico, sigue una distribución normal de media 14 días y desviación típica desconocida. Fue administrada a 16 enfermos, obteniéndose una desviación típica muestral de 1,4 días. Determinar la probabilidad de que la efectividad media en la muestra no supere los 3 días, que es el tiempo mínimo de efectividad requerido.Preocupados por una posible subestimación de la varianza poblacional, que podría llevar a subestimar la probabilidad de
67
Palacios C. Severo
que no se alcance la efectividad mínima, se desea determinar la probabilidad de que con una muestra de 16 enfermos se subestime la varianza en más de un 20%. Si la muestra es de 61 pacientes, esta probabilidad ¿aumenta o disminuye?Determinar el tamaño de muestra necesario para que la probabilidad anterior sea 0,05.
(86) En una muestra de 19 individuos se observa que un determinado trastorno emocional se produce a partir de una edad media de 50 años y una desviación típica de 6 años. Se supone que estamos ante un fenómeno que sigue la ley normal.Fijar los límites del intervalo de confianza para la varianza con un nivel de confianza del 99%Realizar lo mismo que en el apartado anterior para n = 200
(87) En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan más a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar. Explicar qué procedimiento de selección sería más adecuado utilizar: muestreo con o sin reposición. Como los gustos cambian con la edad y se sabe que en el barrio viven 2500 niños, 7000 adultos y 500 ancianos, posteriormente se decide elegir la muestra anterior utilizando un muestreo estratificado. Determinar el tamaño muestral correspondiente a cada estrato.
(88) Sea la población de elementos 22 24 26Escriba todas las muestras posibles de tamaño dos, escogidas mediante muestreo aleatorio simple. Calcule la varianza de la población.
(89) La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribución normal de media 1,62 m y la desviación típica 0,12 m. Cuál es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1,60 m
(90) Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios:
95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.
Suponiendo que los precios de este producto se distribuyen según una ley normal de varianza 25 y media desconocida:¿Cuál es la distribución de la media muestral?
68
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Determine el intervalo de confianza, al 95%, para la media poblacional.
(91) La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria que sigue una distribución normal con varianza σ2 = 0,16 m2. Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la población. Cuál sería el mínimo tamaño muestral necesario para que pueda decirse que la verdadera media de las estaturas está a menos de 2 cm de la media muestral, con un nivel de confianza del 90%
(92) Las ventas mensuales de una tienda de electrodomésticos se distribuyen según una ley normal, con desviación típica US$ 900. En un estudio estadístico de las ventas realizadas en los últimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son US$ 4663 y US$ 5839. ¿Cuál ha sido la media de las ventas en estos nueve meses? ¿Cuál es el nivel de confianza para este intervalo?
(93) Se desea estimar la proporción, p, de individuos daltónicos de una población a través del porcentaje observado en una muestra aleatoria de individuos, de tamaño n. Si el porcentaje de individuos daltónicos en la muestra es igual al 30%, calcula el valor de n para que, con un nivel de confianza de 0,95, el error cometido en la estimación sea inferior al 3,1%. Si el tamaño de la muestra es de 64 individuos, y el porcentaje de individuos daltónicos en la muestra es del 35%, determina, usando un nivel de significación del 1%, el correspondiente intervalo de confianza para la proporción de daltónicos de la población.
(94) En una población una variable aleatoria sigue una ley normal de media desconocida y desviación típica 2. Observada una muestra de tamaño 400, tomada al azar, se ha obtenido una media muestra al igual a 50. Calcule un intervalo, con el 97 % de confianza, para la media de la población. Con el mismo nivel de confianza, ¿qué tamaño mínimo debe tener la muestra para qué la amplitud del intervalo que se obtenga sea, como máximo, 1?
69
Palacios C. Severo
(95) Una marca de nueces afirma que, como máximo, el 6% de las nueces están vacías. Se eligieron 300 nueces al azar y se detectaron 21 vacías.Con un nivel de significación del 1%, ¿se puede aceptar la afirmación de la marca? Si se mantiene el porcentaje muestral de nueces que están vacías y 1-α = 0,95, ¿qué tamaño muestral se necesitaría para estimar la proporción de nueces con un error menor del 1% por ciento?
(96) La duración de las bombillas de 100 W que fabrica una empresa sigue una distribución normal con una desviación típica de 120 horas de duración. Su vida media está garantizada durante un mínimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de significación de 0,01, ¿habría que rechazar el lote por no cumplir la garantía?
§2ANÁLISIS DE REGRESIÓN
La falacia del cuadro estadístico estriba en que es unilateral, en la medida en que representa sólo el aspecto promedio de la realidad y excluye el cuadro total. La concepción estadística del mundo es una mera abstracción, y es incluso falaz, en particular cuando atañe a la psicología del hombre.
Carl Jung
I. INTRODUCCIÓN
Las técnicas estadísticas estudiadas hasta ahora tenían por objeto fundamental la comprobación de ciertas hipótesis.
Un campo más útil e importante del análisis estadístico en el diseño consiste en el desarrollo de modelos matemáticos que representen situaciones físicas. Este tipo de análisis se denomina análisis de regresión, se ocupa de desarrollar una cierta relación matemática que incluye el modelo matemático, su significación estadística y su confiabilidad.
70
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Se puede demostrar que está íntimamente relacionada con el modelo del análisis de varianza.
II. MÉTODOS DE MÍNIMOS CUADRADOS
Se predice una variable dependiente en función de una variable independiente simple; en muchos problemas de este tipo la variable independiente se observa sin error o con error que es despreciable se compara con el error de la variable independiente.
Ejemplo 2.19Al medir la cantidad de óxido formado en la superficie de un menaje de aluminio, las variables de anodinado electrolítico suelen ser cantidades, pero la medición del espesor del óxido anodizado esta sujeto a variables aleatorias consideradas.
Así, a pesar que la variable independiente puede ser estable en X, las mediciones repetidas de ella pueden atribuirse a diversas causas, principalmente a errores de medición y a la existencia de otras variables incontrolables capaces de influir en el valor de X cuando este fija. En esta forma la medición del espesor de la capa anodizada pueden variar en toda la superficie para el mismo período a la misma variable ejecutada.
Estudiemos el caso de regresión Y sobre X lineal, esto es, para cualquier X dada la media de la distribución de las Y esta dada por:
εβα ++= XYε es el valor de una variable aleatorizada y podemos elegir a tal que la media de la distribución de esta variable aleatoria sea igual a cero.
Ejemplo 2.20Consideremos una regresión de Y sobre X sea lineal, suponiendo un fenómeno físico de tensores, se flexiona variando la carga.
X 1 2 3 4 5 6Y 35 64 96 124 156 182
71
Palacios C. Severo
X
Y
Consideremos n pares de observaciones (Xi,Yi), deseamos determinar la línea que de el mejor ajuste. Si predecimos y por medio de la ecuación:
ε++= bXbY o
Donde
iIi YY −=εPuesto que no podemos minimizar cada εi por separado, debemos tratar de hacer una sumatoria Σεi; tan cerca de cero como sea posible, minimicemos la suma de cuadrados de las εi.
( )[ ]2∑ +− ioi bXbY
Nótese en la figura, que la minimización de la suma de cuadrados de las distintas verticales a partir de los puntos respecto a la línea. Una condición necesaria para que exista un mínimo relativo es la acumulación de las derivadas parciales con respecto a bo y b.
( )[ ]( ) 02 =−∑ +− iioi XbXbY
( )[ ] ( ) 012 =−∑ +− ioi b XbY
Siendo las ecuaciones normales,
∑ ∑+=ioi
XbnbY1
72
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
∑ ∑+∑= 2
1 iiojiXbXbYX
Este conjunto de ecuaciones lineales con la incógnita bi denominados casos normales, da los valores para la línea con el mayor ajuste a un conjunto de datos.
Ejemplo 2.21Ajuste una línea recta a los datos por el método de mínimos cuadrados, utilice para estimar el coeficiente de evaporación de una gota de combustible, cuando la velocidad del aire proveniente de una turbina es de 190 cm/seg.
X 20 60 100 140 180 220 260 300 340 380Y 0,18 0,37 0,35 0,78 0,56 0,75 1,18 1,36 1,17 1,65
∑ = 2000X
∑ = 532000²X
∑ = 35,8Y
∑ = 4,2175XY
bb
bb
o
o
53200020004,2175
20001035,8
+=+=
Resolviendo
bo = 0,069, b = 0,0038
segmmY /²79,0)190(0038,0069,0 =+=
III. MODELOS DE REGRESIÓN
En las aplicaciones de la estadística se exige estimar el carácter de la dependencia entre las variables estadísticas observadas.
Ejemplo 2.22Entre los parámetros de los procesos tecnológicos, la producción acabada, la luminosidad de las estrellas y sus dimensiones, la cantidad de precipitación fluvial en sectores, el rendimiento de
73
Palacios C. Severo
cosecha, el engorde de ganado, la recuperación de material valioso de un mineral, la transformación de un producto, etc.
[ ]
[ ][ ]
bLogXbLogY
bXbLogY
XbXbXbbY
XbXbbY
XbXbXbbY
bXbY
XbXbbY
bLogXbY
XbXbXbbY
XbbY
bXbY
o
o
ijijijijiio
nniio
ijijiiiiiio
o
jio
o
ijijiiiiiio
iio
o
+=+=
∑ ∑+++=∑ +++=
∑+∑+∑+=
+=
++=+=
∑+∑+∑+=∑+=
+=
2
32
2
/1
.../1
/1
/1
En este caso, el problema fundamental consiste en el aislamiento de los datos experimentales con ayuda de curvas especialmente elegidas llamadas líneas o superficie de regresión que con mayor o menor seguridad caracteriza la dependencia de correlación entre las variables en observación.Las funciones más usadas en el análisis de regresión estadística son:
IV. MODELO DE REGRESIÓN LINEAL CON K VARIABLES
Generalizando el modelo de regresión lineal de dos y tres variables, el modelo de regresión de K-variables que tiene la variable dependiente Y y K- 1 variables independientes X1, X2, …, Xk, puede escribirse de siguiente manera.
ikkiio XbXbbY ε++++= −− 11...
Donde:
bo es el interceptobi a bk-1 son las pendientes, y
74
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
εi la perturbación
La regresión lineal se debe interpretar como ya se ha visto, nos proporciona la media o valor esperado de Y condicional a los valores fijos (en muestras repetidas) de X1, X2, ..., Xk-1 es decir E(Y/X1,X2, ..., Xk-
1)
V. REGRESIÓN LINEAL SIMPLE
Determina la relación entre una sola variable de regresión X y la respuesta Y. Usualmente se supone que la variable X es continua y controlada por el investigador. Si el experimento esta diseñado se eligen los valores X y se observan los valores correspondientes a Y.
El valor esperado de Y para cada valor de X es:
bXbXYE o +=)/(
En donde los parámetros de la recta bo son constantes desconocidas. Se supone que cada observación Y puede describirse mediante el modelo,
ε++= bXbY o
Donde ε es un error aleatorio con media cero y varianza δ2.
Los parámetros del modelo bo y b pueden estimarse mediante mínimos cuadrados si se tiene n pares de datos.Ejemplo 2.23El forjado de hierro a cierta temperatura afecta en la dureza del templado, para investigar esta relación se ha tomado las siguientes muestras:
X 6 9 11 13 22 26 28 33 35Y 68 67 65 53 44 40 37 34 32
75
Palacios C. Severo
89,48
33,20
7701
23232²
440
4665²
183
=
=
∑ =∑ =∑ =∑ =∑ =
Y
X
XY
Y
Y
X
X
Suma de cuadrados de los factores:
( )[ ] 118²1839/146658/12 =+=XS
( )[ ] 11,215²4409/1232328/12 =−=YS
Suma de cuadrados de los productos cruzados
( )[ ] 71,155)440(1839/177018/1 −=−=XY
S
( )[ ] 11,215²9/440232328/1 =−=YY
S
La pendiente es:
32,1118/71,1551
−=−=b
En el origen:
89,48==Ybo
( )XXbYY i −=−
( )33,2032,189,48 −−=− XY
XY 23,173,75 −=La prueba de significancía de regresión de los datos, es:
Tabla 2,5 Análisis de varianzaFuente SC GL CM Fo Ft(99%
76
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
)RegresiónError
205,539,58
17
205,531,3688
150,153 > 12,2
Total 215,11 8 R² = 95,54%
VI. REGRESIÓN LINEAL MÚLTIPLE
Muchos problemas de regresión en la vida real son con más de dos variables.
El problema general se ajusta al modelo lineal,
kko XbXbXbbY ++++= ...2211
Se conoce como regresión lineal múltiple.El método de mínimos cuadrados se usa para estimar los coeficientes de regresión, las ecuaciones normales en el método son:
∑=∑+∑+∑+∑∑=∑+∑+∑+∑∑=∑+∑+∑+∑∑=∑+∑+∑+
YXbXbXXbXXbX
YXbXXbXbXXbX
YXbXXbXXbXbX
YbXbXbXNb
o
o
o
o
33232321313
23322221212
133122112
11
332211
Ejemplo 2.24Determine la función múltiple de la relación entre dos factores X1 y Xz
a partir de los siguientes datos:
1X2X Y 21X 2
2X 21 XX YX1 YX 2
47912
1258
7121720
164981
144
14
2564
4144546
2884153240
72485
16032 16 56 290 94 159 505 276
81 =X 42 =X 14=Y
Ecuación normal
2769415916
50515929032
5616324
21
21
21
=++=++=++
bbb
bbb
bbb
o
o
o
77
Palacios C. Severo
Resolviendo la determinante obtenemos los coeficientes:bo = 0,6440b1 = 1,6610b2 = 0,0169
Resultando el modelo lineal múltiple
21 0160,0661,1644,0 XXY ++=
El procedimiento para el análisis de varianza es:
Tabla 2.6 Análisis de varianzaFuente SC GL CM Fo Ft(95%
)RegresiónError
95,5562,444
21
47,778
2,444
19,55 > 19
Total 98,000
3 R² = 97,51%
Se concluye que al menos una variable afecta significativamente a la regresión.
Tabla 2.7 Análisis de varianzaFuente SC GL CM Fo Ft(95%
)Regresiónbo
b1
b2
Error
95,556784,00
011,0360,0012,444
21111
47,778784,00
011,0360,0012,444
19,55320,7
84,52<1
>><
19161161
Total 894,007
6
VII. REGRESIÓN POLlNOMIAL
La aplicación práctica de la regresión polinomial tiene un objeto esencial el incremento de los grados de alisamiento que exige realizar de nuevo todos los cálculos.
En este caso es útil emplear los polinomios ortogonales en el modelo:
∑++∑+∑+= ijijijijiio XbXbXbbY 2
78
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Aplicando el criterio de mínimos cuadrados, igualando a cero las derivadas parciales de Y con respecto a los coeficientes bo, b1,.. .,b12, reacomodando algunos términos, se tiene las k+1 ecuaciones normales.
Resolviendo el sistema, por cualquier método, se obtiene bo, b1, b2,..., b12 que son los estimadores mínimos cuadrados que nos permiten estimar Y a partir de la ecuación matriz.
∑ ∑=∑ ∑+∑ ∑+∑ ∑+∑ ∑+∑ ∑+∑ ∑
∑=∑ ∑+∑+∑ ∑+∑+∑ ∑+∑
∑=∑ ∑+∑ ∑+∑+∑ ∑+∑+∑
∑=∑ ∑+∑+∑ ∑+∑+∑ ∑+∑
∑=∑ ∑+∑ ∑+∑+∑ ∑+∑+∑
∑=∑+∑+∑+∑+∑+
YXXXXbXXbXXbXXbXXbbXX
YXXXbXbXXbXbXXbbX
YXXXbXXbXbXXbXbbX
YXXXbXbXXbXbXXbbX
YXXXbXXbXbXXbXbbX
YXXbXbXbXbXbNb
o
o
o
o
o
o
2122
2112
321222
3111
22122
21121
22
32112
4222
22
2111
322
2211
22
212
3112
22
2122
41112
212
311
21
222112
32222
2111
2222112
122
11222122
3111212
2111
21122222
21112211
Las pruebas estadísticas son las mismas que para los casos de regresión múltiple con sólo dos cambios en los grados de libertad, en lugar de un F con (r-2, n-r) grados de libertad tendremos una F con (r-k-1, n-r) grados de libertad, donde k es el grado del polinomio que se ajusta.
VIII. REGRESIÓN POLINOMIAL CUADRÁTICO
Un polinomio de grado k en una variables
∑+∑+∑+= ijijiiiiiio XbXbXbbY 2
que se aplica para estimar los efectos polinomiales de un factor cuantitativo.
Ejemplo 2.25Ajustar los siguientes datos a un polinomio de segundo orden restando mil al factor X y 23,2 al factor Y, para facilitar los calculas:
X 850
860
870 890
890 900 910 920 930 940 950
Y 0 8,2 16,6
27 39,7
52,8
68,6
82,5
99,6
108,5 128,5
desarrollando un artificio matemático para X, siendo
79
Palacios C. Severo
[ ] 10/9001 −= XX
X1 -5 -4 -3 -2 -1 0 1 2 3 4 5Y 0 8,2 16,
627 39,
752,8
68,6
82,5
99,6
108,5
128,5
∑ = 0X
∑ =1102X
∑ = 8,1429XY
92092∑ =YX
∑ = 8,886Y
92901958011
8,14290110
8,886110011
21
21
21
=++=++=++
bbb
bbb
bbb
o
o
o
resultando los coeficientes
bo = 76,64b1 = 13b2 = 0,3974
el modelo polinomial de segundo orden es:
²3974,01664,76 XXY ++=
reemplazando con el valor original
²003474,08,1378,11952 XXY +−=
IX. REGRESIÓN NO LINEAL
Es una práctica común de la ingeniería bosquejar parejas de datos sobre varias clases de hojas para graficar, con el fin de determinar si para una escala de transformación adecuada, los puntos caerán cerca de una línea recta. De ser así el tipo de transformación nos lleva a una forma funcional de la ecuación de regresión y las constantes
80
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
necesarias pueden determinarse aplicando el método de mínimos cuadrados a los datos transformados. Sí un conjunto de datos que consta de n puntos se linealiza cuando son graficados sobre el papel semi logarítmico indica que la curva de regresión es exponencial para cualquier X considerada, la medida de la distribución de las Y está dada por αβX, entonces la ecuación predictiva será:
βα XLogLogLogY +=
Ejemplo 2.26Una fabrica de llantas decide analizar una variedad de sus productos para saber cuanto tiempo se puede usar después de un recorrido estándar.
Recorrido 1 2 5 10 20 30 40 50Porcentaje 98,2 91,7 81,3 64 36,4 32,8 17,7 11,3
ΣX = 158ΣX² = 5530ΣLog Y = 130312ΣXLog Y = 2121224
LogbLogb
LogbLogb
o
o
55301582121224
1588130312
+=+=
cuya solución es
XLogY 0188,0002,2 −=
en forma exponencial: XY )96,0(100=
X. COEFICIENTE DE CORRELACIÓN MÚLTIPLE R2
En el caso de dos variables se define R2 como la bondad de ajuste de la ecuación de regresión; es decir, nos da la proporción o porcentaje de variación total en la variable dependiente Y explicada por las variables independiente X.
Este sentido de R2 puede fácilmente extenderse a modelos de regresión de más de dos variables. Por consiguiente, en el modelo de tres variables estamos interesados en conocer la proposición de las variables en Y explicada conjuntamente con las variables X1 y X2. El valor que nos da esta información se conoce como el coeficiente de
81
Palacios C. Severo
correlación múltiple y se denota por R2, conceptualmente es igual que R2.
La suma total de cuadrados es igual a la suma de cuadrados de las dependientes más la suma de cuadrados residuales. Por definición.
totalerror SCSCR /² =
Dado que los valores de la ecuación son generalmente computados en forma rutinaria, R2 puede calcularse fácilmente. Note que R2 esta comprendido entre 0 y 1. Si es uno, significa que la línea de regresión ajustada explica el ciento por ciento de la variación de Y. De otro lado, si es cero, el modelo no explica nada de la variación en Y. Típicamente, sin embargo, R2 esta entre estos valores extremos.
Se dice que el ajuste del modelo es mejor mientras más cerca de uno está R2.
XI. PRUEBAS DE SIGNIFICANCIA
No podemos utilizar la prueba t para verificar la hipótesis conjunta según la cual las pendientes de las distintas variables son simultáneamente cero. Sin embargo esta hipótesis conjunta puede verificarse mediante la técnica de ANAVA y puede demostrarse del modo siguiente.
Recordemos la identidad (ver el libro Manual de la Teoría del Diseño Experimental publcado por el Autor).
SCtotal tiene como es costumbre N-1 grados de libertad.
SCresidua tiene N-3 grados de libertad por motivos ya conocidos ySCerror tiene 2 grados de libertad en razón de que es función de b1 y b2.
Por lo tanto, siguiendo el procedimiento ANAVA, podemos elaborar las tablas.
( )[ ] )3/(/2/ 22211 −∑∑ ∑+= NXYbXYbF iiiii ε
Tabla 2.8 Cálculo de análisis de varianzaFuente SC GL CM Fo
82
residualerrortotal SCSCSC +=
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
RegresiónError ∑ ∑+ iXYbXYb i 222111
∑ 2iε
23−N
GLSC / ( ) 2// σGLSC
Total ∑ 2iY 1−N
R² =
∑ ∑+ iXYbXYb i 222111
/ ∑ 2iY
Puede demostrarse ahora que bajo el supuesto de que los εi
distribuidos normalmente y de que la hipótesis nula b1=b2=0, la variable.
La aplicación práctica de la regresión tiene por objeto esencial el incremento de los grados del modelo, el alizamiento exige realizar calculas precisos.
Para estimar los parámetros:
1312221121,...,,...,,,...,,,, bbbbbbbY
o
Para obtener los coeficientes aplicamos las matrices aquí detalladas,
FUNCIÓN MATEMÁTICA: DISEÑO FACTORIAL 22
Y oX1X 2X 2
1X 22X 21 XX YX 1 YX 2
Y1
Y2
Y3
Y4
1111
-+-+
--++
1111
1111
+--+
-+-+
--++
∑Y 4 4 4 YX∑ 1 YX∑ 2
∑=∑+∑+∑∑=∑+∑+∑∑=∑+∑+
YXXbXXbbX
YXXXbXbbX
YXbXbNb
o
o
o
2
2
222112
1212
2
111
2211
Ejemplo 2.27Evalué los datos
4bo = 300 bo = 754b1 = 30 b1 = 7,74b2 = 10 b2 = 2,5
Y X1Y X2Y6580
- 65+ 80
- 65- 80
83
Palacios C. Severo
7085
- 70+85
+ 70+ 85
Σ 300 Σ 30 Σ 10
Resultando el modelo
( ) ( ) 18,116/4,1532,1010...4,93,9 22222 =−++++=totalSC
FUNCIÓN MATEMÁTICA: DISEÑO FACTORIAL 23
Y oX1X 2X 3X 2
1X 22X 2
3X YX 1 YX 2 YX 3
Y1
Y2
Y3
Y4
Y5
Y6
Y7
Y8
11111111
-+-+-+-+
--++--++
----++++
11111111
11111111
11111111
-+-+-+-+
----++++
----++++
∑Y8 8 8 8 YX∑ 1 YX∑2YX∑ 3
∑=∑+∑+∑+∑∑=∑+∑+∑+∑∑=∑+∑+∑+∑∑=∑+∑+∑+
YXXbXXbXXbbX
YXXXbXbXXbbX
YXXXbXXbXbbX
YXbXbXbNb
o
o
o
o
3
2
333223113
2323
2
222112
1313212
2
111
332211
Ejemplo 2.28Evalué los datos
8bo = 548,74 bo = 68,598b1 = - 0,86 b1 = - 0,118b2 = 4,24 b2 = 0,538b3 = - 2,48 b3 = - 0,31
Y X1Y X2Y X3Y68,7269,0669,4467,7567,9368,7368,7268,39
Σ 548,74
- 0,86 4,24 - 2,48
el modelo es:
32131,053,011,059,68 XXXY −+−=
84
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
FUNCIÓN MATEMÁTICA: DISEÑO HEXAGONAL
Y oX1X 2X 2
1X 22X 4
1X 42X 2
22
1 XX YX 21 YX 2
2YX 1 YX 2 YXX 21
Y1
Y2
Y3
Y4
Y5
Y6
Y7
Y8
Y9
111111111
∑Y9 0 0 3 2,9 2,3 2,3 0,75 Σ Σ Σ Σ Σ
Para mayor detalle ver el tópico de Diseño Hexagonal.
FUNCIÓN MATEMÁTICA: DISEÑO COMPUESTO CENTRADODE DOS FACTORES
Y oX1X 2X 2
1X 22X YX 2
1 YX 22
YX 1 YX 2 YXX 21
Y1
Y2
Y3
Y4
Y5
Y6
Y7
Y8
Y9
Y10
Y11
Y12
Y13
1111111111111
∑Y13 0 0 8 8 Σ Σ Σ Σ Σ
Problemas
(97) Se dan los datos correspondientes al tiempo de secado de cierto barniz y a un aditivo que reduce el tiempo de secado, al aplicarlo sobre un producto que es novedoso.Barniz 0 1 2 3 4 5 6 7 8Secad
o12 10,
510 8 7 8 7,5 8,5 9
(98) Se realiza un tratamiento a un cierto tipo de aleación, requiriendo cierta fuerza de ruptura, dicho producto es una pieza como parte de un componente de autopartes.
Fuerza 38 48 85 59 40 60 68 53
85
Palacios C. Severo
Aleación 1 2 3 4 1 2 3 4Fuerza 31 35 42 59 18 34 29 42Aleación 1 2 3 4 1 2 3 4
(99) Los datos corresponden al tiempo que tardan diez técnicos en ensamblar computadoras por las mañanas, los cuales trabajan 8 horas como jornada laboral.
Tiempo 11,1 10,3 12,0 15,1 13,7 18,5 17,3 14,2 14,8 15,3Maquina 10,9 14,2 13,8 21,5 13,2 21,1 16,4 19,3 17,9 19,0
(100) Al problema (98) adicione otra aleación siendo los datos:Aleación 5 5 5 5 10 10 10 10Aleación 15 15 15 15 20 20 20 20
(101) Al problema (99) adicione los datos de trabajo en la tardeTarde 9,6 15,1 12,6 24,5 12,8 22,1 15,6 21,6 16,9 20,6
(102) Un gerente de ventas tiene la responsabilidad de seleccionar nuevos vendedores.Con el fin de lograr una mejor selección posible de un grupo de aspirantes, diseño un test. Su objeto era predecir el volumen de ventas de un individuo sobre la base del puntaje. Sin embargo para determinar si existía alguna relación entre su test y las ventas pidió a varios vendedores antiguos que se sometieran al test. En la tabla se registran los puntajes de sus respectivos test y sus ventas semanales.
Vendedor Test Venta semanalNatanielAlbertoHugoEmilioCarlos
34234
57464
a) Cuál es la variable dependienteb) Represente gráficamente con las variables independientes y
dependientes.c) Determine la ecuación de la recta.d) Si Nataniel es un aspirante al puesto a vendedor. Obtuvo 3
puntos en el test, sobre la base de la ecuación de regresión. ¿Cuál será la cifra de sus ventas semanales medias según pronóstico?
e) Obtenga el coeficiente de correlación e interprete.(103) Supongamos que una ecuación de regresión múltiple es:
EDCBAY 7,047,314,218,2106,018,16 +++++= Qué significa el coeficiente 3,47
Qué significa cada uno de los coeficientes de los factoresQué significa 16,18 en la ecuación de regresión
86
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Si todos los factores se hacen cero cual es el valor inicial con que se empieza el desarrollo de la ecuación de regresión.
(104) Interprete un coeficiente de correlación igual a 0,99 0,98 0,88 0,79 0,67 0,56 0,45 -0,89 -0,78 -0,06
§3PRINCIPIOS DE DISEÑO
EXPERIMENTAL
87
Palacios C. Severo
(...) Demostrar que la realidad nos pasa delante de los ojos como un relato, en el que hay diálogos, enfermedades, amores, además de estadísticas y discursos.
Tom Wolfe
I. INTRODUCCIÓN
Diseñar estadísticamente un experimento, es realizar una prueba o una serie de pruebas, buscando caracterizar las variables o factores de mayor influencia en un ensayo de interés, evaluado a través de varias variables respuesta tal que, si deliberada o sistemáticamente se introducen cambios controlados en algunas de las variables explicativas del proceso, siempre sea posible observar o cuantificar los cambios que éstos generan en las variables respuesta buscando adicionalmente, minimizar el efecto de las variables no controlables, procurando con ello estabilizar y minimizar la variabilidad de las respuestas.
Aunque la aplicación o uso del diseño experimental se da en cualquier área del conocimiento, este debe cumplir las siguientes fases:
1. Caracterización de un proceso. En esta fase, se busca determinar los rangos de las variables o factores controlables de mayor influencia en las variables respuesta que a la vez minimizan el efecto de las variables no controlables (factores o variables).
2. Depuración y optimización de un proceso ya caracterizado. En esta fase se hallan los niveles de los factores estudiados que proporcionan la respuesta óptima a la solución del proceso caracterizado en la fase anterior.
En cualquier aplicación de la estadística en el diseño y análisis de un experimento, es necesario que quienes lo desarrollen entiendan claramente el problema objeto de estudio, que posean un amplio conocimiento del material experimental a usar, que conozcan las posibilidades existentes para procesar los datos y además posean el conocimiento estadístico necesario para interpretar adecuadamente los resultados del experimento.
II. TIPOS DE EXPERIMENTOS
Se clasificó los experimentos como pertenecientes a dos tipos.
88
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
a) El experimento absoluto en el cual el interés principal es la estimación y las propiedades físicas de la población a ser estudiada. Estas propiedades se esperan que sean constantes, de acá el término absoluto. En estos experimentos un factor singular es estudiado frecuentemente para examinar un número reducido de niveles de un factor. La selección de los tratamientos se hace generalmente mediante procesos aleatorios, por tanto, si el experimento puede ser repetido, el mismo grupo de tratamientos no necesariamente será utilizado.Por esta razón, el tratamiento es considerado una variable aleatoria y el modelo señalado es un modelo de efectos aleatorios o Modelo II, bajo el cual se detectan y estiman componentes de variación asociada a una población compuesta.b) El experimento comparativo. Frecuentemente cuando se estudia un grupo de tratamientos, los resultados absolutos varían erráticamente mientras que los resultados relativos permanecen razonablemente estables. En tales situaciones es posible establecer, que en circunstancias similares se espera que ciertos tratamientos sean sustancialmente mejores que otros. En tales campos de la experimentación, los experimentos tienden a ser comparativos y tienen un interés secundario dado por los resultados absolutos. La teoría estadística del diseño de experimentos se relaciona inicialmente con este tipo de experimentos.
Los experimentos comparativos son básicamente experimentos en los cuales los tratamientos se comparan por sus efectos medios sobre una variable respuesta con el objeto principal de determinar cuál de ellos es mejor en algún sentido. El propósito de este tipo de experimento es proveer información necesaria para tomar decisiones administrativas satisfactorias. La principal característica de este tipo de experimentación es que todos los tratamientos de interés están incluidos en el experimento. Consecuentemente, la estructura matemática básica es el modelo de efectos fijos ya que bajo experimentos repetidos se seleccionarían los mismos tratamientos. En este caso, es de interés la detección y estimación de relaciones constantes entre las medias del universo de objetos considerados, Para estos modelos, el interés primordial es probar varias hipótesis relacionadas con las medias de los tratamientos.
89
Palacios C. Severo
El experimento comparativo comienza con un planteamiento exacto del problema a ser resuelto. Esto es, se debe hacer una especificación detallada de los objetivos del experimento con una formulación precisa de la hipótesis a probar.
Es insuficiente solamente establecer en forma simple comparar estos tratamientos. Esta especificación define la población a la cual las conclusiones serán aplicadas, determina los factores, tratamientos y sus niveles, especifica las variables respuesta a ser medidas y establece las diferencias críticas a ser detectadas. Sin estas especificaciones, ningún experimento podrá ser diseñado adecuadamente.
Como lo fundamental en la decisión sobre las hipótesis son los experimentos planeados, es necesario que se tenga en cuenta las siguientes características generales para estos ensayos.
1. Simplicidad: Acá se debe tener en cuenta que tanto la selección de los tratamientos como la disposición experimental deberá hacerse lo más simple posible.2. Grado de precisión: El experimento deberá tener la capacidad de medir diferencias entre tratamientos con los grados de precisión que desee el investigador. Para cumplir con este propósito se deberá tener entonces un diseño apropiado y un número de repeticiones adecuado.3. Ausencia de error sistemático: Se debe planear un experimento con el propósito de asegurar que las unidades experimentales que reciban un tratamiento no difieran sistemáticamente de aquellas que reciben otro, procurando de esta manera obtener una estimación insesgada del efecto de tratamientos.4. Rango de validez de las conclusiones: Las conclusiones deberán tener un rango de validez tan amplio como sea posible. Los experimentos que contribuyen a aumentar éste rango son los experimentos replicados y los experimentos con estructuras factoriales.5. Cálculo del grado de incertidumbre: En todo experimento existe algún grado de incertidumbre en cuanto a la validación de las conclusiones. El experimento deberá ser concebido de modo que sea posible calcular la posibilidad de obtener los resultados observados debidos únicamente al azar.
90
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
III. UNIDADES EXPERIMENTALES Y MUÉSTRALES
El elemento básico en los experimentos comparativos es la unidad experimental. Este concepto se usará en la siguiente definición.
Los elementos sobre los cuales se hacen las mediciones y a los cuales un tratamiento puede ser asignado independientemente se denomina unidad experimental y al conjunto de unidades experimentales se les denomina material experimental. Cada unidad experimental contiene una o más unidades muéstrales en las cuales las condiciones experimentales planeadas previamente se realizan.
Ejemplo 3.29a) En un experimento agrícola para evaluar el rendimiento de algunas variedades de olivo, la unidad experimental puede ser una porción de terreno de tamaño óptimo preestablecido, usualmente denominada parcela, o un número de plantas o un número de mazorcas.b) En un estudio farmacéutico, un paciente sometido a un tratamiento de un fármaco puede ser considerado como una unidad experimental.c) En un trabajo de plaguicida la unidad experimental puede ser un insecto, una colonia o toda una especie. En general la definición de la unidad experimental depende de los objetivos de la investigación.
Por definición, las unidades experimentales deben estar en capacidad de recibir diferentes tratamientos.
En la conducción del experimento existen dos grupos de variables.
1) Las variables respuestas que proporcionan las mediciones del experimento, las cuales varían debido a la diversidad presente entre las unidades experimentales.2) Las variables explicativas que influyen en las respuestas y que se denominan factores. Entre estos existen los denominados factores de clasificación que según sus valores definen los niveles de clasificación sobre los cuales se hace la inferencia.
Por su naturaleza las unidades muéstrales de la misma unidad experimental deben recibir el mismo tratamiento, consecuentemente
91
Palacios C. Severo
la asignación del tratamiento a estas unidades muéstrales no es independiente.Esta distinción es importante dado que para hacer inferencia sobre los efectos del tratamiento, se requiere tener un conocimiento de la estimación de la variabilidad inherente al material experimental, esta variabilidad es conocida como el error experimental. Esta estimación es dada por la variación entre unidades idénticamente tratadas las cuales inicialmente pudieron haber sido tratadas de manera distinta. Solo la unidad experimental considerada como un todo satisface este requisito. La variación entre las unidades experimentales provee una estimación del error experimental. En general, la variación entre unidades muéstrales dentro de las unidades experimentales es un valor muy pequeño al calcular los errores de estimación de los efectos del tratamiento.
IV. FUENTES DE VARIACIÓN
Los tratamientos se asignan a las unidades experimentales para determinar si tienen un efecto sobre la respuesta de interés. Cualquier efecto podrá resultar en diferencias sistemáticas de respuesta entre unidades experimentales. Será obvio que para detectar estas diferencias, las unidades experimentales deberán ser lo más homogéneas posibles; esto es, que la variación entre unidades experimentales uniformemente tratadas va a ser menor en relación con las diferencias de tratamiento. Si esto no ocurre, la variación de las unidades experimentales pueden resultar en un fracaso para encontrar diferencias de tratamientos; los cuales van a ser importantes para la investigación.
Desafortunadamente, las unidades experimentales generalmente no serán homogéneas porque, ellas poseen diferentes propiedades físicas inherentes para una o más características. Frecuentemente detrás del control del experimentador, estos factores inherentes causan diferencias sistemáticas entre las unidades experimentales creando fuentes de variación no deseadas. Estas fuentes son de escaso interés práctico y no están relacionadas con el estudio. Por esta razón, se conocen como fuentes extrañas de variación. No es necesariamente cierta que todas estas fuentes de variación sean conocidas por el experimentador. Sabemos que estos factores pueden ser usados para clasificar las unidades experimentales en subgrupos más homogéneos, aunque también son conocidos como factores de clasificación, hasta tanto ellos sean de interés para el experimentador.
92
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Mientras el error experimental es una variación aleatoria, no toda variación aleatoria es error experimental.
La variación entre unidades muéstrales dentro de las unidades experimentales es también una variación aleatoria, pero, no debe dársele mucho valor al juzgar los efectos de los tratamientos. Los tratamientos son parte de la estructura de la unidad experimental y hay una diferencia básica entre la clasificación y los factores de tratamiento. Los factores de clasificación son propiedades inherentes a la unidad experimental y solo raramente pueden ser cambiados por el experimentador.
Cada combinación específica de niveles de factores se denomina tratamiento.
Ejemplo 3.30Se planea un experimento para evaluar el rendimiento de un tubérculo en función del tipo de variedad V1, V2 y V3 y los nutrientes N y P a los niveles (10; 30) y (20; 40) respectivamente. Los posibles 12 tratamientos VNP son:
)40,30,(
)40,10,(
)40,30,(
)40,10,(
)40,30,(
)40,10,()20,30,()20,30,()20,30,(
)20,10,()20,10,()20,10,(
3
3
2
2
1
1
321
321
V
V
V
V
V
VVVV
VVV
El concepto de tratamiento implica que:
1. Cualquier unidad experimental esta en capacidad de recibir cualquier tratamiento.
2. La asignación de tratamientos a la unidad experimental esta bajo el control del experimentador.
Bajo esta definición, en un experimento que compare medicamentos por ejemplo, el género nunca podrá ser considerado como un factor (tratamiento). El género de un sujeto particular es una propiedad intrínseca del sujeto que no podrá ser asignado al experimentador. Los medicamentos, sin embargo, constituyen un tratamiento dado que a cada sujeto incluido en el estudio (unidad experimental) se le puede asignar un medicamento.
93
Palacios C. Severo
La distinción entre tratamiento y factores de clasificación no es absoluta. Estos tratamientos serán aplicados a muestras de madera con superficies ásperas o suaves. La superficie de madera no representa un factor tratamiento a menos que el experimentador pueda especificar los tipos de superficies de las piezas. Así, si el experimentador tiene una oferta de pedazos ásperos de madera y puede decidir cuales son suaves, entonces el tipo de superficie será un factor tratamiento. Si el tipo de superficie es una propiedad intrínseca de las especies maderables elegidas, entonces será un factor de clasificación.
Como afirman Cochran y Cox (1957), los tratamientos deben tener las siguientes particularidades:
1. Presentar la finalidad, es decir si pretende simplemente mostrar al ganador entre los diferentes tratamientos o si además se desean encontrar indicios acerca del comportamiento de los tratamientos. Un caso particular, es el ensayo con un fertilizante compuesto de dos sustancias A y B principalmente. El resultado no muestra si la efectividad del fertilizante se debe a alguno de los dos componentes o a los dos conjuntamente. Será necesario un experimento más extenso, con tratamientos adicionales que den luces sobre éste hecho. Si el propósito es encontrar el mejor de los tratamientos prácticos, entonces ciertos tratamientos pueden omitirse por su no practicidad.
2. La respuesta en algunos casos, puede deberse a las condiciones bajo las cuales se aplica un tratamiento dependiendo del medio circundante a este, tal vez habrá un favorecimiento en su efecto sobre las unidades experimentales. Esta situación es muy frecuente en trabajos con sustancias químicas aplicadas sobre suelos, en los que su efecto sobre las plantas se ve comprometido con los componentes del terreno, o de las plantas mismas. Luego debe decirse si habrá controles sobre el terreno, por ejemplo homogenizando el suelo mediante la aplicación de estos componentes en cantidades considerables (estas decisiones se toman previo un análisis de suelos). No se debe perder de vista la población sobre la cual se desea hacer inferencia, porque un procedimiento como el descrito, tal vez cambie la población objetivo.
3. Los tratamientos propuestos, generalmente no son los que en la práctica se prueban. Por desconocimiento, por descuido,
94
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
por materiales, instrumentos, etc., se obtienen tratamientos diferentes a los de interés. Un caso muy común es cuando un tratamiento está definido para ser aplicado de una forma específica y resulta aplicándose de otra; por ejemplo una sustancia para controlar plagas, la cantidad aplicada puede ser alterada, o el momento de su aplicación puede ser diferente. Aquí, de una parte se ha modificado la dosis, y de otra, el tiempo hace que los animales a controlar estén posiblemente en una etapa de su desarrollo diferente a la prevista. Siendo extremistas, se puede afirmar que la mayoría de los tratamientos en el acto no corresponden a la definición original; por más cuidado que se tenga en mantener una cámara de muchas temperaturas, se procura naturalmente, que estas estén muy cerca de 20oC durante el ensayo, por ejemplo.
4. En muchos experimentos se presenta la necesidad de un tratamiento testigo o control. Este término se refiere a un tratamiento en el que no se tiene un interés particular, pero puede servir de comparación para revelar si los demás tratamientos son efectivos. Se recomienda la inclusión de un testigo cuando las condiciones físicas, químicas, ambientales, etc., donde se apliquen los tratamientos enmascaran la relevancia de éstos; por ejemplo, el caso donde la fertilidad de un terreno sea muy alta tenderá a esconder el efecto del nutriente adicional. Otras situaciones se presentan en animales, en los cuales sus rasgos genéticos, condiciones fisiológicas o morfológicas, no revelarán claramente la efectividad de las dietas en la ganancia de peso. Otra justificación para la consideración de un testigo suele ser cuando existe un desconocimiento muy alto acerca de la efectividad de los tratamientos objetos de estudio.
V. CONTROL DE LA VARIACIÓN DEL NO TRATAMIENTO
Para hacer valida la comparación entre tratamientos, se deben separar los efectos de fuentes extrañas de variación de los efectos de tratamientos y de la estimación del error experimental. Si esto no se puede hacer, se obtendrán estimaciones sesgadas tanto de las diferencias de tratamientos como del error experimental.
Lo que se necesita son métodos a través de los cuales la variación debida a fuentes distintas a los tratamientos sea controlada, de tal
95
Palacios C. Severo
forma que los efectos de tratamiento puedan ser estimados en forma segura y adecuada. Los métodos que hacen esta distinción, están referenciados en forma conjunta como control del error.
El objetivo principal de estos métodos, es obtener un estimador insesgado del error experimental resultante de mejorar la precisión asociada con la estimación de diferencias de tratamiento. Estos métodos pueden ser técnicos (experimentales) o estadísticos.
Los métodos técnicos son aquellos impuestos por el experimentador.Selección de más unidades experimentales homogéneas. Esto incluye hacer condiciones ambientales más uniformes para mantener las variables potenciales constantes. El criterio para la selección del material deberá ser el de obtener el máximo beneficio con unos recursos dados (generalmente escasos). Sin embargo, el experimentador esta limitado a la disponibilidad de material con el cual debe realizar el estudio, aunque tenga pocas alternativas de elección en la unidad experimental a ser usada. Consecuentemente, el uso de más unidades experimentales homogéneas no siempre es posible. Las unidades experimentales deben ser lo más representativas de la población para la cual el experimento va a sacar conclusiones.
Por esta razón, controlando experimentalmente algunos factores extraños y manteniéndolos constantes en algún valor específico puede seriamente limitar la aplicabilidad de los resultados experimentales.
La técnica experimental es responsabilidad del experimentador y debe ser siempre examinada para asegurar que esta sea lo más precisa posible. En la mayoría de ocasiones, la variabilidad asociada con una técnica determinada es relativamente pequeña, y hasta ahora solo se ha podido obtener un muy limitado mejoramiento en la precisión del experimento. Hay casos, donde los errores de técnica aumentan considerablemente la variabilidad. Tales errores deben prevenirse pero no sobredimensionarse.
Las técnicas estadísticas son métodos que deben obtener ventajas de las características de las unidades experimentales (diseño experimental) y cuando hay información disponible adicional de tipo cuantitativo o cualitativo se tienen más ventajas. Una función básica de los diseños de experimentos es la de reducir la necesidad de control exacto del ambiente experimental, dado que el control de dichos factores es costosa y tediosa. Es a través del diseño de experimentos que las fuentes conocidas de variabilidad se controlan. Esto se
96
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
consigue arreglando las unidades experimentales en subgrupos más homogéneos conocidos como bloques los cuales están basados en valores comunes de los factores de clasificación. Haciendo esto, algunas de las variaciones naturales entre unidades experimentales son asociadas con otro factor cuya contribución a la estimación del error experimental puede ser eliminada.
En muchos experimentos la precisión de la comparación de tratamientos puede ser aumentada usando variables concomitantes y/o auxiliares, este tipo de análisis, conocido como el análisis de varianza se recomienda usar cuando la variación entre unidades experimentales es, en parte, debida a la variación en algún otro carácter medible no suficientemente controlable, para ser usada en la asignación de unidades experimentales a los bloques sobre las bases de resultados similares. Frecuentemente, la agrupación de estas variables cuantitativas en bloques, construidos a partir de rangos de valores no es efectiva ya que la variación dentro de bloques puede ser más grande. Más aún, se puede requerir mucho más grados de libertad para controlar este factor. Este aumento de los grados de libertad puede ser usado para estimar el error experimental.
El control estadístico a través del uso del bloqueo y/o el análisis de la varianza elimina la variación debida a fuentes extrañas conocidas. Es a través de la aplicación de la aleatorización, como las fuentes de variación desconocidas para el experimentador pueden ser controladas. El concepto de aleatorización y su función se discuten mas adelante.
Como última consideración, el incremento en la repetición, no reduce el error de la varianza, pero mejora la precisión de las estimaciones dado que el error estándar se disminuye proporcionalmente a la raíz cuadrada del tamaño de la muestra. Este incremento en la cantidad de reducción que debe realizarse aumentando las replicaciones, solo deberá realizarse cuando todas las demás opciones han sido eliminadas y la precisión deseada no ha sido obtenida.
VI. PROPIEDADES DEL DISEÑO ESTADÍSTICO
Finney (1955) establece que por el diseño de experimentos se entiende:
a) Especificaciones de las unidades experimentales a las cuales los tratamientos han sido aplicadas.
97
Palacios C. Severo
b) Especificaciones de mediciones que pueden ser tomadas en cada unidad experimental.
Selección de un grupo de tratamientos para comparación. Mientras la responsabilidad principal es del experimentador, la estadística contribuye respecto a la elección óptima de las combinaciones de tratamientos a ser usadas, por ejemplo, en un experimento factorial fraccionado o en la exploración de superficies de respuesta. Esto se conoce como un diseño de tratamientos.
La asignación de los tratamientos a las unidades experimentales (aleatorización), esto es lo que caracteriza el diseño estadístico de experimentos.
El diseño estadístico de experimentos es esencialmente el plan para poner a funcionar el experimento, especificando el arreglo de las unidades experimentales en el tiempo y/o espacio y el patrón de observaciones que van a reportar información.
El diseño, por lo tanto, es una secuencia compleja de etapas tomadas para garantizar que los datos serán obtenidos de la forma que permitan un análisis objetivo, soportado en inferencias válidas respecto al planteamiento del problema, el cual debe ser lo más preciso posible y además viable económicamente.
El diseño de un experimento es una función importante, dado que ninguna técnica estadística puede revelar información no implícita inicialmente en los datos.
Para cualquier grupo de datos, el análisis apropiado de los mismos es determinado por el diseño de experimentos. La habilidad, por lo tanto, de obtener un análisis significativo se basa inicialmente en la forma en que se han recolectado los datos. Un buen diseño experimental, es aquel que proporciona la información requerida con el mínimo esfuerzo experimental. Muchos criterios han sido propuestos para contar con un experimento estadísticamente válido. En general, los requisitos estadísticos para el buen diseño de experimentos son:
Proveer estimaciones insesgadas para los efectos del tratamiento. Hasta donde es posible la comparación de tratamientos deben estar libres de sesgos sistemáticos. Es la comparación de tratamientos el interés principal, por lo tanto es de primordial importancia que estas comparaciones reflejen
98
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
diferencias debidas a los tratamientos, y no a las diferencias inherentes a las unidades experimentales. Es importante que el experimento este diseñado para asegurar que las unidades experimentales que reciban un tratamiento especifico no difieran de otros tratamientos.
Requerir que la precisión asociada con la estimación de efectos este de terminada al mismo tiempo que las estimaciones mismas. En este sentido, el experimento esta auto contenido. Para esto, debe haber una medición del error experimental. Esta estimación es necesaria para asegurar la significancía estadística de las diferencias de tratamientos. Si esta estimación no es insesgada, se presentará una pérdida de eficiencia del experimento lo cual conllevara a un desperdicio de tiempo, materiales y dinero. Si el experimento no provee una estimación del error experimental, será necesario usar una estimación de un experimento previo. La validez del procedimiento se basa en el hecho que la magnitud del error experimental deberá permanecer invariante desde el último experimento (un supuesto que frecuentemente es insostenible).
Las comparaciones de tratamientos, deben de ser lo suficientemente precisas para detectar las mínimas diferencias de importancia práctica para el investigador. Cuando se comparan tratamientos, si existen unas mínimas diferencias esto proveerá una ganancia real. Así, si un tratamiento debe ser cambiado por otro, este debe ser mejor, aunque sea por una mínima diferencia. Claramente el experimento deberá tener suficiente precisión para detectar tales diferencias o de lo contrario no tiene sentido realizarlo. La precisión de un determinado experimento dependerá de:
1. La variabilidad intrínseca del material experimental y de la precisión del trabajo experimental.2. La cantidad de replicaciones del tratamiento, y3. El diseño del experimento.
Las conclusiones tienen un rango amplio de validez. Las condiciones encontradas en la práctica, nunca serán exactamente las obtenidas cuando se lleva a cabo el experimento. Deben procurarse que las conclusiones sobre los resultados del experimento se hagan sobre condiciones similares del experimento. Si las conclusiones se aplican, deberá haber confiabilidad de que las condiciones donde se apliquen sean similares. Cumpliendo esto el experimento
99
Palacios C. Severo
debe tener un rango amplio de validez. Entre más amplio sea el rango de condiciones investigadas en el experimento, mayor será la confiabilidad de estas conclusiones cuando no cumplan las condiciones de homogeneidad, en aquellos casos donde las condiciones sean algo distintas.
Se debe tener cuidado, para verificar que la organización del experimento no se torne muy compleja y tener en cuenta además que si un grupo de tratamientos no es investigado totalmente, no se podrán obtener conclusiones significativas.
El diseño debe ser lo más simple posible para alcanzar los objetivos del experimento. La selección del diseño depende de la naturaleza de las fuentes de variación en el material experimental. Se debe elegir el diseño más simple posible que permita controlar adecuadamente la variabilidad conocida. A medida que el diseño experimental se torna más complejo, hay una menor flexibilidad haciendo difícil la organización lo cual puede llevar a cometer errores cuando se realiza el experimento. Entre más simple el diseño, más fácil será llevar a cabo ajustes por las equivocaciones que siempre suelen aparecer.
Una consecuencia general de los experimentos comparativos es que puede conducir a decisiones administrativas, mientras es verdad que la hipótesis nula para igualdad de efectos de los tratamientos siempre será rechazada dados determinados recursos, se debe recordar que el manejo de la no significancía implica equivalencia. Algunas acciones deberán tomarse siempre sobre la base de los resultados obtenidos; bien sea, mantener todo tal cual o cambiar por un nuevo tratamiento.
Las decisiones diarias son un proceso de dos etapas:
1. Examen (análisis) de las probabilidades asociadas a los datos estimados con las conclusiones (acción estadística).
2. Basados en estos resultados, se toma la decisión para implementar una acción (decisión de gestión).
El trabajo del estadístico es el de presentar las probabilidades de la primera etapa lo más acertadamente posible para lograr minimizar el número de decisiones incorrectas a tomar en la segunda etapa.
Un buen diseño de experimentos puede ser obtenido al aplicar los principios básicos establecidos por Fisher (1935). Ellos son:
100
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
1. Replicaciones de algunos o todos los tratamientos para estimar la magnitud del error experimental.
2. Aleatorización de los tratamientos a las unidades experimentales para tener así una estimación válida del error experimental así como estimaciones insesgadas de los efectos de los tratamientos.
3. El uso del control local de fuentes de variación extrañas conocidas a través del uso de sub-grupos homogéneos de unidades experimentales.
En el diagrama de Fisher, según las condiciones del experimento, se escoge el diseño experimental, se formula un modelo lineal apropiado y se lleva a cabo el análisis estadístico basado en la escogencia del diseño y del modelo.
II. Aleatoriza ción(Produce estimaciones insesg ados de varia nza y va lida el error
experimental)
I. Replica ción(Permite estimar error experimenta l)
III. Control Loca l(Disminuye el error)
Diagrama de Fisher Principios de la experimentación
Para mayor claridad se lleva a cabo en las siguientes secciones una explicación más amplia de estos principios.
VII. REPLICACIÓN
Es el proceso de repetir en condiciones similares el experimento para cada tratamiento se denomina replicación. Cuándo el número de replicaciones es igual para todos los tratamientos el diseño se denomina balanceado, en caso contrario se dice que es desbalanceado. Un número adecuado de replicaciones permite al experimentador obtener una estimación del error experimental.
La replicación es la asignación del mismo tratamiento a más unidades experimentales, o sea que hace referencia al número de unidades experimentales de cada tratamiento, no al número de observaciones.
101
Palacios C. Severo
El propósito de la replica es proveer una estimación del error experimental. Se obtiene de comparar unidades experimentales tratadas igual pero que antes del experimento tenían la oportunidad de ser tratadas de manera diferente. Las múltiples mediciones tomadas en una unidad experimental no satisfacen esta definición, dado que esto no es replicación; las repeticiones reducen la variación asociada con mediciones y/o errores muéstrales, pero no proveen ninguna información relacionada con los errores experimentales.
Además de proveer una estimación de error experimental, las replicaciones aportan la precisión del experimento al reducir el error estándar asociado con la comparación de tratamientos. Esto se desprende del hecho que la varianza de la media disminuye inversamente proporcional a la raíz cuadrada del número de replicas. Esto provee una forma para controlar el tamaño de la varianza del error.
A pesar de que el incremento en el número de replicaciones da precisión a las estimaciones, éstas no se pueden incrementar indefinidamente. Un punto para su disminución se alcanza cuando el incremento en los costos de la experimentación no es compensado con una reducción en la varianza. Cuando el número de replicas se torna demasiado grande, y las diferencias entre tratamientos detectadas son demasiado pequeñas, la importancia práctica que resulta es una pérdida de recursos valiosos.
Las replicaciones también proveen formas para incrementar el rango de las condiciones estudiadas en el experimento. No hay requisitos para que las replicaciones sean adyacentes en tiempo o espacio, dado que cuando se usan conjuntamente con el control local se puede investigar un mejor rango de condiciones experimentadas.
VIII. ALEATORIZACIÓN
La aleatorización es fundamental para que el diseño de un experimento sea válido. Es el procedimiento que permite que cada unidad experimental tenga iguales condiciones para recibir cualquier tratamiento. Esto no significa que el experimentador podrá escribir como quiera la identificación de tratamientos (nombres o símbolos) en el orden que se le ocurra. La aleatorización es un proceso físico que asegura que cada tratamiento tenga igual probabilidad de ser asignado a cualquier unidad experimental. Este es el punto en el cual,
102
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
el procedimiento experimental con las leyes de azar son explícitamente introducidas. De acuerdo con Brownlee (1957) una de las principales contribuciones que el estadístico puede hacer es insistir en la aleatorización del experimento.
La aleatorización es necesaria ya que provee las bases para obtener un tests válido de significancía al destruir cualquier sistema de correlación que pueda existir entre las unidades experimentales. Un supuesto valido que resalta el análisis de varianza es que los errores experimentales son independientes. Es bien sabido que los errores asociados con las unidades experimentales adyacentes en tiempo y/o espacio están correlacionados. Una correlación positiva entre las unidades experimentales va a tener una mayor varianza del tratamiento que si las observaciones fueran independientes. Consecuentemente la probabilidad del error tipo I será mayor que el valor preestablecido. Con una correlación negativa, los efectos son opuestos a aquellos con una correlación positiva. Con la asignación de tratamientos al azar con las unidades experimentales, posiblemente sujetas a las restricciones, el efecto de la correlación se disminuye entre las unidades experimentales. La aleatorización no hace que los errores sean independientes pero asegura que, en promedio, las correlaciones sean cero. Como resultado, los datos pueden ser analizados si el supuesto de independencia de los errores es verdadero.
Una segunda función de la aleatorización es la de proveer medios para evitar sesgos en la estimación del error experimental y los efectos de tratamiento. La estimación del error experimental se obtiene comparando las unidades experimentales tratadas de manera similar. Para que esta estimación sea válida, es necesario garantizar que las unidades experimentales tratadas de manera similar no sean diferenciables de manera relevante de las unidades experimentales tratadas de manera distinta. La forma de asegurar que la estimación del error sea válida se obtiene realizando una asignación aleatoria de los tratamientos.
La aleatorización también provee estimaciones insesgadas de los efectos de tratamiento al controlar los efectos de fuentes de variación desconocidas. Esto provee la seguridad de haber asignado adecuadamente estas fuentes de variación, las cuales deben ceñirse a normas donde el experimentador no tiene ni el tiempo ni el conocimiento para investigar, pero que de otra forma, podrán
103
Palacios C. Severo
conducir a conclusiones erradas. Esta es la única forma de asegurar que la comparación entre tratamientos no sean sesgadas por un tratamiento que fue asignado de manera premeditada, para hacer mejores o peores algunas unidades experimentales. La aleatorización romperá cualquier patrón asociado con factores desconocidos de tal forma que ningún tratamiento será favorecido frente a los demás. La aleatorización nunca elimina la variación causada por factores extraños desconocidos, pero distribuye sus efectos en promedio, equitativamente sobre todos esos factores extraños.
Finalmente, la aleatorización es necesaria para abolir los sesgos personales, conscientes e inconscientes, de las personas que intervienen en el experimento, incluyendo al experimentador. La historia cuenta con un gran número de experimentos en Inglaterra sobre efectos de comida suplementaria para colegios de niños de distritos pobres que fueron inválidos porque la selección de los niños fue dejada en manos de los profesores. Parece ser que se les asignó el mejor suplemento a los niños más desnutridos.
Hay un problema que aparece al aplicar la aleatorización cuando el número de unidades experimentales es muy pequeño. En estos casos es posible que los arreglos producidos por la aleatorización aparezcan al experimentador como bien, deseables o inaceptables. Por ejemplo, la secuencia:
XXXYYYZZZ
Es apenas una forma de las 1670 secuencias posibles de tres tratamientos con tres replicas en el tiempo. Este patrón sin embargo, probablemente no será aceptado por la mayoría de experimentos. Tal relación sugiere, una falta de conocimiento por parte del experimentador. Youden (1964) sugiere tres formas para manejar esta dificultad, todas ellas, colocando restricciones a la aleatorización:
1) Incorporar al diseño de experimentos la condición que hace el arreglo inaceptable, esta sería la mejor forma para manejar el problema. Tal vez no sea práctico o deseable, sin embargo, para introducir estas futuras restricciones al diseño puede ocurrir que:
a) Pierde grados de libertad en la estimación del error experimental debido a la eliminación de la otra fuente de
104
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
variación que puede no estar completamente compensada.b) El experimento se vuelve más complicado, oc) Que se hayan usado hasta ahora distintos sistemas de agrupación.
2) Rechazar arreglos extremos cuando ellos ocurran y re-aleatorizar: el mayor problema aquí será el de determinar subjetivamente lo que es un arreglo extremo. Si esto se puede hacer, entonces esta será una solución más razonable.3) Seleccionar un diseño al azar de un grupo predeterminado de arreglos aceptables.
IX. CONTROL LOCAL
Al proceso de clasificación de las unidades experimentales en grupos homogéneos, se le denomina Control Local.
Ejemplo 3.31Un ejemplo de control local en el ejemplo 3.30 puede ser controlar el nivel de fertilidad del terreno. Para esto se determinan unidades homogéneas de terreno llamadas bloques según el grado de fertilidad, cada bloque se subdivide en parcelas de igual área preferiblemente y sobre estas se aleatorizan los tratamientos buscando que cada unidad experimental reciba un único tratamiento y que la totalidad de los tratamientos estén en el bloque (caso de bloques completos).
Una función primaria del diseño de experimentos es el de reducir el control exacto del ambiente experimental debido a que tal control es un hecho costoso y tedioso, y presume que todos los factores que influyen han sido identificados.
La función principal del control local es la de eliminar los efectos de fuentes conocidas de variación extrema.
El control se acompaña del bloqueo de las unidades experimentales. El bloqueo es un arreglo de unidades experimentales en grupos más homogéneos, basados en características comunes, de los factores de clasificación. Los tratamientos se asignan a las unidades experimentales, basadas en la estructura de bloques, así el uso de control local coloca algunas restricciones en la aleatorización de tratamiento a las unidades experimentales. Para alcanzar la máxima eficiencia con el bloqueo, es necesario el conocimiento relacionado con
105
Palacios C. Severo
varios factores extraños que afectan las unidades experimentales, información que solo el experimentador puede proveer.
El bloqueo a las unidades experimentales se debe hacer de tal manera que se asocien a fuentes asociadas de variación extrema con diferencias entre bloques, en este caso se debe cumplir que:
1) Una estimación más precisa del error experimental debe ser obtenida, puesto que la contribución de estos factores, extraños se eliminan, introduciendo además eficiencia al experimento debido a que se podrán detectar menores diferencias entre los tratamientos y2) Las comparaciones de tratamiento no serán sesgadas por diferencias en las unidades experimentales debido a los factores externos.
La aplicación de control local (bloqueo) no remueve el requisito de aleatorización, solo impone restricciones al tope de aleatorización que se llevará a cabo.Para todos los diseños, la asignación aleatoria de tratamientos a las unidades experimentales dentro de los límites impuestos por el control local es esencial para poder tener así una interpretación válida de los resultados.
La relación de los tres principios básicos de un buen diseño de experimentos es la clave de la estructura que provee una estimación del error experimental y a través de la aleatorización, se asegura la validez de las estimaciones y de las pruebas de significancía. La replicación también trae consigo una reducción de los errores de la estimación directamente por medio de la relación n/σ e indirectamente a través de la determinación de un sistema de control local.
X. CLASIFICACIÓN DE LOS DISEÑOS
El diseño de un experimento depende solamente de los supuestos relacionados con las propiedades de las unidades experimentales; esencialmente tales características, determinan las restricciones que deben ser colocadas al aleatorizar los tratamientos a las unidades experimentales, las cuales a su vez determinan el tipo de diseño experimental, los cuales pueden ser clasificados como: sistemáticos y al azar.
106
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Los diseños sistemáticos poseen un patrón regular para la asignación de tratamientos a las unidades experimentales. Las razones dadas para usar un diseño sistemático frecuentemente son:
1)Simplicidad, siendo extremadamente sencillo de aplicar.2) Provee muestreo adecuado del material experimental.3) Lleva a colocaciones inteligentes u ordenamiento natural de los tratamientos.4) La aleatorización no es necesaria, dada que la heterogeneidad de las unidades experimentales por si solas aleatorizan los efectos de tratamientos.
Las desventajas de los diseños sistemáticos son:
1) El arreglo de los tratamientos, puede combinarse con un patrón en variaciones no controladas que producen errores sistemáticos en la estimación de los efectos del tratamiento.2) No hay una estimación válida de la varianza del error.
En los experimentos al azar, la aleatorización elimina esta desventaja, esta es la razón para que estos experimentos sean de tanta importancia. Estos experimentos pueden ser subdivididos, de acuerdo con las siguientes restricciones: ninguna (irrestricto), única y múltiple. De acuerdo con las restricciones impuestas los diseños pueden ser clasificadas como completos e incompletos, dependiendo si los tratamientos ocurren con la misma frecuencia o no, dentro de cada restricción que se le impone al experimento que se ha definido. Los diseños de bloques incompletos serán clasificados después como balanceados o parcialmente balanceados, dependiendo de la varianza asociada con las comparaciones pareadas.
Al seleccionar un diseño, se deberá elegir el más simple posible que satisfaga los requisitos del experimento elegido. Si ningún diseño conocido esta disponible para el análisis, este deberá ser construido. Un axioma básico es el de diseñar para el experimento y no experimentar para el diseño. Hay investigadores que piensan que la elección del diseño y/o tratamientos experimentales deberán ser limitados para aquellos que aparecen publicados en la literatura especializada, de esta forma se forzó innecesariamente al experimentador a modificar el experimento y ajustarlo al diseño conocido. Aún cuando un diseño estándar haya sido usado para
107
Palacios C. Severo
determinar si los objetivos del experimento han sido logrados, siempre se hace necesario la verificación y su análisis estadístico.
1. Sistemático. Los tratamientos son asignados a las unidades experimentales de acuerdo a algún patrón predeterminado. Tales diseños no proveen estimaciones válidas del error experimental.2. Aleatorizados. La asignación de los tratamientos a las unidades experimentales depende de algún patrón de aleatorización. Solo para estos diseños, las técnicas de análisis de varianza son validas.
a) Irrestrictos. La aleatorización no está restringida a ningún arreglo de las unidades experimentales.b) Restricción Única. La aleatorización se restringe a un único requisito determinado en el arreglo de las unidades experimentales. Estos son los diseños de bloques.c) Balanceado. Se obtiene la misma precisión para cada par de comparaciones entre tratamientos.d) Parcialmente Balanceado. La precisión no es constante para cada par de comparaciones, pero depende de los tratamientos involucrados.e) Restricciones múltiples. La aleatorización se restringe a dos o más requisitos localizados en los arreglos de las unidades experimentales. La misma subclase general existe para estos diseños como en el caso de los diseños de bloques.
XI. ESTRATEGIA DEL DISEÑO
En la selección de un diseño experimental se debe tener en cuenta las características propias de la disciplina en donde se realiza; a pesar que los principios estadísticos son los mismos, las estrategias frecuentemente son distintas.
La estrategia experimental depende del tiempo para realizar el experimento, el costo de la experimentación y la cantidad de variación en el material experimental, como así mismo el factor climático a la cual se someten los experimentos.
El hecho de que no haya una única estrategia de experimentación, puede ser ilustrada por la comparación entre los experimentos agrícolas y los industriales.
108
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
En general, los experimentos agrícolas:
1. Requieren un tiempo más largo, frecuentemente meses, y en algunos casos se extienden hasta años, cuando se relacionan con cultivos perennes2. Por ejemplo. Usualmente presentan una mayor variabilidad entre las unidades experimentales. Es casi imposible alterar o modificar estos experimentos una vez ha comenzado. Consecuentemente, el campo de la experimentación agrícola debe estar auto-contenido, y así frecuentemente involucran diseños más amplios, comprensivos y complejos, de tal manera se puede obtener mucha información de cada experimento.
Por el otro lado, la mayoría de experimentos industriales satisfacen que:
1. La capacidad para realizar experimentos pueden ser muy rápidos, el tiempo de intervalo puede ser solo uno o unos pocos días inclusive horas, y2. La variación natural entre las unidades experimentales es generalmente muy pequeña.
Más aún la mayoría de la experimentación se hace secuencialmente, dado que los resultados están disponibles para su análisis antes de terminar el experimento. Como resultado, hay una gran flexibilidad. Como cada observación o grupo de observaciones están disponibles, la situación puede ser revisada antes de comenzar un próximo grupo de ensayos. Con base en los resultados, una decisión como que hacer luego permite hacer ajustes respectivos en el diseño de experimentos.
Consecuentemente, se puede usar secuencias de experimentos más pequeños, y simples, esta es una ventaja.
Box (1957) notó una paradoja interesante respecto al diseño de programas experimentales; el único tiempo en el cual el programa de experimentación puede ser diseñado adecuadamente es después de haber sido culminado. Es común encontrar en la culminación de un programa que:
109
Palacios C. Severo
1. Una o más variables probablemente hayan sido omitidas del experimento.2. Una o más variables originalmente incluidas en el experimento aparezcan con un pequeño efecto, por lo tanto no son tan importantes como se pensó al principio.3. Un diseño experimental más complejo se necesita para solucionar adecuadamente los problemas.4. Algunas transformaciones a las variables podrán ser apropiadas.
La experimentación deberá involucrar indeterminaciones como el hecho que dos experimentadores, que estudian el mismo problema, tendrán la misma opinión relacionada con estos items. Si determinara una serie de normas sobre sistemas de experimentación rígidos que puedan abolir estas dificultades, tendrán como único resultado el sacrificio en el conocimiento del experimentador, su experiencia e imaginación.
XII. DISEÑO DE TRATAMIENTOS
Cada uno de los diseños que controlan el error mencionados en la tabla 3.9 se usa con el fin de comparar los tratamientos entre si. Sin embargo los tratamientos son seleccionados según alguna estructura, en particular una estructura factorial, la cual se refiere al diseño de los tratamientos. Estos se seleccionan de acuerdo a las metas ó intereses de la investigación, el material experimental y los factores disponibles. La escogencia de los tratamientos estará enmarcada dentro de un apropiado diseño que controle el error. Dentro de la estructura factorial de tratamientos se conocen dos clases. Las estructuras factoriales simétricas y las estructuras factoriales asimétricas. En la primera, se tienen k factores cada uno s niveles, donde s es un entero, en este caso se tienen sk tratamientos. En la segunda estructura, se tienen k1 factores con s1 niveles, k2 factores con s2 niveles, … km factores con sm niveles, el cual tiene en total
jk
j
m
jmk
m
kk sssst 12
21
1 . . . === tratamientos.
Tabla 3.9 Efecto de diseño de control del errorFactores de control del
diseño aleatorizado Tipo de diseño Caracterización
0 Diseño completamente
110
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
aleatorizado
1Diseño en bloque aleatorizado
1.Diseño Bloque Aleatorizado.
2.Diseño Bloque Aleatorizado
generalizado
3.Diseño Bloque Incompleto
4.Diseño Bloque extendido
5.Diseño Bloque por franjas.
2 Diseño cuadrado latino
1. Diseño cuadrado latino.
2. Diseño cuadrado latino incompleto
3. Diseño Cross - Over
3Diseño cuadrado latino replicado.Cuadrado grecolatino
>3Cuadrado latino mutuamente ortogonales
Cuando se desea reducir el tamaño del experimento considerado por motivos muchas veces de tiempo y costos, se trabaja con un diseño de tratamientos factorial fraccionado.
XIII. DISEÑO DE MUESTREO
Lo más importante de un diseño de control del error con sub muestreo es la separación del error experimental y el error observacional (o de muestreo), o más precisamente, la separación de la varianza del error experimental y el observacional.
La noción de sub muestreo puede obviamente ser extendida a más de un nivel, por ejemplo, para cada unidad experimental se puede tener algunas unidades muéstrales y luego para cada unidad muestral se pueden tener algunas unidades observacionales.
XIV. ESTUDIO EXPERIMENTAL
Para que el experimento sea exitoso, se deben tener en cuenta lo siguiente:
111
Palacios C. Severo
1) Conocimiento claro del material experimental. Aunque parezca obvio en la práctica, no siempre el desarrollo de un problema requiere de experimentación ni es simple presentar un claro y apropiado estado del problema. Es necesario abordar todas las ideas sobre los objetivos del trabajo. Un claro estado del problema frecuentemente contribuye a un mejor entendimiento del fenómeno y a una solución del problema.2) Escogencia de factores y niveles. El experimentador debe seleccionar las variables independientes o factores a ser estudiados, estos pueden ser cuantitativos o cualitativos. En el caso cualitativo hay que tener en cuenta como se controlarán estos valores en los valores de referencia y como van a ser medidos. Es importante seleccionar los rangos de variación de los factores y el número de niveles a considerar, los cuales pueden ser predeterminados o escogidos aleatoriamente del conjunto de los posibles niveles.3) Selección de las variables respuesta según los objetivos. En la escogencia de la variable respuesta o variable dependiente, el experimentador ha de estar seguro que la respuesta a medir realmente provee información sobre el problema de interés. Es necesario suministrar la forma como se mide esta variable y de ser posible la probabilidad de ocurrencia de estas medidas.4) Selección del diseño experimental. Este paso es de primordial importancia en el proceso de investigación. Se debe indicar la diferencia a la respuesta verdadera (que tan lejos se admite la realidad de lo observado), que se desea detectar y la magnitud de los riesgos tolerados (grado de confiabilidad), en el orden a escoger un tamaño de muestra apropiado (replicaciones); es procedente señalar también el orden de recolección de los datos y el método de aleatorización a emplearse. Siempre es necesario mantener un equilibrio entre la exactitud y los costos. Se deben recomendar planes que sean eficientes estadísticamente y económicamente viables. En la conducción de un estudio experimental es de esencial importancia la escogencia del diseño, esta escogencia depende de cuatro componentes:El diseño de tratamientos. En esta etapa se determinan los tratamientos a ser medidos en el estudio, es decir se establecen cuales y cuantos tratamientos se deben aplicar teniendo en cuenta la naturaleza del experimento. El interés del investigador en el sentido de decidir cuántos factores deben incluirse, cuántos
112
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
niveles de factores se deben identificar en cada factor y cuál es el rango razonable de cada factor. Los aspectos del diseño de tratamientos están estrechamente ligados con el diseño para controlar el error.Diseño de control del error. Por diseño de control del error se entiende la distribución aleatoria de los tratamientos en un plan experimental usando la regla de asignación aleatoria de los tratamientos a las unidades experimentales. Como ejemplos de control de error se tienen los diseños completamente aleatorizados, bloques completos aleatorizados y cuadrados latinos. La escogencia del diseño depende de la variabilidad de las unidades experimentales, la estructura de estas unidades y la precisión de la estimación deseada por el investigador.Estructura del control del error. Por esta se entiende la asignación aleatoria de los tratamientos a las unidades experimentales.Muestreo y diseño de observaciones. Hace referencia a determinar el número de observaciones tomadas por tratamiento y unidad experimental, lo cual caracterizará los planes experimentales, con sub muestreo.Una vez definidas los componentes anteriores, la respuesta del vector R para el análisis seleccionado satisface la formulación del modelo estadístico apropiado está íntimamente relacionado con la estructura del diseño de tratamientos, el diseño del control del error y el muestreo de las observaciones.El diseño seleccionado se asocia a un modelo lineal de la forma
εβ += XY si el modelo es de efectos fijos, se descompone la variabilidad de la respuesta (variabilidad total) como una partición ortogonal de las diferentes fuentes de variabilidad, es decir,
∑==
q
itotal iSCSC
1
)(
Donde:
YYSC total ´= y YPYSC Xii ´)( = siendo tii
tiXi XXXXiP −= )( , i=1, …, q el proyector ortogonal en el
espacio columna de iX ; y para iX el bloque
113
Palacios C. Severo
X asociado con el i-ésimo factor de clasificación
[ ]421 :...:: XXXX =5) Conducción del experimento. Es el proceso de muestreo de recolección de datos. Sé entenderá que en el proceso haya un ajuste al plan (control). En la mayoría de las veces, la realización de un experimento no es lo suficientemente fiel al proyecto de investigación, porque surgen situaciones no consideradas previamente, como en el caso de un cultivo atacado por plagas, el agotamiento producido sobre una unidad experimental que se esta evaluando, o la aparición de una característica no determinada. De todas formas, se debe tener en cuenta si estos imprevistos alteran los propósitos del ensayo; de otra forma hay que tenerlos en cuenta en el análisis de los resultados.6) Análisis de datos. Las variables que intervienen, o mejor, que se procura sean considerados en un ensayo, pueden relacionarse matemáticamente de alguna forma. El problema no está en la consecución de una expresión matemática sino en que tanto explica la realidad dicha expresión. Es preferible renunciar a un bello modelo que aceptar una realidad deformada por el. En esta etapa se busca una fórmula matemática que explique el comportamiento de una(s) variable(s) a través del comportamiento de otras. Existen técnicas estadísticas, como el análisis de regresión que suministran estas relaciones. Se debe buscar que el modelo se analice junto con el especialista que lo está investigando.Una vez se ha seleccionado el diseño experimental, se establece la matriz de diseño X, el vector de parámetros β y se asocia a un modelo εβ += XY el cual generalmente resulta ser de rango incompleto y estimado por el método denominado mínimos cuadrados a través de una matriz inversa generalizada de X. Para la estimación del modelo y análisis estadístico de los datos, se debe tener en cuenta:
1. Estimación del modelo. Estimar mediante los métodos de mínimos cuadrados o máxima verosimilitud los parámetros asociados al modelo, en este último método, se tiene en cuenta la distribución de la variable respuesta; por este motivo la mayoría de los desarrollos realizados en este texto se hacen asumiendo que la variable respuesta sigue una distribución normal multivariada. Cuando el modelo es de rango incompleto, se realizan cálculos muy
114
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
similares al caso de rango completo, con lo cual simplemente los estimadores son adaptados a este modelo.2. La teoría de estimabilidad. Conocer los principales criterios para caracterizar las funciones estimables.3. Pruebas de hipótesis. Conocer la estructura distribucional de los estadísticos de prueba para las hipótesis de interés.
Una parte del análisis es el chequeo adecuado del modelo propuesto, lo cual conlleva a un examen crítico de las bases del modelo estadístico y su relación con los supuestos. En esta etapa recientemente el computador ha jugado un papel importante. Existen diferentes procedimientos y paquetes estadísticos que facilitan el análisis de los datos. Un paquete estadístico es un conjunto de programas elaborados para el procesamiento de información, los cuales se manipulan por medio de una serie de instrucciones y comandos dirigidos a resolver problemas de la estadística. Entre los paquetes estadísticos de más amplia difusión en el área experimental podemos mencionar: el SPSS (Statistical Package for Social Science), SAS (Statistical Analysis System), Statgraphics. 7) Conclusiones y recomendaciones. Hecho el análisis de los datos, el experimentador puede extraer conclusiones (inferencia) sobre los resultados.Las inferencias estadísticas deben ser físicamente interpretadas y su significancía práctica evaluada.Las recomendaciones deben de hacerse con base en los resultados. En la presentación de estos se deben evitar el empleo de terminología estadística seca y en lo posible presentar los resultados de manera simple. La elaboración de gráficos y tablas evita la redacción de resultados y recomendaciones extensas y confusas.
115
Palacios C. Severo
Problemas
(105) Desarrolle un bloque completo para el ejemplo 3.31 para el control del nivel de fertilidad del terreno.
(106) Determine el bloque de fertilidad para cada bloque que se subdivide en parcelas.
(107) Que los tratamientos del problema 100 sean unidades experimentales y reciban un único tratamiento y que estén por bloques.
(108) Una empresa farmacéutica desea evaluar por bloques una nuevo producto para el control de la natalidad para ello recurre a un investigador conocedor del tratamiento de dichos productos. El análisis lo desarrolla en una comunidad cercana a la población y obtiene datos que se tienen que corroborar a nivel macro. Se desea determinar el mejor bloque con el producto.
(109) Una capsula para el tratamiento del AH1N1 esta siendo probada en una población para el cual se desarrolla un diseño por bloques, y cada bloque se subdivide en zonas de tratamiento. Se desea determinar el bloque en donde se desarrolla con efectividad el tratamiento de dicha capsula.
(110) Un plaguicida para el control de la mosca blanca se viene aplicando en la zona agrícola de la población en donde se comprobó que dicha mosca viene desarrollando una plaga sin control. Se desea desarrollar un diseño por bloques a fin de contrarrestar dicha plaga.
(111) Un producto químico se desea probar para el control de la mosca de la fruta, el investigador desea desarrollar un diseño por bloques en diversas zonas agrícolas, para el cual trabaja en varios puntos con dicha plaga. Se desea evaluar dicho diseño con bloques a fin de eliminar dicha plaga.
116
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
(112) Un investigador se encuentra con un problema doble, ya que la siembra de un producto viene infectado por una plaga, como así mismo las semillas están contaminadas con un producto químico que no permite el desarrollo sustancial de la planta. Para ello desarrolla un diseño por bloques a fin de descartar dichos males y obtener un buen producto al cosechar.
§4DISEÑO EXPERIMENTAL
APLICADO A CIENCIASNo existe la suerte. Sólo hay preparación adecuada o inadecuada para hacer frente a una estadística.
Robert Heinlein
I. INTRODUCCIÓN
Fenómenos naturales. Al fin de esta definición y revisada corresponden a la meta de la mayoría de los proyectos de investigación en las ciencias de la ingeniería.
Y como se logra todo esto. En la ciencia esto se hace a través de experimentos definidos. La definición de experimento científico es una prueba que se hace a fin de demostrar una verdad conocida o por conocer, examinar la validez de una hipótesis, o determinar la eficacia de algo previamente ensayado. Los físicos, químicos agrónomos, metalurgistas, mineros, geólogos, y muchos científicos comparten el objetivo de entender y predecir causa y efecto.
LIMITACIONES
117
Palacios C. Severo
Los científicos en ciencias de la ingeniería tienen más facilidad en construir y llevar a cabo sus experimentos que los investigadores en las ciencias sociales. Las sustancias químicas y los tubos de ensayo son más fáciles de controlar que los consumidores y las campañas de publicidad. Algunas de las diferencias entre ambas ciencias que crea obstáculo para un experimento perfecto son:
Dispositivos imperfectos de medición: Los científicos pueden medir y pesar sus resultados. En cambio las ciencias sociales a menudo tienen que obtener sus datos preguntando a sus sujetos (cualitativos).Influencia de la medición en los resultados: Cuando se pesa un tubo de ensayo esto no afecta ni altera el tubo de ensayo. Pero cuando se pregunta a una persona si alguna vez ha oído a un artista popular esto si afecta a la persona, pues habiendo escuchado anteladamente no lo asociaría.
Limitaciones de corto tiempo: Los científicos a menudo se demoran años, generaciones y hasta siglos en hacer descubrimientos concluyentes. En cambio casi todos los problemas de la sociedad requieren soluciones en días, semanas, a lo sumo en meses. Por esto, rara vez existe el tiempo o el dinero para realizar un experimento en forma tranquila y detallada.
Complejidad y control de las variables: El resultado esperado de todos los esfuerzos es el resultado de muchos factores diferentes que incluyen el producto, el precio y venta. Cada uno de estos factores a su vez, esta afectado por muchas otras. Comprenden o siquiera identificar, todas las posibles causas es virtualmente imposible, y más aún el poder controlar con precisión en un experimento continuo.
Por esto y otras razones la experimentación científica de las ciencias de la ingeniería proporciona un estándar para los experimentos y siempre que sea posible se debe tratar de traer los atributos de esos experimentos para la aplicación
III. PREDICCIÓN
Los proyectos de investigación pueden considerarse en una jerarquía según el grado en que proporcionan hallazgos predictivos, la jerarquía tiene tres etapas:
118
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Investigación descriptiva: Simplemente plantea lo que existe o describe algo que ha ocurrido en el pasado. No intenta inferir causa y efecto.
Investigación evolutiva: Añade juicio de valor a los datos descriptivos a fin de crear una dimensión de comparado con. Determina si algo es mejor. Añade un elemento analítico implícito de causa y efecto.
Investigación predictiva: Da significado absoluto a los resultados de las investigaciones. Pone causa y efecto en el tiempo futuro. Si usted hace esto, entonces sucederá tal y tal caso.La investigación siempre aspira a alcanzar este nivel predictivo.
Los experimentos en la investigación constituyen un forma de mover los proyectos a lo largo de las jerarquías y hacerla evaluativo y, a veces hasta predictivo.
IV. DISEÑOS EXPERIMENTALES
El uso del diseño experimental es esencial en el tratamiento de unidades experimentales (cuantitativo) en investigación científica.
Si deseamos comparar n poblaciones se efectúa los diseños experimentales. Dichos diseños son conjuntos de reglas (estructurado) que sirven para asociar unidades experimentales.
Las unidades experimentales son datos a los cuales se aplica una causa y efecto.
Para el análisis de las unidades experimentales procedemos a describir cada uno de los diseños.
a) DISEÑO ALEATORIZADO
Todo experimento se determina por cierto complejo de condiciones, los cuales bien se crean artificialmente o bien se realizan independientemente de la voluntad del experimentador, y por los resultados del experimento, es decir, por unos sucesos determinados que se observan como resultado de haberse ejecutado dicho experimento de condiciones. Un experimento se considera dado, si están determinadas sus condiciones e indicado los sucesos.
119
Palacios C. Severo
Los experimentos se pueden dividir a grandes rasgos en dos clases.
En una de ellas las condiciones del experimentador determinan el modo unívoco la aparición o no de los sucesos que se emplean. Los resultados de tales experimentos pueden pronosticarse de antemano a base de las leyes de las ciencias naturales. Los experimentos de esta índole se denominan deterministas.
En otra clase de experimentos, con iguales condiciones, es posible la aparición de los sucesos que entre si se excluyen. El estudio teórico de tales experimentos constituye precisamente el objeto de la teoría probabilística, esta última lleva el nombre de experimento aleatorio.Ventajas
b) Se pueden trabajar con un pequeño número de muestras de la población, sin que esto disminuya la exactitud de los datos.c) Se elimina la influencia del factor tiempo (cinética) sobre los resultados del experimento, las variantes cambian de lugar en los diferentes períodos.d) Es económico, ya que se trabaja con pocas muestras de la población.
b) DISEÑO UNIFACTORIAL CON n NIVELES
En dichos diseños se analizan ciertos experimentos que se usan para comprobar dos condiciones. A menudo se denominan experimentos de comprobación simple, los datos tienen pequeñas variaciones.
En la experimentación donde participan dos clases distintas de equipos, probeta, muestras, etc. con dos métodos distintos de niveles. Muchos experimentos de estos tipos implican más de dos niveles del factor. En el presente explicaremos con detalle los diseños aleatorizados.
Ejemplo 4.32Se desea maximizar la fibra de llama que se emplea en una manufactura de alfombras. Se sabe por experiencia que la resistencia es influida por el porcentaje de algodón presente, además se sospecha que elevar el contenido de algodón incrementará la resistencia, el contenido de algodón debe variar aproximadamente entre 10 y 40 por
120
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
ciento para que la alfombra resultante tenga otras características de calidad que se desean.
Se desea probar muestras a cinco niveles de porcentaje de algodón 15, 20, 25, 30, 35 por ciento. Así mismo, decide ensayar cinco muestras a cada nivel de contenido de algodón.
Este es un experimento unifactorial con a=5 niveles del factor y n=5 repeticiones. Las 25 corridas deben hacerse al azar.
Se elige un número aleatorio entre 1 y 25 ver tabla 4.10. Supóngase que este número es 8. Entonces la observación número, 9 (20% de algodón) se corre primero. El proceso se repite hasta que se ha asignado una posición en la secuencia de prueba a cada una de las 25 observaciones.
Tabla 4.10 Influencia del % de algodón a la fibra de llama% algodón Corrida experimental Total Media
1520253035
16111621
27
121722
38131823
49141924
510152025
La secuencia de pruebas aleatorizadas es necesaria para evitar que los resultados sean contaminados por los efectos de variables inconvenientes desconocidas, que puedan salir del control durante el experimento. Supongamos que se corren las 25 pruebas en el orden no aleatorizado original (esto es, las 5 muestras con 15 por ciento de algodón se prueban primero, luego las 5 muestras con 20 por ciento de algodón y así sucesivamente).
Tabla 4.11 Maximizar la fibra de llama por la Influencia del % de algodón% algodón Corrida experimental Total Media
1520253035
71214197
718182510
1512182211
1118191915
918192311
49778810854
9,815,417,621,610,8
Total 376 15,04
Si la maquina que dan los resultados presenta un efecto de calentamiento tal que ha mayor tiempo de funcionamiento menor lectura se tendrá (influencia perturbadora), entonces dicho efecto contaminará los datos de respuesta e invalidará el experimento. Si se efectúa en orden aleatorio.
121
Palacios C. Severo
Es bueno representar gráficamente los datos experimentales, en la figura se muestran los diagramas de dispersión a cada nivel de porcentaje de algodón.
109
99
89
79
69
59
49
15 19 23 27 31 35%
Diagrama de dispersión
Interpretando la gráfica indica que la resistencia aumenta con el aumento del algodón, hasta un valor aproximado de este último de 30 por ciento. Más halla del 30 por ciento ocurre un notable decremento en la resistencia. No hay una fuerte evidencia que sugiera que la variabilidad en la resistencia al rededor del promedio dependa del porcentaje de algodón.
En base a este sencillo análisis gráfico, sospechamos que:
a) El porcentaje de algodón influye en la respuesta, yb) Un porcentaje aproximado de 30 por ciento de algodón daría por resultado la máxima resistencia.
Análisis de varianza
Si se desea comparar a-tratamientos o niveles de un factor único. La respuesta que se observa en cada uno de los tratamientos es una variable aleatoria. Los datos se muestran en la tabla 4.10
Es útil describir las observaciones mediante el modelo estadístico2
ijiijY εµ +Τ+= nji ,...,4,3,2,1, =
Donde:
Yij es el ij-ésima observación,µ es un parámetro común a todos los tratamientos denominados
media global,Ti es un parámetro único para el i-ésimo, y
2 Polinomino ortogonal
122
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
εij es el componente aleatorio del error.
Nuestro objetivo será probar una hipótesis apropiada con respecto a los efectos del tratamiento, y hacer una estimación de ello. Para probar la hipótesis, se supone que los errores del modelo son variables aleatorias independientes con distribución normal, con media cero y varianza δ2. Se supone que esta última es constante para todos los niveles del factor.
Este modelo se denomina, análisis de varianza de clasificación en un sentido porque sólo se investiga un factor. Además se requiere que el experimento se realice en orden aleatorio, de manera que el medio en que se usan las unidades experimentales (tratamiento) sea lo más uniformemente posible. Por lo tanto, este diseño experimental es un diseño completamente aleatorizado.Para ilustrar este análisis de varianza, recordemos que deseamos determinar si al variar el contenido de algodón es una fibra de llama influye en la resistencia.
La suma de cuadrados requeridos para el análisis de varianza se calcula como sigue:
( ) NYYSCiIJtotal
/22 ∑−∑=
( ) NYnYSC iIJotratamient // 22 ∑−∑=
otratamienttotalerrorSCSCSC −=
Donde
SCtotal suma de cuadrados del totalSCtratamiento suma de cuadrados del tratamientoSCerror suma de cuadrados del errorΣYij sumatoria de los componentes del tratamientoΣYi sumatoria total de los tratamientosn número de datos por columnaN número total de datos del tratamiento
( ) ( ) 96,63625/3761115...77 22222 =−++++=total
SC
( ) ( ) 76,47525/3765/54108887749 222222 =−++++=otratamient
SC
123
Palacios C. Severo
20,16176,47596,636 =−=error
SC
En la tabla 4.12 se muestran los resultados del procedimiento.
Tabla 4.12 Análisis de varianzaFuente SC G
LCM Fo Ft(99%)
% algodónError
475,76161,20
420
118,948,06
14,76
> 4,43
Total 636,96 24 R² = 74,6923%
Hay que notar que la media de cuadrados entre tratamientos (118,94) es mucho mayor que la media de cuadrados dentro del tratamiento (8,06). Esto indica que es probable que las medias de tratamiento sean iguales. Más formalmente, es posible calcularlas razón Fo=14,76 y comparando con Ft(99%)=4,43, debe rechazarse Ho y concluir que la media de tratamientos difieren; en otras palabras el porcentaje de algodón en la fibra de llama afecta significativamente su resistencia media.c) DISEÑO DE PARCELAS DIVIDIDAS
Los diseños en parcelas divididas y subdivididas se emplean frecuentemente en experimentos factoriales en las que las condiciones del material experimental, o las operaciones experimentales contempladas dificultan el manejo de toda la combinación de factores.
El diseño básico de una parcela dividida involucra la asignación de tratamientos de un factor a parcelas principales o parcelas grandes, las cuales se disponen en diseños experimentales clásicos.
Los experimentos de parcelas divididas se utilizan cuando se quiere dar mayor precisión o importancia a un factor en comparación con otro. Este diseñó se divide en parcelas denominado grande y chicas correspondiendo a estas últimas la mayor precisión. En algunas ocasiones este es el diseño óptimo a elegir ya sea porque un factor requiere de áreas grandes para su evaluación o por razones económicas: láminas de riego y variedad de arroz, sistema de cultivo y fertilización.
Cabe mencionar que la diferencia entre un experimento factorial y uno de parcela dividida está en el proceso de aleatorización de los tratamientos. Así mientras que en un diseño factorial se hacen todas las combinaciones de tratamiento y se distribuyen aleatoriamente a las unidades experimentales, en el experimento de parcelas divididas
124
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
primero se distribuyen aleatoriamente los tratamientos de las parcelas grandes y luego los tratamientos de las parcelas chicas dentro de las parcelas grandes.
Ejemplo 4.33Se desea estudiar el efecto de la frecuencia de corte (parcela grande) y tres alturas de corte (parcela chica) en una producción de materia seca del pasto.
El primer paso es localizar el área donde se realizará el experimento. Si el terreno es homogéneo entonces es factible utilizar un diseño completamente al azar, si el terreno muestra un gradiente de variación la solución pudiera ser un diseño de bloque al azar.
Tabla 4.13 Experimento de parcelas divididas
FrecuenciaCorte (días)
AlturaCorte (cm)
Replicas
I II III IV
20 510155
3,693,723,66
5,983,202,85
5,373,902,60
6,304,513,83
23,3415,3312,94
Total 13,07 12,03 11,87 14,64 51,6140 5
1015
6,483,8611,15
7,924,543,54
4,744,423,91
6,305,063,66
25,4417,8822,26
Total 21,49 16,00 13,07 15,03 65,5860 5
1015
4,905,343,40
5,734,285,47
12,006,164,78
8,566,343,75
31,1922,1217,40
Total 13,64 15,48 22,94 18,65 70,71
Tabla de doble entrada para totales de tratamiento
Altura de corteFrecuencia corte 5 10 15 Total
204060
23,3425,4431,19
15,3317,8822,12
12,9422,2617,40
51,5665,6870,71
Total 52,60 55,33 79,97 187,90
Factor de corrección
( )73,980
36
41,35306
36
²90,187 ===FC
Suma de cuadrados debido a las replicas
125
Palacios C. Severo
( ) ( ) ( ) ( )FCSC replica −+++=
9
²31,48²88,47²51,43²20,48
79,173,98052,98273,9809
71,8842 =−=−=replicaSC
Suma de cuadrados debido a las parcelas grandes (frecuencia de corte)
( ) ( ) ( )FCSC pg −++=
12
²71,70²58,65²61,51
29,1673,98012
90,499974,430059,2663 =−+++=replicaSC
Suma de cuadrados debida a las parcelas chicas (altura de corte)
( ) ( ) ( )FCSC pch −++=
12
²60,52²33,55²97,79
88,3773,98012
76,276640,306120,6395 =−++=pchSC
Suma de cuadrados debida a las interacciones de los tratamientos (frecuencia de corte y altura de corte)
( ) ( ) ( )pchpg SCSCFCSC −−−+++=
4
²40,17...²33,15²34,23int
71,888,3729,1673,9804
45,4174int =−−−=SC
( ) ( ) ( ) ( )FCSC ppgx −++++=
3
²65,18²94,22...²03,12²07,13Re
52,4773,98025,102873,9803
74,3084Re =−=−=ppgxSC
44,2929,1679,152,4752,47 =−−=−−= pgreperrorpg SCSCSC
( ) ( ) ( ) ( ) FCSC total −++++= ²75,3²78,4...²98,5²69,5
126
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
01,14973,98074,1129 =−=totalSC
intSCSCSCSCSC pchpgxreptotalerrorpch −−−=
9,5471,888,3752,4701,149 =−−−=errorpchSC
Tabla 4.14 Análisis de varianzaFuente SC G
LCM Fo
ReplicaFrecuencia corteError pgAltura corteInteracción (f x a)Error pch
1,7916,2929,4437,888,71
54,90
3262418
0,608,154,9018,942,193,05
1,65
6,210,72
Total 149,01 35
Los efectos de bloque (replica) y frecuencia de corte se prueban utilizando la SCepg; mientras que los efectos de altura de corte (parcela chica) y de la interacción de frecuencia de corte de altura de corte se prueban utilizando la SCepch.
65,190,4
15,8
.
. ===pgerror
cortfre
CM
CMFC
72,005,3
19,2
.
int ===pcherrorCM
CMFC
Problemas
(113) Un industrial textil utiliza un gran número de telares. Se desea que los telares sean homogéneos con el objeto de producir telas de resistencia uniforme. El industrial supone que, aparte de la variación usual en la resistencia de la tela en muestras del mismo telar, puede existir una variación significativa de la resistencia entre los distintos telares. Para investigar esto, selecciona cuatro telares al azar y realiza cuatro determinaciones de la resistencia. Este experimento es realizado en orden aleatorio.Realice un análisis de varianza y vea si existe diferencia significativa.
127
Palacios C. Severo
Telar Corrida experimental Total1234
98919695
97909596
99939799
96929598
390366383388
(114) Una fabrica de calzados cuenta con cinco tipos de cuero curtido. Cada cuero tiene una forma de proceso. Para investigar se escogen cinco cueros al azar, y se mide la cantidad de cuero producido en cinco tiempos diferentes. Obteniéndose los datos.
Cuero Corrida experimental Total12345
14,013,914,013,613,8
14,013,814,213,813,6
14,213,914,114,013,9
14,014,014,013,913,8
14,114,013,913,714,0
70,369,670,269,069,1
Estime la varianza del error experimental(115) Se pide a cuatro químicos qué determinen el contenido de
nitrógeno de un fertilizante cada uno realiza tres determinaciones y los resultados son los siguientes:
Químico Corrida experimental Total1234
44,4945,1544,7244,20
44,0445,1344,4844,10
44,3844,8845,1644,55
133,41135,16134,36132,85
Difieren significativamente los resultadosQue análisis químico debe ser seleccionado.
(116) Un ingeniero de producción esta interesado en maximizar una aleación. Sabe por experiencia que la aleación contiene 3 elementos metálicos. Desea determinar si variando el contenido de un elemento metálico se incrementa la resistencia a la corrosión. Por bibliografía sabe que el contenido de dicho elemento metálico debe variar entre 10 a 30 por ciento para que la aleación tenga buenas características.
% metal Corrida experimental Total12345
923191811
1518191119
127
147
19
2211151218
10177
1825
6876746692
Existe diferencia significativa entre las medias(117) Una panadería desea averiguar la tendencia de sus productos
para el siguiente año, bajo las siguientes encuestas, para la diversidad de sus productos en cinco diferentes distritos.
Producto Corrida experimental Total12
200700
150200
300180
100500
700300
0,890,79
128
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
34
300400
150800
100600
200150
250350
0,960,85
Describa las observaciones con un modelo matemáticoExiste diferencia significativa entre las mediasSi existe diferencia aplicar las pruebas de Duncan
(118) Se desea evaluar el rendimiento de los estudiantes de cinco colegios en cuatro materias A: matemáticas, B: física, C: química y D: lenguaje
Materia Colegio NotaABCD
20181525
30252035
25182732
29352735
27333235
50403543
(119) Se realizó un estudio de ingeniería de tránsito sobre los retrasos en las intersecciones con semáforos en las calles de una ciudad. Se usaron tres tipos de semáforo: a) programado, b) semiautomático y c) automático.Se usaron cinco intersecciones para cada tipo de semáforo. La medida de retraso utilizada fue el promedio de tiempo que cada vehículo permanece detenido en cada intersección (segundos/vehículo). Los datos son los siguientes:
Programado Semiautomático
Automático
3837313635
1821192623
1611191117
Escriba el modelo linealCalcule el análisis de varianza.Calcule las medias de mínimos cuadrados del retraso en el tránsito y sus errores estándar para cada tipo de semáforo.Calcule el intervalo de confianza del 95% estimado para las medias de los tipos de semáforo.Pruebe la hipótesis de que no hay diferencia entre las medias de retraso para los tipos de semáforo; a un nivel de significación de 0.05, con la prueba F.Escriba las ecuaciones normales para los datos.
(120) Se llevó a cabo un experimento para probar los efectos de un fertilizante nitrogenado en la producción de lechuga. Se aplicaron cinco dosis diferentes de nitrato de amonio a cuatro parcelas (réplicas) en un diseño totalmente aleatorizado. Los datos son el número de lechugas cosechadas de la parcela.
Tratamient Lechuga
129
Palacios C. Severo
o0
50100150200
104134146147131
114130142160148
90144152160154
140174156163168
Escriba el modelo lineal estadístico para este estudio y explique sus componentes.Calcule el análisis de varianza.Calcule el intervalo de confianza del 95% estimado para las medias de los niveles de nitrógeno.Pruebe la hipótesis de que no hay diferencia entre las medias de los niveles de nitrógeno con una prueba F a un nivel de significancía de 0.05.Escriba las ecuaciones normales para los datos.Este experimento se llevó a cabo con un diseño totalmente aleatorizado de las parcelas en un arreglo rectangular. Muestre una aleatorización de los cinco tratamientos con nitrógeno de las 20 parcelas, usando una permutación aleatoria de 1 a 20.
(121) Un fisiólogo de animales estudió la función pituitaria de las gallinas, bajo el régimen estándar de muda de pluma forzada que usan los productores de huevo para mantenerlas en producción. Se usaron 25 gallinas en el estudio. Cinco se utilizaron para la medición, una previa al régimen de muda forzada y una al final de cada una de las cuatro etapas del régimen. Las cinco etapas del régimen fueron:
1. Premuda (control),2. Ayuno de 8 días,3. 60 gramos de salvado al día durante 10 días,4. 80 gramos de salvado al día por 10 días y5. Mezcla de malta durante 42 días.
El objetivo era dar seguimiento a las respuestas fisiológicas asociadas con la función pituitaria de las gallinas durante el régimen para explicar por qué vuelven a producir después de una muda forzada. Uno de los compuestos medidos fue la concentración de suero T3. Los datos de la tabla son las medidas de suero T3 en las cinco gallinas sacrificadas al final de cada etapa del régimen.
Tratamiento Suero T3PremudaAyuno60 g salvado80 g salvadoMezcal malta
94,198,8197,2102,983,1
90,5103,6207,3117,589,6
99,4115,3177,5119,987,8
73,6129,1226,1112,196,4
74,4117,6222,
8101,1
130
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
82,2
Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo.Calcule el análisis de varianza.Calcule un intervalo de confianza de 95% estimado para las medias de los tratamientos.Pruebe la hipótesis de que no hay diferencia entre las medias de los cinco tratamientos con la prueba F a un nivel de significancía de 0,05.Escriba las ecuaciones normales de los datos.Este experimento se llevó a cabo en un diseño totalmente aleatorizado, con una gallina en cada una de las 25 jaulas. Proporcione una asignación aleatoria de los cinco tratamientos a las 25 jaulas, con una permutación aleatoria de los números 1 a 25.
(122) Se recolectaron datos de estudiantes de pedagogía en cuanto a su uso de ciertas estrategias de enseñanza estudiadas antes de sus prácticas. Había 28 estudiantes que habían aprendido las estrategias (9 en 2002, 9 en 2003 y 10 en 2004). El 2001 había 6 profesores que no habían aprendido el uso de estas estrategias y se usaron como grupo de control.El investigador registró el número promedio de estrategias por semana que cada estudiante usaba durante sus prácticas. El investigador quería saber si el número de estrategias usadas variaba con el tiempo.
Número promedio de estrategias usadasControl 2001 2002 2003 2004
6,95,615,99,87,85
7,310,68,68,78,87,1
11,27,3
10,5
10,97,56,87,67,85,78,95,97,3
7,514,96,15,25,7
14,29,35,67,3
10,8
Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo.Calcule el análisis de varianza.Calcule un intervalo de confianza del 95% estimado para las medias de los tratamientos.Pruebe la hipótesis de que no hay diferencia entre las medias de los cuatro tratamientos, con la prueba F a un nivel de significancía de 0.05.
131
Palacios C. Severo
Escriba las ecuaciones normales de los datos.(123) En cierto estudio de calibración de espectroscopia de
absorción atómica, las medidas de respuesta fueron las unidades de absorción de un instrumento según la cantidad de cobre diluido en una solución ácida. Se usaron cinco niveles de cobre con cuatro réplicas del nivel cero y dos réplicas de los otros cuatro niveles.En la siguiente tabla se dan los datos de espectroscopia para cada nivel de cobre como microgramos de Cu/mililitro de solución.
Cobre mg/ml0,00 0,05 0,10 0,20 0,500,0450,0470,0510,054
0,0840,087
0,1150,116
0,1830,191
0,3950,399
Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo.Calcule el análisis de varianza.Calcule las medias de mínimos cuadrados y sus errores estándar para cada tratamiento.Calcule un intervalo de confianza del 95% estimado para las medias de los tratamientos.Pruebe la hipótesis de que no hay diferencia entre las medias de los cinco tratamientos, con la prueba F(95%).Escriba las ecuaciones normales de los datos.
(124) Considere el experimento del ejercicio 121. Suponga que se perdieron algunas gallinas durante el transcurso del mismo, lo que dio como resultado el siguiente conjunto de observaciones.
Tratamiento Suero T3PremudaAyuno60 g salvado80 g salvadoMezcal malta
94,198,8197,2102,983,1
90,5103,6207,3117,589,6
99,4115,3177,5119,987,8
73,6129,1
112,196,4
117,6
101,1
Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo.Calcule el análisis de varianza.Calcule las medias de mínimos cuadrados y sus errores estándar para cada tratamiento. ¿Cómo afectó la pérdida de gallinas a las estimaciones de las medias?Calcule un intervalo de confianza de 95% estimado para las medias de los tratamientos.
132
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Pruebe la hipótesis de que no hay diferencia entre las medias de los cinco tratamientos; con la prueba F a un nivel de significancía de 0,05.Escriba las ecuaciones normales de los dato
(125) Utilice los datos del ejercicio 51 para determinar cuántas gallinas necesitaría el biólogo en cada tratamiento para rechazar la hipótesis nula a un nivel de significancía de 0.05, si la diferencia entre el tratamiento de control y cualquier tratamiento nuevo es de 30 unidades de T3.
(126) Use los datos del ejercicio 49 para determinar cuántas intersecciones necesita el ingeniero de tránsito con cada tipo de semáforo para rechazar la hipótesis nula a un nivel de significancía de 0.01, si los retrasos medios respectivos en los tres tipos de señal fueron 20, 18 y 16 segundos.
(127) Se quiere probar el efecto de cinco dietas en el aumento de peso en cerdos pero se tiene diferente peso inicial en las unidades experimentales. Aquí el factor peso inicial es medible y no puede utilizarse como un criterio de clase (nivel de un factor) por lo que es mejor utilizar un diseño completamente al azar con peso inicial de las unidades experimentales como covariables. De esta manera se ajusta respecto a peso inicial, se tiene más grados de libertad para el cuadrado medio del error y se maneja un diseño más sencillo. Si además del peso inicial, la edad se los animales fuese otro factor de importancia podría incluirse teniendo así un diseño completamente al azar con dos covariables.
(128) Suponga que un investigador en fisiología esta interesado en planear un experimento para medir el efecto del área necrótica sobre la fotosíntesis de 8 variedades de café susceptibles a la roya. Planea usar parcelas experimentales de 4 plantas en un lote ubicado en una pendiente del 70 %. Por experimentos anteriores se sabe que la roya es más agresiva en la zonas bajas que en este caso además son las más húmedas y por lo tanto más favorables para el desarrollo de la enfermedad. El investigador cuenta con 320 plantas y solo puede sembrar grupos de 32 plantas para distribuirlas a lo largo de la pendiente. Por otra parte cuenta solo con 8 equipos para la medir la fotosíntesis y decide medir entre 10:00 y 10:15 a.m. Se sabe que tarda en medir la fotosíntesis de cada hoja afectada 3 minutos. ¿Qué diseño experimental le recomendaría al investigador? De acuerdo con lo recomendado, indíquele como
133
Palacios C. Severo
hacer el análisis de los datos y las comparaciones de tratamientos.
(129) Un investigador plantea la hipótesis de que el gusano blanco de la papa se puede controlar biológicamente usando tres especies de nematodos. Para su aplicación, quiere ensayar tres sistemas diferentes: en la superficie, en la parte media y en el fondo de cada matera formando un círculo. La efectividad del sistema puede variar de acuerdo con el nematodo. Para evitar complejidad, el investigador esterilizara el suelo, aplicara soluciones nutritivas a todas las materas e infestara cada matera con igual número de larvas. La infestación con las larvas se hará 8 días después de la floración del cultivo de papa y la aplicación de los nematodos se hará 15 días antes de la infestación. Se consideró la matera con 2 kg de suelo y una planta, como unidad experimental. Por tratamiento va a tener 10 unidades experimentales en un invernadero.Qué diseño experimental recomendaría.Como asignaría los tratamientos a las unidades experimentales Que variable(s) mediríaEscriba una tabla de análisis mostrando solamente las fuentes de variación y los grados de libertad.Son los factores cualitativos o cuantitativosConsidere los factores aleatorios y escriba como calcular las componentes de varianza y las pruebas de F
(130) Para determinar la permanencia del controlador biológico beauveria bassiana sobre las hojas del cafeto después de un aguacero, se piensa hacer un experimento en el cual se usará un solo simulador de lluvia para despachar una misma cantidad de agua con diferentes tiempos de duración, para una intensidad dada. Los tiempos de duración son: 30, 60 y 90 minutos en horas de la tarde. Se asperjarán 3 dosis del hongo (108, 1010 Y 1012 esporas por mililitro) debidamente calibradas, donde se espera tener una distribución uniforme del número de gotas por centímetro cuadrado en las hojas. La unidad experimental estará constituida por 10 plántulas de 6 meses de edad. Se quiere medir el número de esporas promedio en 5 campos de la hoja. El simulador de lluvia logra regar 30 plantas a la vez. El investigador cuenta con 450 plantas para su experimento. ¿Que diseño experimental recomienda? ¿Qué le indicaría al investigador para hacer el análisis de los datos?
(131) Suponga que un ingeniero está interesado en la comparación de tres procesos químicos para la manufactura de cierto
134
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
compuesto. Se sospecha que la impureza de la materia prima usada en el proceso puede afectar el producto final, sin embargo se espera ajustar el proceso al final del análisis. Usando un diseño completamente aleatorizado con 15 unidades experimentales obtuvo la siguiente información:
Tratamiento Impurezas Producción1
2
3
4,12,91,54,12,26,82,73,86,45,66,62,23,53,54,6
12,510,39,612,611,311,58,67,211,68,96,84,85,67,56,2
Estime la línea de regresión para cada tratamientoLleve a cabo la prueba de hipótesis de que las tres líneas de regresión tienen la misma pendienteObtenga la estimación combinada de la pendiente.Obtenga las medias sin ajustar y ajustadas de los tratamientos y compárelos comentando los resultados respectivos.Obtenga la tabla de análisis de la varianza e interprete cada uno de los resultados de esta tabla.
(132) A continuación se analizan los datos de un experimento en caña de azúcar. En las parcelas grandes se ensayaron dos tratamientos.C: Con compuesto orgánicoS: Sin compuesto orgánicoEn las sub parcelas se ensayaron cuatro tratamientos.1 Testigo.2 Cal 1,5 Ton/ha.3 Cal 3,0 Ton/ha.4 Cal 4,5 Ton/ha.La respuesta de interés fue el rendimiento del campo en kilogramos por parcela chica de 100.8 m2, y se generó la variable R: para el rendimiento de caña en toneladas por hectárea.
V. DISEÑO TOTALMENTE ALEATORIZADO
135
Palacios C. Severo
Se usa cuando los datos tienen pequeña variación, y además cuando el número de tratamientos también es pequeño.
Si tenemos N-tratamientos, y queremos ubicar n-elementos para los N-tratamientos procedemos de la siguiente manera.
Se eligen aleatoriamente n-unidades experimentales para aplicarle un tratamiento digamos t, luego tenemos n-elementos de las Nn-n restantes para aplicarles el tratamiento t2 y así sucesivamente hasta agotar las Nn unidades experimentales.
En muchos problemas es necesario diseñar experimentos en los que pueda controlarse sistemáticamente la variabilidad producida por diversas fuentes extrañas.
Ejemplo 4.34Se desea determinar la alimentación de terneras con productos distintos para el engorde artificial. El experimentador ha decidido obtener cuatro observaciones para cada alimentación.
Solo existe un factor - alimentación artificial, y el diseño de un factor completamente aleatorizado consiste en asignar aleatoriamente cada uno de los 4x4=16 ensayos a una unidad experimental, o sea la alimentación de terneras, el engorde artificial correspondiente.
Por lo tanto, se requerirán 16 formas de alimentación para realizar este experimento, una para cada ensayo.
En principio existe un problema serio en el diseño. Como las terneras son distintas, las unidades experimentales contribuyen a la variabilidad observada en la lectura de alimentación.
Como resultado, el error experimental reflejará tanto el error aleatorio como la variabilidad entre los animales.
Tabla 4.15 Datos de alimentación de ternerasTernera Corrida experimental Total Media
1234
9,39,49,29,7
9,49,79,49,6
9,69,89,510
109,99,7
10,2
38,338,837,839,5
9,5759,7009,4509,875
136
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Se desea que el error experimental sea lo más pequeño posible; en otras palabras, se busca sustraer del error experimental la variabilidad producida por las terneras. Un diseño que logre esto requiere que el experimentador pruebe cada alimentación, una vez, en cada uno de las cuatro terneras diferentes.
El diseño que aparece en la tabla 4.15, se conoce como diseño aleatorizado. La respuesta observada es el incremento de peso diario en gramos.
El análisis estadístico se lleva a cabo en función de la prueba F, el valor de Fo se compara con el valor de Ft en función de los grados de libertad de los tratamientos y del error experimental.
Debemos calcular la varianza total y descomponerla para el tratamiento y el error.
( ) ( ) 18,116/4,1532,1010...4,93,9 22222 =−++++=total
SC
( ) ( ) 395,016/4,1534/5,398,373,383,38 22222 =−+++=ootratamient
SC
785,0395,018,1 =−=error
SC
12:
31:
151:
416:
=−=−
=−==
nNError
noTratamient
NTotal
nNGL
Tabla 4.16 Análisis de varianzaFuente SC G
LCM Fo Ft(99%)
TernerasError
0,3950,785
312
0,1280,065
1,96 < 5,95
Total 1,18 15 R² = 66,5254%
El análisis de la prueba F indica que puede ser rechazado la hipótesis Ho por lo que puede afirmarse que existe diferencia entre las medias de los tratamientos comparados; sin embargo el investigador puede concluir entre cuales tratamientos es que existe diferencia.
137
Palacios C. Severo
Problemas
(133) Un técnico textil desea probar el efecto que tiene cuatro productos químicos sobre la resistencia de un tipo de tela. Como puede haber variabilidad entre un rollo de tela y otro, decide utilizar un diseño aleatorizado, seleccionando cinco rollos al azar y les aplica los cuatro productos químicos en orden aleatorio. A continuación, se proporcionan los resultados de la resistencia.Analice estos datos y haga las conclusiones apropiadas.
Químico Corrida experimental Total Media1234
73737573
68676871
74757875
71727375
67706869
(134) Se emplean cuatro laboratorios para realizar un análisis químico como parte de un estudio, para determinar si los laboratorios dan en promedio los resultados mínimos, se le envía a cada uno una muestra del mismo material. Los resultados analíticos son:
Análisis Corrida experimental Total Media1234
58,764,557,361,4
62,756,160,958,2
55,960,359,160,3
60,760,959,258,1
61,463,155,262,3
Existe diferencia significativa entre los laboratoriosRealice un análisis de varianza
(135) Tres diferentes soluciones para lavar están siendo comparadas con objeto de estudias su efectividad en el retraso de crecimiento de bacterias en envases de leche. El análisis se realiza en un laboratorio y sólo puede efectuarse tres pruebas en un sólo día, el experimentador recupera las observaciones durante cuatro días y los datos aparecen a continuación.
Químico Corrida experimental Total Media123
13165
18171
394422
22244
(136) Se desea estudiar la adición sistemática para la obtención de peltre (aleación de estaño, plomo, cobre antimonio) de muy buena calidad, se comparan cinco estándares con el suministro
138
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
de estaño (Sn) y cobre (Cu): a) Sn=92, Cu=2; b) Sn=93, Cu=1; c) Sn =93, Cu=2; d) Sn=94, Cu=1, e) Sn=94, Cu=2
Aleación Corrida experimentalABCDE
1,181,451,361,451,96
1,201,231,231,782,12
1,031,761,411,561,78
0,921,621,251,741,83
1,271,341,511,672,07
1,241,601,441,461,76
(137) Se realizó una prueba de la vida útil, a temperatura acelerada, de un tipo de calentador tubular. Se probaron seis calentadores, cada uno a cuatro temperaturas distintas: 1520°F, 1620°F, 1660°F y 1708°F. Se registró el número de horas transcurridas hasta que se presentó falla en los 24 calentadores utilizados en el estudio.
temperatura
Horas hasta la falla
1520162016601708
19531190651511
21351286837651
24711550848651
472721251038652
613425571361688
631428451543729
Investigue las suposiciones necesarias para un análisis de varianza de los datos.Realice un análisis de varianza de los datos transformados, y haga una partición de la suma de los cuadrados de la temperatura en contrastes polinomiales ortogonales, para determinar la mejor relación entre la temperatura y su variable de respuesta. Como las temperaturas de prueba tenían espaciamientos desiguales, use los siguientes coeficientes de contraste:
Temperatura
1520 1620 1660 1708
LinealCuadráticaCúbica
-0,7730,382-0,078
-0,051-0,6370,584
0,238-0,328-0,765
0,5850,5830,259
(138) Un entomólogo contó el número de huevos que pone cada una de las 15 hembras de polillas en días sucesivos, en tres variedades de gusano de tabaco (USDA, campo y resistente). Los siguientes datos son el número de huevos puestos en el tercer día después del apareamiento de cada hembra en cada variedad.
Variedad Número de huevos por polillaUSDACampoResistente
4482110
906276
9
28415143
227787
1
6341826
48118127
3691
161
137151294
USDA 29 522 319 242 261 566 734
139
Palacios C. Severo
CampoResistente
00
253348
610
014
27521
00
153218
El entomólogo desea realizar un análisis de varianza del número de huevos.
(139) Un criador de plantas evaluó la capacidad de enraizar de nueve clones de pasto en un experimento de laboratorio. Cultivó dos réplicas de cada clon en una solución oxigenada en un diseño totalmente aleatorizado.
ClonReplica I Replica II
Enraizado No enraizado
Enraizado No enraizado
123456789
15131361614898
495151424850565540
111164129181016
535358605255465448
El cultivador quiere analizar la proporción de cultivos enraizados o la proporción de nodos enraizados.
(140) Dada la siguiente muestra aleatoria de N = 15 observaciones, ordenadas de menor a mayor:
14,3 16 17,3 17,5 17,8 18,7 18,8 18,920 20,8 21,4 22,7 23,2 25,6 27,8
Determine los valores f y sus cuantiles normal estándar.Grafique las observaciones contra los cuantiles normal estándar.Interprete la gráfica respecto a la forma de la distribución a partir de la cual se muestrearon las observaciones.
(141) Dada la siguiente muestra aleatoria de N = 16 observaciones, ordenadas de menor a mayor:
2 3 4 5 10 28 34 3539 63 87 97 112 156 188 253
Determine los valores f y sus cuantiles normal estándar.Grafique las observaciones contra los cuantiles normal estándar.Interprete la gráfica respecto a la forma de la distribución a partir de la cual se muestrearon las observaciones.
140
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
VI. DISEÑO DE BLOQUES ALETORIZADOS
El concepto de bloques fue introducido en agricultura; al observarse que los campos experimentales en agricultura marcaban una heterogeneidad de fertilidad, lo que complicaba la asignación de los tratamientos de un punto a otro, de aquí que el bloque permitía la partición de la variabilidad inherente en el campo experimental después de la asignación de los tratamientos en las siguientes componentes:
1. Diferencias entre tratamientos-Variación entre tratamientos.2. Variación dentro de bloques.3. Variación entre bloques.
De esta forma nació el concepto de diseño en bloque completos aleatorizados. El término bloque es usado más ampliamente para referirse a un grupo de unidad experimental que tienen un conjunto de características que provocan un problema efectivo de respuesta, una vez que han sido aplicados los tratamientos.
El diseño de bloques aleatorizados constituye una de las variantes para el agrupamiento de las unidades experimentales que se utilizan cuando en la conformación de los grupos en un experimento de comparación por grupos, se detecta que existen diferencias en cuanto a una característica determinada entre los objetos. A partir de ello se estructura la formación de los grupos, en función de establecer bloques de tratamiento semejantes en cuanto a las características en
141
Palacios C. Severo
cuestión para que compongan cada bloque en forma aleatoria en cada uno de los grupos experimentales posteriores.
Esta distribución permite llevar a cabo un control más preciso de los efectos de esta característica variable a través del agrupamiento en bloques elevando con ello la precisión del experimento.
Ejemplo 4.35Se realizo un experimento con el objeto de comparar el efecto del suministro de diferentes niveles de concentrado a las aves de corral para lo cual se aplicaron las siguientes variantes:
A; Sin concentrado (dieta normal)B: 250 gramos de concentrado por cada kilo de ave vivaC: 300 gramos de concentrado por cada kilo de ave vivaD: 500 gramos de concentrado por cada kilo de ave viva
El experimento se monto utilizando 80 aves de corral, los que fueron agrupados en 5 bloques de acuerdo al peso inicial, que vario entre 1 a 2 Kg. teniendo en cuenta este agrupamiento se formaron unidades experimentales de cuatro aves por corral.
Lográndose obtener los resultados en el aumento de peso diario durante la prueba (alimento de concentrado), expresado en Kg/día de peso vivo.
ConcentradoBloque
Total MediaI II III IV V
ABCD
0,81,01,21,4
1,01,11,31,4
0,91,01,11,8
0,81,11,31,6
1,01,31,11,8
4,55,568
0,91,11,21,6
Total 5,2 4,8 4,4 4,8 4,8 24
( ) ( ) 6,120/244,16,1...9,01 22222 =−++++=total
SC
( ) ( ) 3,120/245/865,55,4 22222 =−+++=otratamient
SC
( ) ( ) 08,020/245/8,48,44,48,42,5 222222 =−++++=bloqueSC
22,008,03,16,1 =−−=error
SC
142
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
121:
41:
31:
191:
5420:
=+−−=−
=−=−
===
mnNError
mBloque
noTratamient
NTotal
mnNGL
Tabla 4.17 Análisis de varianzaFuente SC GL CM Fo Ft(99%)
ConcentradoBloqueError
1,300,080,22
3412
0,430,020,018
23,45
1,09
><
5,955,41
Total 1,6 19 R² = 81,25%
Al comparar los resultados de los valores de F encontramos que los efectos de los tratamientos resultan significativos lo que indica que existe una influencia diferente entre los efectos de las diferentes dietas comparadas en cuanto al incremento de peso diario de las aves de corral durante las pruebas.
Referente al efecto del agrupamiento en bloque resulto no significativo por lo que las aves de corral se comportan en forma semejante independiente de su peso inicial del experimento.
A partir de los resultados podemos concluir desde un punto de vista biológico el efecto obtenido con la utilización de concentrados en la dieta para aves de corral, sin embargo debe de estudiarse con detenimiento los factores que provocan los resultados obtenidos al comparar las dietas.
Ejemplo 4.36Un agrónomo desea determinar el efecto de diferentes fuentes de nitrógeno en la producción de una materia seca sobre cebada forrajera. Hay cinco fuentes a ser comparadas: (NH4)2SO4, NH4NO3, CO(NH2)2, Ca(NO3)2 y NaNO3 y con un tratamiento control sin nitrógeno. Se deseo aplicar los resultados sobre un rango bastante amplio de condiciones, se hicieron ensayos sobre cuatro tipos de suelo.
Para el diseño experimental se eligió un diseño en bloques completamente aleatorizado con los tipos de suelo como factor de bloqueo, se localizaron seis parcelas en cada uno de los cuatro tipos de suelo, y se asigno aleatoriamente los tratamientos a las parcelas
143
Palacios C. Severo
dentro de cada tipo de suelo. La variable de interés es la producción de cebada bajo varias fuentes de nitrógeno.
Los datos obtenidos de realizar este experimento se presentan en la tabla 4.18.
Tabla 4.18 Producción (kg/parcela) de cebada bajo varias fuentes de nitrógenoTipo de suelo
Tratamiento I II III IV(NH4)2SO4
NH4NO3CO(NH2)2Ca(NO3)2
NaNO3Control
32,130,125,424,126,123,2
35,631,527,133,031,024,8
41,937,133,835,633,826,7
35,430,831,131,431,926,7
Las sumas de cuadrados se obtienen de la siguiente manera:
( )ij
ij
ijtotal n
YYSC
2
2∑ −=
494518324
²2,74052,23323 =−=totalSC
( )∑ −=
ij
ij
ijotratamient
n
YY
bSC
2
21
[ ] 256153324
²2,740²4,110²8,122²1,124²4,117²5,129²145
4
1 =−+++++=otratamientSC
( )∑ −=
ij
ij
ijbloque
n
YY
tSC
2
21
[ ] 192748324
²2,740²3,187²9,208²183²161
6
1 =−+++=bloqueSC
bloqueotratamienttotalerror SCSCSCSC −−=
144
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
456166192748325615334945183 =−−=errorSC
Tabla 4.19 Análisis de varianzaFuente SC GL CM Fo Ft(99%)
SueloTratamientoError
19274832561533456166
3515
64249451230630411
21,1316,8
5
>>
5,424,56
Total 4945183
23 R² = 90,7755%
Ejemplo 4.37Un agricultor rocía hojas de manzana con diferentes concentraciones de un compuesto de nitrógeno, luego determina la cantidad de nitrógeno que permanecía en las hojas inmediatamente después de la aplicación y al final de ciertos tiempos preestablecidos.
La finalidad de este experimento fue determinar la rapidez a la que el nitrógeno es absorbido por las hojas, hubo dos reproducciones de cada tratamiento según se muestra en la tabla 4.20
Tabla 4.20 Cantidad de nitrógeno que permanece después de la aplicaciónConcentración de nitrógeno
Tiempo N1 N2 N3
t0
t1
t2
2,292,540,460,190,000,26
6,805,943,031,000,751,16
8,759,522,492,041,401,81
Asumiendo un bloqueo por tiempos, al llevar a cabo el análisis de varianza y probar la hipótesis de interés H0: µN1 = µN2 = µN3, los resultados del ANOVA se muestran en la tabla 4.21
[ ] 91757618
²43,50²83,5²21,9²84,35
6
1 =−++=bloque
SC
[ ] 35113618
²43,50²01,26²68,18²74,5
6
1 =−++=otratamientSC
[ ] 309755²21,3..²74,12²83,42
12884143 =+++−=errorSC
145
Palacios C. Severo
1715741412880233045617640162853167exp =+−−=ererrorSC
147126214128802884143 =−=totalSC
Con base en éstos resultados, se obtiene la tabla 4.21 y a partir de la ésta, se concluye que la permanencia de nitrógeno en las hojas se ve afectada por la cantidad de nitrógeno aplicada, pues Fo = 4,09 < Ft(95%)
= 6,9. Por otro lado, al parecer los tiempos (bloques) difieren de manera significativa, ya que el cuadrado medio es grande en relación con el error experimental.
Tabla 4.21 Análisis de varianzapermanencia de nitrógeno en las hojas
Fuente SC GL CM Fo Ft(95%)TiempoNitrógenoError expError
91757635113617157430975
2249
458788175568428933441
10,694,09
><
6,946,94
Total 1471262 17 R² = 88,3383%
Ejemplo 4.38Un ingeniero químico piensa que el tiempo de reacción de un proceso químico en donde los reactantes actúan espontáneamente esta en función directa del tipo de catalizador empleado, se emplean cuatro tipos de catalizadores a fin de realizar el presente estudio.
Tabla 4.22 Tiempos de reacción del procesoLote de materia prima
Catalizador I II III IV Yoi
1234
73-
7375
747575-
-676872
7172-
75
218214216222
Yoj 221 224 207 218 Yoo=870
Se están investigando cuatro catalizadores, en cuatro lotes de materia prima y se observa el tiempo de reacción. Los datos obtenidos se presentan en la tabla 4.22
Para este conjunto de datos se tiene r = 3; k = 3 y el número de veces que cada par de tratamientos aparece en el mismo bloque es:
146
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
( ) ( )2
3
23
1
1 ==−−=
t
krλ
Este diseño en bloques incompletos balanceado tiene una eficiencia relativa con respecto al DBCA de:
( )( ) 889,033
42 ===kT
tE
λ
Prefiriendo de esta forma bloques incompletos balanceados.
Para comprobar la hipótesis H0: τ1 = τ2 = τ3 = τ4, se construyen las diferentes sumas de cuadrados con base en la estructura de las siguientes matrices:
( )444443
2xx JIC −= 443
8xI=Ω 44
1
3
8xI=Ω−
Con base en estos resultados, se encuentra que:
810012
²87063156 =−=totalSC
( ) 550012
²870²218²224²207²221
3
1 =−+++=bloqueSC
( ) 227540016498124
1 =+++=ajustratSC
En la tabla 4.23 se resumen los resultados anteriores a través del análisis de varianza. Puesto que Fo = 11,66 > Ft(95%) = 5,41, se concluye que el catalizador empleado tiene un efecto significativo sobre el tiempo de reacción.
325550022758100 =−−=−−= bloquetrattotal SCSCSCSCerrorajus
Tabla 4.23 Análisis de varianza para los tiempos de reacción del procesoFuente SC GL CM Fo Ft(95%)
BloqueTratamiento(ajus
55002275
33
1833758
28,211,6
><
5,415,41
147
Palacios C. Severo
)Error
325 5 65
Total 8100 11 R² = 95,9876 %
Problemas
(142) Se describe un experimento en el cual se determinó el factor de forma para distintos embutidos a seis niveles de velocidad. El interés se concentro en las diferencias potenciales del equipo, y la velocidad se consideró una variable problemática.
Embutido
Velocidad
123
0,780,830,83
0,750,860,89
0,770,810,89
0,800,850,92
0,810,920,95
0,780,850,93
148
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
45
0,830,75
0,880,76
0,860,76
0,790,86
0,980,78
1,140,97
(143) Un fabricante produce nutrientes en cuatro reactores se sabe que cada reactor tiene sus propias características de procesamiento de modo que cada reactor se considera una variable problemática en cualquier corrida experimental en la fabricación que implica más de un reactor. El ingeniero de planta sospecha que la velocidad de agitación influye en la homogenización y dilución de los productos sólidos. Cada reactor puede operar a cuatro velocidades de agitación distinto.Se efectuó un diseño de bloques aleatorizados para una empresa exportadora, los datos son:
Agitación Reactor5
101520
6926
5693
814147
4569
Existe alguna evidencia de que la velocidad de agitación influya en la disolución de los productos.Que recomienda usted al ingeniero de planta respecto a la elección de la velocidad de agitación y el reactor para este proceso.Existe alguna evidencia de que la velocidad de agitación influya en la disolución de los productos.Que recomendaría usted al ingeniero de planta respecto a la elección de la velocidad de agitación y el reactor del proceso.
(144) Se emplean cuatro laboratorios para efectuar un análisis químico. Como parte del estudio para determinar si los datos dan un promedio en los resultados, se le envía a cada uno una muestra del mismo material, los resultados son:
Análisis Laboratorio12345
58,761,460,959,158,2
62,764,563,159,260,3
55,956,157,355,258,1
60,760,360,961,462,3
Existe alguna diferencia significativa entre los laboratorios.(145) Se estudia el rendimiento de cuatro detergentes diferentes. Se
obtuvieron las siguientes lecturas de blanqueo para 12 cargas de lavado distribuidos en tres modelos de lavado.
Detergente
Lavado
ABC
454748
434650
315255
149
Palacios C. Severo
D 42 37 49
(146) Considere un experimento de 10 tratamientos y 5 replicaciones en el diseño experimental de bloques completos al azar. Muestre un plan de la aleatorización de los tratamientos en las réplicas (Bloques).
(147) Quince variedades de maíz fueron sembradas en una estación experimental, con el propósito de seleccionar los de mayor producción. El ensayo se realizó teniendo en cuenta una estructura de bloques. Se midió el rendimiento de maíz tonelada/unidad de superficie y los resultados del ensayo se resumen en la siguiente tabla:
Fuente SC GL CM Fo
BloqueVariedadError
238033,14 7,38
Total 7082935
DISEÑO CUADRADO LATINO
El diseño en bloques aleatorios es adecuado cuando una fuente de variabilidad extraña se elimina comparando un conjunto de medias muéstrales. Una Característica importante de este tipo de diseño es su balance, que se logra asignando el mismo número de observaciones a cada tratamiento de cada bloque. La misma clase de balance puede
150
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
lograrse en otros tipos de diseño más complicados, en los cuales es conveniente eliminar el efecto de varias fuentes extrañas de variabilidad.
El diseño cuadrado latino se usa para eliminar dos fuentes de variabilidad problemática, en otras palabras, permite analizar sistemáticamente por bloques en dos direcciones. En este diseño los renglones y columnas representan, en realidad, dos restricciones a la aleatorización. En general, un cuadrado latino PxP, es un cuadrado que contiene P renglones y P columnas, dada una de la P2 celdas contiene una de las P letras que corresponde a un tratamiento, y cada letra aparece una sola vez en cada renglón y columna, ejemplo.
BCAED
AEDBC
CDBAE
DAECB
EBCDA
CBAD
BADC
ADCB
DCBA
CAB
ABC
BCA
,,
Su utilidad esta determinado por la búsqueda de ejercer un control efectivo de posibles fuentes de error en el experimento, derivadas éstas fundamentalmente de las características individuales del material experimental; se puede ampliar las posibilidades de control a dos posibles fuentes, con lo que resulta comparativamente con los diseños anteriores.
Esta posibilidad de control de dos fuentes de error determinado por el agrupamiento de las unidades experimentales en un sistema de distribución bi direccional; de tal manera ejecutado, que permita una formación de los grupos que componen cada variante del experimento, con una distribución equitativa, teniendo en cuenta dos posibles fuentes de error.
Ejemplo 4.39Se realizó un experimento para investigar la influencia entre los tiempos medios para ensamblar 4 tipos de equipos aspersores distintos.Hay dos fuentes de variación moderada que afectan la respuesta, la variación entre los operarios y el efecto de la fatiga.
151
Palacios C. Severo
Si una persona ensambla una serie de dispositivos durante un cierto tiempo, se desea evaluar dichas influencias.
Por consiguiente cuatro operarios fueron seleccionados y cada uno ensambla los cuatro dispositivos de acuerdo al siguiente diseño.
FilasEnsamblado
TotalI II III IV
1234
C=44B=41A=59D=58
A=41C=42D=41B=37
B=30D=49C=59A=53
D=40A=49B=34C=59
153181193207
Total 202 161 191 192 763
Tratamiento
A B C D
Total 202 142 204 188Media 50,5 35,5 51 47
Partiendo de la base de datos obtenemos:
( ) ( ) 133016/7635953...4144 22222 =−++++=totalSC
( ) ( ) 36516/7634/20719318115322222 =−+++=
filaSC
( ) ( ) 5,22616/7634/19219116120222222 =−+++=
columnaSC
( ) ( ) 62616/7634/188204142202 22222 =−+++=otratamientSC
5,1126265,2263651330 =−−−=errorSC
623:
31:
31:
31:
151:
416:
=+−=−
=−=−=−
==
nNError
noTratamient
nColumna
nFilas
NTotal
nNGL
Como se aprecia en la tabla 4.24 del análisis de varianza la columna de fuente no resulto controlada significativamente ya que el valor de F es menor que el Ft(99).
152
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Tabla 4.24 Análisis de varianzaFuente SC G
LCM Fo Ft(99%)
TratamientoFilaColumnaError
626365
226,5112,5
3336
208,66121,66
75,518,75
11,126,484,02
><<
9,789,789,78
Total 1330 15 R² = 76,5037%
Ejemplo 4.40Se presenta un experimento, en donde se probaron cuatro métodos distintos, A, B, C y D, para preparar mezclas de concreto. Consistieron los métodos de dos relaciones de cemento y agua, y dos duraciones de mezclado. Los cuatro métodos fueron controlados por cuatro lotes y cuatro días. El concreto se coló en cilindros y se midió la resistencia a la compresión en kg=cm2, a los 7 días de almacenamiento en cámaras especiales con 20°C de temperatura y 50% de humedad relativa. Los resultados del diseño que se uso se presentan en la tabla 4.25
Tabla 4.25 Resistencia del concreto a la compresión en kg=cm2
DíasEnsamblado
TotalI II III IV
1234
A=303B=280C=275D=304
B=299A=321D=315C=293
C=290D=313A=319B=295
D=290C=282B=300A=305
1182119612091197
Total 1162 1228 1217 1177 4784
2854016
²47841433270 =−=totalSC
[ ] 1750016
²4784²1222²1140²1174²1248
4
1 =−+++=métodoSC
[ ] 91516
²4784²1197²1209²1196²1182
4
1 =−+++=díasSC
[ ] 745516
²4784²1177²1217²1228²1162
4
1 =−+++=loteSC
2670=−−−= lotedíastrattotalerror DCSCSCSCSC
153
Palacios C. Severo
Con base en los anteriores resultados, se llega a la tabla 4.26 y a partir de la misma, con un nivel de significancía del 5% el valor F es Ft(95%) > 4,75 y puesto que Fo = 13,1,
Se concluye que el método afecta la resistencia a la compresión. Además, al parecer los días no difieren significativamente en dicha resistencia (cuadrado medio es pequeño en relación al del error), mientras los lotes si, ya que el cuadrado medio es grande en relación con el error.
Tabla 4.26 Análisis de varianza para la resistencia a la compresión en kg=cm2
Fuente SC GL
CM Fo Ft(95%)
DíaLoteMétodoError
9157455
175002670
3336
30524855833445
0,685.5813,1
<>>
4,754,754,75
Total 28540 15 R² = 90,6447%
154
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Problemas
(148) Se encuentra en estudio el efecto que tienen 5 productos distintos A, B, C, D y E sobre el tiempo de reacción de un proceso. Cada lote de material nuevo es lo suficientemente grande para permitir que sólo se realicen cinco pruebas. Más aún cada prueba tarda hora y media; por lo que solo se pueden realizar cinco ensayos al día.El investigador decide efectuar el experimento usando un diseño cuadrado latino con el fin de controlar sistemáticamente las variables: lote de material y día. Obteniéndose los siguientes datos.
FilasEnsamblado
I II III IV V12345
A=8C=11B=4D=6E=4
B=3E=8A=5
C=10D=8
D=7A=3C=1E=6B=8
C=1D=7E=10B=6A=3
E=7B=2D=9A=8C=2
(149) Un ingeniero agrónomo está investigando el efecto que tienen cuatro métodos de fumigado (A, B, C y D) sobre el tiempo de curado de una plaga. Se selecciono cuatro operarios para realizar este estudio.Por otra parte, el ingeniero sabe que cada método produce cierto tipo de intoxicación, por lo que, el tiempo que se tarde en el último fumigado debe ser menor que el primero, independiente del método.En otras palabras, se produce un patrón en el tiempo de fumigado. Para controlar esta posible fuente de variabilidad el ingeniero utiliza el diseño cuadrado latino:
FumigadoOperario
I II III IV1α1β1µ1ε
C=2B=8A=9
D=14
D=7C=1B=11A=12
A=14D=18C=10B=10
B=10A=7D=5C=10
(150) Se va efectuar un estudio de los movimiento para determinar el mejor diseño de trabajo para montar computadoras, cinco diseño se hallan en estudio. Se seleccionan cuatro estudiantes en
155
Palacios C. Severo
ensamblaje aleatoriamente entre un grupo de sesenta, se le enseña minuciosamente a trabajar con los cinco diseños.
EstudianteDiseño de trabajo
I II III IV V1234
A=10B=5C=6D=4
B=3C=10D=12E=8
C=9D=5E=5A=4
D=14E=10A=10B=11
E=11A=6B=6C=5
Cada estudiante sigue cada diseño durante dos días y se registra el número de computadoras montadas:
(151) Se efectúa un experimento de soldadura, empleando el siguiente arreglo:
EstudianteDiseño de trabajo
I II III123
A=14B=9,5C=11
B=16,5C=17A=12
C=11A=15B=13
(152) Se fabrica una cubierta de caucho para una avioneta y se experimenta un cuadrado latino, el experimento es descrito:
PruebaMaquina
I II III IV2314
A=251D=234C=236B=195
B=241C=273D=236A=270
D=227A=274B=218C=230
C=229B=226A=268D=225
(153) Una investigación describe los métodos de preparación de cierto insecticida. Se usa un diseño cuadrado latino para analizar.
MezclaIngredientes
I II III IV V VI VII1234567
A=98B=69C=37D=65E=56F=113G=64
B=17E=67F=83G=60D=44C=15A=62
C=89A=70G=83E=91B=70D=65F=65
D=64G=70B=74F=56C=68A=51E=86
E=63F=111D=70C=61A=88G=83B=45
F=132D=60A=75B=59G=111E=57
C=100
G=244C=218E=169A=150F=220B=233D=187
(154) Una agencia de control supone que existe diferencia en el contenido de nitrato en lotes de fertilizante que son suministrados por un proveedor. Existe en estos momentos gran cantidad de lotes en el almacén. Se han elegido aleatoriamente cinco de estos. Mediante un análisis químico sobre cada lote se obtienen:
AnálisisLote
I II III IV V12
A=24,3B=24,4
B=24,7C=24,3
C=24,3D=24,9
D=24,4E=24,4
E=24,3A=24,4
156
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
345
C=24,6D=24,9E=24,0
D=24,5E=24,4A=24,2
E=24,7A=24,5B=24,8
A=24,5B=24,4C=24,6
B=24,6C=24,4D=24,9
(155) En un fuelle de herrero se forjan 4 clases de aceros. A una misma temperatura, aunque se sospecha que cada uno de los tipos de acero tiene un punto de caldeo, se trabaja con cada uno de ellos al temple, lográndose los siguientes resultados
AceroCaldeo
I II III IV1234
A=48C=41B=49D=46
B=43D=48A=45C=41
D=47A=43C=41B=46
C=41B=47D=49A=46
(156) Se evalúan tres muestras de tierra fertilizada con abono: químico, natural y compost. Siendo los resultados siguientes.
AbonoFertilizante
I II III IVQuímicoNaturalCompost
A=4,9B=5,1C=4,7
C=4,0A=5,3D=4,8
B=4,3D=4,8A=5,1
D=4,2C=4,1B=4,5
Analice y obtenga sus conclusiones.(157) Se realiza un experimento para determinar si la temperatura
(°C), de horneado afecta en el vidriado de cierto tipo de azulejo. El experimento proporciono los siguientes datos:
TemperaturaVidriado
I II III IV1300140015001800
C=23A=24D=25B=28
A=21B=22C=25D=23
B=24D=27A=29C=29
D=26C=25B=28A=27
(158) Se han preparado tres diferentes tipos de soluciones para eliminar el óxido de joyas (oro y plata). El análisis de realiza en un laboratorio, usando un diseño aleatorizado por bloques.Los datos se recopilaron durante tres días.
SoluciónDías
I II III123
A=13C=22B=9,5
B=44A=12C=22
C=16B=13A=39
(159) Se utilizan cinco reactores distintos sobre una solución galvánica de dorado electrolítico. Para evaluar se utilizan varios lotes que sólo permiten realizar cinco ensayos por día. La investigación se realiza mediante un diseño cuadrado latino, con el fin de controlar sistemáticamente las variables de material y día.
Reactor Días
157
Palacios C. Severo
I II III IV VABCDE
A=8C=6
B=10D=2E=8
B=10E=1A=7C=7D=4
D=5A=3C=1E=8B=6
C=8D=7E=6B=2A=4
E=3B=8
D=10A=9C=11
(160) Se encuentra bajo estudio el efecto que tienen 5 reactivos distintos (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material nuevo es lo suficientemente grande para permitir que sólo se realicen 5 ensayos. Más aún, cada ensayo tarda, aproximadamente, 1 hora y media, por lo que sólo pueden realizarse 5 ensayos por día. La investigadora decide efectuar el experimento usando un diseño de cuadrado latino, con el fin de controlar las variables lote de material y día. Ella recolecta los siguientes datos:
DíaLote 1 2 3 4 5
12345
A=8C=11B=4D=6E=4
B=7E=2A=9C=8D=2
D=1A=7
C=10E=6B=3
C=7D=3E=1B=6A=8
E=3B=8D=5A=10C=8
Analice la tabla de ANOVADiga que otro diseño experimental pudiera utilizarse.Diga que recomendaría respecto a la elección del reactivo químico, del día y lote para realizar el proceso químico en el menor tiempo posible.Realice un análisis de los residuos.
(161) Complete la siguiente tabla de análisis de varianza, concluya e interprete. Se midió el rendimiento de trigo de 4 variedades (tratamientos) en kg/parcela.
Fuente SC GL
CM Fo
FilasColumnasTratamientoError 2,72
1,445,0458,4
7Total 90,40
158
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
VIII. DISEÑO CUADRADO GRECO-LATINO
Consideremos un cuadrado latino NxN al que se le sobrepone un segundo cuadrado latino cuyos tratamientos se designan con letras griegas. Se dice que los cuadrados son ortogonales si al sobreponerse poseen la propiedad de que cada letra aparezca solamente una vez en cada letra latina. Este diseño se denomina cuadrado greca-latino.
CuadroColumna
I II III IV1234
AαBβCτDσ
BβCτDσAα
CτDσAαBβ
DσAαBβCτ
El análisis de varianza es muy similar al de un cuadrado latino.
El factor representado por la letra griega es ortogonal a los renglones, las columnas y los tratamientos de las letras latinas porque cada letra griega ocurre una sola vez en cada renglón, en cada columna y para cada letra latina. Por lo tanto, la suma de cuadrados debido al factor letra griega puede calcularse usando los totales de la letra griega. El error experimental se reduce en esta cantidad.
Ejemplo 4.41Un ingeniero sospecha que en el lugar de trabajo usado por cuatro operarios puede representar una fuerte adición de variabilidad. Es posible introducir al lugar de trabajo α, β, τ, σ a como un cuarto
159
Palacios C. Severo
factor. Se produce el cuadrado greca latino que se muestra a continuación.
MontajeOperario
YiI II III IV1234
Cβ=11Bα=8Aσ=9Dτ=9
Bτ=10Cσ=12Dα=11Aβ=8
Dσ=4Aτ=10Bβ=7
Cα=18
Aα=8Dβ=12Cτ=15Bσ=6
33424241
Total 37 41 39 41 158
( ) ( ) 75,17316/158157...109 22222 =−++++=total
SC
( ) ( ) 25,1416/1584/41424233 22222 =−+++=filaSC
( ) ( ) 75,216/1584/41394137 22222 =−+++=columna
SCTratamiento A B C DTotal 35 31 56 36Media 8,75 7,75 14 9
( ) ( ) 25,9416/1584/36563135 22222 =−+++=ootratamient
SC
los totales de las líneas de montaje son:
Letra Griega Total de montajeαβτσ
Y1 = 45Y2 = 38Y3 = 44Y4 = 31
( ) ( ) 25,3116/1584/31443845 22222 =−+++=montajeSC
25,3125,3125,9475,225,1475,173 =−−−−=error
SC
160
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
334:
31:
31:
31:
31:
151:
416:
=+−=−
=−=−
=−=−==
nNError
noTratamient
nMontaje
nColumna
nFilas
NTotal
nNGL
Tabla 4.27 Análisis de varianzaFuente SC GL CM Fo Ft(99%)
TratamientoFilaColumnaMontajeError
94,2514,252,7531,2531,25
33333
31,414,750,9110,4110,41
3,0170,4560,08
71
<<<<
29,529,529,529,5
Total 173,75 15 R² = 82,0143%
En el análisis de varianza ninguna de las fuentes de variación controladas resultaron significativas al análisis ya que los valores calculados de F siempre son menores que los valores de Ft.
Problemas
(162) Se desea saber si hay diferencia entre cuatro combustibles usados en cuatro sembradoras. Diseñar un experimento grecolatino.
MontajeOperario
I II III IV1234
Aα=14Bβ=16Cτ=19Dσ=15
Bβ=16Cτ=16Dσ=18Aα=11
Cτ=21Dσ=11Aα=16Bβ=15
Dσ=14Aα=23Bβ=16Cτ=15
(163) Con el fin de mejorar la calidad de las gallinas, se han añadido dos productos químicos en su alimentación. Las distintas cantidades del primero se indican con A, B, C y D.Las del segundo por α, β, τ y σ. Se alimenta a las gallinas ordenados en grupos de acuerdo con sus pesos iniciales 1 1,5 1,8 y 2 kilogramos y cuatro especies diferentes. El incremento de
161
Palacios C. Severo
peso por unidad de tiempo viene dado en el cuadro. Realice un análisis de varianza del experimento, sacar conclusiones de acuerdo a su criterio.
EspeciesPeso
I II III IV1234
Aα=3Bβ=4Cτ=8Dσ=6
Bβ=6Cτ=6
Dσ=10Aα=3
Cτ=10Dσ=5Aα=5Bβ=7
Dσ=6Aα=6Bβ=8Cτ=3
IX. PRUEBA DE INTERVALOS MÚLTIPLES DE DUNCAN
Procedimiento de uso amplio para comprobar las parejas de medias. Para aplicar dicha prueba en muestras del mismo tamaño, se disponen en orden ascendente los a - promedios del tratamiento y se determina el error estándar para cada promedio.
Ejemplo 4.42Consideremos los datos de la tabla 4.28, siendo el CMerror = 8,06 para N=25 y n=5, el error tiene 20 GL, organizando los promedios Y de tratamientos en orden ascendente se tiene
Y1 = 9,8Y5 = 10,8Y2 = 15,4Y3 = 17,6Y4 = 21,6
162
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Error estándar de cada promedio: 27,1/ == nCMS erroriY
iYSrr *95,2)20,2( 05,005,0 →=
iYSrr *10,3)20,3( 05,005,0 →=
iYSrr *18,3)20,4( 05,005,0 →=
iYSrr *25,3)20,5( 05,005,0 →=
Tabla 4.28 Datos para tratamientoTratamiento Y1 Y5 Y2 Y3
Y 9,8 10,8 15,4 17,6Y4 21,6 11,8 10,8 6,2 4Y3 17,6 7,8 6,8 2,2Y2 15,4 5,6 4,6Y5 10,8 1
Y3 y Y2 no existe diferencia significativaY5 y Y1 no existe diferencia significativa
X. DISEÑO DOBLE REVERSO
En los experimentos de nuestro campo, sin duda, el estudio de la influencia de diferentes factores sobre la producción de ciertos procesos; ocupa uno de los principales lugares por su importancia económica y social.
El costo alto de estos experimentos y su duración cuando se utiliza los métodos por grupos, ha exigido estudiar y ampliar nuevas técnicas que permitan reducir los mismos.
Tales circunstancias han llevado a investigar un método experimental en grupo-tratamiento, con el objeto de abaratar los costos y reducir el tiempo de ejecución de los mismos.
Estudios sobre la producción de leche, huevo, derivados de leche, empollado de huevos, mejoramiento genético, etc. Han permitido establecer una serie de particularidades propias de los mismos, las que unidas a las técnicas experimentales, han dado origen a diseños
163
Palacios C. Severo
que logran una medida importante al resolver los problemas planteados.
El diseño doble reverso cumple los principios fundamentales del método de comparación por. grupo-tratamiento, aprovechando las características y la influencia de los diferentes factores sobre si misma.
Ejemplo 4.43Un total de 24 gallinas fueron seleccionadas para un experimento con el objeto de estudiar la influencia entre ponedoras y ordinarias. Con este fin se utilizo el diseño doble reverso que tuvo sub tratamientos experimentales de 30 días con duración semanal. Los tratamientos se identifican como: (a) ponedoras y (b) ordinarias.
Tabla 4.29
GallinasSub experimentos d = I – 2II + III
I II II d1 d2 d2
123456789101112
b=6b=6a=9b=4
a=10a=7
a=12a=9b=4b=3b=6a=8
a=7a=9b=3a=8b=12b=7b=4b=6a=15a=18a=9b=4
b=3b=2a=9b=2a=7
a=10a=15a=11b=4b=8b=7
a=12
12
-73198
12
-3-10
-10
-22-25-5
9100144100499
36164
48462525144
Total 47 -75 2114
Pasemos a continuación al análisis de los resultados de este experimento en relación a la producción de huevos por semanas.
Los datos en el caso se organizan de acuerdo al esquema que se siguió en el experimento.
Tratamiento Total MediaAB
18593
10,2823,25
( ) ( ) 206512/75472114 2 =−−=total
SC
( ) ( ) 33,124012/75476/7547 222 =−−+=ootratamient
SC
164
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
67,82433,12402065 =−=error
SC
Tabla 4.30 Análisis de varianzaFuente SC GL CM Fo Ft(99%)
TratamientoError
1240,33824,67
110
1240,3382,467
15,04 > 10,0
Total 2065,00 11 R² = 60,0644 %
En función de los resultados existe diferencia significativa en cuanto a la producción de huevos de las gallinas sometidas a tratamiento y esta en función de los datos obtenidos respectivamente.
Como puede apreciarse este diseño tiende a dar solución a las limitaciones en los métodos precedentes. Este método fue desarrollado ampliamente para la aplicación en estudios con más de 3 tratamientos y resulta de amplia utilidad en la práctica actual de trabajo.
Problemas
(164) Elabore el diseño doble reverso para 14, 15, 20 y 24 pruebas(165) Simule el proceso con tres fertilizantes (Compost, Turba y
Químicos) en la siembra de hortalizas.(166) Establezca la diferencia entre el diseño doble reverso y los
diseños aleatorizados.(167) Elabore el modelo del ejemplo 4.43(168) Aporte un criterio de evaluación útil del diseño doble reverso.(169) A los problemas de (156, 157, 158 y 159) elabore sus análisis de
varianza.
165
Palacios C. Severo
XI. ESTIMACIÓN DE PARÁMETROS DEL MODELO
Las herramientas principales para el diagnóstico de modelos unifactoriales esta basado en los residuos.
ijijij YY −=ε
Los residuos del i-ésimo tratamiento se determinan restando el promedio del tratamiento a cada observación dentro del tratamiento.
166
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Usualmente la comprobación de linealidad del promedio consiste en graficar los residuos, tal como se muestra. Se recomienda que tal comprobación de diagnostico sea un paso de rutina en cada proyecto de diseño experimental.
Ejemplo 4.44Analizar los datos de la tabla 4.10
Tabla 4.31 Valores originales y residuos% 1 2 3 4 5 Yi
15 7 -2,5 7 -2,8 15 5,2 11 1,2 9 0,8 9,520 12 -3,4 17 1,6 12 -3,4 18 2,6 8 2,6 15,425 14 -3,6 18 0,4 18 0,4 19 1,4 19 1,4 17,630 19 -2,6 25 3,4 22 0,4 19 1,4 23 1,4 21,635 7 -3,8 10 -0,8 11 0,2 15 0,2 11 0,2 10,8
Orden K εij PK=(K-1/2)/2512345678910111213141516171819202122232425
-3,8-3,6-3,4-3,4-2,8-2,8-2,8-2,6-0,8-0,8+0,2+0,2+0,4+0,4+0,4+1,2+1,4+1,4+1,4+1,6+2,6+2,6+3,4+4,2+5,2
0,020,060,100,140,180,220,260,300,340,380,420,460,500,540,580,620,660,700,740,780,820,860,900,940,98
Los residuos se organizan en forma ascendente y se calculan sus puntos de probabilidad acumulada Pk.
La gráfica de probabilidad normal se deja al lector para que lo desarrolle, con los residuos graficados contra Pkx100 en la escala vertical derecha.
167
Palacios C. Severo
En la parte inferior los puntos del residuo.
XII. POLINOMIO ORTOGONAL
Cuando los niveles de los factores son equidistantes, puede simplificarse mucho el ajuste del modelo polinomial por el método de mínimos cuadrados. El procedimiento utiliza los coeficientes de los contrastes ortogonales. Además del ajuste de mínimos cuadrados del polinomio se obtiene el efecto lineal, cuadrático, cúbico, cuártico y así sucesivamente, así como la suma de cuadrados del factor. Esto permite probar la contribución de cada término al polinomio.
Ejemplo 4.45Los datos de la tabla 4.32 en este problema el factor independiente, porcentaje de algodón, tienen cinco niveles equidistantes. La suma de cuadrados de los efectos lineales, cuadráticos; cúbicos y cuárticos descompone la suma de cuadrados de tratamiento y pueden ser incorporados al análisis de varianza como se muestra. Cada efecto tiene un grado de libertad y puede ser probado comparando su suma de cuadrados en la media de cuadrados del error.
% algodón Total detratamiento
Coeficiente de loscontrastes ortogonales Ci
Lineal Cuadrático Cúbico Cuártico1520253035
49778810854
-2-1012
2-1012
-120-2-1
1-46-41
τ 1 1 5/6 35/2
∑ YCEfecto i41 -155 -57 -100
( )[ ]∑∑ 22 / ii CnYCSC33,62 343,21 64,98 33,95
El modelo polinomial cúbico ajustado a los datos es:
εαααα ++++= )()()(332211
XPXPXPYo
∑ === 04,1525/376/ NYSCoα
∑ ==∑= 82,0)10(5/41/ 2
1 ii CnYCSCα
168
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
∑ −=−=∑= 2143,2)14(5/155/ 2
2 ii CnYCSCα
∑ −=−=∑= 14,1)10(5/57/ 2
3 ii CnYCSCα
Como se tiene a=5 niveles de X e Y entre los niveles, d=5 el modelo del polinomio ortogonal es:
( )( ) ( )[ ]( ) ( )[ ]2 0/)7)5(3(5/2 55/2 5)6/5(1 4,1
1 2/155/2 52 1 4 3,25/)2 5(8 2,00 4,1 52
22
−−−−−−−−−−+=
XX
XXY
resultando el modelo
32 00786,04814,001,9611,62 XXXY −+−=
Tabla 4.32 Análisis de varianzaFuente SC GL CM Fo Ft(95%)
% AlgodónLinealCuadráticoCúbicoCuárticoError
475,95(33,62)(343,4)(64,98)(33,95)161,20
41111
20
118,9433,62
343,4064,9833,958,06
14,764,17
42,588,064,21
><>><
2,874,354,354,354,35
Total 637,15 28 R² = 74,6998%
Los efectos cuadrático y cúbico del porcentaje de algodón son significativos.
§5MÉTODOS DE ANÁLISIS
169
Palacios C. Severo
Las cosas complejas y estadísticamente improbables, son por naturaleza más difíciles de explicar que las cosas simples y estadísticamente probables.
Richard Dawkins
I. INTRODUCCIÓN
No imite al ebrio que utiliza un poste de luz como apoyo, en vez de usarlo como iluminación. No deje que el ANAVA (análisis de varianza) se convierta en muleta de un trabajo de campo mal hecho o como sustituto de pensar. Recuerde estas pautas:
Adapte la técnica al problema, no el problema a la técnica: evite enamorarse de un método y tratar de acomodarse siempre a cualquier estudio. No se convierta en tecnócrata.
Los resultados son solo tan buenos como los datos: Las técnicas estadísticas no arreglan los malos datos. Por eso sea siempre cuidadoso en la elaboración del diseño y en la toma del vector respuesta.
Piense ante, no después de haber hecho el experimento: no amontone todo lo que se le ocurra en el computador con la esperanza de que éste lo clasifique y lo haga intangible para usted. Primero desarrolle hipótesis; luego ensaye sus preguntas. Puede estar casi seguro de que siempre habrá algo que conseguir en un trabajo de investigación.
Considere la investigación: usted siempre aprende conforme avanza - sobre cosas que usted hubiera querido añadir y sobre otras que hubiera querido dejar por fuera. Una o dos etapas piloto mejorarán la calidad de un gran estudio final. El análisis estadístico es costoso; por eso, proceda en forma planificada.
Encuentre la forma de comunicar los resultados con claridad: La mayoría de los investigadores no están familiarizados con estas técnicas y por eso hay peligro de confundirlo con datos y con jergas. Busque maneras de comunicar las técnicas y sus resultados en una forma fácil de entender.
Mantenga el análisis estadístico como un medio, no como un fin: "Correr un análisis conglomerado" no ayuda mucho si no contribuye al objetivo general del estudio. Empiece con el problema, no con la técnica.
170
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Las técnicas estadísticas de análisis prueban ser herramienta muy valiosa. Su papel más útil generalmente es complementar análisis y juicios directos reuniendo variables complejas en un solo análisis. Es arriesgado hacer depender todo el estudio, de una sola técnica. Un procedimiento mejor es experimentar con estas técnicas como parte del estudio hecho con otros fines; luego, proseguir con un estudio más grande después de que el valor y la aplicabilidad de la técnica se hayan aprobado.
II. MÉTODOS NO PARÁMETRICOS
En la práctica aparecen situaciones en las que los requisitos no están justificados, como es el caso de una población fuertemente asimétrica. A causa de ello, se han creado métodos que son independientes de las distribuciones de la población y de los parámetros asociados.
Las pruebas no paramétricas se pueden usar como observaciones de contraste más complicada. Son especialmente útiles cuando se trata con datos no numéricos, por ejemplo, cuando los consumidores colocan productos por orden de preferencia.
III. PRUEBA U DE MANN-WHITNEY
Consideremos dos productos distintos de los cuales obtenemos dos muestras, queremos decidir si hay o no diferencia entre las muestras, o sea, si proceden o no de una misma muestra poblacional. Es conveniente una prueba no paramétrica consistente en los siguientes pasos:
1. Combinar todos los valores muéstrales en una ordenación ascendente y asignar rangos a todos los valores. Si dos o más muestras son idénticas, se le asigna a cada uno un rango que es la media de los rangos que los ubica con tal coincidencia.2. Hallar la suma de los rangos para cada muestra, denominándolo Rn y los tamaños muéstrales Nn. Por conveniencia elegimos N1 al menor. Una diferencia significativa entre la suma del rango R1 y Rz, implica una diferencia entre las muestras.3. Para encontrar la diferencia entre las sumas de rangos, usamos:
171
Palacios C. Severo
jiRNN
NNU iii
ji ≠−++=2
)19(
La distribución muestral U es simétrica y tiene una media
2ji
U
NN=µ
y una varianza
12
)1(2 ++= jiji
U
NNNNσ
Si Ni y Nj son ambas al menos iguales a 8, resulta que la distribución de U es aproximadamente normal
U
UUz
σµ−=
Esta normalmente distribuido con media cero y varianza 1. Un valor correspondiente a otra muestra viene dada por.
jiRNN
NNU iii
ji ≠−++=2
)19(
Además
jiji NNUU =+
676,033 −=b
Donde:
N = Ni + Nj
Ejemplo 5.46Se desea determinar si hay diferencia entre los telares I y II, al nivel de significancía del 0,05.
Tabla 5.33 Datos de telares I y II
172
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
12345
11,711,812,612,914,1
678910
14,715,215,916,116,9
1112131415
17,818,318,919,620,5
161718
22,724,225,3
Combinando los 18 valores de la muestra en ordenación ascendente, tal como se indica en la tabla 5.33, en la segunda fila se asignan los rangos.
Donde
10821== NN
Además
6510621== RR
( ) ( ) 101062/98108 =−+=U
402/10*8 ==U
µ
67,12612/19*10*82 ==Uσ
la distribución es
[ ] 67,225,11/4010 −=−=z
Textil I Textil IIResistencia Rango Resistencia Rango
18,316,422,717,818,925,316,124,2
121016111318917
12,614,120,510,715,919,612,915,211,814,7
351518144726
Suma 106
Suma 65
como la hipótesis Ho que estamos estudiando es que no hay diferencia entre los telares, entonces
173
Palacios C. Severo
9 6,19 6,1 +≤≤− zs iHo
Rechazamos y concluimos que hay diferencia entre los telares al nivel del 0,05.
IV. PRUEBA H DE KRUSKAL-WALLIS
Con esta prueba podemos decidir si dos muestras provienen o no de la misma población. Una generalización para k muestras de Kruskal-Wallis con sus pruebas.
La prueba puede describirse como: sean k muestras de tamaño Nk, con suma total N, supongamos que los datos de todas las muestras se ordenan y que las sumas de rangos para las k muestras son Rk
respectivamente. Definido:
)1(3)1(
122
+−∑
+= N
N
R
NNH
j
j
Ejemplo 5.47Una fabrica de tejidos desea comprar una de cinco maquinas diferentes. En un experimento diseñado para saber si hay diferencia en la eficacia de tales maquinas, cinco operarios expertos trabajan en cada maquina un tiempo determinado.
Los resultados se escogen y ordenan en forma ascendente pero colocada por orden de presentación.
12,52,54
42485050
6,56,56,56,5
53535353
9101112
57606163
14141416
64646465
17,517,51921
68687072
2121232425
722
757782
ABCDE
6872604864
7253826165
7763645770
42535348757264506853
RangoABC
17,52110
216,525
241214
16,523
6,52,521
7048,593
174
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
DE
2,514
1116
919
1417,5
46,5
40,573
44,6=H
Para K-1=4 grados de libertad al nivel de significación 0,05 296,0X .
Puesto que 6,44 < 9,49 no podemos rechazar la hipótesis de igualdad entre las maquinas. Podemos aceptar la hipótesis de que no hay diferencia entre las maquinas.
V. MÉTODOS MULTIVARIABLES
Cuando varias variables se analizan juntas, el procedimiento se llama análisis multivariable.
El primer paso analítico en la mayoría de los proyectos de investigación es una tabulación cruzada directa de los resultados.
Las técnicas multivariables más utilizada en el análisis son:
Análisis de regresión múltipleInteracción automáticaAnálisis discriminanteAnálisis de factoresAnálisis de conglomerados
Escalas multidimensionalesAnálisis conjunta.
Las tres primeras técnicas miden la dependencia entre variables. Estos métodos tienen que ver con dos tipos de variables, y es importante entender la distribución entre ellos.
Variables dependientesEstas son las variables que usted esta tratando de predecir o explicar. Un ejemplo típico es el volumen de utilización de un producto o de utilización de un cierto tipo de equipo.
Variable independienteEstas son las variables que explican o predicen diferencias en las variables dependientes.
175
Palacios C. Severo
Las otras cuatro técnicas, están diseñados para medir la interdependencia entre las variables. En este método no hay variable dependiente o independiente.
Análisis de regresión múltiple
Este tipo de análisis enfoca una ecuación de predicción que relaciona una variable dependiente y un conjunto de variables independiente. Esta es una de las técnica multivariable más básicas. Es muy útil para predecir el intervalo de una variable dependiente.El procedimiento proporciona la ecuación correspondiente a la línea recta que mejor se ajusta a los datos. La ecuación de esta línea recta se puede usar como ecuación de predicción.
La ecuación se desarrolla mediante un procedimiento conocido como mínimos cuadrados y corresponde a una línea recta, no es apropiado para situaciones donde la relación entre las variables dependiente e independiente no es lineal.
Interacción automática
Al igual que la regresión múltiple, la interacción automática es un método para analizar la relación entre una variable dependiente y varias variables independientes. Pero mientras el análisis de regresión múltiple produce una ecuación predictiva que describe la relación, la interacción automática genera una serie de ecuaciones de dos vías, seleccionado en cada división la variable independiente que explica la mayor variación en la variable dependiente.
Análisis discriminante
El procedimiento determina las variables predictivas más estrechas que identifican a un subgrupo en la muestra, es decir, identifica las variables que son las discriminadoras entre los miembros de los subgrupos cuyo comportamiento se quiere predecir. La técnica puede usarse con variables de dos grupos.
Análisis de factores
Sirve para analizar las interrelaciones entre variables e intenta reducirlas a un conjunto más pequeño. En procesos sociales es común medir un gran número de datos, por esta razón se cree que en la mayoría de los casos todas estas variables son facetas de un número
176
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
menor de variables subyacentes. El propósito del análisis de factores es establecer la cantidad de variables que sustenten el fenómeno.
Análisis de conglomerados
Define los grupos naturales de objetos que son similares dentro de una población muestra. El análisis de conglomerado crea sub muestras cuyos miembros son similares entre ellos con los demás. Es decir identifica conglomerados de unidades homogéneas.Escalas multidimensionales
Es un análisis matemático de percepciones y preferencias que los miembros tienen en el espacio muestra.
Análisis conjunta
Es una técnica que separa de sus componentes los juicios globales de los informantes sobre alternativas complejas, tales como característica de un producto.
VI. CORRELACIÓN DE SPEARMAN
Se utiliza este método para medir la correlación de dos variables X e Y. En lugar de usar valores precisos de las variables, o cuando tal precisión no es alcanzable, a los datos se les puede asignar un rango de 1 a N ordenándolo por su tamaño, importancia, preferencia, etc. Dicha asignación viene dada por:
)1(
61
2
2
−∑−=NN
DrS
Ejemplo 5.48Se analiza agua contaminada de 10 estanques, además para ver la confiabilidad de dicho análisis se procede a realizar los cálculos analíticos para ver su dispersión.
Laboratorio 8 3 9 2 7 10 4 6 1 5Teórico 9 5 10 1 8 7 3 4 2 6
Diferencia de rangos:
D -1 -2 -1 1 -1 3 1 2 -1 -1D2 1 4 1 1 1 9 1 4 1 1
177
Palacios C. Severo
[ ] 8545,0)110(*10/)24*6(1 2 =−−=Sr
Indica que hay marcada relación entre los análisis de laboratorio y teórico.
Análisis de varianza
El análisis de varianza es una técnica que resulta útil para mejorar la precisión de un experimento. Supongamos que en un experimento la variable respuesta Y está relacionada linealmente con la variable independiente X. Además, el experimentador no puede controlar la variable X pero puede medirla al mismo tiempo que a Y. Con el análisis de varianza se busca adaptar el valor observado de la respuesta para tomar en cuenta el efecto de la variable concominante. Si no se lleva a cabo dicho ajuste, la variable concominante puede aumentar la media del cuadrado del error, con lo que hay mayor dificultad en la detección de diferencias reales en la respuesta debidos a los tratamientos. Por lo tanto, el análisis de covarianza es un método para tomar en cuenta el efecto de algunas variables que no pueden ser controladas.
Ejemplo 5.49Se usan tres maquinas distintas para producir fibras para una empresa textil. El ingeniero de proceso esta interesado en determinar si existe diferencia en los resultados de la fibra producida por las tres maquinas. Sin embargo, la resistencia de la fibra depende del grosor de la misma, siendo más resistente las fibras de mayor grosor. Se selecciona una muestra aleatoria de cinco fragmentos para cada maquina siendo. Y: resistencia de cada fibra y X: grosor.
Maquina I Maquina II Maquina IIIY X Y X Y X
3641394249
2025242532
4048394544
2228223028
3537423432
2123262115
207 126 216 130 180 106
( ) ( ) 40,436)5(3/6033234...4136 22222 =−++++=YYSC
178
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
( ) ( ) 73,261)5(3/3621521...2520 22222 =−++++=XXSC
( ) ( ) 60,282)5(3/603*36232*1534*21...41*2536*20 2222 =−++++=XYSC
( ) ( ) 40,140)5(3/6035/180216207 2222 =−++=ΤYY
( ) ( ) 13,66)5(3/3625/106103126 2222 =−++=ΤXX
( ) ( ) 00,96)5(3/603*3625/180*106216*130207*126 =−++=ΤXY
00,20640,14040,346 =−=Τ−=Ε YYYYYY SC
50,19513,6673,261 =−=Τ−=Ε XXXXXX SC
60,18600,9060,282 =−=Τ−=Ε XYXYXY SC
( ) ( ) 27,4173,261/6,28240,346/ 22´ =−=−=Ε XXXYYY SCSCSCSC
( ) ( ) 99,276,195/6,186206/ 22 =−=ΕΕ−Ε=Ε XXXYYYSC
28,1399,2727,41´ =−=− ΕΕ SCSC
( ) [ ][ ] ( )( )[ ]11//1/´ −−−−= ΕΕΕ naS CaS CS CFo
[ ] [ ] 61,211/99,27/2/28,13 ==oF
86,211,2,90 =F
954,06,195/6,186/ ==ΕΕ= XXXYβ
( )[ ] ( ) ( ) ( ) 08,7059,2/6,195/6,186// 22 ==ΕΕ= errorXXXYo CMF
65,911,2,90 =F
179
Palacios C. Severo
( ) ( ) 38,4013,242,25954,04,41111 =−−=−−= XXYAjustadaY β
( ) ( ) 42,4113,240,26954,02,43222 =−−=−−= XXYAjustadaY β
( ) ( ) 80,3813,242,21954,00,36333 =−−=−−= XXYAjustadaY β
Tabla 5.34 Análisis de varianza
Fuente GLSC
Y GL CMX XY Y
MaquinaErrorTotal
21214
66,13195,6
0261,73
96,0186,6282,6
140,4206,0346,4
27,9941,27
1113
2,54
Maquina
ajustada
13,28 2 6,64
Problemas
(170) Se dan los rangos de 10 estudiantes en mitad de semestre y a fin de semestre obtenido en los exámenes de estadística.Compute el coeficiente de correlación de Spearman e interprételo.
Estudiantes1 2 3 4 5 6 7 8 9 10
Mitad de semestre
5 4 8 2 6 1 3 7 10 9
Fin de semestre 4 1 10 5 6 9 7 8 2 3
(171) Una Empresa textilera desea comprar una de cinco maquinas diferentes. En un experimento diseñado para saber si hay diferencia en la eficacia de tales maquinas, cinco operarios trabajan en cada maquina un tiempo determinado.Los resultados se escogen y ordenan en forma ascendente pero colocada por orden de presentación
12
2,54
24283739
66,57
7,5
43455253
9101112
58626364
13141516
65666768
1717,51921
69717375
2324262832
7778798082
180
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
(172) Se analiza Aire contaminado de 10 Ingenios mineros, además para ver la confiabilidad de dicho análisis se procede a realizar los cálculos analíticos para ver su dispersión.
Laboratorio
12 8 9 7 9 18 6 9 3 5
Teórico 11 6 12 4 12 14 4 6 4 6
(173) Se analiza Aire contaminado con ácido cianhídrico de una empresa minera aurífera, además para ver la confiabilidad del análisis químico se procede a realizar los cálculos analíticos para ver su dispersión.
Laboratorio
0,011 0,08 0,09 0,07 0,09 0,018 0,06
Teórico 0,011 0,06 0,012 0,04 0,012 0,014 0,04
(174) Se usan tres maquinas distintas para producir Queso cremo para una empresa Lechera. La ingeniera a cargo de la investigación esta interesada en determinar si existe diferencia en los resultados del Queso cremoso producido por las doss maquinas. Se selecciona una muestra aleatoria de cinco fragmentos para cada maquina siendo. Y: sabor y X: dureza.
Maquina I Maquina IIY X Y X
0,310,400,320,490,48
0,290,270,220,200,39
0,490,450,300,420,41
0,200,290,270,350,29
2,00 1,37 2,07 1,40
(175) Se usan tres maquinas distintas para producir Yogur para una empresa Heladera. La ingeniera de proceso esta interesada en determinar si existe diferencia en los resultados del Yogur producida por las tres maquinas. Se selecciona una muestra aleatoria de cinco fragmentos para cada maquina siendo. Y: consistencia y X: sabor.
Maquina I Maquina II Maquina IIIY X Y X Y X3140324948
2927222039
4945304241
2029273529
3935494347
2826292419
200 137 207 140 213 126
(176) Se dan los rangos de 10 estudiantes en mitad de semestre y a fin de semestre obtenido en los exámenes de diseño experimental de una Universidad Estatal del Sur del Perú.
181
Palacios C. Severo
Compute el coeficiente de correlación de Spearman e interprételo.
Estudiantes1 2 3 4 5 6 7 8 9 10
Mitad de semestre
15 14 18 12 06
11 13 17 10 09
Fin de semestre 14 11 10 15 06
09
07 08
12 13
§6DISEÑOS EXPERIMENTALES
APLICADO A INGENIERÍALa estadística ha demostrado que la mortalidad de los militares aumenta perceptiblemente durante tiempos de guerra.
Alphonse Allais
182
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
I. INTRODUCCIÓN
En muchos procesos experimentales de carácter exploratorio, el investigador se enfrenta con el problema de determinar el efecto de un gran número de variables. En estas condiciones, es necesario establecer un procedimiento aceptable para elegir las condiciones de cada uno de los ensayos experimentales.
La estrategia estadística en el diseño de experimentos consiste en el procedimiento sistemático y controlado para desarrollar las combinaciones correctas de condiciones variables para que el análisis resulte confiable. En la industria se utilizan tres tipos de diseños fundamentales de experimentación estadísticamente diseñados, que son:
a) Diseños Factorialesb) Diseños Rotablesc)Operaciones Evolutivas
Se ha desarrollado un nuevo diseño de mucha utilidad para los procesos industriales al cual he denominado Diseño Severo.
Antes de estudiar con amplitud estos métodos conviene familiarizarse con la nomenclatura utilizada en este campo del análisis estadístico.
A las variables experimentales las llamamos factores, el valor numérico del factor se denomina nivel. La combinación de factores que se utilizan en ciertos ensayos experimentales se llama tratamiento. El resultado del ensayo se llama efecto.Si la cantidad de material que se procesa es limitada, de manera que resulta necesario utilizar varios lotes de material, cuyas características son similares pero no idénticas, cada lote se llama bloque. Si el mismo experimento se repite en las mismas condiciones se llama replica.
La aplicación de estas técnicas a una estrategia experimental puede ilustrarse considerando la optimización de las consideraciones operativa de un proceso.
Ejemplo 6.50Todo proceso científico, tecnológico y social esta vinculado bajo el siguiente esquema:
183
Palacios C. Severo
a) El insumo varia por su calidad, cantidad y la variedad.
b) El proceso varia si es continuo (dinámico) o Bach (estacionario).c) El control si es de calidad, de rendimiento o eficiencia (cualitativo o cuantitativo).
Donde al variar el insumo en el proceso el control es muy distinto para cada caso.
Proceso
Factores externos
Y1
Y2
R espuesta(Salidas)
X2
Factorescontrolables
X1
( Entradas)Diseño
Ejemplo 6.51Se lixivia un desecho minero conocido como cola (relave, desecho, desmonte) con alto contenido de plata, estaño, plomo y cobre. En medio ácido bajo dos procesos distintos:
a) Clorurado en donde los componentes lixiviados fueron complejos de plata.
b) Nitratado en donde se forma compuestos de nitrato de plata.Siendo el insumo el desecho de mineral a diferentes dosificaciones de cloruros y nitratos.
El procedo viene a ser la disolución al dosificarse el cloruro o nitrato en medio ácido, a fin de disolver la plata en forma de complejo clorurado de plata o nitrato de plata.
El vector de control viene a ser la recuperación del metal valioso (plata) de la cola (relave, desecho, desmonte).
La recuperación de la plata de los dos medios acuosos (insumo en donde esta la plata en forma ionica) se efectúa por medio de la
184
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
precipitación (cementanción) con chatarra de hierro obteniéndose los siguientes productos respectivamente.
++ +↓→+ 222 FeAgOFeAg
++ +↓→+ 222 FeAgFeAg
Dos productos distintos en donde el insumo es el mismo, produciendo un control distinto en la recuperación del metal valioso, en cada tipo de medio acuoso.
Problema
(177) En un centro educativo se ve el rendimiento académico de los estudiantes alimentados y desnutridos, Obteniéndose el gráfico asintótico ascendente y descendente respectivamente.¿Evalué el insumo en el proceso de aprendizaje?
(178) Se procesa un mineral aurífero con dos reactivos con el fin de evaluar el rendimiento de recuperación de oro de dicho material.¿Plante un diseño factorial para el presente proceso?
185
Palacios C. Severo
(179) Se realiza la comparación de dos procesos para la recuperación de oro, siendo el proceso convencional la cianuración y el proceso innovativo el Proceso SEVERO.Plantee un diseño experimental para los procesos mencionados.
(180) Se tiene una solución ácida de cloruro de plata y desea precipitarse electrolíticamente dicho metal, se pide al lector que factores influyen en dicho proceso y a que niveles trabajaría.
(181) Al problema 169 en vez del proceso electrolítico se desarrolla el proceso de cementación con chatarra de hierro, que factores y niveles utilizaría para desarrollar el proceso.
(182) Se tiene una solución ácida de cobre, del cual se quiere recuperar el cobre por vía electrolítica, se pide que se evalué dos factores: densidad de corriente y concentración de cobre.¿Proponga un tipo de diseño?
(183) Se quiere recuperar cobre de una solución ácida, para el cual se adiciona chatarra de hierro, el cobre producto de dicha precipitación es de calidad comercial, a partir de dicho cobre se desea producir sulfato de cobre de calidad comercial.¿Elabore un diseño que produzca una sola variación con los dos productos obtenidos?
II. DISEÑOS BIFACTORIALES
Por diseño Bifactorial se entiende aquel en el que se investigan todas las posibles combinaciones de los niveles de los factores, en cada ensayo completo o réplica del experimento.
Por ejemplo, si existen a-niveles del factor A y b-niveles del factor B, entonces cada réplica del experimento contiene todas las ab combinaciones de los tratamientos. A menudo, se dice que los factores están cruzados cuando éstos se arreglan en un diseño factorial.
186
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
El efecto de un factor se define como el cambio en la respuesta producida por un cambio en el nivel del factor. Este se conoce como efecto principal.
Ejemplo 6.52Consideremos los datos de la tabla 6.34. El efecto del factor A es la diferencia entre las respuestas promedio en el primero y segundo nivel de ese factor.
Tabla 6.34 Experimento factorial
a) Interactivo
4 5
12 10
Factor B
Fact
or A
b) Sin interacción
4 5
10 15
Factor B
Fact
or A
Numéricamente
[ ] [ ] 5,62/542/1012 =+−+=A
Interpretando este resultado nos indica que incrementando el factor A del nivel 1 al 2 produce un cambio en la respuesta promedio de 6,5 unidades.
Para el efecto B:
187
Palacios C. Severo
[ ] [ ] 5,02/1242/105 −=+−+=A
Interpretando este resultado indica un decremento del factor B del nivel 1 al 2 produciendo un cambio en la respuesta promedio de -0,5 unidades.
Como en este caso la diferencia en la respuesta entre los niveles de un factor no es la misma en todos los niveles de otros factores. Cuando esto ocurre existe una interacción entre los factores.
Gráficamente podemos visualizar este fenómeno,
Interactivo Sin Interacción
Ejemplo 6.53Un investigador diseña un calefactor eléctrico para mantener constante la temperatura de una Piscigranja debiendo este ser sometido a ciertas variaciones de temperatura. El único parámetro de diseño que él puede seleccionar en este punto es el material de la cubierta de calefacción, y tiene tres alternativas. Cuando el calefactor se manufactura y se envía a la Piscigranja, el investigador no tiene control sobre los extremos de temperatura a que será expuesto, sabe por experiencia que es probable que la temperatura influya en la duración efectiva del calefactor.El investigador decide probar los tres materiales de la cubierta a tres niveles de temperatura ( 2°C, 8°C y 12°C). Se prueban tres calefactores a cada combinación de material de la cubierta y temperatura y las 36 pruebas se ejecutan al azar.
En la tabla 6.35 se presenta el experimento y los datos resultantes de duración observada de los calefactores.
Tabla 6.35 Datos para el experimento del calefactor eléctricoMateria Temperatura Yi
188
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
l 2 8 12
12082
7058 230
150126
188126 623
138168
110160 576 1429
2136106
122115 479
2558
7045 198
13074
155180 539 1216
33480
4075 229
150139
174120 583
9682
10460 342 1154
Total 938 1404 1457 3799
79,7764636/37996082...7020 22222 =−++++=totalSC
[ ] 72.1068336/37994*3/115412161429 2222 =−++=materialSC
[ ] 72,3911836/37994*3/14571404938 2222 =−++=aatemperaturSC
[ ] ( ) 78,961372,3911872.1068336/37994/342...230 222
int =−−−++=eracciónSC
75,1823078,961372,3911872,1068397,77646 =−−−=errorSC
En la tabla 6.36 se muestran los resultados del procedimiento.
Tabla 6.36 Análisis de varianzaFuente SC GL CM Fo Ft(99) Ft(95)Material 10683,72 2 5341,86 7,91 5,53 3,37Temperatura
39118,72 2 19558,36 28,97 5,53 3,37
Interacción 9613,78 4 2403,94 3,56 4,14 2,74Error 18230,75 27 675,21Total 77646,97 35
Se concluye que no existe interacción para un Ft(99)=4,14 entre el tipo de material y la temperatura. Además son significativas los efectos principales del tipo de material y la temperatura para Ft(99)=5,53. En cambio para Ft(95) existe interacción así como influencia de los efectos principales.
189
Palacios C. Severo
Temperatura
Du
raci
ón
Tipo 1
Tipo 2
Tipo 3
Gráfica de tipo de material contra temperatura.
Como una interpretación auxiliar de los resultados en este experimento resulta útil la construcción de una gráfica de las respuestas promedio en cada combinación del tratamiento.
El hecho de que las rectas no son paralelas indica una interacción significativa tan solo para Ft(95). En general a menos temperatura, mayor duración, independiente del tipo del material.
Al variar la temperatura de baja a intermedia la duración aumenta con el material tipo 2 mientras que disminuye con el material tipo 1 y 3. Cuando la temperatura varia de intermedio a alta, la duración disminuye con los materiales tipo 3 y 2, mientras que con el tipo 1 permanece sin cambio, al parecer, el material tipo 2 da los mejores resultados.
III. COMPARACIÓN MÚLTIPLE
Si el análisis de varianza indica que hay diferencia en el nivel medio de los renglones y columnas, es de interés llevar a cabo comparación entre las medias individuales de renglón y columna para describir las diferencias significativas.
Y22 = 9,8 Y32 = 10,8 Y12 = 15,4
Error estándar de cada promedio
99,124/21,675/ === NCMS erroriY
Del apéndice obtenemos los valores críticos para 27 GL y 95% de significación
190
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
80,3799,12*91,2)27,2(05,0 ==r 75,3999,12*06,3)27,3(05,0 ==r
Tabla 6.37Tratamiento Y22 Y32
Yij 9,8 10,8Y12 21,6 11,8 10,8Y32 17,6 7,8
Y1 y Y3 no existe diferencia significativa
El modelo estimado para el presente caso es:
Material Y1Coeficientes de los contrastes ortogonales
Lineal Cuadrático123
142912161154
-101
1-21
r 1 3Efecto ΣCiY 275 151
SC[(ΣCiY)2/n ΣCi2] 12604,16 1266,72
164,25)6(3/151*3/
83,45)2(3/275/
52,10536/3799/
2
22
2
11
==∑ ∑=
−==∑ ∑=
==∑=
ii
ii
o
CnYCSC
CnYCSC
NYSC
α
α
α
τ
τ
El modelo del polinomio ortogonal es:
21 164,2535,7911,225 XXY +−=
Tabla6.38 Análisis de varianzaFuente SC GL CM Fo Ft(65
)Material 10683,72 4 5341,86 7,91 > 3,36Lineal 12604,16 1 12604,16 18,6
6> 4,22
Cuadrático 1266,72 1 1266,72 1,83 4,22Error 18230,75 27 675,21Total 31
El efecto lineal es significativo.
22,59413intmod =++= eraccióntempmaterialelo scSCSCS
191
Palacios C. Severo
765,0/mod
2 == totalelo SCSCR
IV. DISEÑO ANIDADO
En ciertos experimentos multifactoriales, los niveles de un factor son similares pero no idénticos pero diferentes del otro factor. Tal arreglo se conoce como diseño anidado con los niveles del factor.
Ejemplo 6.54Un industrial compra materia prima por lotes a tres proveedores. La pureza de la materia prima varia considerablemente, lo cual causa problemas en el control del producto terminado. Se desea determinar si la variabilidad en la pureza puede atribuirse a diferencias entre los proveedores. Cuatro lotes de materia prima de cada proveedor se seleccionan al azar y se hacen tres determinaciones de la pureza sobre cada lote. Esto por supuesto, corresponde a un diseño anidado. Los datos después de codificarse aparecen en la tabla.
Tabla 6.39Lote Proveedor I Proveedor II Proveedor III
1 2 3 4 1 2 3 4 1 2 3 4949293
919089
919394
949793
949190
939795
929391
939695
959793
919395
949295
969594
Tlote 279
270
278
284
275
285
276
284
285
279
281
285
Tproveedor 1111 1120 1130
31,14836/3361313935 2 =−=totalSC
[ ] 06,1536/33618*4/113011201111 2222 =−++=proveedorSC
[ ] [ ] 92,698*4/1130112011113/285281...270279 2222222 =++−+++=loteSC
[ ] 33,633/285281...270279313935 2222 =++++−=errorSC
3436: === mnNGL
351: =−NTotal
192
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
21:Pr =−moveedor
9)1(: =−nmLote
24)12(: =−mnError
Tabla 6.40 Análisis de varianzaFuente SC G
LCM Fo Ft(99)
Proveedor 15,06 2 7,53 0,97
< 2,26
Lote 69,92 9 7,77 2,94
> 2,26
Error 63,33 24 2,64Total 148,31 35
193
Palacios C. Severo
Problemas
(184) Un ingeniero de procesos sospecha que el acabado de una pieza no metálica (polietileno) depende de la alimentación y la temperatura. Selecciona tres niveles de alimentación y eligió aleatoriamente cuatro niveles de temperatura a continuación se realiza un experimento Bifactorial.
Alimentación m/min
Temperatura (°)160 180 200 240
0,508608076
746460
9910496
9810899
0,63599110111
1198892
1049995
928688
0,76299110107
9810488
114108110
10488102
Analice los datos.Elabore una gráfica de los residuos.Estime los componentes de varianza con la temperatura.
(185) Se estudian factores que influyen en la resistencia de ruptura de una fibra. Se eligen al azar tres maquinas y dos operarios y se realiza un experimento Bifactorial usando la fibra de un mismo lote de producción.
OperarioMaquina
1 2 3
1 110111
111109
114112
2 112115
114119
120117
(186) Un ingeniero electromecánico estudia la fuerza producida por un torno. Sospecha que los factores más importantes son las revoluciones del motor y la alimentación. Se selecciona aleatoriamente cuatro niveles de alimentación y se usan los niveles de velocidad de rotación baja y alta para representar las condiciones de operación extrema. Analice los datos.
194
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
VelocidadTorno
Rapidez alimentación0,15 0,30 0,45 0,60
9802,852,80
2,862,87
2,942,88
2,832,86
12002,452,44
2,702,78
2,752,86
2,602,72
(187) Se realizó un experimento para determinar si la temperatura influye en la cocción de un azulejo ordinario producto de arcillas contaminadas.
AzulejoTemperatura °C
800 850 900
198810261004
526538532
528547521
2106310801043
565510590
570565583
(188) Un fabricante esta estudiando la tasa de combustible para tres tipos de estufas. Se seleccionan aleatoriamente tres lotes de combustible y se recopilan cuatro observaciones de la razón de calefacción en cada lote. Analice los datos y obtenga conclusiones.
LoteProceso I Proceso II Proceso III
1 2 3 1 2 3 1 2 315252026
16192820
13151714
35191714
27252421
25182117
25141520
27352129
33385450
(189) Un Ingeniero está estudiando el calibrado y afino de un embolo producido por tres fresadoras. Cada fresadora tiene 2 ejes. Se seleccionan aleatoriamente cuatro componentes de cada eje. Analice los datos.
LoteProceso I Proceso II Proceso III
1 2 1 2 1 2910816
15131914
10111312
10121114
1515148
9111212
195
Palacios C. Severo
V. DISEÑOS FACTORIALES
El término experimento factorial o arreglo factorial hace referencia a la constitución de los tratamientos o combinaciones de tratamientos que se desean comparar. Este término no afecta lo que se conoce como diseño de tratamientos, pues este se refiere a la selección de factores que se desean estudiar los niveles de los factores a ensayar y combinación de éstos.
De esta forma se debe dejar en claro que el diseño de tratamientos es independiente del diseño experimental, el cual hace referencia a la manera en que los tratamientos se aleatorizan a las diferentes unidades experimentales y la forma como se controla la variabilidad natural de las mismas. Así el diseño experimental puede ser completamente aleatorizado, bloques completamente aleatorizados, cuadrados latinos, etc., y para cada uno de éstos diseños se puede tener un arreglo factorial.
En muchos experimentos el éxito o fracaso del ensayo depende más de la selección de los tratamientos que se desea comparar que de la elección del diseño. Sin embargo, la selección de ambos (del diseño y de los tratamientos) es importante por tanto ninguno de los dos debe descuidarse en la planeación del experimento. En un experimento factorial se investigan simultáneamente los efectos de cierto número de diferentes factores. La necesidad de estudiar conjuntamente varios factores obedece principalmente a dos razones:
a. Encontrar un modelo que describa el comportamiento general del fenómeno en estudio. Esto se restringe al rango de variación de los niveles de los factores.b. Optimizar la respuesta o variable independiente, es decir, encontrar la combinación de niveles de los factores que optimizan esa respuesta.
196
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Los tratamientos en el análisis factorial consisten en todas las combinaciones se forman de los distintos niveles de los factores. Por ello, la característica esencial que hace necesario el estudio conjunto de factores es la posibilidad de que el efecto de un factor cambie en presencia de los niveles de otro factor, es decir, que los factores interactúen, lo cual conlleva al concepto de interacción entre ellos.
Si se estudia un factor en forma separada el resultado puede ser diferente al que daría con un estudio conjunto, y es mas difícil describir el comportamiento general o encontrar el óptimo.Ejemplo 6.55Se presenta un experimento de factores por separado que consiste en determinar las condiciones óptimas de almacenaje de los pescados en barcos pesqueros. Los factores estudiados fueron: temperatura, duración y método de empaque (proporción de hielo y pescado). La respuesta de interés es una medida de la calidad del pescado al descargue.
Al investigar únicamente la temperatura se debe tener varios niveles de temperatura y mantener constante la duración y el empaque a niveles arbitrarios. Una vez obtenida una temperatura óptima (manteniendo los niveles constantes de duración y empaque) se investiga otro factor, por ejemplo el empaque con la temperatura óptima y un nivel arbitrario de duración. Si el empaque óptimo encontrado no es el que se seleccionó en la primera etapa se deberá estudiar de nuevo la temperatura haciéndose necesario ajustes sucesivos.
Si el tiempo de obtención de la variable respuesta es corto y barato se puede seguir este procedimiento secuencial, en caso contrario es más conveniente el uso de experimentos factoriales.
Los diseños experimentales factoriales son ampliamente utilizados por agrónomos, químicos, metalúrgicos, físicos, economistas, sociólogos, industriales, ingenieros y científicos. Ya sea en el laboratorio, planta piloto o nivel industrial.
PruebaCombinació
nNotación 2
A B C1234
1ab
ab
-+-+
--++
----
197
Palacios C. Severo
5678
cacbc
abc
-+-+
--++
++++
Los diseños factoriales son particularmente útiles en la primera fase del trabajo experimental, cuando es comprobado que hay muchos factores por investigar. Conlleva el menor número de corridas con las cuales pueden estudiarse n-factores en un diseño factorial completo. Debido a que sólo hay dos niveles para cada factor, debe suponerse que la respuesta (rendimiento, calidad, recuperación) es aproximadamente lineal en el intervalo de los niveles escogidos de los factores.Si cada variable es continua, existen dos niveles el superior e inferior.
Las notaciones arriba mencionadas son obtenidas para asignar los niveles superior e inferior de los factores. La combinación 1 indica que todas las variables están en su nivel inferior. Las variables que no aparecen en el resto de combinaciones están en su nivel inferior. La combinación a indica los valores superior e inferior por + y - respectivamente. Un diseño experimental 2n puede combinarse geométricamente y cada combinación experimental corresponde a un punto en el espacio cartesiano cuyas coordenadas son ±1.
VI. DISEÑO FACTORIAL 2n
Los diseños factoriales se usan ampliamente en experimentos que incluyen varios factores cuando es necesario estudiar el efecto conjunto de los factores sobre la respuesta. Hay varios casos especiales del diseño factorial que son importantes debido a su uso generalizado en el trabajo de investigación y porque constituyen las bases de otros diseños de gran valor práctico.
El más importante de estos casos especiales es el de n factores, cada uno con sólo dos niveles. Si todos los factores se estudian con dos niveles, se dice que es un experimento factorial 2n. Los niveles de estos factores pueden ser cuantitativos o bien cualitativos.
La selección de únicamente dos niveles puede conducir a inferencias erróneas.
198
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Así cuando la respuesta se afecta en forma cuadrática, los niveles estudiados pueden indicar que no efecto el factor. Este es un riesgo que se corre al usar dos niveles por factor.
1 2
3 4
Diseño factorial 2n simpleEn el caso de n = 2, se tiene el factorial más sencillo 22.
VII. DISEÑO FACTORIAL 22
A este diseño se le llama diseño factorial 22. Los niveles de los factores pueden denominarse arbitrariamente mínimo y máximo.
Se tienen cuatro tratamientos que se denotan por cualquiera de los siguientes símbolos.
El primer diseño de esta serie, es aquel que tiene Sólo dos factores, A y B, Cada uno con dos niveles, con cuatro combinaciones en el plano.
Ejemplo 6.56Un investigador desea estudiar la influencia de la temperatura y el tiempo de acondicionamiento en un experimento. Su vector respuesta Y¡ es la recuperación del proceso.
Factores NivelesA = Temperatura (°C)B = tiempo (min)
201
803
El número de experiencias de 22 = 4 y el diseño será:
Tabla 6.41 Notación de un diseño 22
PruebaCombinació
nDiseño Niveles
YiX1 X2 A B123
1ab
-+-
--+
208020
113
658070
199
Palacios C. Severo
4 ab + + 80 3 85
El análisis del diseño 22 nos permite obtener información sobre los efectos e interacciones de las variables.
Efecto A = [-1+a-b+ab]/2 = [-65+80-70+85]/2 = 15Efecto B = [-1-a+b+ab]/2 = [-65-80+70+85]/2 = 5Interacción AB = [+1-a-b+ab]/2 = [65-80-70+85]/2 = 0
El efecto principal se calcula simplemente de las diferencias de los promedios de las respuestas cuando el efecto A esta en su nivel superior, menos el promedio de las respuestas cuando A está en su nivel inferior.
No existe interacción con los factores en estudio.Ejemplo 6.57Se desea evaluar un proceso donde se estudian dos factores a tres niveles. Para evaluar el error se corren pruebas centrales.
A: 8 9 10B: 90 115 140
Tabla 6.42 Notación de un diseño 22 con pruebas centrales
PruebaCombinació
nDiseño Niveles
YiX1 X2 A B1234567
1ab
ab000
-+-+000
--++000
810810999
9090140140115115115
80828695899091
Para determinar la varianza media del error, evaluamos los puntos 5, 6 y 7 bajo la siguiente expresión:
( )( )11
222
−∑−
−∑=
NN
Y
N
YS ii
( )1
6
270
2
919089 22222 =−++=S
Efecto A = (-80+82-86+95)/2 = 5,5Efecto B = (-80-82+86+95)/2 = 9,5
200
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Interacción AB = (+80-82-86+95) = 3,5
Ejemplo 6.58En una investigación se desea evaluar el efecto del SO2, sobre una población cercana a una empresa minera que monitorea dicho contaminante para lo cual estudia a la salida de la chimenea, la altura de la chimenea, la velocidad del viento y la distancia promedio a la población respecto de la chimenea y la dirección del viento. Los niveles elegidos para evaluar cada uno de los factores son los siguientes.
FactoresNiveles
- 0 +Q: Tasa de emisividad (g/s)H: Altura de chimenea (m)V: Velocidad del viento (m/seg)X: Distancia (m)
80305
500
120457.5650
606010
800
La concentración de SO2 viene expresada por la relación:
−
Π=
2
221
6
5,0exp10
K
H
KvK
QC
Donde:
k1 = 36; k2 = 18,5: son constantes de proporcionalidad.
Ejemplo 6.59
Un estudioso desea conocer la influencia de la temperatura y el tiempo de acondicionamiento en un experimento. Particularmente está interesado en entender como al elevar la temperatura del acondicionador cambia las características del medio produciendo un conjunto de condiciones no favorables para el proceso.
FactoresNiveles
- +A: Tiempo (min)B: Temperatura (°C)
3010
6030
Se evalúan dos factores fijados a dos niveles, es decir se decide utilizar un diseño factorial completo, en donde N = 2n = 22 = 4 experimentos. Los valores de las variables a experimentar se codifican con valores +1 y –1. Con los recursos que se dispone se decide realizar el experimento por triplicado. Los resultados se visualizan en la siguiente tabla.
201
Palacios C. Severo
Tabla 6.43 Notación de un diseño 22 replicadoPrueb
aA B Recuperación
1234
-+-+
30603060
--++
10103030
0,170,220,300,37
0,160,200,290,36
0,150,210,310,38
Tabla 6.44 Efecto e interaccionesEfectos Interacciones
A = 0,06B = 0,15
AB = 0,01Bloque = -0,015Bloque = 0,005
Basado en 1 grado de libertad
Tabla 6.45 Análisis de varianzaFuente SC G
LCM Fo Ft(99)
ABABBloqueError
0,01080,06750,0003
0,000350,00045
11126
0,01080,06750,0003
0,0001750,00007
5
144,00900,0
04,002,33
>><<
13,7413,7413,7413,74
Total 0,0794 11 R2 = 99,4332%
Ejemplo 6.60Se estudia un proceso electrolítico en donde interactúan dos factores: densidad de corriente y temperatura, en la tabla 6.46 se dan las respuestas y los niveles de trabajo.
Tabla 6.46 Notación de un diseño 22 con pruebas centrales
PruebaExperimento
YX1 X2
1234567
0,50,70,50,70,60,60,6
646466
353535
68,7267,8569,6069,4468,7368,7268,74
Varianza del error
[ ] [ ] 0001,06/16,2062/74,6872,6873,68 22222 =−++=S
el modelo lineal viene representado bajo un estudio de Yates.
202
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
2121 1775,06175,025,083,68 XXXXY ++−=
Ejemplo 6.61La remoción del cobre y la recuperación de cianuro de los efluentes de cianuración son, sin duda de gran interés desde el punto de vista ambiental y económico.
En este ejemplo se estudian dos objetivos, el primero es la evaluación preliminar de utilizar aminas para eliminar el cobre de las soluciones de cianuración por medio de la formación de un sólido que pueda separarse fácilmente por filtración. El segundo es hacer una evaluación con diferentes aminas seleccionando la mejor y realizar un diseño experimental 22 utilizando como variables el pH y la cantidad de reactivo adicionado para el compuesto que de mejores resultados en la evaluación preliminar.
Los experimentos preliminares consistieron en adicionar 0,025 g de cada uno de los compuestos a 100 ml de solución a pH 12 y 8. Después de filtrar las soluciones con papel de filtrado lento (tamaño de poro de 1,5 micrones) se analizó el cobre remanente por absorción atómica. Una vez seleccionado el mejor compuesto, se realizó un diseño de experimentos factorial 22 utilizando como variables el pH (9 y 12) y la concentración del compuesto (0,25 y 5 g/L). Todas las pruebas de este diseño experimental se realizaron por triplicado.
Amina FórmulaQuartamin 2050Quartamin 60DodecilaminaQuartamin D86P
R-N(CH3)3ClR-N(CH3)3Cl
CH3(CH2)11NH2
2R-N(CH3)3Cl
NivelesFactores - +
X1: pH soluciónX2: Amina (g/L)
90,25
125
PruebaExperimento
Remoción cobre (%)X1 X2
1234
912912
0,250,25
55
9,510,05
60,2555,54
9,000,0961,6355,12
9,970,0561,2756,87
203
Palacios C. Severo
Efectos estimados para YEfectos Interacciones
X1: pH = -53,683X2: Amina = -7,318
AB = -2,1116Bloque = -0,305Bloque = 0,855
Errores estándar con 6 GL
El primer paso para interpretar los efectos principales es comprobar que la variación observada en la respuesta es debida a un efecto real de cada factor y no al error experimental. Para no entrar en detalles, se considera que los dos efectos no son significativos y que no parecen fruto de la imprecisión de la experimentación. No existe interacción entre los factores.
Análisis de varianzaFuente SC G
LCM Fo Ft(99)
X1: pHX2: AminaX1X2
BloqueError
8640,87160,67413,37741,126552,03945
11126
8640,87
160,67413,37740,563270,3399
25421,18
472,7039,361,66
>>><
13,7413,7413,7413,74
Total 8818,09 11 R2 = 99,9769%
Valor óptimo = 61,05Facto
rBajo Alto Óptim
opHAmina
9,00,25
12,05,0
9,00,25
2121 2963,05712,11115,17327,215 XXXXY −+−=
De aquí puede verse que la amina y no así el pH afectan la eficiencia de eliminación de cobre. Un aumento en la cantidad de amina incrementará la remoción de cobre, de la misma manera que lo hará una disminución del pH.
El efecto más importante es el de la cantidad de amina, por lo que valdría la pena explorar cantidades mayores a las estudiadas en este trabajo.
204
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
9Amina
5
Gráfica de Efectos Principales para Y
0
10
20
30
40
50
60
Y
pH12 0.25
9
Amina=0.25Amina=5
Gráfica de Interacción para Y
0
20
40
60
80
Y
pH12
Amina=0.25
Amina=5
Grafico de efectos principales Interacción de efectos principales
En el gráfico de efectos principales vemos que el pH no tiene efecto significativo, la Amina tiene efecto significativo.
No existe interacción en el rango (niveles) trabajado, pero existe interacción a niveles inferiores de ambos factores.
Contornos de la Superficie de Respuesta Estimada
9 9.5 10 10.5 11 11.5 12
pH
0
1
2
3
4
5
Am
ina
Y0.0-8.08.0-16.016.0-24.024.0-32.032.0-40.040.0-48.048.0-56.056.0-64.064.0-72.072.0-80.080.0-88.0
Superficie de Respuesta Estimada
9 9.5 10 10.5 11 11.5 12pH
01
23
45
Amina0
20
40
60
80
Y
Y0.0-8.08.0-16.016.0-24.024.0-32.032.0-40.040.0-48.048.0-56.056.0-64.064.0-72.072.0-80.080.0-88.0
Gráfico lineal con punto óptimo Gráfico espacial con punto óptimo
En el gráfico lineal y espacial se puede visualizar la región óptima del proceso.
Problemas
(190) Se presume que el efecto del pH y la temperatura en el rendimiento de cierta reacción química no son independientes. Para determinar el grado de relación entre los factores estudiados (pH, T), se realizó un diseño experimental 22 donde se evalúan dos niveles de cada uno de estos factores y se mide el % de rendimiento de la reacción. Acá se muestran las condiciones del diseño, la matriz del mismo y los resultados experimentales de 2 determinaciones paralelas:
Rendimiento (%)
205
Palacios C. Severo
pH T (°C) Replica I Replica II--++
-+-+
45732330
47712633
Haciendo uso del análisis de varianza, confirme el resultado.Escriba la ecuación de regresión teniendo en cuenta solamente los términos significativos.Analice los efectos principales de los factores estudiados y de la interacción entre estos sobre el rendimiento mediante los gráficos correspondientes.Determine las condiciones experimentales óptimas de T y pH que permiten obtener el mayor rendimiento.
(191) Se llevó a cabo una investigación para estudiar el efecto que tienen la concentración de un reactivo cR y la presencia de un catalizador K sobre el rendimiento de un proceso químico. El estudio se realizó mediante un diseño factorial 22 en las siguientes condiciones experimentales:
Rendimiento (%)cR mK Replica I Replica II Replica III-+-+
--++
28361831
25321930
27322329
Analice de manera cualitativa la significación de los factores de interés (cR, mK) y la interacción cRmK sobre el rendimiento de la reacción estudiada y compruebe estadísticamente el resultado de su análisis.Escriba la ecuación de regresión obtenida. ¿Qué información le brindan los signos de los coeficientes de la ecuación? ¿De que tipo es la interacción cRmK?.Analice los gráficos de efectos principales de los factores estudiados y de la interacción entre estos sobre el rendimiento. Determine las condiciones experimentales óptimas de cR y mK
para obtener el mayor rendimiento. Reporte el valor del rendimiento y su intervalo de confianza en estas condiciones.
(192) En la determinación potenciométrica simultánea de NH3 y CO2 con HCl se desea estudiar la influencia de Co(II) y Ni(II) presente en la muestra sobre los resultados obtenidos. Con este objetivo se realizan dos diseños experimentales 22 para estudiar el efecto de Co(II) y Ni(II) sobre la determinación del NH3 y sobre la determinación de CO2. Las condiciones del diseño son las siguientes:
NH3 CO2
206
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Ni(II)
Co(II)
NH3 Ni(II) Co(II)
CO2
-+-+
--++
75,936,766,8
36,2
76,136,5
66,5
36,3
-+-+
--++
56,956,756,556,8
57,256,456,756,7
Analice de manera cualitativa la significación de los factores de interés (concentración de Ni y de Co) y la interacción entre estos sobre el resultado de la determinación de cada uno de los compuestos químicos analizados. Compruebe estadísticamente el resultado cualitativo obtenido.Escriba la ecuación de regresión obtenida. ¿Qué indican los signos de los coeficientes de la ecuación? ¿Cómo es la interacción Ni(II) Co(II)?.Analice los gráficos de efectos principales de los factores estudiados y de la interacción entre estos. Determine cuales son las condiciones experimentales óptimas tal que no se afecte la determinación de NH3 y de CO2.
(193) Se desea estudiar el efecto sobre el rendimiento (expresado en %) de un proceso químico para obtener un compuesto inorgánico de tres factores de manera simultánea: concentración de un reactivo, pH de la mezcla reaccionante y temperatura de reacción. Con este objetivo se diseña un experimento factorial 23 bajo las siguientes condiciones experimentales:
C (mol/L) pH T (°C) Rendimiento (%)-+-+-+-+
--++--++
----++++
56,052,537,854,269,072,049,170,6
58,054,239,453,066,070,848,271,9
59,655,540,155,667,574,547,073,2
Afectan de manera significativa los factores estudiados el rendimiento del proceso bajo investigaciónActúan de manera independiente estos tres factores sobre el rendimiento de la reacciónCuáles son las condiciones experimentales óptimas
(194) Un método nuevo de determinación de manganeso (Mn) fue desarrollado para conocer el contenido de este elemento en un mineral. Para validar el método se tomaron 8 muestras
207
Palacios C. Severo
homogéneas del mineral y se determinó el porcentaje en masa de Mn por dos laboratorios diferentes. Los resultados obtenidos son:
A B Mn (%)-+-+
--++
1,701,751,681,72
1,72
1,77
1,67
1,73
Suponiendo que el contenido real de Mn en la muestra es de 1.71 %, compare el mismo con cada una de las 2 medias experimentales (en caso de existir diferencias significativas entre estas).
(195) En muestras de licores amoniacales de níquel, obtenidos en la industria niquelífera mediante la digestión de los minerales, se determinó el contenido de este elemento por tres métodos analíticos diferentes: gravimetría, colorimetría y complejometría. Los resultados en % de níquel se encuentran abajo:
A B C Mn (%)Gravimetrí
aColorimetrí
aComplejometrí
a-+-+-+-+
--++--++
----++++
1,761,801,481,271,601,741,272,18
4,444,065,794,344,645,125,574,39
1,781,852,121,401,721,601,581,23
Cuáles de los métodos pueden emplearse para la determinación de Ni
(196) Consideremos un experimento donde el objetivo es estudiar la relación entre la frecuencia de oscilación de un reloj de cuarzo patrón y las condiciones de humedad y temperatura. En este caso el instrumento ya cuenta con un dispositivo para minimizar los cambios de temperatura, dado que los fabricantes conocen su impacto en la frecuencia de oscilación. Los factores seleccionados son temperatura (T) y humedad (H) y sus niveles de prueba se eligen de acuerdo a las condiciones del laboratorio; en este caso los niveles de temperatura son (22oC, 24oC) y para la humedad (20%, 50%).
208
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
La variable de respuesta es la frecuencia de oscilación (Y). El diseño experimental seleccionado es un factorial completo 22 con punto central que se muestran a continuación.
Prueba
Temperatura(°C)
Humedad(%)
Frecuencia (Hz)
123456
222422242323
202050503535
9,97069,9706997049,97029,97049,9692
En particular en el estudio presentado se muestra cómo evaluar experimentalmente la incertidumbre dada por el fabricante de un equipo para verificar su magnitud en las condiciones del propio laboratorio. Este tipo de estudios podrían llevar a mejoras tanto de los equipos como de las instalaciones del laboratorio, buscando tener un menor impacto de las fuentes de incertidumbre detectadas como las más importantes.
(197) En la definición de las variables de estudio de electrodeposición de oro se tuvo en cuenta las condiciones impuestas por el proceso previo de desorción de oro, sobre todo en aquellas que tienen que ver con el electrolito, como la concentración de oro, la concentración de cianuro de sodio e hidróxido de sodio, la conductividad, el pH y la temperatura. Con estas queda definida la referencia base para la selección y rango de las variables de estudio.Entre las variables mencionadas se seleccionaron el potencial aplicado, la concentración de hidróxido de sodio y la Densidad de corriente catódica como las de mayor interés para este estudio, y como variables de respuesta se consideraron la eficiencia de corriente, el consumo de potencia, la cinética de la deposición del oro y su recuperación.
FactoresNiveles
- +Potencial (Vols)NaOH (g/L)DC (A/cm³)
2,510
0,025
3,520
0,075
Prueba
Potencial(Vols)
NaOH(g/L)
DC(A/cm³)
Consumo energía
(Watt-h)Tiempo (min)
2,53,52,53,52,5
1010202010
0,0250,0250,0250,0250,075
3,439,384,3313,943,29
115,078,7
108,576,078,9
209
Palacios C. Severo
3,52,53,53,03,03,03,03,0
1020201515151515
0,0750,0750,0750,0500,0500,0500,0500,050
9,385,73
15,667,797,646,877,756,70
78,7173,9113,288,987,480,393,880,0
Se pretende minimizar el tiempo del proceso, de consumo de energía (mayor eficiencia de corriente) y menor cantidad de hidróxido de sodio a fin de optimizar las condiciones por medio de las ecuaciones logradas. Esto redunda en un beneficio económico y practico para la recuperación electroquímica de oro.
(198) El reciclado electroquímico de los compuestos de partida en disolución ácido se ha monitorizado por análisis de la DQO (demanda química de oxígeno), cromatografía de placa fina, análisis de CG-MS y por espectroscopia de UV-VIS.El tiempo de cada electrólisis se ha calculado para circular la cantidad teórica de electricidad necesaria para oxidar completamente el sustrato, a partir de las leyes de Faraday, y una concentración de sustrato a tratar de 0,015 M en un volumen de 150 cm3. El tiempo de reacción se ha prolongado para aquellos casos en que se observó un mejor comportamiento de la disminución de la DQO al aumentar la carga eléctrica.El plan experimental escogido para estudiar la influencia de las principales variables de reacción es un diseño factorial completo 23 con ocho barridos experimentales, donde las variables escogidas y sus niveles fueron la temperatura (25 y 40ºC), la concentración de electrolito (50 y 96%) y la densidad de corriente (500 y 1000 A/m2).
FactoresNiveles
- +X1: Temperatura (°C)X2: Concentración (%)X3: DC (A/m²)
2550
500
4096
1000
Prueba
Temperatura(°C)
Concentración
(%)DC
(A/m²) DQO1234567
25402540254025
50509696505096
500500500500
100010001000
32487725
3075285227756525867
210
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
8 40 96 1000 4425
La tecnología propuesta se presenta como una técnica universal para degradar compuestos nitratados aromáticos en contra de la biodegradación, en la que las especies microbianas encargadas de degradar son específicas para cada contaminante concreto y mucho más versátil y cómoda de escalar y diseñar a nivel industrial que tecnologías basadas en sistemas fotocalíticos.Del estudio experimental de la degradación de los sustratos de partida se realizó en base al diseño de experimentos detallados en la tabla adjunta. La influencia de las variables tenidas en cuenta, temperatura, densidad de corriente y concentración de electrolito, así como las interacciones entre ellas, se han estudiado estadística y comparativamente.Se pide demostrar la influencia de dichos factores
(199) El propósito de este estudio fue evaluar la remoción de sólidos totales, presentes en la vinaza (destilado del alcohol), mediante procesos de electrocoagulación-electroflotación utilizando electrodos de aluminio y como variables de operación pH inicial, concentración de electrolito y densidad de corriente.Las variables evaluadas fueron densidad de corriente (DC), pH inicial y concentración de NaCl como soporte electrolítico, todas las variables en dos niveles.Los niveles usados para cada variable fueron: DC 20, 40 y 60 mA/cm2; pH 4, 7 y 9; [NaCl] 0, 2000 y 4000 ppm.
FactoresNiveles
- 0 +X1: DC (mA/cm²)X2: pHX3: [NaOH] (ppm)
2040
407
2000
609
4000
Prueba
DC(mA/cm²) pH
[NaOH](ppm)
Al(g)
% Sólidos totalesClarificado Espuma
1234567891011
2060206020602060404040
44994499777
0000
4000400040004000200020002000
0,06630,06590,02450,13010,21390,06480,06580,06470,21090,20910,2173
19,8120,9522,5922,0921,7315,0514,5615,2322,0016,8820,16
22,7323,4924,0023,7722,7717,2517,9218,6923,1216,8019,15
Que factor influye en el mayor desprendimiento de aluminio al desarrollar la electrocoagulación-electroflotación.
211
Palacios C. Severo
En que región del pH ocurre mejor el proceso.(200) La investigación se desarrolló con las aguas residuales de una
industria láctea de la región. Se tomaron muestras tanto del tanque de descargas, como del tanque de homogeneización; este último toma las aguas del tanque de descarga de las aguas residuales de la empresa y las mezcla. A éstas se le analizaron: pH, DQO, conductividad eléctrica, grasas y aceites. Los análisis se realizaron el mismo día del muestreo; de acuerdo con los resultados, se decidió que las muestras de agua para la investigación serían recolectadas sólo del tanque de homogenización, por ser éste el más representativo en las características fisicoquímicas del agua residual láctea. La experimentación se llevó a cabo en un sistema para electrólisis. Este sistema opera como reactor discontinuo a escala prototipo, con capacidad para tratar dos litros de aguas residuales. Consta de una celda electrolítica de dos litros en la que están sumergidos los electrodos; estos electrodos son placas rectangulares metálicas de hierro y aluminio, dispuestas en paralelo y conectadas a una fuente de voltaje de corriente continua que proporciona la corriente eléctrica requerida para la electrocoagulación.
FactoresNiveles
- 0 +X1: pHX2: DC (A/m²)X3: tiempo (min)
532,43
5
737,83
10
843,23
15
Prueba pHDC
(A/m²)tiempo(min)
DQO(%)
1234567891011
58585858777
32,4332,4343,2343,2332,4332,4343,2343,2337,8337,8337,83
555515151515101010
75,7362,3646,5593,9970,8351,4477,2993,9943,8845,7942,15
La electrocoagulación se vislumbra como un tratamiento eficiente para la remoción de contaminantes en las aguas residuales industriales, específicamente en el caso de la industria láctea como se muestra en esta investigación. Los tres factores bajo estudio (pH, densidad de corriente y tiempo) tienen efecto significativo sobre la remoción de DQO. El
212
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
diseño de tres factores es bastante ajustado a los datos. En particular, si se tienen niveles óptimos del estudio para pH, tiempo y densidad de corriente.
(201) La planificación de los experimentos se realizó aplicando el diseño experimental factorial 2n; se analizó la influencia de la temperatura, la relación líquido/sólido y tiempo en la depuración de especies metálicas de efluentes, manteniendo fija la velocidad de agitación. Las variables de respuesta consideradas fueron: porcentaje de extracción de especies metálicas (E) y selectividad (S). Esta última, se determinó como la relación entre la recuperación de un componente dado y el grado de dilución del mineral. La extracción de Ni, Co, Fe y Mn como residuo de la depuración de efluentes. Las condiciones experimentales y niveles de las variables se muestran en la tabla.
FactoresNiveles
- 0 +X1: Temperatura (°)X2: tiempo (h)X3: Líquido/Sólido (L:S)
3018
45210
60312
Condiciones fijas del experimento: Velocidad de agitación 600 rpm; pH 4,06.Los modelos que regulan el proceso son:
9058,87²765,20625,01325,44475,62433,72 21321 =+−++= RXXXXXYNi
5456,96²165,23425,0255,258,30333,81 21321 =++++= RXXXXXYCo
0524,90²61125,151625,10613,1724125,522625,636,71 3221321 =−−−++= RXXXXXXXYFe
9567,95²2425,34925,06675,45,62356,70 21321 =++++= RXXXXXYMn
Elabore un diseño experimental que satisfaga la depuración del efluente
(202) Los residuos sólidos de la lixiviación o colas constituyen un gran problema para el ecosistema de la región industrial; su tratamiento, disposición y manejo son objeto de estudios con el fin de encontrar alternativas para minimizar los impactos negativos al medio ambiente. Una cuestión de interés lo constituye la recuperación de plata y el cobre contenidos en las colas residuales, las cuales son consideradas un mineral de baja ley. Con el objetivo de recuperar especies metálicas de las colas de los procesos de lixiviación, ya sean las resultantes del proceso ácido o del proceso amoniacal, se han realizado estudios de biolixiviación y lixiviación química con ácidos orgánicos
213
Palacios C. Severo
producidos por los microorganismos en sus procesos metabólicos.En la tabla aparece la matriz experimental correspondiente al plan 23, y un experimento en el nivel central. Con este diseño de experimento se obtuvo el comportamiento de las variables de respuesta Selectividad y Extracción de Ag y Cu. La selectividad se consideró como la relación entre la recuperación de un componente dado y el grado de disolución total del mineral. En todos los experimentos se mantuvieron fijos los parámetros siguientes: relación líquido:sólido: L/S=12/1 cm3 de solución/g de cola; velocidad de agitación: 630 rpm; tamaño de partículas (-0,149+0,074) mm. Se realizó el estudio del comportamiento cinético de la disolución del Ag y Cu. Las muestras de licor de lixiviación se colectaron a determinados intervalos de tiempo, se filtraron y analizaron por espectroscopia de absorción atómica.
FactoresNiveles
- 0 +X1: Temperatura (°)X2: tiempo (h)X3: Líquido/Sólido (L:S)
3011
4535
6059
PruebaT
(°)t
(h)L/S
(cm³/g)% Extracción
Ag Cu123456789
306030603060306045
115511553
111199995
62,9671,6069,0782,4064,2470,4563,7287,1278,63
77,3880,5377,9387,3977,5880,0977,3990,9180,10
(203) Se controlaron 3 variables que permitieron conocer las condiciones óptimas del reactor para obtener altos porcentajes de descontaminación y realizar el escalamiento del reactor a nivel industrial. Las variables escogidas para el estudio fueron:
FactoresNiveles
- 0 +X1: [H2O2] (ml/L)X2: Volumen a tratar (L)X3: [TiO2] (mg/L)
040
18100
212
200
Prueba[H2O2](ml/L)
Volumen
(L)
[TiO2](mg/L) Radiación
(W/m²)pH Degradación
(%)12
02
44
00
36,544,5
3,853,91
23,5246,19
214
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
34567891011
020202111
1212441212888
00
200200200200100100100
18,044,8326,0361,8352,8335,4140,1750,8334,17
5,775,413,725,738,435,124,244,24,12
7,3933,0343,3431,8714,86,6216,819,8
14,84
Para el estudio de estas variables se realizaron una serie de experimentos donde la variable de respuesta fue el porcentaje de degradación medido como el porcentaje de reducción en la DQO.Del análisis de los datos obtenga el ANAVA, estime la respuesta óptima, además de la superficie de respuesta, que permiten obtener un modelo estadístico que describe el comportamiento del sistema de fotodegradación respecto a las variables experimentales estudiadas y que permitan establecer el grado de confiabilidad de los datos obtenidos.
(204) Se seleccionaron modelos lineales del tipo 2n, en los que n representa el número de variables a estudiar. Para un diseño experimental con 3 variables (pH, dosis de coagulante y floculante), el número de experimentos a realizar es igual a 8.En la tabla se especifica los niveles de cada experimento para una pareja coagulante-floculante determinada. Como se observa en esta tabla los valores probados para el pH son 6 y 9, las dosis de coagulante fueron 20 y 100 mg/L y las del floculante de 0,1 y 1,0 mg/L.
PruebaFloculante
(mg/L)Coagulante
(mg/L)pH
Concentración residualColor DQO
12345678
0,11
0,11
0,11
0,11
2020
1001002020
100100
66669999
47,04513
22,5188,5180,540,540,5
84,575,060,555,5
105,5138,582,542,5
Debido a la buena calidad del efluente obtenido bajo las condiciones óptimas determine el modelo de remoción de los parámetros y, con el fin de disminuir el volumen de lodos y los costos del proceso, utilice dicho modelos para realizar un análisis de sensibilidad de respuesta con respecto a la variación de dosis para poder reducir la cantidad de coagulante a aplicar, de tal manera de conservar niveles de remoción aceptables para los derivados.
215
Palacios C. Severo
VIII. DISEÑO FACTORIAL 23
Cuando se tienen tres factores, A, B y C, con dos niveles cada uno, entonces hay un total de 8 tratamientos en investigación. Al diseño se le llama diseño factorial 23, y en este caso la representación geométrica de las ocho combinaciones de tratamientos puede hacerse con un cubo como se muestra
1 2
3 4
6
7 8
Diseño factorial 23 simple
Al igual que en el diseño factorial 22, existen tres notaciones diferentes para los ocho tratamientos que son de uso general. La primera es la notación + y -, llamada con frecuencia notación geométrica. La segunda es el uso de las letras minúsculas para identificar las combinaciones de los tratamientos. La tercera notación utiliza 1 y 0 para denotar los niveles alto y bajo, respectivamente, de los factores, en lugar de + y -
En este diseño se estudian tres factores A, B y C cada uno a dos niveles con ocho combinaciones de tratamiento que se representan gráficamente en un cubo.
216
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
En este tipo de diseño se asume el error al valor de la mayor combinación, abad.
Ejemplo 6.62En un autoclave se desarrolla un experimento a nivel planta piloto con la finalidad de evaluar la influencia sobre la taza de filtración de un producto, se estudian tres variables.
A: Concentración, B: Temperatura y C: Presión.
Tabla 6.47 Datos para un diseño 23
Prueba
A B C Combinación
Y
12345678
-+-+-+-+
--++--++
----++++
1ab
abc
acbc
abc
7165606590958696
Tabla 6.48 Efecto e interaccionesEfectos InteraccionesA = 3,5B = -3,5C = 26,5
AB = 4,0AC = 4,0BC = 2,0
Error estándar 1 GL
Tabla 6.49 Análisis de varianzaFuente SC G
LCM Fo Ft(99)
ABCABACBCError
24,524,5
1404,532,032,08,04,5
1111111
24,524,5
1404,532,032,08,04,5
5,445,44312,1
17,117,111,78
<<><<<
12,2512,2512,2512,2512,2512,25
Total 1530,0 7 R2 = 99,7059%
Ejemplo 6.63Al ejemplo 6.62 se le adiciona un factor de mezcla en un experimento a nivel planta piloto para estudiar los efectos que influyen sobre la taza de filtración de un producto.
Tabla 6.50 Datos para un diseño 24
Prueba
A B C D Combinación
Y
217
Palacios C. Severo
12345678910111213141516
-+-+-+-+-+-+-+-+
--++--++--++--++
----++++----++++
--------++++++++
1ab
abc
acbc
abcd
adbd
abdcd
acdbcd
abcd
71656065909586968588688083857570
Tabla 6.51 Efecto e interaccionesEfectos InteraccionesA = 3,25B = -7,75C = 12,25D = 0,75
AB = 2,25AC = -0,25BC = 1,25
AD = -0,25BD = -4,25CD = -14,25ABC = -2,75ABD = -1,75ACD = -4,25BCD = -0,75
ABCD = -1,25
Tabla 6.52 Matriz de variables independientesAB AC AD BC BD CD AB
CABD
BCD
ACD
ABCD
+--++--++--++--+
+-+--+-++-+--+-+
+-+-+-+--+-+-+-+
++----++++----++
++--++----++--++
++++----++++----
-++-+--+-++-+--+
-++--++-+--++--+
--++++--++----++
-+-++-+-+-+--+-+
+--+-++--++-+--+
Los efectos importantes son B, C y CD.
Tabla 6.54 Análisis de varianza
218
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Fuente SC GL
CM Fo Ft(99)
B 240,25 1 240,25
10,79 > 9,33
C 600,25 1 600,25
26,98
> 9,33
CD 812,25 1 812,25 36,51 > 9,33Error 267,00 12Total 1919,75 R2 = 86,09%
Ejemplo 6.64Se lixivia un mineral argentífero en una salmuera clorurada, de desea evaluar tres factores con el fin de establecer el efecto significativo de cada uno de dichos factores y el rango de cada uno de ellos,
A: NaCl (gr) 100 150B: H2SO4 (ml) 50 120C: FeCl3 (gr) 15 35
A B C Y100150100150100150100150125125125
50501201205050120120858585
1515151535353535252525
68,7167,3964,9362,1661,0565,8269,2170,3564,1364,8864,27
Tabla 6.55 Efecto e interacciones Efectos interaccione
sA = 0,45B = 0,92C = 0,81
AB =-1,27AC = 2,50BC = 5,42
Errores estándar con 4 GL
Tabla 6.56 Análisis de varianzaFuente SC G
LCM Fo Ft(99)
ABCABACBCError
0,4141,6921,3123,22512,5
58,5617,792
1111114
0,4141,6921,3123,22512,5
58,5611,948
0,210,870,671,666,4230,21
<<<<<
21,2021,2021,2021,2021,2021,20
Total 85,798 10 R2 = 90,9175%
219
Palacios C. Severo
BCACABCBAY 0077,0005,00007,0243,1089,0054,083,86 ++−−−−=
Valor óptimo = 70,1382Factor Bajo Alto Óptimo
ABC
1005015
15012035
15012035
100B
120 35
Gráfica de Efectos Principales para Y
65.2
65.4
65.6
65.8
66
66.2
Y
A150 50
C15 100
-
+
100 150
-
-+
-
+
Gráfica de Interacción para Y
62
64
66
68
70
Y
AB150
-+
AC
+
BC50 120
-
+
Efectos e interacciones significativas de factores principales
Contornos de la Superficie de Respuesta Estimada
C=25.0
100 110 120 130 140 150
A
50
70
90
110
130
B
Y64.0-64.364.3-64.664.6-64.964.9-65.265.2-65.565.5-65.865.8-66.166.1-66.466.4-66.766.7-67.067.0-67.3
Contornos de la Superficie de Respuesta Estimada
B=85.0
100 110 120 130 140 150
A
15
19
23
27
31
35
C
Y64.0-64.364.3-64.664.6-64.964.9-65.265.2-65.565.5-65.865.8-66.166.1-66.466.4-66.766.7-67.067.0-67.3
Contornos de la Superficie de Respuesta Estimada
A=125.0
50 70 90 110 130
B
15
19
23
27
31
35
C
Y64.0-64.364.3-64.664.6-64.964.9-65.265.2-65.565.5-65.865.8-66.166.1-66.466.4-66.766.7-67.067.0-67.3
Superficie respuesta estimada en el plano con punto óptimo de factores principales
Superficie de Respuesta EstimadaC=25.0
100 110 120 130 140 150A
5070
90110
130
B
64
64.5
65
65.5
66
66.5
67
Y
Y64.0-64.364.3-64.664.6-64.964.9-65.265.2-65.565.5-65.865.8-66.166.1-66.466.4-66.766.7-67.067.0-67.3
Superficie de Respuesta EstimadaB=85.0
100 110 120 130 140 150A
15 1923 27 31 35
C
64
65
66
67
68
Y
Y64.0-64.364.3-64.664.6-64.964.9-65.265.2-65.565.5-65.865.8-66.166.1-66.466.4-66.766.7-67.067.0-67.3
220
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Superficie de Respuesta EstimadaA=125.0
50 70 90 110 130B
15 1923 27 31 35
C
62
64
66
68
70
72
Y
Y64.0-64.364.3-64.664.6-64.964.9-65.265.2-65.565.5-65.865.8-66.166.1-66.466.4-66.766.7-67.067.0-67.3
Superficie respuesta estimada en el espacio de factores principales
Aplicación nanotecnologica
Actualmente el desarrollo de la nanotecnología está asociado a la disponibilidad de nanoestructuras, o también, al dominio de las técnicas de fabricación de las mismas.
En este entorno han aparecido diferentes modos de abordar la fabricación de nanoestructuras. Se puede trabajar en sentido descendente (de arriba abajo), desprendiendo o añadiendo material a una superficie para darle forma. O por el contrario, se puede partir desde el nivel más elemental (sentido ascendente, de abajo arriba), desde átomos o moléculas que se ordenan espontáneamente cuando las condiciones son apropiadas, hasta estructuras más complejas. Así, entre los nuevos materiales que se pueden obtener con esta tecnología, tienen especial importancia, los films cerámicos obtenidos por procesos de electrodeposición, bien sea electroforética o deposición electrolítica. En este último método se utilizan disoluciones de alta conductividad, la velocidad de deposición es del orden de 1 a 1000 nm/min y el espesor del depósito varía de 1 a 104 nm, que puede controlarse variando el tiempo de deposición, el voltaje o la densidad de corriente, en cuanto a la uniformidad del depósito ésta se controla por el campo eléctrico. Además, en la deposición electrolítica catódica, los iones metálicos o complejos se hidrolizan por los OH– generados para formar óxido, hidróxido o peróxido, finalmente los depósitos de hidróxidos y peróxidos se pueden convertir en los óxidos correspondientes por tratamiento térmico.
Dentro de estos materiales se ha observado que las películas muy finas de óxido de cinc, ZnO, un semiconductor de gap elevado, presentan propiedades ópticas muy interesantes, lo que les hace especialmente útiles para determinadas aplicaciones ópticas y opto electrónicas como emisor de luz y diodos láser abarcando un amplio rango desde el rojo al ultravioleta debido a sus interesantes propiedades, particularmente su amplio band-gap de 3,37 eV a 300 ºK.
221
Palacios C. Severo
En el presente ejemplo se ha aplicado una técnica de electrodeposición sobre un sustrato de vidrio conductor para obtener columnas de ZnO.
Ejemplo 6.65Con el fin de poder investigar, de forma rápida, la influencia que las variables del proceso (densidad de corriente, tiempo de exposición al electrolito y temperatura de desarrollo del proceso) tienen en la formación y crecimiento de las columnas obtenidas, se diseño un modelo experimental de tres variables a dos niveles (diseño factorial a dos niveles), de esta manera se ha conseguido optimizar el proceso. Es decir, este método permite con muy pocas experiencias de laboratorio obtener la información suficiente para poder abordar, con garantías de éxito, la fabricación de estas estructuras.
Las muestras se obtuvieron por electrodeposición, sobre un sustrato de vidrio de entre 0,5 y 1 cm2, recubierto de una capa conductora de óxido de estaño y flúor.
Con el fin de poder controlar la densidad de corriente aplicada, el tiempo de exposición y la temperatura se utilizó un potenciostato-galvanostato modelo 263 A y su correspondiente celdilla, introducida en una manta calefactora con termostato.
El electrodo de referencia utilizado fue el de Ag/AgCl en una solución saturada de KCl/AgCl y contraelectrodo de Pt.
Como electrolito se empleó una solución de concentración 5.10-3 M de ZnCl2 y 0,1 M de KCl en agua desmineralizada. Durante todo el proceso de electrodeposición se mantuvo la solución saturada de oxigeno. Los pH iniciales y final de la solución fueron 6,5 y 6,3 respectivamente. En la tabla se indican las variables a controlar.
FactoresNiveles
- 0 +X1: DC (mA/cm²)X2: Tiempo (seg)X3: Temperatura (°C)
160065
1,751200
75
2,5180
085
Prueba X1 X2 X3Altura(nm)
123
-+-
--+
---
439281611
222
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
45678
+-+-+
+--++
-++++
902304256109687
Los valores de la variable respuesta, altura de las columnas expresada en nanómetros (nm), se analizaron mediante el programa para computadoras STATGRAPHICS Centurion.
Efectos estimados para AlturaEfectos Interacciones
A: X1 = 165,75B: X2 = 257,25C: X3 = -219,25
AB = 268,75AC = 79,25BC = -139,25
Errores estándar con 1 GL
Tabla 4.12 Análisis de varianzaFuente SC G
LCM Fo Ft(99%)
A: X1
B: X2 C: X3 ABACBCError
54946,113235,596141,114445,319701,138781,13916,13
1111111
54946,113235,596141,114445,319701,138781,13916,13
14,0333,8024,5536,895,039,90
<<<<<<
161,4161,4161,4161,4161,4161,4
Total 490294 7 R² = 99,2013%
323121321 0116,0616,62986,06166,8562118,0083,74433,1271 XXXXXXXXXAltura −++−+−=Valor óptimo = 924,125
Factor Bajo Alto ÓptimoA: X1
B: X2 C: X3
160065
2,51800
85
2,51800
65
1X2
1800 85
Gráfica de Efectos Principales para Altura
320
370
420
470
520
570
620
Alt
ura
X12.5 600
X365
1
-+
1 2.5
-
-
+
-
+
Gráfica de Interacción para Altura
200
300
400
500
600
700
800
Alt
ura
AB2.5
-
+
AC
+
BC600 1800
-
+
Efectos e interacciones significativas de factores principales
223
Palacios C. Severo
Contornos de la Superficie de Respuesta Estimada
X3=75.0
1 1.3 1.6 1.9 2.2 2.5
X1
600
800
1000
1200
1400
1600
1800
X2
Altura
260.0-320.0
320.0-380.0
380.0-440.0
440.0-500.0
500.0-560.0
560.0-620.0
620.0-680.0
680.0-740.0
740.0-800.0
800.0-860.0
860.0-920.0
Contornos de la Superficie de Respuesta Estimada
X2=1200.0
1 1.3 1.6 1.9 2.2 2.5
X1
65
69
73
77
81
85
X3
Altura
260.0-3 20.0
320.0-3 80.0380.0-4 40.0440.0-5 00.0
50 0.0-560.0
560.0-6 20.0
620.0-6 80.0680.0-7 40.0740.0-800.0
80 0.0-860.0
860.0-9 20.0
Contornos de la Superficie de Respuesta Estimada
X1=1.75
600 800 1000 1200 1400 1600 1800
X2
65
69
73
77
81
85
X3
Altura
260.0-320.0
320.0-380.0380.0-440.0
440.0-500.0
500.0-560.0
560.0-620.0
620.0-680.0680.0-740.0
740.0-800.0
800.0-860.0
860.0-920.0
Superficie respuesta estimada en el plano con punto óptimo de factores principales
La formación y crecimiento de columnas de ZnO sobre un sustrato de FTO se favorece con tiempos largos de exposición (≈ 30 minutos) de éste al electrolito.
La densidad de corriente alta (≈ 2,5 mA/cm2) también favorece la formación y el crecimiento de las columnas. No obstante este factor tiene menor influencia que el tiempo de exposición.
Superficie de Respuesta EstimadaX3=75.0
1 1.3 1 .6 1.9 2.2 2.5X1
600800
10001200
14001600
1800
X2
260
360
460
560
660
7 60
860
Alt
ura
Altura
260.0-320.0320.0-380.0380.0-440.0440.0-500.0500.0-560.0560.0-620.0620.0-680.0680.0-740.0740.0-800.0800.0-860.0860.0-920.0
Superficie de Respuesta EstimadaX2=1200.0
1 1 .3 1 .6 1.9 2.2 2.5X1
656 9
7377
8185
X320 0
30 0
40 0
50 0
60 0
Alt
ura
Altura260.0-3 20.0320.0-3 80.0380.0-4 40.0440.0-5 00.0500.0-5 60.0560.0-6 20.0620.0-6 80.0680.0-7 40.07 40.0-800.0800.0-860.0860.0-9 20.0
Superficie de Respuesta EstimadaX1=1.75
600 800 1000 1200 1400 1600 1800
X2
6569
7377
8185
X3280
380
480
580
680
780
Alt
ura
Altura
260.0-320.0320.0-380.0380.0-440.0440.0-500.0500.0-560.0560.0-620.0620.0-680.0680.0-740.0740.0-800.0800.0-860.0860.0-920.0
Superficie respuesta estimada en el espacio de factores principales
224
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
La temperatura alta (≈ 80 - 90 ºC) influye negativamente en la formación y crecimiento de las columnas. Siendo su efecto, en valor absoluto, superior al de la densidad de corriente alta y menor al del tiempo de exposición al electrolito.
El tiempo de exposición y la densidad de corriente, considerados en conjunto, favorecen mucho la formación de columnas. Su efecto, en conjunto, es del orden del de el tiempo considerado sólo y mucho mayor que el de la densidad de corriente, también, considerada sola.
Ejemplo 6.66Los recubrimientos compuestos de Ni-D fueron electrodepositados desde una suspensión de nanopartículas de diamante (tamaño promedio 4 nm-sintetizado por PlasmaChem) en una solución típica Watts. Las nanopartículas se dispersaron en la solución mediante agitación magnética durante 24 horas y 5 minutos en el ultrasonido antes de la electrodeposición. Los recubrimientos de Ni y Ni-D fueron aplicados sobre un sustrato de acero AISI 1016 el cual se limpió y decapó según las normas ASTM B183 e ISO 9226. La electrodeposición se realizó empleando un electrodo de disco rotatorio acoplado a un potenciostato-galvanostato y la temperatura de la solución se controló empleando un baño termostatizado con recirculación. Una malla de platino con suficiente área efectiva se empleo como ánodo inerte y un electrodo de calomel saturado fue usado como electrodo de referencia. Siguiendo un diseño experimental factorial 2n completamente aleatorizado con replica, se depositaron los recubrimientos compuestos de Ni-D variando la densidad de corriente, la agitación del baño y la concentración de nanopartículas de Diamante en los niveles que se presentan en la tabla.
FactoresNiveles
- 0 +X1: DC (A/cm²)X2: Agitación (rpm)X3: Concentración (g/L)
240010
3,565015
5900
20
Prueba X1 X2 X3Espesor película
(µm)123
252
400400900
101010
144015
225
Palacios C. Severo
45678
52525
900400400900900
1020202020
40143915
39,5
1Los recubrimientos compuestos de Ni-D presentan mejor resistencia a la corrosión que los recubrimientos de Níquel puro, cuando son obtenidos a altas velocidades de rotación del electrodo y alta concentración de partículas en el baño.
Efectos estimados para PelículaEfectos Interacciones
A: X1 = 25,125B: X2 = 0,625C: X3 = -0,375
AB = -0,375AC = -0,375BC = 0,125
Errores estándar con 1 GL
Tabla 4.12 Análisis de varianzaFuente SC G
LCM Fo Ft(99%)
A: X1
B: X2 C: X3 ABACBCError
1262,530,781250,2812
50,2812
50,2812
50,0312
50,0312
5
1111111
1262,530,781250,281250,281250,251250,031250,03125
40401,025,09,09,09,01,0
>><<<<
12,2512,2512,2512,2512,2512,25
Total 1264,22 7 R² = 99,9975%
323121321 00005,0025,00005,00175,000225,0075,94625,4 XXXXXXXXXPelicula +−−+++−=Valor óptimo = 40.0625
Factor Bajo Alto ÓptimoX1
X2 X3
2,0400,010,0
5,0900,020,0
5,0900,010,0
226
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
2X2
900 20
Gráfica de Efectos Principales para Pelicula
14
19
24
29
34
39
44
Pel
icu
la
X15 400
X310 2
-+
2 5
-
-
+
-+
Gráfica de Interacción para Pelicula
14
19
24
29
34
39
44
Pel
icu
la
AB5
-+
AC
+
BC400 900
-+
Efectos e interacciones significativas de factores principales
Contornos de la Superficie de Respuesta Estimada
X3=15.0
2 2.5 3 3.5 4 4.5 5
X1
400
500
600
700
800
900
X2
Pelicula
14.0-17.017.0-20.020.0-23.023.0-26.026.0-29.029.0-32.032.0-35.035.0-38.038.0-41.041.0-44.044.0-47.0
Superficie de Respuesta EstimadaX3=15.0
2 2.5 3 3.5 4 4.5 5
X1
400500
6007 00
800900
X214
19
24
29
34
39
44
Pelic
ula
P elicula14.0-17 .0
17.0-20.020.0-23.023.0-26.0
26.0-29.029.0-32.032.0-35.0
35.0-38.038.0-41 .041.0-44.0
44.0-47 .0
Superficie respuesta estimada en el plano y espacio de factores principales
2La presencia de las nanopartículas en los recubrimientos de Níquel, mejora su microdureza hasta en un 243,3%. 34La incorporación de nanopartículas de Diamante en la matriz de Níquel, tiene un efecto positivo sobre el proceso de electrodeposición, haciéndolo más eficiente. 56El transporte de masa influye durante el proceso de electrodeposición de los recubrimientos compuestos Ni-D. 78Las nanopartículas de Diamante cambian la morfología de los recubrimientos de Níquel, haciéndolos más compactos.
Ejemplo 6.67El licor residual de la tecnología ácida de níquel y cobalto ocupa un lugar cimero entre los efluentes líquidos que poseen un mayor potencial de impacto ambiental en éste proceso debido a su alta acidez y a la presencia de varios metales disueltos (Cr, Mn, Al, Zn, Fe, Ni, Co).
227
Palacios C. Severo
En el ámbito mundial uno de los aspectos principales a tener en cuenta al diseñar los procesos de recuperación de níquel y cobalto usando la lixiviación ácida a presión de minerales oxidados de níquel está relacionado precisamente con el tratamiento a realizar al licor residual que se genera.
Para realizar el estudio se utilizó una muestra compósito representativa del licor residual de la tecnología ácida de níquel y cobalto, con un contenido promedio de 8,2 g/L de H2SO4, 4,3 g/L de aluminio y 0,62 g/L de cromo.
Como reactivo neutralizante se usó una muestra compósito representativa de los sólidos residuales industriales del proceso carbonato amoniacal, o sea, una muestra de la suspensión saliente de los alambiques de destilación de amoniaco que se envía al depósito de colas. En la tabla1 se muestra la composición química de dicha muestra. En ella se observa que el contenido de magnesio en dicha muestra fue 4,11%, siendo éste el elemento neutralizante principal.
En el estudio experimental se analizó la influencia de varias variables en el proceso: la temperatura; la relación Mg/ácido, expresada en gramos de magnesio contenidos en los sólidos residuales industriales con respecto a los gramos de ácido libre en el licor residual; la inyección de un agente oxidante, oxígeno del aire y la agitación.
Las principales respuestas que se analizan en el diseño son la neutralización del ácido libre (H2SO4) y la precipitación del aluminio y el cromo del licor residual.
En el diseño de la matriz experimental se usó el método factorial completo (2n). En la tabla se muestran las variables y los niveles usados.
FactoresNiveles
- 0 +X1: Temperatura (°C)X2: Relación Mg/ácido (g/g)X3: Agitación (Re)X4: Inyección aire (L/min)
701
80005
751,5
10000
7,5
802
1200010
La selección de la temperatura en el nivel medio de 75 °C estuvo basada en pruebas preliminares realizadas. La relación magnesio/ácido fue establecida en el nivel básico en 1,5 gramos de
228
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
magnesio contenidos en los sólidos residuales por gramos de ácido libre contenidos en el licor residual. Dicho valor se determinó sobre la base de cálculos estequiométricos con relación al ácido libre contenido en el licor residual y del ácido que se genera durante la hidrólisis del aluminio y el cromo. El nivel mínimo de este parámetro se fijó en 1 g/g y el nivel máximo en2 g/g, para un intervalo de precisión de 33,33%.
La intensidad de agitación fue determinada mediante el número de Reynolds, tomándose como nivel básico un valor de 10000 entre los regímenes transitorio y turbulento, con un grado de precisión de 20%, lo que corresponde a un Re de 8000 en el nivel mínimo y de 12000 en el nivel máximo. La inyección de aire se realizó para valorar su influencia en la disminución del contenido de hierro en el licor neutralizado.
Se utilizó un reactor de 2 litros de capacidad de dimensiones estándar con un coeficiente de llenado del 85%, para un volumen útil de trabajo de 1,7 litros. En la tabla se muestra la matriz experimental descodificada.
PruebaTemp
(°)
Relación(Mg/ácido
)
Agitación
(Re)
Aire(L/min)
Al(g/L)
Cr(g/L) pH
12345678910111213141516
70807080708070807080708070807080
1122112211221122
800080008000800012000120001200012000800080008000800012000120001200012000
55555555
1010101010101010
3,664,302,590,782,570,230,202,642,270,850,201,042,640,972,092,14
0,120,620,310,140,320,060,060,320,320,140,061,040,310,150,310,33
3,661,203,353,603,333,773,853,333,383,603,803,573,233,593,383,52
Para realizar los experimentos se midió el volumen de licor residual y se adicionó al reactor, secalentó la solución hasta alcanzar la temperatura de trabajo, se puso en funcionamiento el agitador y el compresor de aire, se adicionó la suspensión de sólidos residuales y se
229
Palacios C. Severo
puso en marcha el cronómetro inmediatamente. Finalmente se tomaron las muestras para los análisis químicos.Se observa el incremento que tiene lugar en el pH del licor residual y la disminución que se produce en el contenido de aluminio y cromo en el licor. El pH aumenta de 1,2 a 3,47 y la concentración de aluminio y cromo disminuyen de 4,3 y 0,62 g/L a 1,5 y 0,21 g/L respectivamente como promedio general de todo el diseño.
La concentración promedio de Ni y Co en el licor obtenido en el diseño es de 0,2 y 0,078 g/L respectivamente, produciéndose un incremento notable en el contenido de estos elementos en el licor tratado, de modo que el licor que se obtiene constituye una fuente potencial para recuperar éstos metales de alto valor en el mercado.
En la tabla se muestra el porcentaje de disminución del ácido libre del licor residual y de precipitación del aluminio y el cromo. También se muestra la disolución que tiene lugar de metales de los sólidos residuales durante la neutralización.
Prueba
Ácido libre (%)
Precipitación Al y Cr (%)
Disolución de metales(%)
H2SO4 Al Cr Ni Co Fe Mg Mn12345678910111213141516
99,499,799,599,199,099,799,498,799,199,499,599,099,099,599,698,8
37,592,969,933,622,893,165,922,938,863,378,825,024,272,492,136,9
35,385,566,636,736,785,864,738,539,762,171,136,939,767,885,141,8
43,025,218,127,422,421,316,522,628,016,219,420,720,417,620,526,2
43,640,434,145,840,134,932,840,846,533,638,339,440,133,635,844,3
4,32,61,73,72,42,81,52,33,81,52,22,22,21,72,63,3
27,124,621,031,532,222,521,527,633,320,422,830,428,920,722,033,9
49,534,223,849,433,724,320,729,447,124,629,530,931,822,825,641,9
En la tabla se muestran los valores obtenidos de R2, el error estándar y las pruebas estadísticas Durvin Watson.
Estadigráfo Ni Co Fe Mg Al Cr H2SO4
R²Error estándarDarwin-Watson
98,772,791,65
99,860,641,48
99,510,232,20
99,631,141,83
99,962,072,10
99,664,431,60
97,960,281,76
230
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Los valores de R2, indicativos de la proporción de la varianza de las variables de salida (Y) con respecto a las variables de entrada (X), son altos en todos los casos, lo que denota un buen porcentaje de adaptación de los datos experimentales a los modelos lineales.Los resultados de la prueba estadística Durvin – Watson indican que no existe correlación significativa entre los diferentes efectos escogidos como independientes, ya que los valores obtenidos en este estadígrafo son mayores que el valor mínimo de 1,4 que se utiliza como patrón comparativo.
A continuación se presentan los modelos estadísticos de las variables de salida. Los mismos presentan un nivel de confiabilidad o significación estadística del 95% y se excluyen las variables e interacciones que no tienen una influencia estadísticamente significativa.
Modelos estadísticos de la precipitación del aluminio y el cromo del licor residual
TemplAl 18,17Re35,4838,54% ++=
))((Re07,852,8Re41,3586,55% TemplTemplaciónCr +++=
y de la neutralización del ácido libre:
lAc Re462,028,99% +=
Modelos estadísticos de la disolución de magnesio, níquel, cobalto, hierro y manganeso del licor residual:
)(Re)(23,284,1Re70,827,26% TempTemplMg ++−=
lTempNi Re98,607,784,22% −+=
))((52,156,139,4Re13,702,39% AireTempAireTemplCo +++−=
))(Re(27,0Re96,025,156,2% lTemplTempFe −−+=
))((05,545,10Re5,1345,32% relTempTemplMn −+−=
Donde:Temp = Temperatura
231
Palacios C. Severo
Rel = RelaciónRe = Reynolds
En las ecuaciones anteriores se observa que la relación magnesio/ácido y la temperatura son las variables que ejercen una mayor influencia en el proceso. El aumento de la relación magnesio/ácido favorece la neutralización del ácido libre y la precipitación del aluminio y el cromo que están disueltos en el licor residual e influye de forma negativa en la disolución de Mg, Ni, Co, Fe y Mn de los sólidos residuales industriales.
El aumento de la temperatura favorece la precipitación del aluminio y el cromo del licor residual así como la disolución del Mg, Ni, Co, Fe y Mn de los sólidos residuales industriales.
Existe una alta correlación entre las variables de entrada (temperatura, relación magnesio/ácido, agitación y aire) y las respuestas de salida, siendo el valor de R2 superior al 98%.
Las variables que ejercen una mayor influencia sobre las respuestas analizadas son la relación magnesio/ácido y la temperatura. No obstante la inyección de oxígeno del aire y el Reynolds ejercen también una influencia significativa sobre algunas variables.
El orden de influencia de las variables analizadas es en orden decreciente la relación magnesio/ácido, la temperatura, la inyección de aire y la agitación.
A los 15 minutos de reacción, a la temperatura de 80 °C, relación magnesio/ácido de 2 g/g, agitación, Re: 12000 y un flujo de aire de 10 L/min., se neutraliza el 99,6% del ácido y precipita el 92,94% del aluminio y el 85,54% del cromo.
Se recomienda completar la neutralización del licor residual con carbonato e hidróxido de calcio y recuperar el níquel y el cobalto a partir del licor neutralizado con los sólidos residuales.
232
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Problemas
(205) En un estudio del rendimiento para el desarrollo de un proceso se consideraron cuatro factores, cada uno a dos niveles: tiempo (A): 2,5 a 3, concentración (B): 14 a 18, presión (C): 60 a 80, y temperatura (D): 225 a 250. Se corrieron dos replicas de un diseño 24, y los datos resultantes se muestran en la siguiente tabla:
A B C D Replica I Replica II-+-+-+-+-+-+-+-+
--++--++--++--++
----++++----++++
--------++++++++
12181313171520151025132419211723
14161517181419171322162521232226
Que factores y que interacciones influyen en el rendimiento.Elabore gráficas e interprete los efectos de los factores principales y las interacciones
(206) Un equipo realizó un estudio del rendimiento de un proceso para establecer los parámetros óptimos de operación. El equipo decidió considerar tres factores, cada uno a dos niveles. Se corrieron dos réplicas y decidieron utilizar un diseño 23.A = Tiempo (2 h, 4 h)B = Concentración (10%, 20%).C = Presión (55 psi, 85 psi)
RendimientoA B C I II-+-
--+
---
121813
141615
233
Palacios C. Severo
+-+-+
+--++
-++++
1617152015
1718141917
Que factores y que interacciones influyen en el rendimiento.Elabore gráficas e interprete los efectos de los factores principales y las interacciones
(207) Un investigador químico desea determinar las condiciones experimentales óptimas para la determinación colorimétrica de Mn en un mineral. Tres de los factores más importantes que pueden afectar esta determinación son: la cantidad de oxidante añadido, la temperatura de calentamiento y la longitud de onda seleccionada para medir la absorbancia de la muestra. Realiza un experimento factorial 23 con diferentes niveles de los factores de interés, obteniendo 8 determinaciones replicadas para todas las posibles combinaciones estudiadas. A continuación se muestran las condiciones del diseño y los resultados obtenidos:
Vox λ T Mn (%)-+-+-+-+
--++--++
----++++
0,450,870,66
0,88
0,24
0,63
0,550,73
0,46
0,89
0,66
0,90
0,22
0,65
0,550,73
0,44
0,89
0,68
0,910,25
0,610,510,71
Qué factores influyen significativamente de manera independiente en el rendimiento de la reacciónQué interacciones entre factores son estadísticamente importantes y cómo son estasCuáles son las condiciones experimentales óptimas
(208) Se realiza un experimento factorial 24 en una planta piloto para estudiar los efectos que se supone influyen sobre la rapidez de filtración de un producto. Se estudia el efecto de 4 factores, temperatura, presión, concentración de reactivo y rapidez de mezclado. Los resultados del diseño se muestran a continuación:
Factores FiltraciónA B C D
- - - - 45
234
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
+-+-+-+-+-+-+-+
-++--++--++--++
---++++----++++
-------++++++++
7148656860806543
10045
10475867096
Plantee la ecuación de regresión teniendo en cuenta los resultados de la tabla de ANOVA y el error de cada coeficiente.Actúan de manera independiente los factores estudiados. Interprete el gráfico de efectos principales y el de las interacciones.Halle el valor óptimo de rapidez de filtración junto a su intervalo de confianza.Se puede simplificar este diseño 24 a un diseño experimental 23
Si su respuesta es positiva, realice partiendo de éste un diseño de experimentos 23.
(209) Se aplicó un diseño factorial 24 para estudiar un proceso de corrosión selectiva con nitruro en un plasma corrosivo. En el proceso se utilizó C2F6 como gas reactivo y se tomaron como factores de interés el espacio entre ánodo y cátodo (A), la presión en la cámara del reactor (B), gasto de C2F6 (C) e intensidad de la corriente aplicada al cátodo (D). La variable de respuesta de interés es la rapidez de corrosión del nitruro de silicio. Los resultados obtenidos son los siguientes:
Factores Rapidez de
A B C D Corrosión-+-+-+-+-+-+
--++--++--++
----++++----
--------++++
5506696046506336426016351037749
1052868
235
Palacios C. Severo
-+-+
--++
++++
++++
10758601063729
Estime los efectos de los diferentes factores sobre la rapidez de corrosión.Realice el ANAVA y determine los factores importantes para el rendimientoEscriba la ecuación de la regresión, teniendo en cuenta los intervalos de confianza correspondientes.Determine las condiciones experimentales óptimas que permiten obtener la mayor rapidez de corrosión.Si no todos los factores son importantes, realice un nuevo diseño 2k con k<4 y realice el análisis de varianza. Rescriba la ecuación de regresión.
(210) Se determinó el contenido de níquel en un mineral mediante la técnica de valoración complejométrica por dos vías diferentes: directa y retroceso. Los resultados obtenidos en % en masa son:
A B Ni (%)-+-+-+-+
--++--++
1,0110,9860,9920,9820,9900,9880,9970,994
0,9950,9980,9890,9950,9960,9990,9980,996
(211) Un fabricante de aleaciones de aluminio produce refinadores de textura en forma de lingotes. La compañía manufactura el producto en 4 hornos. Se sabe que cada horno tiene sus propias características de operación, de modo que los hornos se considerarán una variable problemática en cualquier corrida experimental en la fundición que implique más de un horno. Los ingenieros del proceso sospechan que la velocidad de agitación influye en el tamaño del grano del producto. Cada horno puede operarse a 4 velocidades de agitación distintas. Se realiza un diseño de bloques aleatorizados para un refinado en particular bloqueando la variable horno; los datos del tamaño de grano resultantes son los siguientes:
Velocidad de HornoAgitación
(rpm)1 2 3 4
5101520
8141417
4569
5693
6926
236
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Analice la tabla de ANOVADiga si las sospechas del ingeniero son ciertas. Explique.Explique si fue conveniente bloquear el efecto de los diferentes hornos.Realice un análisis de los residuos
IX. DISEÑO FACTORIAL 2k REPLICADO
En una variedad del diseño factorial en donde el vector respuesta se repite o replica dos, tres, cuatro, veces.
El efecto se calcula multiplicando por el número de replicas. La suma de cuadrados se procede similarmente a los efectos.
Ejemplo 6.68Se lleva a cabo una investigación para estudiar los efectos que tienen la concentración y un catalizador sobre la reacción de un proceso.
Factores NivelesA = ConcentraciónB = Catalizador
151
202
Tabla 6.57 Datos para el diseño 22 replicadoPrueba A B Y1 Y2 Y3 Yt
1234
15201520
1122
31302918
19233632
32282527
82819077
( ) [ ] ( )[ ][ ] 33,28290817723/112*/1 1 −=−−+=−−+= − baabnAEfecto k
( )[ ][ ] 66,08281907723/1 =−−+=BEfecto
237
Palacios C. Severo
( )[ ][ ] 0,29082827723/1 −=−−+=ABnInteracció
El efecto A (concentración) es negativo, sugiere que al elevar la cantidad de A, el proceso reducirá su rendimiento. El efecto B (catalizador) es positivo, sugiere que al elevar B del nivel inferior al nivel superior, incrementará el rendimiento. El efecto de la interacción es negativo.
Vamos a emplear el análisis de varianza para confirmar esta interpretación. Para el presente diseño existe un método especial para realizar los cálculos del ANAVA.
( ) [ ] [ ][ ] ( )[ ] 33,1643/33,22*/112*/1 222 =−=−−+= EfectoAnóbaabnSC kk
A
( ) [ ] [ ][ ] 33,12*/112*/1 22 =−−+= EfectoBnóababnSC kk
B
( ) [ ] [ ][ ] 0,122*/112*/1 22 =−−+= nABInteracciónóbaabnSC kk
AB
La suma total de cuadrados se determina de la misma manera que los diseños aleatorizados.
( ) ( )k
iitotal nYYSC 2*/22∑ ∑−=
( ) ( ) ( ) 3234*3/3302732...1931 22222 =−++++=totalSC
La suma de cuadrados del error, se calcula similarmente a los diseños aleatorizados.
34,2931233,133,16323 =−−−=errorSC
El análisis de varianza se presenta en la tabla 6.58
Tabla 6.58 Análisis de varianzaFuente SC G
LCM Fo Ft(99)
A 16,33 1 16,33 0,485
< 11,3
B 1,33 1 1,33 0,039
< 11,3
AB 12,00 1 12,00 0,356
< 11,3
Error 293,34 8 33,67
238
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Total 323,00 11 R2 = 9,18%
Ambos efectos principales como la interacción no es significativa para un 99% de significancía, que nivel de significancía debe tener efectos e interacciones.
Sí notamos que los factores principales afectan el proceso, pero en el análisis no influye el efecto A. Para solucionar dicho fenómeno tan solo cambiamos los niveles de los factores que influyen, de la siguiente manera.
Factores NivelesA = ConcentraciónB = Catalizador
201
152
Tabla 6.59 Datos para el diseño 22 replicadoPrueba A B Y1 Y2 Y3 Yt
1234
20152015
1122
30311829
23193236
28322725
81827790
( ) [ ] 33,212*/1 1 =−−+= − baabnAEfecto k
( )[ ][ ] 66,08281907723/1 =−−+=BEfecto
( )[ ][ ] 0,27782908123/1 =−−+=ABnInteraccio
Ejemplo 6. 69Se lleva a cabo una investigación para estudiar los efectos que tienen la dosificación de reactivos químicos en un proceso
FactoresNiveles
- +A = Concentración XB = Concentración YC = Concentración Z
151
18
202
25
Tabla 6.60 Datos para el diseño 22 replicado
PruebaDiseño
Y1 Y2 Y3 YtA B C12345
1520152015
11221
1818181825
3130291819
1923363232
3228252731
8281907782
239
Palacios C. Severo
678
201520
122
252525
233630
252527
272918
759075
Tabla 6.61 Efecto e interaccionesEfectos Interacciones
A = -3,0B =+ 1,0C = -0,66
AB =-1,667AC =-0,66BC = 0,33Bloque = 0,416
Error estándar 1 GL
Tabla 6.62 Análisis de varianzaFuente SC G
LCM Fo Ft(95)
ABCABACBCBloqueError
54,006,0002,66616,662,6660,6660,583
546,083
111111215
54,006,0002,66616,662,6660,6660,29236,40
6
1,480,190,070,460,070,020,01
<<<<<<<
4,544,544,544,544,544,543,68
Total 629,33 23 R2 = 13,22%
Todos los efectos principales como la interacción no es significativa para un 95% de significancía, así mismo el bloque de las replicas no tiene significancía.
Problemas
(212) En un experimento dirigido a estudiar un sistema particular de filtración para carbón mineral, se agregó un coagulante a una solución en un tanque que contenía carbón y lodo, lo cual fue entonces colocado en un sistema de recirculación con objeto de lavar el carbón. Se variaron tres factores en el proceso experimentalA: Porcentaje de sólidos que circula inicialmente B: Ritmo de flujo del polímero C: pH del tanqueLa cantidad de sólidos en el flujo de entrada del sistema de purificación determina cuan limpio queda el carbón. Se utilizaron dos niveles de cada factor y se corrieron dos pruebas
240
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
experimentales para cada una de las 8 combinaciones (n=2). Los porcentajes de sólidos en peso obtenidas son
Vector respuestaA B C Replica I Replica II-+-+-+-+
--++--++
----++++
4,6521,4212,6618,279,7313,186,51
18,23
5,8121,3512,5616,627,8812,876,2617,83
Suponga que todas las interacciones son potencialmente importantes y realice un análisis completo de los datos. Utilice un nivel de significación de 0.01
(213) Los siguientes datos se obtuvieron de un experimento 23 con tres réplicas (n=3)
Vector respuestaA B C Replica I Replica II Replica III-+-+-+-+
--++--++
----++++
1215242317162428
1920161725192325
1016172721192920
Evalué todos los efectos factoriales. Utilice un nivel de significación de 0.05
(214) Se llevó a cabo un experimento para determinar si existe o no una diferencia significativa en la cantidad de aluminio alcanzada en el análisis entre cierto niveles de las siguiente variables de proceso.Tiempo de mezcla (T): 2 y 4 horasVelocidad de mezcla (V): 36 y 78 rpmCondición del Nitrógeno (C): seco y humedad relativa (72%) Estado físico del propulsor (E): no vulcanizado y vulcanizado
Estado
físico
Tiempo mezcla
Velocidad
mezcla
Condición delnitrógeno
Cantidadaluminio
--------
-+-+-+-+
++----++
++-++---
16,316,016,216,116,016,015,515,9
241
Palacios C. Severo
++++++++
-+-+-+-+
++----++
++-++---
16,7.16,116,315,815,915,915,615,8
Suponga que todas las interacciones de tres y cuatro factores son despreciables y analice los datos. Utilice un nivel de significación de 0.05
(215) Se lleva a cabo un experimento para determinar el crecimiento de plantas de poroto de acuerdo a tres factores: la profundidad de plantado de la semilla: 0,5 cm. y 1,5 cm., la frecuencia de riego: una y dos veces diarias y el tipo de poroto sembrado: pequeño y grande.Se hacen tres réplicas del experimento y se obtienen los siguientes datos.
Profundidad Replica I Replica II Replica III0,5 6 7 61,5 4 5 50,5 10 9 81,5 7 7 60,5 4 5 41,5 3 3 10,5 8 7 71,5 5 5 4
Calcule los efectos correspondientes a los factores y a las interacciones. Interprete los resultados obtenidos y sugiera condiciones ideales para sembrar.
(216) Un ingeniero esta interesado en el efecto de la velocidad de corte (A), la dureza del metal (B) y el ángulo de corte (C) sobre la duración de una herramienta de corte. Para ello se eligen dos niveles para cada factor y se corren dos réplicas del diseño factorial 23. La tabla siguiente presenta los datos de tiempo de duración (en horas) de la herramienta.
Combinación de tratamientos
RéplicaI II
(1) 221 311a 325 435b 354 348
ab 552 472c 440 453
ac 406 377bc 605 500
abc 392 419
Calcule los efectos correspondientes a cada uno de los factores.
242
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Determine cuáles de estos efectos son importantes usando la tabla de análisis de varianza.
X. DISEÑO 2k CON PRUEBAS CENTRALES
En un estudio factorial simple 2n estudiamos tan solo las combinaciones en el plano cartesiano y no vemos la influencia de los factores en la linealidad supuesta de dicho factor. Por lo que adicionamos pruebas centrales a dicho diseño para evaluar el error aleatorio a dicha muestra así mismo evaluar la curvatura de la función matemática.
Tal como se ve en la figura, el plano factorial 1-2 y 3-4 está cruzado por una línea de curvatura (Gauss).
243
Palacios C. Severo
1 2
3 4
5
3-4
1-2
5
Diseño Factorial 2n con pruebas centrales
El punto central 5, el cual sirve para evaluar el error aleatorio, también nos sirve para analizar la linealidad del modelo matemático. Por ejemplo, en el punto 5 de intersección si no existe curvatura, el modelo es lineal, pero si el análisis nos indica que existe curvatura en el modelo por lo que desechamos el análisis lineal y continuamos con un tratamiento cuadrático aumentando pruebas experimentales al diseño inicial (rotacional).
Existe un método para replicar ciertos puntos en un diseño factorial 2n
lo cual protegerá contra la curvatura además de permitir obtener estimaciones de errores independientes. Dicho método consiste en agregar pruebas centrales al diseño 2n, para lo cual se hacen n réplicas en el eje central. Un método importante para agregar las corridas de réplicas en el centro del diseño es que los puntos centrales no influyan en las estimaciones usuales de los efectos en un diseño 2n. Con una observación en cada uno de los puntos factoriales.
Sea YF el promedio de las cuatro corridas en los puntos factoriales y Sea YC el promedio de las corridas del punto central.
Si la diferencia CF YY − es pequeña, entonces los puntos centrales
se encuentran en el plano, y no hay curvatura. Si CF YY − es grande entonces existe curvatura. Una suma de cuadrados para la curvatura con un GL esta dado por:
( )CF
CFCFcurvatura nn
YYnnSC
−−
=
Donde nF y nc es el número de puntos de la factorial y el central respectivamente (esta cantidad puede comprobarse con el cuadrado medio del error para probar la curvatura).
∑ ∑∑ ∑+++= 2jjjjijiiio XAXXAXAAY
244
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Donde:
Ajj son efectos cuadráticos.
Sí los puntos factoriales del diseño no son replicados, es posible emplear los nc puntos centrales para construir una estimación del error con nc - 1 grados de libertad.
Ejemplo 6.70Se esta evaluando el rendimiento de un proceso. Existen dos variables de interés, concentración de sulfato de cobre y temperatura en el proceso de cabreado ácido. Se tiene duda acerca de la linealidad en la región que se explora, se decide realizar un diseño factorial 22 con una sola replica en cada punto factorial, incrementándose cinco puntos centrales.
70 8572,372,572,772,272,6
65 80
El cuadrático medio del error se calcula a partir de los puntos centrales:
( ) 1/1/2 −−=−= CiCerrorerror nYYnSCCM
[ ] 4 6,7 25/6,7 22,7 27,7 25,7 23,7 2 =++++=CY
( ) ( )[ ] 043,04/46,726,72...46,723,72 22 =−++−=errorCM
El promedio de los puntos comprendidos en los puntos factoriales es:
[ ] 754/85708065 =+++=FYLa diferencia entre el promedio del factorial y el promedio del central es 2,54 resulta dicho valor muy grande, lo cual nos indica que existe curvatura.
La suma de la curvatura de los cuadrados se calcula de la ecuación general.
245
Palacios C. Severo
( )( )( ) ( ) 8,5054/54,254 −=−=curvaturaSC
Tabla 6.63 Análisis de varianza del diseño con punto centralFuente SC G
LCM Fo Ft(99)
ABABCurvaturaError
225,0025,000,0050,80,17
11114
225,00
25,0050,80,000,04
5325,56
581,391270,0
00,00
>>><
21,221,221,221,2
Total 300,97 7
El análisis de varianza indica que ambos factores presentan efectos significativos y que no hay interacción AB = 0, existe evidencia de curvatura en la respuesta de la región explorada.
XI. DISEÑO CONFUNDIDO
Un diseño confundido es una técnica mediante el cual se confunden, deliberadamente, ciertos efectos sin importancia, con el propósito de fijar los efectos más importantes con mayor precisión. En el hecho, al calcular el valor de un efecto o interacción confundido estamos calculando la suma de los dos.
Las situaciones que requieren el uso del presente diseño:
a) Aquellos en los cuales no hay suficiente materia prima para efectuar una experimentación completa. En el diseño experimental se denomina bloque a una agrupación homogénea de experimentos.
b) Aquellas en los cuales la experimentación se realiza usando dos o más tipos de maquinas.
XII. DISEÑO FACTORIAL 2K CON DOS BLOQUES
Si deseamos correr una sola replica del diseño 2n. Requerimos una cantidad de materia prima y cada lote de materia prima deberá cubrir una prueba de las combinaciones de tratamiento.
Tabla 6.64 Diseño 24 con dos bloques, asignando las corridasBloque I Bloque II
(1)abac
===
716595
abc
===
656090
246
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
bcadbdcd
abcd
=====
8688688370
dabcbcdacdabd
=====
8596758560
Σ 626 Σ 636Σ 1262
Por lo tanto se requieren n lotes de materia prima. Si estos lotes se tratan como bloques, entonces debemos asignar la mitad de la n combinaciones de tratamiento a cada bloque no replicado. Los efectos e interacciones se calculan idénticamente a un diseño factorial simple no replicada.
Ejemplo 6.71Del ejemplo 6.67, el experimento factorial 24 deseamos tratarlo en bloques. Supongamos que no se pueden efectuar las 24 combinaciones en un mismo día. Decidiendo el experimentador realizar diariamente ocho combinaciones por bloque, por ser apropiado. Es lógico confundir la interacción de mayor orden ABCD con los bloques.
Tabla 6.65 Análisis de Varianza del BloqueFuente SC GL CM Fo Ft(99)
Bloque (ABCD)ABCDABACADBCBDCDError
6,2542,25
240,25600,25
2,2520,250,250,256,2572,25
812,25117,00
111111111114
6,2542,25240,2
5600,2
52,25
20,250,250,256,25
72,25812,25
0,211,148,21
20,520,080,690,010,01
0,0212,7427,77
<<>><<<<<<>
7,717,717,717,717,717,717,717,717,717,717,71
Total 1919,75
15
La suma de cuadrados del bloque
[ ] [ ] 25,616/12628/638626 222 =−+=bloqueSC
25,42=ASC 25,240=BSC 25,600=CSC 25,2=DSC
25,20=ABSC 25,0=ACSC 25,0=ADSC 25,6=BCSC
25,72=BDSC 25,812=CDSC
247
Palacios C. Severo
Las sumas de cuadrados de los efectos e interacciones se proceden a analizar por diferentes técnicas (ver algoritmo de Yates). Se ha decidido que las interacciones de tres factores son despreciables, por lo que la suma del error es:
BCDACDABDABCerror SCSCSCSCSC +++=
11725,225,7225,1225,30 =+++=errorSC
Como podemos visualizar el bloque ABCD no influye en el análisis de las combinaciones de los tratamientos, siendo B, C y CD los efectos e interacciones que presentan significación, tal como concluimos en el mismo ejemplo del diseño 24.
XIII. DISEÑO FACTORIAL 2k CON 4 BLOQUES
Este tipo de diseño es de mucha utilidad cuando se desarrolla experimentos a nivel laboratorio y bach, el número de factores es relativamente grande con k>4.
Ejemplo 6.72Consideremos un diseño factorial 25, a cada bloque debemos asignar ocho combinaciones de tratamiento correspondientes, requiriendo un total de cuatro bloques para las 32 pruebas a desarrollar para efectuar el experimento.
Tabla 6.66 Diseño 25 con 4 bloques, asignando las corridasBloque I Bloque II Bloque III Bloque IV
1adbc
abeacecdebdeabc
d
========
2,1522,00
42,3011,9911,9781,9442,2152,161
adbece
abcbcdabd
eacde
========
2,025
2,1702,03
72,2102,22
02,33
21,8571,919
bc
aede
abdacdabc
ebcd
e
========
2,1112,2672,03
32,07
22,1462,1142,02
51,89
8
eacbdcdabadebce
abcde
========
2,057
2,013
2,1642,30
12,04
12,05
72,23
61,944
Σ 16,746 Σ 16,770 Σ 16,666 Σ 16,813Σ 66,995
01197,0== ABCDEbloque SCSC 0999,0=errorSC 4898,0=totalSC
248
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Tabla 6.67 Análisis de Varianza del bloqueFuente SC GL CM Fo Ft(99)
Bloque (ABCD)ABCDEABACADAEBCBDBECDCEDEError
0,01190,11730,00410,01670,005
00,13110,000
50,002
60,000
70,00140,004
50,000
30,00770,02390,03520,02660,009
9
1111111111111111
15
0,01190,11730,00410,01670,005
00,13110,000
50,002
60,000
70,00140,004
50,000
30,00770,02390,03520,02660,0067
1,795517,5950,061
52,5050,75019,6650,0750,3900,10150,2100,6750,0451,1553,5855,2503,990
<><<<><<<<<<<<><
4,544,544,544,544,544,544,544,544,544,544,544,544,544,544,544,54
Total 0,4989 31
XIV. DISEÑO FACTORIAL 2k CON BLOQUES REPLICADOS
Es una variedad del diseño confundido en donde el vector respuesta se repite o replica dos, tres, …… veces.
Para entender mejor este tipo de diseño aplicaremos un ejemplo.
Ejemplo 6.73Se realiza un estudio para determinar los efectos que tienen tres variables A, B y C. Se efectúan sólo cuatro combinaciones de tratamiento. Por lo tanto, cada réplica del diseño 23 debe recopilarse en dos bloques. Se realiza las reproducciones confundidas ABC en la replica I y AB en la replica II.
Tabla 6.68 Diseño 23 con bloques replicadosReplica I Replica II
1abacbc
====
68,72
69,44
abc
ab
====
67,8569,6
067,75
1c
abab
====
68,66
68,1769,0
abacbc
====
68,22
69,1068,2
249
Palacios C. Severo
67,93
68,73
c 68,72 c 268,6
6
668,6
6
Σ 548,74 Σ 548,75
[ ] 0 1 2 5,02*/1 2" =−−−−+++= k
A B C nb ca ca ba b ccbaS C
[ ] 0 1 6 9,02*/1 2" =−−−−+++= k
A B nb cbaa cca ba b cS C[ ] [ ] 0001,016/49,10978/75,54874,548 222 =−+=replicaSC
005516,000456,00506,0"" =+=+= ABABCbloque SCSCSC
36655,4=totalSCTabla 6.69 ANAVA diseño 2k con bloques replicados
Fuente SC GL CM Fo Ft(99)ReplicaBloque (replica)ABCAB (replica)ACBCABC (replica)Error
0,00001
0,053160,10402,536
0,86950,02690,20470,06500,01250,5027
1211111115
0,00001
0,02758
0,10402,536
0,86950,02690,20470,06500,01250,1005
9,94E<4
0,27431,0344
25,22388,64830,13812,03600,64650,1243
<<<>><<<<
7,716,947,717,717,717,717,717,717,71
Total 4,3665 15
Los efectos principales B y C son significativos, vemos que la replica y los bloques no afectan el proceso.
XV. ALGORITMO DE YATES
250
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Un método rápido para calcular los efectos e interacciones y que proporciona seguridad en el análisis de varianza posterior, de un diseño factorial.
Construcción de Yates: La primera mitad de la columna se forma sumando el vector respuestas por pares. La segunda mitad de la columna se forma restando el vector respuestas por pares (el segundo menos el primero) y así sucesivamente.
Las demás columnas se generan de la misma manera usando los datos de la columna anterior.
Los efectos se calculan dividiendo la última columna por 2n-1, donde n es el número de factores.
La suma de cuadrados se calcula, elevando al cuadrado los miembros de la última columna y dividiendo por 2n.
Si en caso se realizan replicas en el proceso, entonces el calculo de los efectos deberá dividirse por k*2n-1, donde k es el número de replicas. De igual manera para el calculo de la suma de cuadrados multiplicar por k*2n.
Ejemplo 6.74Los datos de la tabla 6.70, analizarlo aplicando la técnica de Yates.
Comprobacióna. La suma total de la vector respuesta deberá ser igual al primer valor de la última columna, caso contrario se ha ejecutado un mal cálculo.b. La suma total de la suma de cuadrados debe ser igual a la suma de cuadrados del total, de la siguiente manera.
Tabla 6.70 Algoritmo de YatesY I II III Efecto
sSC
1ab
abc
acbc
abc
68,7267,8569,6069,4467,7567,9368,7368,72
136,57139,0
4135,6
8137,45-0,87-0,160,18
275,61
273,13
-1,030,172,471,770,71
548,74
-0,864,240,52-2,481,20
-0,70-0,90
--0,2151,0600,130
-0,6200,300-0,175-0,225
-0,092
42,24720,033
80,768
80,180
251
Palacios C. Severo
-0,01 -0,19 00,06120,1012
548,74
3,4847
( ) n
iitotal YYSC 2/22∑ −=
Tabla 6.71 Yates modificadosY A B AB C AC BC ABC
68,7267,8569,6069,4467,7567,9368,7368,72
-+-+-+-+
--++--++
+--++--+
----++++
+-+--+-+
++----++
-++-+--+
Σ + 273,9
276,5
274,6
273,1 274,9
274,0
273,4
Σ - 274,9
272,2
274,1 275,6
273,8
274,7 274,8
Diferencia
-0,86
4,24 0,53 -2,48
1,2 -0,7 -0,9
Efectos -0,22
1,06 0,13 -0,62
0,3 -0,18 -0,23
( ) 4847,34485,3763993,376422/22 =−=∑ −= n
iitotal YYSC
Problemas
(217) Se estudia la recuperación del cromo, níquel e hierro de los desechos de acero inoxidable. La disolución de dicho acero se realiza electrolíticamente, siendo las variables pH y temperatura, de acuerdo a los estudios termodinámicos el
252
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
potencial de la aleaciones Ea = 2,897. Elabore el ANAVA y analice los efectos e interacciones del proceso.pH: 8,88 8,43 7,01 6,92T: 23,9 28,3 24,3 27,5Ed: 2,16 2,08 2,22 2,19
(218) Un relave con alto contenido de plata 300 g/ton, es tratado por flotación y cianuración siendo ambos procesos antieconómicos.Se procede a realizar un estudio de lixiviación en medio clorurante oxidante, siendo sus variables A: cloruro de sodio 50 - 150 g/l, B: Tiempo 5 - 10 h, C: Ácido sulfúrico 5 – 0 g/l.Y: 89 87 84 79 86 88 83 82Elabore el diseño y analice.
(219) En un laboratorio de investigación se produce un derivado químico, el investigador tiene interés en los efectos de los factores A: H2SO4 87 - 93 %, B: Tiempo 15 - 30 min, C: catalizador 35 - 45 min, D: Temperatura 60 - 80 °C.
(220) Un investigador en Bacteriología esta interesado en el efecto que tienen dos diferentes medios de cultivo y dos lapsos sobre el crecimiento de un virus en particular. Realiza un diseño factorial 22 en orden aleatorio. Analice los datos que se muestran. A: 21 - 37, B: 26 - 34.
(221) Se manufacturan circuitos integrados. El proceso básico de procedimiento consiste en depositar una capa epitaxial en el tablero de silicio pulido. Los tableros se colocan dentro de una campana en el cual se introduce vapores químicos. El receptor se hace girar y se aplica calor hasta que la capa epitaxial sea la adecuada. Se realizó un experimento empleando dos factores, A: Gasto de arsénico 55 - 59, B: Tiempo de depósito 1 - 2. Se corrieron cuatro replicas, y se midió el grosor de la capa epitaxialReplica 1: 14,1 13,8 14,8 14,2Replica 2: 16,1 13,8 14,7 14,9Replica 3: 13,9 14,0 14,8 14,4Replica 4: 13,9 13,2 14,8 14,9
(222) Se utiliza una aleación ligera de aluminio-titanio para la fabricación de componentes aeroespaciales. Se realizo un estudio sobre agrietamiento a fin de determinar el efecto de cuatro factores sobre las grietas. Los factores son A: Temperatura, B: Contenido de titanio, C: Tratamiento térmico,
253
Palacios C. Severo
D: Contenido de aluminio. Se hicieron dos replicas de un diseño 24, se mide la longitud de grieta en mm.
Replica I Replica II1,71,41,31,61,21,21,41,22,01,81,71,41,81,31,41,3
1,91,41,51,51,31,21,41,22,11,81,91,51,91,21,21,3
Estime los efectos de los factores. Realice un ANAVA.Existe algún indicio de que algún factor influya en la variabilidad de agrietamiento.
(223) Se realizó un experimento en una prensa de dispositivos para microcomputadoras. Se estudian 5 factores, cada Uno a dos niveles los factores son A: Tiempo, B: Revelado C: Dimensión D: Corrosión, E: Material.
1ab
abc
acbc
abc
========
810325018214461
dadbd
abdcd
acdbcd
abcd
========
610305315224565
eaebe
abece
acebce
abce
========
812355215204563
deadebde
abdecde
acdebcde
abcde
========
79
345516204060
Realice un ANAVAInterprete las interacciones significativasDesarrolle un diseño 25 y un diseño con bloques.
(224) En un estudio del rendimiento de un proceso se consideran 4 factores, cada uno a dos niveles, A: Tiempo 2,5 - 3, B: Concentración 16 - 18, C: Presión 70 - 90, D: Temperatura 250 - 200.Se corre una sola replica de un diseño 24.Y: 12, 18, 13, 16, 17, 15, 20, 15, 10, 25, 13, 24, 19, 21, 17, 23Realice un ANAVAPruebe realizar un diseño por bloques e interprete.
(225) Se elabora galletas, y se desea saber si las variables tienen influencia en el proceso siendo A: Material vidrio-aluminio, B:
254
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Homogenizado pala-batidor, C: Harina popular-extra. El vector respuesta es lo crocante. Analice los datos de las replicas.
Replica 1 11 15 19 16 10 12 10 15Replica 2 9 10 12 17 11 13 12 12Replica 3 10 16 11 15 15 14 13 12Replica 4 10 19 11 12 18 13 10 13
(226) Se desea realizar una investigación con el fin de estudiar la influencia de tres factores en la vida media de un pesticida químico aplicado en el suelo. La unidad experimental lo constituirán recipientes que contienen el suelo sobre el cual se aplica el pesticida. Los niveles de los factores a estudiar son los siguientes:
FactoresNiveles- +
A: Temperatura (°C)B: Humedad (%)C: Suelo (%)
25151
35353
Se desarrollan replicas con la finalidad de evaluar la vida media del proceso, siendo los resultados experimentales:
Y1: 886, 188, 230, 130, 168, 65, 156, 32Y2: 850, 190, 235, 127, 170, 60, 160, 30
¿Cual de las variables independientes influyen en el proceso?¿Cuantas pruebas realizará para desarrollar el proceso?¿Que temperatura, humedad y tipo de suelo el pesticida no es nocivo?
(227) Se desea controlar la emisión gaseosa de SO2 de una planta por medio de inyección de sosa calcinada en la parte superior del emisor. Dicho método funciona en el laboratorio, pero cuando se implemento a nivel industrial, se formo ocasionalmente NO2, provocando un gas tóxico. Con el fin de investigar las condiciones bajo las cuales se produce, se diseño un experimento factorial considerando los siguientes factores a tres niveles:
FactoresNiveles
- +A: Concentración de SO2 (ppm)B: Temperatura (°C)C: Concentración de O2 (%)D: Humedad (%)
0150
00
3000350
620
Se realiza el experimento con la finalidad de controlar la emisión de NO2, siendo los resultados experimentales:
130 150 210 200 110 180 110 150 130 150 250 140 140 220 150 170
Además se desarrollaron pruebas centrales, siendo estos:470 740 830 730
255
Palacios C. Severo
¿Se desea eliminar la presencia de NO2, por lo que se quiere saber que factores deben controlarse?
(228) Se desea investigar la influencia de cuatro factores en la vida media del problema 226. Se desea efectuar dos bloques con la finalidad de mezclar los efectos.Se desea verificar los factores de mayor influencia en la vida media del proceso.A que temperatura, humedad y que tipo de suelo el pesticida no es nocivo.
(229) En un laboratorio de corrosión se desea evaluar la eficiencia de un inhibidor para disminuir la corrosión de una tubería de hierro, utilizada para el transporte de agua en la industria petrolera. Una de las variables de mayor importancia fue la temperatura promedio del agua que se usa como refrigerante y la otra la concentración del inhibidor. Los niveles de ambos factores son:
FactoresNiveles
- +A: TemperaturaB: Inhibidor
6010
9015
Las respuestas obtenidas en diversas probetas de hierro fue la disminución del espesor a cierto tiempo de inmersión durante un tiempo constante para todas las probetas.
40,2 54,7 29,6 28,8Desarrollando pruebas centrales con la finalidad de evaluar la varianza del error: 38,6 37,8 37,1 39,0¿Mediante un diseño factorial aplique el mínimo ascenso para averiguar en que zona debemos realizar pruebas adicionales para minimizar la corrosión de la tubería de hierro?
(230) Se desea minimizar la vida media del problema 226, por el cual se corrieron pruebas adicionales con la finalidad de optimizar dicho proceso, siendo su vector respuesta:
462 298 424 343 247 479 219 313 256 402 491 292 250 484Así mismo se corrieron pruebas centrales siendo estas:
348 340 337¿Se desea conocer el modelo y su forma geométrica?¿Cuales son los niveles óptimos de las variables que eliminan la permanencia del pesticida?
(231) Se desea maximizar la resistencia de un acero que depende de dos aleantes Mo y W.
FactoresNiveles
- +A: Mo (%) 0.2 0.8
256
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
B: W (%) 1.5 3.5
Un investigador decide experimentar pruebas secuenciales, para lo cual desarrolla las siguientes aleaciones:Suponiendo que la resistencia del acero es una función establecida por:
( )[ ] ( )²25,4²²15,0151000 MoMoWR −−+−−=Se desea saber:Cual es la combinación óptima del aleante para alcanzar la máxima resistenciaEn cuantas pruebas se puede llegar al máximo
(232) La eficiencia de un fertilizante depende de sus componentes minerales del suelo que se va a utilizar. Un estudioso decide preparar diversos tipos de suelos y aplicar el fertilizante a una variedad vegetal y la respuesta esta medida en función del rendimiento del fertilizante. El contenido de los minerales varia en los siguientes rangos:
FactoresNiveles
- +A: Fósforo (%)B: Fertilizante (%)C: Nitrógeno (%)D: Carbono (%)
0.21.50.30.0
0.63.00.90.6
Suponiendo que la eficiencia del fertilizante se puede estimar mediante la siguiente relación.
( ) ( ) ( ) ( ) ( )2846405,0 5,15,0111005,0100 −−−−−−−−−−+−−= − DADCTanCBBeE A
f
¿Diga cual es la combinación óptima del suelo al alcanzar su máximo?¿En cuantas pruebas se alcanza al objetivo?
(233) Se desea estimar el efecto del SO2 sobre la población cercana a una fabrica monitoreando la concentración de este contaminante y considerando los siguientes factores: la tasa de emisividad Q del contaminante a la salida de la chimenea y la altura del la chimenea. Los niveles elegidos de cada uno de los factores son los siguientes:
FactoresNiveles
- +A: Tasa de emisividad (g/s)B: Altura (m)
530
1060
Siendo el vector respuesta:140 180 200 310 130 320 170 300 280 270 265 275 266
257
Palacios C. Severo
DISEÑO FACTORIAL FRACCIONADO
Los diseños factoriales simples requieren cantidades excesivas de tiempo, material, conviene encontrar otros diseños que requieran menores pruebas de diseño, pero que no desdeñar una gran cantidad de información sobre la naturaleza del vector respuesta que se expresa con los experimentos.
Los diseños factoriales fraccionados permiten lograr este objetivo. Si se está dispuesto a conformarse con una investigación algo menos completa, incluyendo los efectos principales y las interacciones de dos factores y excluyendo los efectos de tres factores o interacciones de alto orden.
Los diseños factoriales fraccionadas se usan principalmente para la depuración o selección, es decir, para identificar la variable más importante que influye en la respuesta.
En cualquier diseño que utilice menos pruebas de los que requiera uno de tipo factorial completo, se tendrán los mismos efectos de confusión. Por ejemplo, un efecto principal se puede confundir con uno o más efectos de interacción de alto orden, esto es, la estadística que mide un ejemplo principal puede ser igual a la estadística que determina algunos de los efectos de las interacciones. Por lo tanto, la estadística en cuestión puede indicar que existe algún efecto, pero no señalará si está presente el efecto principal, el de interacción o alguna combinación aditiva de efectos.
Todos los diseños, proporcionan estimaciones confusas. Por ejemplo, si los efectos cuadráticos y cúbicos, se confunden las estimaciones de la media y los efectos principales, respectivamente, siempre que no emplee un diseño factorial de dos niveles, las tendencias y otros efectos confunden las estimaciones.
Cualquier fenómeno emitido en un modelo ajustado confunde ciertos parámetros estimados en el modelo, sea cual fuere el tipo de diseño empleado. Los buenos diseños factoriales fraccionados se arreglan cuidadosamente de tal manera que la estimación de los efectos que se piensa son importantes, se confunden por acción de los efectos que se consideran no importantes.
258
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Puesto que en la investigación es de interés los efectos principales, es fundamental que éstos no se confundan con otros efectos principales. En casi todos los diseños factoriales fraccionados comúnmente usados, los efectos principales se confunden con interacciones de alto orden. Por lo tanto si un experimentador utiliza uno de estos diseños para medir los efectos principales, deberá estar dispuesto a suponer, cuando menos en forma tentativa, que las interacciones con las que se confunden los efectos principales son cero o muy pequeñas.
Pocos experimentadores evitan usar los diseños factoriales fraccionados debido a la necesidad de hacer tales supocisiones respecto a los efectos de alto orden.
XVII. MEDIO FRACCIONADO DEL DISEÑO 2k
Se estudian a partir de k=3 factores en dos niveles cada uno, para lo cual utilizamos un diseño factorial fraccionado del tipo (1/2)n2k donde n es la cantidad que debe disminuirse la fracción.
Ejemplo 6.75Si tenemos un diseño 23=8 pero queremos una media fracción por lo tanto tendremos (1/2)*23=4 combinaciones de tratamiento.
Tabla 6.72 Primer media fracción del diseño 23
A B C Combinación
-+-+
--++
+--+
cab
abc
Nótese que el diseño 23-1 se forma al seleccionar sólo las combinaciones de tratamiento que producen la multiplicación de signos, donde C=AB.
Es posible construir la combinación de tratamientos del diseño 2k-1
completo igualando el factor C por la interacción -AB, de amplia aplicación cuando los efectos principales son negativos, pero tienen una gran influencia en el proceso.
Tabla 6.73 Segunda media fracción del diseño 23
A B C=-AB Combinación
-+-
--+
-++
1acbc
259
Palacios C. Severo
+ + - ab
El uso del diseño factorial fraccionado a menudo conduce a una gran economía y eficiencia en la experimentación, especialmente si los ensayos pueden hacerse en sucesión. Por ejemplo, supongamos que se están investigando k=5 factores (25 ensayos). Es preferible realizar un diseño fraccionado 25-1 (16 ensayos) analizar los resultados y decidir el mejor conjunto de ensayos que deben recopilarse después.
Ejemplo 6.76Consideremos el experimento de la autoclave, el diseño mostrado en la tabla 6.74, consta de una réplica del diseño 24. En este estudio, los efectos principales B, C y la interacción CD resultaron diferentes de cero.
Utilizaremos el diseño 24-1con D=ABC. Para construir el diseño primero se escribe el diseño base de 23 que se mueve en las primeras tres columnas tal como se indican en la tabla.
Tabla 6.74 Diseño 24-1con D=ABCA B C D=AB
CCombinació
nY
-+-+-+-+
--++--++
----++++
-++-+--+
1adbdabcdacbc
abcd
7188686583958670
Los efectos e interacciones se calculan idem a las factoriales normadas.
[ ] BCDAA +=+−+−+−+−= 5,270869583656888714/1
ACDBB +−= 12
ABDCC += 5,10
ABCDD +−= 2
CDABAB +−= 2,1
BDACAC +−= 5,4
260
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
ADBCBC +−= 0,1
Podemos concluir que los efectos principales B y C son grandes y que la interacción AB también es significativa.
Para ver la efectividad de este diseño investigaremos un diseño 25-1con cinco factores.
Tabla 6.75 Diseño 25-1con E=ABCDA B C D E=ABC
DCombinación Y
-+-+-+-+-+-+-+-+
--++--++--++--++
----++++----++++
--------++++++++
+--+-++--++-+--+
eab
abec
acebceabc
dadebdeabecdeacdbcd
abcde
12181316171520151025132411211723
Calculo de efectos e interacciones:
BCDEAA += 5,5 ACDEBB += 5,1 ABDECC += 0,1
ABCEDD += 25,2 ABCDEE += 0,0 CDEABAB +−= 75,1
BDEACAC +−= 25,3 BCEADAD += 0,5 BCDAEAE += 25,0
ADEBCBC += 25,1 ACEBDBD += 0,1 ACDBEBE += 75,0
ABECDCD +−= 0,1 ABDCECE +−= 25,0 ABCDEDE += 0,0
Tabla 6.76 Análisis de varianza del diseño 25-1
Fuente SC GL CM Fo Ft(99)ADABACADError
121,0020,2512,2542,24100,0
0256,0
0
11111
10
121,0020,2512,2542,24100,0
025,60
4,730,790,481,653,91
><<<>
3,293,293,293,293,29
261
Palacios C. Severo
Total 550,75 15
La suma de cuadrados del modelo es:
75,295mod =++++= ADACABDAelo SCSCSCSCSCSC
XVIII. CUARTO FRACCIONADO DEL DISEÑO 2k
Cuando hay un número grande de factores. Hay que considerar una fracción de un cuarto del diseño 2k este diseño contiene 2k-2 ensayos.
Este diseño se puede construir escribiendo primero las combinaciones de tratamiento asociado con el factorial completo con k-2 factores. Después se asocian las dos columnas adicionales con las interacciones elegidas apropiadamente, que incluyen los primeros k-2 factores.
Los alias estructurados para un diseño 26-2 son:
ABCDFDEFBCEA === ABDEFCDFACEB === ACDEFBDFABEC ===ABCDEAEFFBCD === BCDEFADFABCE === ABCEFADEBCDF ===
BDEFACDFCEAB === BDEFABDFBEAC === ABCFBCDEEFAD ===ABCDFDFBCAE === ABCDBCEFDEAF === ABEDFACDECFBD ===
ABDEACEFCDBF === BEFACFCDEABD === CEFABFBDEACD ===
Ejemplo 6.77Se ha aplicado la técnica experimental para la optimización de un proceso en donde se consideran seis variables a dos niveles
A: 1 3 D: 8 10B: 5 15 E: 14 18C: 5 15 F: 22 38
Elegimos un diseño factorial fraccionado del tipo (1/2)226= 24 en que confundimos los siguientes factores e interacciones E=-ABC, F=BCD.
Tabla 6.77 Diseño 26-2con E=ABC y F=BCDA B C D E=AB
CF=BC
DCombinació
nY
-+-+-+-
--++--+
----+++
-------
-++-+--
--++---
1aefbefabfcdfacfbc
92,090,091,091,290,392,090,2
262
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
+-+-+-+-+
+--++--++
+----++++
-++++++++
+-++-+--+
-++----++
bcedf
abefbdeabdcdeacdbcdf
Abcdef
89,592,392,890,790,491,692,691,692,0
Los efectos e interacciones son:
12,0=A 87,0−=B 01,0=C20,1=D 66,0=E 73,0=F
17,0=−CEAB 43,0=−BEAC 16,0=−− BFAEBC27,0=−EFAD 32,0−=−CFBD 43,0=−BFCD66,0=−DEAF 17,0=−CEDABD 14,0=− ABFACD
Obtenemos información clara sobre los efectos principales si se consideran que las interacciones de tercer orden y superior son insignificativas. Respecto a las interacciones de segundo orden observamos que están confundidas entre si y con interacciones de cuarto orden; su análisis permitirá comprobar el comportamiento lineal de nuestros vectores respuestas en la región experimental estudiada.
El análisis de varianza se muestra en la tabla 6.78. Para decidir si una variable es o no significativa en el rango experimental estudiado, en el nivel de significancía del 99%, el cual nos proporciona esta seguridad en el análisis de varianza para el vector respuesta indican que A, C y E no son significativas en los niveles elegidos y podemos suponer que estamos en el rango elegido para estas variables.
Tabla 6.78 Análisis de varianza para el diseño 26-2
Fuente SC GL CM Fo Ft(99)BDFAF+DEError
3.064.202,181,764,27
111111
3.064.202,181,760,39
7,8910,835,604,53
>>><
4,854,854,854,85
Total 15,47 15
263
Palacios C. Severo
Problemas
(234) Deseamos mejorar el rendimiento de un proceso, en un diseño 25-2 se investigan 5 factores, confundiendo E= ABCD siendo su vector respuesta.
Y: 98, 99, 94, 82, 86, 92, 85, 90, 86, 90, 80, 90, 85, 81, 84, 93(235) Se trabaja a nivel Bach un proceso catalítico, se asume que la
respuesta de interés es la reacción de variables. Cuatro factores han sido propuestos como variables, a dos niveles. Aplique un diseño 26-3 siendo su nivel respuesta.
Y: 53, 83, 62, 77, 75, 84, 75, 86(236) Deseamos mejorar el rendimiento de un proceso, en un diseño
27-4 se investigan 7 factores, confundir D=AB, E=AC, F=BC, G=ABC.
Y: 70, 65, 80, 95, 88, 91, 85, 87(237) Se utiliza un diseño 25-2 para investigar el efecto sobre el
rendimiento del proceso de A = temperatura de condensación, B = cantidad de material 1, C = volumen del solvente, D = tiempo de condensación y E = cantidad del material 2. Los resultados fueron los siguientes:
e = 23.2 ad = 16.9 cd = 23.8 bde = 16.8ab = 15.5 bc = 16.2 ace = 23.4 abcde = 18.1
Determine la relación generadora de este diseño.Escriba las relaciones de alias de este diseño.Calcule los efectos. Determine cuáles de ellos son importantes.
264
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Cómo llevaría a cabo el análisis para este experimento.(238) Es posible diseñar un experimento 25-2 en el cual no se realice
ninguna medición en la cual los factores A y C se encuentren ambos en alto al mismo tiempo?
(239) Usted acaba de ser contratado como jefe de planta en una fábrica de cerveza. Una de las primeras noticias que recibe es que el proceso tiene algunos problemas con el grado alcohólico de la cerveza, el cual es muy alto. La persona que ocupaba su puesto anteriormente había planteado la posibilidad de realizar un experimento factorial fraccionado de la forma 24-1 para estudiar la situación. La estructura de dicho experimento es la siguiente
A = tiempo de fermentación.B = % de cebada presente.C = % de arroz presente.D = % de maíz presente.
(1), ab, c, abc, d, abd, cd, abcdEscriba la matriz de diseño del experimento anterior y diga cuales efectos se encuentran confundidos.¿Es este un diseño ortogonal? ¿Cuál es la resolución del diseño?¿Qué críticas le merece esta estructura de experimentación?Si alguien le propusiera utilizar un experimento de la forma 24–2
para investigar esta situación, ¿qué le respondería usted?Un par de semanas después, ya un poco más calmado y con un mayor conocimiento del proceso, usted decide que existe un quinto factor influyente:E = tiempo de maduración.Escriba la matriz de diseño un nuevo experimento, esta vez de la forma 25-2, que permita tomar en cuenta este factor adicional y que evite los problemas presentados en el diseño anterior.Encuentre los efectos confundidos en este nuevo diseño. ¿Cuál es la resolución del mismo?¿Qué puntos se encuentran dentro de esta fracción?
(240) Usted está recién graduado y acaba de entrar a trabajar en la empresa Soda, la cual elabora galletas. La compañía ha presentado algunos problemas económicos en los últimos tiempos, así que su misión es tratar de incrementar la calidad y la productividad. Se le pide estudiar la influencia de tres variables sobre la textura de la galleta:A = tiempo en el horno.B = % de leche.C = tipo de harina (nacional o importada)
265
Palacios C. Severo
Escriba la matriz de diseño para un experimento 23 (completo).A partir de esa matriz de diseño tome las siguientes medidas:
Nivel Textura(1) 10.0a 13.0b 8.0
ab 15.1c 11.0
ac 12.9bc 8.1
abc 15.0
Determine cuáles de los factores son influyentes sobre la textura de la galleta.En los datos anteriores el factor C no es significativo. ¿Cómo podría interpretarse el diseño anterior en función de un diseño 22, donde sólo estuviesen involucrados los factores A y B?
(241) Usted es gerente de una planta de producción de detergentes. Se detectó que un problema de llenado se debía a la variabilidad en la densidad del detergente, por lo que se decidió realizar un experimento para determinar cuáles factores del proceso de producción afectan la densidad. Los factores (a 2 niveles) a considerar son los siguientes:
A = tiempo en la torre de secado.B = homogeneidad de la mezcla antes de entrar en la torre.C = tiempo de reposo del detergente antes de ser enviado a la
línea de empaque.D = contenido de carbonatos.E = velocidad del agitador de la mezcla.F = temperatura en la torre de secado.G = orden (normal o inverso) de adición de ciertos
ingredientes.(242) Debido a que cada corrida corresponde a un día de
producción, se decidió reducir el tamaño del experimento, de 27
= 128 corridas, a una fracción de 27-3.Los resultados del experimento son los siguientes:
Nivel Densidad (g/ml)(1) 338.0
adg 388.5bdf 332.0
abfg 239.0cdfg 309.5acf 206.0bcg 343.5
acbd 333.5efg 342.0
adef 213.0
266
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
bdeg 295.0abe 405.0cde 393.0
aceg 432.0bcef 325.0
abcdefg
193.5
Diga cuál es la estructura de confusiones del experimento.Determine cuáles factores influyen significativamente en la densidad del detergente, así como cuáles interacciones (de segundo orden) son significativas.
(243) Una empresa de consultoría debe llevar a cabo para un cliente un estudio experimental para determinar los efectos de seis variables sobre las propiedades físicas de cierto tipo de asfalto.Llamemos A, B, C, D, E y F a esas variables.Si se lleva a cabo un diseño factorial completo a dos niveles ¿cuántas corridas deben hacerse?Escriba una cuarta fracción del diseño que requiera sólo 16 corridas. Escriba una relación generadora para este diseño.En el diseño que usted realizó, qué efectos están confundidos con A y con BD.
(244) Considere un diseño factorial fraccional 25-2. Estudie la estructura de confusiones y la resolución de las fracciones que se obtienen de las siguientes formas:Partiendo de un 25 completo, se toman aquellos puntos donde las interacciones ABCDE y ABCD estén ambas a nivel alto.Partiendo de un 25 completo, se toman aquellos puntos donde dos interacciones de cuarto orden ABCD y BCDE estén en nivel alto.Partiendo de un 25 completo, tomando los puntos donde dos interacciones de tercer orden estén a nivel alto.Partiendo de un 23, asignando factores adicionales a dos interacciones de segundo orden, por ejemplo AB y AC.
(245) Suponga que se le presentan las siguientes alternativas:Correr un diseño 26 completo.Correr un diseño 26-2 replicado cuatro veces. Comente en que condiciones es preferible utilizar uno u otro
(246) Se describe un experimento en el cual se utilizó un diseño 25-1
con I = ABCDE para investigar los efectos de cinco factores sobre el color de un producto químico. Los factores son A: solvente/reactivo, B: catalizador/reactivo, C: temperatura, D: pureza del reactivo y E: pH del reactivo. Los resultados fueron como sigue:
267
Palacios C. Severo
Punto Color Punto Colore -0.63 d 6.79a 2.51 ade 5.47b -2.68 bde 3.45
abe 1.66 abd 5.68c 2.06 cde 5.22
ace 1.22 acd 4.38bce -2.09 bcd 4.30abc 1.93 abcde 4.05
Que efectos parecen ser significativosCalcule los residuos.Si uno o más de los factores son despreciables, contraiga el diseño 25-1 a un factorial completo con los factores significativos.Suponga que debe correr un experimento 25, pero que por restricciones en la elaboración de la materia prima debe hacerlo en 4 bloques. Indique los puntos del diseño que deben desarrollarse en cada bloque y cuales efectos están confundidos con los bloques.
(247) Se estudia la influencia de 7 factores sobre la viscosidad de un aceite producido en una nueva planta experimental. Para ello se utilizó un diseño 27-3 donde I=-ABCE=BCDF=ACDG son los generadores utilizados. Los resultados obtenidos son:Analice los resultados obtenidos y determine los factores significativos sobre la viscosidad.
Nivel Viscosidade 33,74
ag 35,90bf 32,53
abefg 35,38cfg 24,46acef 30,24bce 23,82abc 30,27defg 23,30adf 23,38bdg 20,67abde 23,17
cd 26,07acdeg 32,09bcdef 26,29
abcdfg 32,03
En caso de poder correr una nueva secuencia de puntos, ¿cuáles escogería?
(248) Se describe un factorial fraccionado replicado para investigar el efecto de cinco factores sobre la altura libre de muelles de hojas utilizados en aplicación automotriz. Los factores son A: temperatura del horno, B: tiempo de calentamiento, C: tiempo
268
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
de transferencia, D: tiempo de inmersión y E: temperatura del aceite de templar. Los datos se presentan enseguida:
A B C D E I II II-+-+-+-+-+-+-+-+
--++--++--++--++
----++++----++++
-++-+--+-++-+--+
--------++++++++
7,788,157,50
7,597,547,69
7,567,567,50
7,88
7,50
7,63
7,32
7,567,187,81
7,788,187,567,568,00
8,09
7,527,817,257,887,567,757,447,697,187,50
7,817,887,507,757,888,06
7,447,697,127,447,507,567,447,627,257,59
Determine la estructura de confusiones para este diseño.Cuáles son los puntos incluidos en este diseñoQué factores influyen en la altura libre mediaExiste evidencia de que alguno de los factores influya en la variabilidad de la altura libreAnalice los residuos de este experimento en cada caso y comente los resultados.
(249) Se realiza un experimento para determinar la influencia de la presión (A), temperatura (B) y concentración (C) sobre la viscosidad de un detergente líquido. Para ello se ha decido utilizar un diseño 23 con una sola réplica, el cual debe desarrollarse en dos bloques. ¿Cuál de las siguientes dos opciones preferiría y por qué?Opción 1:
Bloque I Bloque II Bloque III Bloque IVa
abc(1)bc
bc
acab
Opción 2:Bloque I Bloque II Bloque III Bloque IV
(1)abc
bac
abc
abc
269
Palacios C. Severo
(250) Si alguien le propone correr un experimento 26 en ocho bloques, ¿qué le diría?
(251) En un esfuerzo por incrementar la producción se realizó un experimento en una planta de manufactura de dispositivos de semiconductor. Se estudiaron cinco factores, cada uno a dos niveles. Los factores y niveles son. A: apertura del diafragma (pequeña, grande), B: tiempo de exposición (20% abajo y arriba del valor nominal), C: tiempo de revelado (30 y 45 seg), D: dimensión de la pantalla (pequeña, grande) y E: tiempo de corrosión selectiva (14.5 y 15.5 minutos). El experimento se corrió en dos bloques:
Bloque I Bloque IIPunto Producción Punto Producción
a 9 (1) 7b 34 ab 555c 16 ac 20
abc 60 bc 40d 8 ad 10
abd 50 bd 32acd 21 cd 18bcd 44 abad 61
e 8 ae 12abe 52 be 35ace 22 ce 15bce 45 abce 65ade 10 de 6bde 30 abde 53cde 15 acde 20
abcde 63 bcde 41
Indique que efectos están confundidos con el bloque.Identifique los efectos significativos y realice recomendaciones sobre las condiciones de operación del proceso.Puede proyectarse este diseño en un 2k más pequeño.
(252) Se desea realizar un experimento 25-1, pero los lotes de materia prima permiten correr un máximo de 10 puntos en cada uno. Indique como debería realizarse este experimento.
(253) Una planta química produce oxígeno licuando aire y separándolo en los diferentes gases que lo componen por medio de destilación fraccionada. La pureza del oxígeno obtenido es una función de la temperatura del condensador principal y del cociente de presiones entre la columna superior y la inferior. Las condiciones actuales de operación son temperatura (ξ 1) = -220ºC y cociente de presión (ξ 2) = 1.2. Usando los datos que se dan a continuación, ajuste un modelo de primer orden, pruebe
270
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
las hipótesis necesarias para comprobar su ajuste y determine el camino de ascenso máximo.
Temperatura (ξ 1)
Cociente de presiones (ξ 2)
Pureza (%)
-225 1,1 82,8-225 1,3 83,5-215 1,1 84,7-215 1,3 85,0-220 1,2 84,1-220 1,2 84,5-220 1,2 83,9-220 1,2 84,3
(254) El diseño experimental para la lixiviación de minerales auríferos mediante un Factorial Fraccionado 28-4, toma las siguientes variables y rangos.
FactoresNiveles
- 0 +X1: Aglutinante (kg/t)X2: Sal oxidante (kg/t)X3: Tipo mineralX4: Humedad (%)X5: Aglomerante (kg/t)X6: Agente lixiviante ppmX7: Radio riego (l/h.m²)X8: tiempo curado (h)
50,11/210
0,02270516
100,81/114
0,068507,556
151,52/118
0,11341001096
Prueba
X1 X2 X3 X4 X5 X6 X7 X8 Y
1234567891011121314151617181920
-+-+-+-+-+-+-+-+0000
--++--++--++--++0000
----++++----++++0000
--------++++++++0000
-++-+--+-++-+--+0000
-++--+--+--++--+0000
-+-+--+-+-+--+-+0000
--++++--++----++0000
76,380,886,284,379,185,782,281,981,887,571,979,381,687,485,084,285,985,683,085,7
Analice los datos de % de recuperación de oro de todas las pruebas estadísticamente para determinar el grado de influencia de cada variable independientemente y sus interacciones.
271
Palacios C. Severo
XIX. DISEÑO DE PLACKETT – BURMAN
Es posible construir diseños para investigar hasta K=N-1 factores con sólo N ensayos, en donde N es un múltiplo de 4.
Frecuentemente estos diseños son útiles en la experimentación industrial. De particular importancia son las que requieren ocho ensayos para hasta siete factores y dieciséis ensayos para hasta quince factores. Se dice que este es una Variedad del diseño factorial fraccionado.
Estas variedades son muy útiles para estudiar factores que no han sido estudiados. El primer diseño es una fracción de un diseño 27. Esta puede construirse escribiendo primero los niveles positivo y negativo
272
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
de un diseño 23 completo con los factores ABC y después conocido los niveles de los otros cuatro factores con las interacciones de los tres factores originales como aparece: D=AB, E=AC, F=BC, G=ABC.
El diseño constituye una fracción de dieciseisavo y, además, es una fracción principal los signos generadores son positivos.
Es posible utilizar los siete grados de libertad de este diseño.
Para estimar los siete efectos principales. Cada uno de estos factores tiene quince alias. Sin embargo, la estructura de los alias se simplifica considerablemente, si se supone que las interacciones de tres o más factores son despreciables. Haciendo esta suposición, cada combinación lineal asociada a los siete efectos principales de diseño realmente estima el efecto principal y tres interacciones bifactoriales.
A+BD+CE+FG B+AD+CF+EG C+AE+BF+DG D+AB+CG+EFE+AC+BG+DF F+BD+AG+DE G+CD+BE+AF
El diseños Plackett-Burman es útiles cuando N = 8, 12, 16, 20, 24, y 36.
A continuación se presentan los renglones de signos positivos y negativos usados para construir los diseños de Plackett-Burman.
K=7 N=8 - - - - + + +K=11 N=12 + + - + + + - - - + -K=15 N=16 - - - - - - - - + + + + + + +K=19 N=20 + + - - + + + + - + - + - - - - + + -k=23 N=24 + + + + + - + - + + - - + + - - + - + - - - -K=35 N=36 - + - + + + - - - + + + + + - + + + - - + - - - - + - + - + + - - + -
El diseño de 12 corridas se proyectará en tres réplicas de un diseño 22
completo en cualquiera de los 11 factores originales.Tabla 6.79 Diseño PLACKETT-BURMAN para N=8 y k=7
Prueba A B C D E F G12345678
-+-+-+-+
--++--++
----++++
-++-+--+
++----++
+-+--+-+
+--++--+
Sin embargo, en tres factores el diseño proyectado es un factorial 23
completo más un factorial fraccionado 23-1.
273
Palacios C. Severo
Los diseños Plackett-Burman se obtienen escribiendo el renglón apropiado N y k en forma de columna o renglón. Una segunda columna o renglón se genera a partir de la primera moviendo los elementos de la columna o renglón un lugar hacia abajo y colocando el último elemento en la primera posición. Simultáneamente, se genera una tercera columna o renglón a partir de la segunda. Este procedimiento se continúa hasta que se genera la columna o renglón k. A continuación se agrega un renglón de signos negativos para cada factor. Por ejemplo
ZXYYZX
YZXZXY
XYZXYZ
Los diseños de Plackett-Burman tienen estructura de alias muy intrincada. En un diseño de doce pruebas, cada efecto principal tiene todo los alias parcial y toda interacción de dos factores en la que no participe el mismo, la interacción AB tiene como alias los nueve efectos principales C, D, ...
Las propiedades de proyección de los diseños Plackett-Burman no son extraordinariamente atractivas. Consideremos el diseño de 12 pruebas. Este diseño se proyecta en tres replicas de un diseño 22
completo en cualquiera de los once factores originales. Sin embargo en tres factores el diseño proyectado es un factor 23 completo más un factorial fraccionado.
Ejemplo 6.78Se estudia la flotación de un mineral sulfurado de cobre. Los factores que inicialmente se consideran importantes son: Colector (A), espumante (B), tiempo de acondicionamiento (C), agitación (D), temperatura (E), porcentaje de sólidos (F) y pH (G). Se consideran dos niveles de cada factor. Se sospecha que sólo unos cuantos de estos siete son despreciables. Se decide llevar a cabo el experimento con el propósito de identificar los factores más importantes para concentrar los estudios futuros sobre estos factores.
Tabla 6.80Diseño PLACKETT-BURMAN para N=8 y k=7Prueba A B C D E F G Y Y2
1234
-+-+
--++
----
-++-
++--
+-+-
+--+
929091
91,2
31,835,8
29,1
274
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
5678
-+-+
--++
++++
+--+
--++
-+-+
+--+
91,692
91,692
36,2
44,5
36,138,131,6
Donde:
Y porcentaje de recuperación.Y2 porcentaje de eficiencia de la recuperación, parámetro definido
Como
( )
hC
YhCY
m −−=2
C = Ley de concentrado obtenidoCm= Ley de cabezah = Ley máxima de concentración obtenida
Con los datos es posible estimar los siete efectos principales y sus alias:
FGCEBDALA +++−= 1 EGCFADBLB +++= 2,0 DGBFAECLC +++= 3
EFCGABDLD +++= 2,2¡ DFBGACELE +++= 6,2 DEDGBCFLF +++−= 2,0
AFBECDGLG +++−= 2,2
Los tres efectos más grandes son C, D, E. La interpretación más simple de datos es que los efectos principales de C, D y E son significativos. Sin embargo, esta interpretación no es única, ya que se pude concluir lógicamente que C, D y la interacción CD o quizás D, E y la interacción DE, o quizás C, E y la interacción CE son los efectos verdaderos.
Tabla 6.81 Diseño PLACKETT-BURMAN para N=8 y k=7Prueba A B C D E F G Y Y2
123456
-+-+-+
--++--
----++
-++-+-
++----
+-+--+
+--++-
949194,6
92,2
3,211,755,348,4
48,
275
Palacios C. Severo
78
-+
++
++
-+
++
-+
-+
92,5
93,2
92,6
92,6
448,6
35,8
45,0
Obsérvese que CDE en una palabra es la relación definitiva para este diseño. Por lo tanto, este diseño no se proyecta en una factorial 23
completo en CDE; más bien, se proyecta en dos réplicas de un diseño factorial fraccionado 23-1, de modo que las interacciones no puedan separarse de los efectos principales. Al parecer el experimentador no tuvo éxito al escoger los factores. Si hubiese asignado el nivel A en vez de D y B en vez de E, el diseño se habría proyectado en un diseño 23
completo.
Para separar los efectos principales y las interacciones bifactoriales, se corre una replica fraccionada con todos los signos invertidos.
Los efectos estimados para está fracción será:
FGCEBDALA −−−= 2,4¡ EGCFADBLB −−−−= 8,0¡ DGBFAECLC −−−= 4,1¡
EFCGABDLD −−−−= 4,0¡ DFBGACELE −−−−= 6,6¡ DEDGBCFLF −−−−= 8,2¡
AFBECDGLG −−−= 8,0¡
Al combinar esta fracción con la original se obtiene las siguientes estimaciones de los efectos:
Tabla 6.82i ½(Li+L´i) ½( Li+L´i)ABCDEFG
A = 1,6B = -0,3C = 2,2D = 0,9E = -2,0F = 1,3
G = -0,7
BD+CE+FG = -2,6AD+CF+EG = 0,5AE+BF+DG = 0,8AB+CG+EF = 1,3AC+BG+DF = 4,6BC+AG+DE = -1,5CD+BE+AF = -1,5
Ejemplo 6.79El ejemplo 6.78 se desea estudiar mediante el diseño Plackett-Burman con bloques.
276
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Tabla 6.83 Diseño PLACKETT-BURMAN con bloquePrueb
aA B C D E F G Y
12345678
-+-+-+-+
--++--++
----++++
+--++--+
+-+--+-+
++----++
-++-+--+
92909191,2
91,6
9291,6
92
Bloque I Bloque IIdefabdacebcf
====
92,091,292,091,6
afgbegadgabcdefg
====
90,0
91,091,692,0
Σ 366,8 Σ 364,6Σ 731,4
[ ] [ ] 605,08/4,7314/6,3648,366 222 =−+=bloqueSC
[ ] [ ] 315,38/4,731926,91...9092 22222 =−++++=totalSC
01,0=+= GBerror SCSCSC
125,0=ASC 005,0=BSC 125,1=CSC
605,0=DSC 845,0=ESC 005,0=FSC
Efectos:
25,0−=A 05,0+=B 75,0+=C 55,0+=D65,0+=E 05,0−=F 55,0−=G
Tabla 6.84 Análisis de varianzaFuente SC GL CM Fo Ft(99)
BloqueACD
0,6050,1251,1250,605
1111
0,6050,1251,1250,605
12125
225121
><>>
98,598,598,598,5
277
Palacios C. Severo
EError
0,8450,010
12
0,8450,005
169 > 98,5
Total 3,315 7 R2 = 99,69%
Para el cálculo de los efectos e interacciones y suma de cuadrados, se procedió por la técnica de Yates. Se ha decidido que las interacciones de valores mínimos son despreciables, por lo que la suma del error se tomo como la suma de cuadrados de B y F. Para el bloque se tomo la suma de cuadrados de G.Problemas
(255) Al problema 193 del diseño factorial fraccionado. Evalué por el método de Plackett-Burman y concluya las diferencias.
(256) Se estudia un proceso nuevo con siete factores aplique el método, siendo D=-AB, E=-AC, G=-ABC
Y: 94, 91, 94, 92, 93, 91, 94, 95(257) Se recupera oro por un método innovativo, se tienen siete
factores, aplique Plackett-Burman, tome G=-ABC. Se obtiene dos vectores respuesta.
Y1: 90,9 90,2 92,8 93,6 92,2 93,5 93,3 94,0Y2: 92,0 90,0 91,0 91,2 90,3 92,0 90,2 89,5
(258) Se lixivio una cola sulfurada con contenido de plata, plomo y cobre, en medio clorurante-oxidante, con el fin de aumentar la solubilidad de la plata en forma compleja AgCI-. Efectuando el estudio de los diagramas de Pourbaix y estabilidad de los complejos. Estudiamos siete variables A: cloruro férrico, B: Cloruro de sodio, C: Temperatura, D: gas cloro, E: Tiempo, F: tamaño de grano, G: porcentaje de sólidos. Se decide efectuar el experimento con el propósito de identificar los factores importantes.
Y: 85 89 92 95 83 86 92 98(259) Se lixivio colas refractarias sulfuradas de oro con sales
oxidantes en medio ácido (Patente del Autor) siendo las variables A: cloruro de sodio B: ácido sulfúrico, C: agente oxidante D: tiempo, E: tamaño de grano, F: porcentaje de sólidos, G: temperatura. El experimento se efectuó en un tanque de agitación, Obteniéndose el vector respuesta.
Y: 94 90 92 96 93 98 95 97(260) Se lixivio mineral refractario con contenido metálico valioso
de oro, rutilo, germanio, indio adicionando sales oxidantes (Patente del Autor) siendo sus variables A: porcentaje de sólidos, B: ácido sulfúrico, C: ácido clorhídrico, O: cloruro de
278
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
sodio, E: Agente oxidante, F: tiempo de acondicionamiento, G: Temperatura. Se efectuó el experimento con el propósito de identificar los factores importantes. Por ser un estudio innovativo se efectuó dos bloques, siendo:
Bloque I, Y: 89 98 86 95Bloque II, Y: 90 85 88 92
(261) Desarrolle un método para un diseño Plackett-Burman con bloque replicado.
(262) Es factible adicionar variables ficticias a un diseño de Plackett-Burman.
(263) Elabore un modelo matemático para los problemas 170, 171 y 172.
(264) En una planta de tratamiento de agua, se estudia un nuevo filtro que presenta problemas en su implementación, de tal manera que retarda el sistema de filtración. Después de realizar múltiples análisis se ha establecido que la causa se debe a
FactoresNiveles
- +A: Tipo de aguaB: Temperatura de filtraciónC: RecicladoD: Flujo de adición de baseE: Material del filtroF: Tiempo de almacenamiento
PozoMedia
SíMediaNuevoMedio
CanalAltaNo
AltaUsado
Alto
Se desea realizar la experiencia con el menor número de pruebas posibles y el menor tiempo posible, como mínimo 8 pruebas.¿Establezca la estructura Alias, y verifique que efectos están mezclados entre sí y que efectos pueden estimarse como constantes?Suponiendo que las respuestas son las siguientes:Y1: 68, 78, 66, 81, 78, 41, 69, 39Y2: 70, 80, 63, 85, 80, 45, 71, 41¿A que factores se debe el retardo de la filtración?
(265) Una empresa tiene problemas en controlar el tamaño de cierto producto. Sus funcionarios han detectado que las variables están provocadas por la distribución irregular de la temperatura del horno de secado. Sin embargo en vez de resolver el problema directamente sugiere reducir la influencia de las variables sobre la temperatura, considerando los siguientes factores
FactoresNiveles
- +
279
Palacios C. Severo
A: Tipo de materia primaB: Granulometría del materialC: AglutinanteD: Material usadoE: Cantidad de cargaF: ColoranteG: Aditivo
OriginalFina
10
120430
UsadaGruesa
82
150634
Después de realizar múltiples ensayos se midió el número de productos rechazados por cada 100.10, 21, 17, 15, 30, 5, 12, 25, 36, 45, 28, 16¿Como se reduciría el número de productos rechazados producto de la mala distribución de la temperatura en el horno de secado?
(266) El diseño experimental para la lixiviación de minerales auríferos mediante el Plackett-Burman, toma las siguientes variables y rangos.
FactoresNiveles
- 0 +X1: Aglutinante (kg/t)X2: Sal oxidante (kg/t)X3: X4: Humedad (%)X4: Aglomerante (kg/t)X5: Agente lixiviante ppmX6: Radio riego (l/h.m²)X7: tiempo curado (h)
50,110
0,02270516
100,814
0,068507,556
151,518
0,1134
1001096
Se desarrolla el proceso con pruebas centrales.
7,850,836,859,85
9,812,827,851,793,842,868,803,76
==
C
F
Y
Y
Analice los datos de % de recuperación de oro de todas las pruebas estadísticamente para determinar el grado de influencia de cada variable independientemente y sus interacciones.
280
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
XX. DISEÑOS FACTORIALES 3n
La inclusión de más factores al diseño de tratamientos aumenta la complejidad de los patrones de interacción entre los factores de tratamiento. El número de combinaciones de tratamientos aumenta tanto como se agregan factores al diseño, es decir, un diseño de tres factores con a niveles de A, b niveles de B y c niveles de C, tiene abc combinaciones. Un cuarto factor, D, con d niveles aumenta el número de tratamientos en un múltiplo de d.
El diseño con dos factores permite la investigación de la interacción de primer orden o doble, AB. En el diseño con tres factores las dos interacciones de primer orden adicionales, AC y BC, amplían las inferencias del estudio y debe considerarse además una interacción de segundo orden o de tres factores (o triple), ABC. Las interacciones de tercer orden o de cuatro factores como ABCD, introducen mayor complejidad en la estructura de la inferencia de la interacción.
Tabla 6.85 Cálculos de las particiones de sumas de cuadrados lineales y cuadráticasVarios Días Media
sSl Sq Dl Dq SlDl SlDq SqDl SqDq
0
6
1421281421
2,755,35
12,804,106,55
-1-1-100
111
-2-2
-101-10
1-211
-2
10-100
-12-100
-10120
1-21
-24
281
Palacios C. Severo
1228142128
10,203,105,207,95
0111
-2111
1-101
11
-21
0-101
01
-21
-2-101
-21
-21
ijC
YPij
∑2
ijCP∑
SCEfectos
-4,76,07,2
-0,78
-4,618,02,3
-0,25
21,06,0147,
03,50
6,718,05,0
0,37
-5,24,013,5-1,30
-4,212,02,9
-0,35
2,712,01,2
0,23
3,136,00,5
0,09
( ) ∑∑ ∑∑ == 22 //²ijijijij CijCCijC PYPEfectoPYPrSC
Cálculo de los coeficientes para contraste polinomial ortogonal de las interaccionesSl
Dl
-1-1
-10
-11
0-1
00
01
1-1
10
11
SlDl
1 0 -1 0 0 0 -1 0 1
Ejemplo 6.80El camarón desova en el mar y los huevos se transforman en lama mientras son transportados a la costa, pasada la etapa larvaria entran en los estuarios, donde crecen con rapidez y se convierten en pre-adultos que emigran de nuevo al mar para alcanzar ahí su madurez sexual.
Como resultado de sus migraciones, el camarón encuentra una amplia variación de la temperatura y salinidad durante su ciclo de vida, por lo que es de gran importancia conocer cómo afectan su crecimiento para entender su vida y ecología.
Cuando se realizó este experimento había un gran interés en el cultivo comercial del camarón y, desde el punto de vista de la acuacultura, otro factor importante era la densidad de almacenamiento en los tanques de cultivo, ya que esta afecta la competencia entre los ejemplares adultos y jovenes.
Tabla 6.86 Aumento del peso de los camarones cultivados en acuariosT D S Aumento peso
(mg)25 80
160
102540102540
8654439053
393249
5237129073
398265
7348239786
208243
282
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
30 80
160
102540102540
439249247324352188
436245277305267223
349330205364316281
Tabla 6.87 Análisis de varianza para el aumento de peso en los camarones cultivadosFuente SC GL CM Fo Ft(99)
TemperaturaSalinidadDensidadTSTDSDTDSError
15376,0096762,5021218,78300855,1
78711,11674,39
24038,3969690,67
1212122
24
15376,0048381,2521218,78150427,5
88711,11337,19
12019,192903,78
5,3016,667,31
51,803,000,124,14
<>>><<<
7,245,617,245,617,245,615,61
Total 537327,01 35
Tabla 6.88 Aumento de peso en cuatro semanas de camaronesDensidad
Temperatura (80°C)
Temperatura (160°C)
Salinidad (%) 25 35 25 35KY
102540
70466359
408275243
71333252
331312231
220346271
Media TxD 298 309 219 291
Las interpretaciones deben estar condicionadas a alguna medida de significancía estadística junto con la significancía biológica de las respuestas. Se requieren los errores estándar de las medias de celdas y marginales para cualquier prueba estadística subsecuente de comparaciones específicas; el error estándar para cualquier media es
nCMS eY /= , donde n es el número de observaciones en la media y
el error estándar de la diferencia entre cualquier par de medias es
( ) nCMYYS eji /2=− . Los errores estándar estimados para el
experimento de cultivo de camarón se muestran en la tabla 6.89
Media TxD Media DxSD S
T 10 25 40iY D 10 25 40
iY2535
71370
399
29
306
237
259300
80160
239
20
370
32
301
24
303
255
283
Palacios C. Severo
3 1 2 2
Interpretaciones de los efectos de los factores
La significancía de la interacción de estos factores indica que temperatura, salinidad y densidad se interrelacionan en cuanto a su efecto sobre el crecimiento del camarón.
La interacción significativa de los tres factores implica que la interacción entre dos de ellos no es constante para los niveles del tercer factor. Considere la interacción entre la densidad y la salinidad por separado, a temperaturas de 25 y 35°C, como se muestra en las gráficas de medias de celdas de aumento en el peso de los camarones cultivados.
Para interpretar los resultados se puede usar una comparación de los efectos simples de la salinidad sobre cada nivel de densidad y temperatura, los efectos simples de la salinidad se estiman mejor como contrastes polinomiales ortogonales lineales y cuadráticas para cada combinación de temperatura y densidad.
Tabla 6.89 Errores estándar para las medias de celdas y marginalesTemperatura: a=2 niveles; Densidad: b= 2 niveles; Salinidad: c= 3 niveles
Medias de los factores principalesTemperatura
7,1218
78,2903 ==rbc
CM e
Salinidad
6,1512
78,2903 ==rab
CM e
Densidad
7,1218
78,2903 ==rac
CM e
Medias marginales de dos factoresDensidad por temperatura
0,189
78,2903 ==rc
CM e
Densidad por salinidad
0,226
78,2903 ==ra
CM e
Salinidad por temperatura
0,226
78,2903 ==rb
CM e
Medias de celdas
1,313
78,2903 ==r
CM e
284
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Gan
anc
ia
Ga
in
SalinidadSalinidad
500
400
300
200
100
0
500
400
300
200
100
0
10 15 20 25 30 35 4010 15 20 25 30 35 40
x Densidad 80o Densidad 160
x Densidad 80o Densidad 160
x
x
x
x
xx
o
o
o
o o
o
25°C 35°C
Aumento en el peso de los camarones cultivados en un arreglo factorial de2x2x3 de temperatura, densidad y salinidad
Los coeficientes cuadráticos de salinidad se calcularon como contrastes polinomiales ortogonales para las cuatro combinaciones de temperatura y densidad, a partir de las medias de celdas de la tabla 6.86, con un patrón similar al que proporciona la tabla 6.88. Por ejemplo, el coeficiente cuadrático de salinidad a 25°C y densidad de 80 es:
( )[ ]( )[ ] 8,83
6
503
²1²2²1
359466270 −=−=+−++−
con error estándar 7,12)3(6/,2903 = . Las estimaciones de un ICS del 95% se calcularon para los cuatro coeficientes según la
70,224,4,5,0 =t de Bonferroni.
Las estimaciones de un ICS del 95% para los coeficientes cuadráticos de una salinidad a 25°C son (-118,1; -49,5) para una densidad de 80 y (-91; -22,9) para una densidad de 160, mientras que las estimaciones respectivas para esas densidades a 35°C son (-17,5; 51,1) y (44,6; 24,0). Es claro que la cuadratura a 25°C es significativa, ya que el ICS del 95% no incluye al 0; y no significativa a 35°C, pues esos intervalos sí lo incluyen.
Problemas
285
Palacios C. Severo
(267) Los datos representan el porcentaje de hombres entre 55 y 64 años con niveles auditivos de 16 decibeles por encima del cero métrico de sonido. Las categorías por renglón son los niveles de sonido en ciclos por segundo (hertz) y las columnas describen siete categorías ocupacionales.
BA 1 2 3 4 5 6 7
iY ( )yY i −1234567
2,11,7
14,457,466,275,24,1
6,88,1
14,862,481,794,010,2
8,48,4
27,037,453,374,310,7
1,41,4
30,963,380,787,95,5
14,612,036,565,579,793,318,1
7,93,7
36,465,680,887,811,4
4,84,531,459,882,480,56,1
6,65,7
27,358,875,084,79,4
-31,6-32,5-10,920,636,846,5
-28,8
iY 31,6 39,7 31,4 38,7 45,7 41,9 38,5 2,38=Y
( )yY i − -6,6 1,5 -6,8 0,5 7,5 3,7 0,3
ip 6719 7730 5046
7776 6850
7313 7192
(268) Un proceso de producción química consiste en la primera reacción de un alcohol y una segunda reacción con una base. Se realizó un experimento factorial de 3x2, con tres alcoholes y dos bases, con cuatro reacciones réplica en un diseño totalmente aleatorizado. Los datos se reunieron como porcentaje de la reacción.
AlcoholBase 1 2 3
191,390,7
89,991,4
89,390,4
88,191,4
89,588,3
87,690,3
287,391,5
89,488,3
92,390,6
91,594,7
93,191,5
90,789,8
Escriba un modelo lineal para este experimento, explique los términos y calcule el análisis de varianza.Construya una tabla de medias de celdas y marginales.
(269) Una compañía probó dos métodos químicos para determinar la glucosa en el suero. Se usaron tres recipientes con suero para el experimento, cada uno contenía distintos niveles de glucosa mediante la adición de glucosa al nivel base. Se prepararon tres muestras de suero de cada recipiente independientes del nivel de glucosa, con cada uno de los dos métodos químicos. Se midió la concentración de glucosa (mg/dl) de todas las muestras en una corrida del espectrómetro.
Método I Método II
286
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Glucosa
1 2 3 1 2 3
42,543,342,9
138,4144,4142,7
180,9180,5183,0
39,840,341,2
132,4132,4130,3
176,8173,6174,9
Escriba un modelo lineal para este experimento, explique los términos, realice un análisis de varianza para los datos y calcule los residuales. ¿Es necesaria una transformación de los datos? Explique.Si es necesaria, calcule la transformación de los datos y el análisis de varianza respectivo.
(270) Se llevó a cabo un estudio del efecto de la temperatura sobre el porcentaje de encogimiento de telas teñidas, con dos réplicas para cada uno de cuatro tipos de tela en un diseño totalmente aleatorizado. Los datos son el porcentaje de encogimiento de dos réplicas de tela secadas a cuatro temperaturas.
Temperatura (°C)Tela 210 215 220 225
1234
1,82,22,83,2
2,12,43,23,6
2,04,24,43,3
2,14,04,83,5
4,65,48,75,7
5,05,68,45,8
7,59,813,2
10,9
7,99,213,0
11,1
Escriba un modelo lineal para el experimento y calcule el análisis de varianza.Divida la suma de cuadrados del efecto principal de la temperatura en particiones con 1 grado de libertad para las sumas de cuadrados de regresión lineal y cuadrática.Haga una partición de sumas de cuadrados de la interacción temperatura x tela en sumas de cuadrados de interacción temperatura lineal x tela y temperatura cuadrática x tela y pruebe la hipótesis nula de que no hay interacción para las respectivas particiones.
(271) Se realizó un experimento de microbiología de suelos para determinar el efecto de la fertilidad del nitrógeno en la fijación de nitrógeno por bacterias Rizhobium. El experimento se ejecutó con tres cosechas; alfalfa, soya y habas. Se inocularon dos plantas con el Rhisobium y se cultivaron en un frasco de Leonard con una de las tres siguientes tasas de nitrógeno en el medio: 0,50 y 100 ppm N. Se usaron cuatro réplicas de frascos de Leonard para cada una de las 12 combinaciones de tratamiento, los tratamientos se arreglaron en un diseño totalmente aleatorizado en una cámara de cultivo y se midió la
287
Palacios C. Severo
reducción de acetileno para cada tratamiento en la etapa de florecimiento de las plantas. La reducción de acetileno refleja la cantidad de nitrógeno que fija la bacteria en la relación simbiótica con la planta
CultivoNitrógeno Alfalfa Soya Habas
0
50
100
2,60,90,00,00,00,0
1,11,20,00,00,00,0
6,53,90,60,30,00,1
2,64,30,60,80,10,0
0,82,20,70,30,30,0
0,91,20,40,80,10,1
Escriba un modelo lineal para este experimento, explique los términos y calcule el análisis de varianza.Realice un análisis residual y determine si es necesaria una transformación de los datos. Si lo es, transforme los datos y calcule el análisis de varianza para los datos transformados.Pruebe la hipótesis nula de que no hay efectos de interacción de cultivo, nitrógeno o cultivo x nitrógeno.Divida la suma de cuadrados del efecto principal del nitrógeno y de la interacción nitrógeno x cultivo en particiones con 1 grado de libertad para regresión lineal y cuadrática.
(272) Un agrónomo realizó un experimento para determinar los efectos combinados de un herbicida y un insecticida en el crecimiento y desarrollo de plantas de algodón (delta de hoja suave). El insecticida y el herbicida se incorporaron al suelo usado en los contenedores de cultivo; se usaron cuatro contenedores cada uno con cinco plantas de algodón, para cada combinación de tratamiento. Los contenedores se arreglaron dentro del invernadero en un diseño totalmente aleatorizado. Se usaron cinco niveles tanto de insecticida como de herbicida para obtener 25 combinaciones. Los datos que siguen son las medias de celdas para el peso de las raíces secas cuando las plantas tenían tres semanas.
HerbicidaInsecticid
a0 0,5 1,0 1,5 2,0
020406080
122,082,7565,7568,0057,50
72,5084,7568,7570,0060,75
52,0071,5079,5068,7563,00
36,2580,5065,7577,2569,25
29,2572,0082,5068,2573,25
Cuadrado medio del error experimental = 174 con 75 GLCalcule las particiones de sumas de cuadrados de regresión con 1 grado de libertad para las sumas de cuadrados de herbicida,
288
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
insecticida e interacción. Calcule un polinomio de grado no mayor a la regresión cúbica para el herbicida o el insecticida.
(273) Se realizó un experimento sobre la duración de tela recubierta sujeta a pruebas con abrasivos normales. El diseño factorial de 2x2x3 incluyó dos sustancias distintas (F1, F2) en tres proporciones diferentes (25%, 50%, 75%) con y sin tratamiento de superficie (S1, S2); se probaron dos especimenes réplica de cada una de las 12 combinaciones en un diseño totalmente aleatorizado. Los datos corresponden a la pérdida de peso (mg) de los especimenes de tela por la prueba de abrasión.
Tratamiento de superficie y sustanciaS1 S2
Proporción sustancia (%)
F1 F2 F1 F2
25
50
75
194208233241265269
239187224243243226
155173198177235229
13716012998155132
Escriba un modelo lineal para el experimento, explique los términos y calcule el análisis de varianza.Prepare una tabla de medias de celdas y marginales con sus respectivos errores estándar.
(274) Un científico de suelos realizó un experimento para evaluar una red de resistencias de cuatro electrodos y calcular la electrocondutividad (EC) del suelo en celdas conductivas de acrílico especiales. El objetivo del estudio era evaluar la relación entre la EC medida y la salinidad del agua en el suelo con diferentes cantidades de agua. Se incluyeron tres texturas básicas de suelo, ya que la EC es específica de la textura; se usaron dos celdas para cada combinación de tratamiento y los tres tipos de suelo fueron arena arcillosa, arcilla y barro. El agua salina, en tres niveles, se basó en la EC del agua a 2,8, y 16 dS/m (decisiemens/metro) y se establecieron tres niveles de contenido de agua en el suelo, 0%, 5% y 15%. El experimento resultante fue un arreglo factorial de 3x3x3 con dos réplicas en un diseño totalmente aleatorizado; los siguientes son los valores de EC del suelo determinados con base en las lecturas de la red de cuatro electrodos.
Salinidad
del agua
2 8 160 5 15 0 5 15 0 5 15
Arena 0,60
1,692,01
3,473,30
0,05
0,110,0
0,06
0,070,0
0,08
0,220,17
289
Palacios C. Severo
Arcilla
Barro
0,48
0,98
0,931,371,50
2,212,483,312,48
5,685,115,475,38
0,120,150,260,720,51
90,230,350,781,11
0,190,40
0,752,101,18
60,070,210,40
0,57
0,140,230,350,720,88
0,430,351,952,87
Escriba un modelo lineal para este experimento, explique los términos y calcule el análisis de varianza.Prepare una tabla de medias de celdas y marginales con sus respectivos errores estándar.
(275) Se colocaron cinco varillas de níquel de 1 mm de diámetro en un sujetador metálico en una suspensión de óxido de aluminio y se aplicó una tensión de 100 volts entre las varillas de níquel y el contenedor con la suspensión de óxido de aluminio. Se registró el grueso de la capa de óxido de aluminio depositada en las varillas a tres posiciones de altura de las varillas; los datos que siguen son el grueso del depósito en micrones.
Posición sujetador varilla de níquelAltur
a1 2 3 4 5
123
125126130
130150155
128127168
134124159
143
118138
Escriba un modelo lineal para este experimento, explique los términos y establezca las suposiciones del modelo.Serán válidas las suposiciones del modelo para este experimentoAdmitiendo esas suposiciones como razonablemente válidas. Calcule el análisis de varianza para los datos.
(276) Un entomólogo realizó un experimento sobre la energía consumida por las abejas de miel al beber, para determinar el efecto de la temperatura del ambiente y la viscosidad del líquido en el consumo de energía.Los niveles de temperatura fueron 20, 30 y 40°C, la viscosidad del líquido se controló por las concentraciones de sacarosa, que eran de 20, 40 y 60% del total de sólidos disueltos en el líquido que bebían las abejas de miel. El entomólogo registró la energía gastada por las abejas en joules/segundo. Los datos que siguen corresponden a tres réplicas de cada uno de los nueve tratamientos en un diseño totalmente aleatorizado.
Temperatura (°C)
Sacarosa (%)20 40 60
20 3,1 3,7 4,7 5,5 6,7 7,3 7,9 9,2 9,3
290
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
3040
6,07,7
6,98,3
7,59,5
11,515,7
12,9
14,3
13,4
15,9
17,5
19,1
15,818,0
14,719,9
Calcule las particiones de regresión de sumas de cuadrados con 1 grado de libertad, las sumas de cuadrados para el % de sacarosa y la interacción.
XXI. DISEÑOS ROTABLES
Para la forma de análisis de datos del modelo que sirve como ejemplo consiste sólo en adecuar una regresión de primer orden a los datos que genera el experimento de simulación, un diseño factorial completo de dos niveles o un fraccionado, Plackett-Burman proporcionarán la precisión suficiente para lograr una estimación de los coeficientes de la ecuación de regresión. No obstante si se adapta un polinomio de segundo orden o de un orden más alto a los datos de salida, un diseño factorial fraccionado puede producir estimaciones de parámetros de los coeficientes de los términos elevados al cuadrado con una precisión relativamente baja.
Un diseño rotacional para ajustar un modelo de segundo orden debe tener por lo menos tres niveles de cada factor. Existen muchos diseños que podrían emplearse para ajustar un modelo de segundo orden.
Uno de los niveles, el central en el cual se repiten las pruebas experimentales, sirven para evaluar la varianza del error experimental desarrollado durante las pruebas y así mismo la variación de los diversos tipos de materiales empleados en las pruebas experimentales.
291
Palacios C. Severo
En este tipo de diseños existen, los que sirven exclusivamente para evaluar tan solo dos factores y otros para tres ó más factores. Se diferencias unos de los otros porque son exclusivos para sus tratamientos y sirven solo para tratar fenómenos cuadráticos, no sirven para tratar fenómenos lineales.
Los diseños para tres o más factores se pueden acondicionar para modelar por bloque, o acoplar cualquier diseño que se desarrolle en el proceso de evaluación sistemática.
XXII. DISEÑOS ROTABLES DE DOS FACTORES
Es un diseño Ortogonal de primer orden, esta configurada en una figura regular equilatera con k+1 vértices en k dimensiones, estás figuras se dan en el plano cartesiano.
A. DISEÑO TRIGONAL
Este es el diseño más simple que existe en los proceso de evaluación de factores de primer orden. Si k=3 es un triángulo equilátero regular.
X1 X2
1-0,50,5000
0-0,86-0,86
000
B. DISEÑO PENTAGONAL
Es uno de los más simples de segundo orden, los puntos experimentales corresponden a un pentágono.
Es un diseño con el cual se puede elaborar un nuevo tipo de análisis, se deja al estudioso a fin de poder evaluar e interpretar un nuevo diseño para el futuro, dicho diseño se puede aplicar desde dos factores a n factores como una alternativa de diseño experimental.
292
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
X1
X2
1, 0
0,31; 0,950,31; -0,95
-0,81; -0,58 -0,81; 0,58
0; 0
2
4
6
810
3
1
5
7
9
Representación esquemática del Diseño Pentagonal
X1 X2
10,31-0,81-0,810,31
000
00,950,58
-0,58
-0,95
000
C. DISEÑO HEXAGONAL
Es un diseño utilizado en investigación, cuando en el proceso se estudian solo dos factores, debiendo ser este siempre cuadrático, si el proceso es lineal dicha técnica no es aplicable. Si el proceso en estudio tuviera tres o más factores, no se puede desglosar y estudiar de par en par, es necesario para este caso desarrollar la técnica del Diseño Compuesto Central o Estrella.
El diseño hexagonal consiste en desarrollar seis pruebas experimentales correspondientes a los vértices de un hexágono regular, siendo necesario replicar pruebas centrales para estimar el error experimental.
293
Palacios C. Severo
-0.5, 0.8 6 6 0.5, 0.8 6 6
1, 0-1, 0
-0.5, -0.8 6 6 0.5, - 0.8 6 6
0, 0 X1
X 2
Representación esquemática del Diseño Hexagonal
Este diseño es de amplia utilidad a nivel experimental, como su nombre lo indica, los puntos corresponden a un hexágono, considerando de tres a cinco puntos centrales.
X1 X2
10,5-0,5
-1-0,50,5000
00,8660,866
0-0,866-0,866
000
Ejemplo 6.81Se estudia dos factores con valores reales, los cuales son codificados por las ecuaciones de recta que se representan mediante las ecuaciones lineales que corresponden dos factores reales mediante las siguientes funciones.
A = 0,375X1 + 1,125B = 1X2 + 2
X1 X2 A B Y Ycal Y - Ycal (Y-Ycal)2
10,5-0,5
-1-0,10,5000
00,860,86
0-0,86-0,86
000
1,51,310,94
0,750,94
1,311,25
22,872,87
21,131,13
222
93,989,688,883,381,989,390,890,289,3
94,5190,2
888,4
084,7081,8289,9390,17
-0,63-0,030,87
0,3970,0010,757
294
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
1,251,25
90,1790,17
0,21 1,155
14,13/21,0155,1 2 =−=errorSC
48,1109/1,79797,70706 2 =−=totalSC
Tabla 6.90 Análisis de varianza de regresiónFuente SC GL CM Fo Ft(99
)RegresiónError
109,34
1,14
62
18,220,57
31,96 > 19,3
Total 110,48 8 R2 = 98,96%
Tabla 6.91 Análisis de varianza de ajusteFuente SC GL CM Fo Ft(99
)AjusteError
3,221,14
12
3,220,57
5,649 < 18,5
Total 4,36 3 R2 = 73,85%
Ejemplo 6.82Se procesa un mineral aurífero con sales oxidantes en medio ácido, se desea evaluar que factores son significativos (cloruro y nitrato de sodio), con el fin de llegar a establecer el óptimo de recuperación.
A: NaCl 25 50B: NaNO3 5 15
Efectos e interacciones CuadráticosA: NaCl = -6263,28B: NaNO3 = -2431,04AB = -508,721
AA = -895,833BB = -229,854
Errores estándar con 3 GL
Tabla 6.92 Análisis de varianza de regresiónFuente SC GL CM Fo Ft(99)
A: NaClB: NaNO3
AAABBBError
13,013726,331
29,8613
312,25
24,6613
0,71333
111113
13,013726,33129,86133
12,2524,66130,23777
8
54,73110,7441,4751,52103,7
2
>>>>>
34,1234,1234,1234,1234,12
295
Palacios C. Severo
Total 128,76 8 R2 = 99,446%
333 .06,4²597,4²866,2453,1166,53667,89 NaNONaClNaNONaClNaNONaClAu −−−++=
La recuperación de oro depende de los dos factores para llegar al óptimo, esto en forma lineal, pero los factores cuadráticos y la interacción tienen efecto negativo para la extracción de dicho metal precioso.
Valor óptimo = 92,0389Factor Bajo Alto ÓptimoNaCl
NaNO3
-1,0-0,28
1,00,86
1,0-0,28
25NaNO3
15
Gráfica de Efectos Principales para Au
-9300
-7300
-5300
-3300
-1300
Au
NaCl50 5
25
NaNO3=5
NaNO3=15
Gráfica de Interacción para Au
-11
-9
-7
-5
-3
-1(X 1000.0)
Au
NaCl50
NaNO3=5
NaNO3=15
Efectos significativos de factores principales
No existe interacción entre ambos factores principales
En el gráfico de interacciones podemos establecer que ambos factores están en su máximo, y se mantienen como constantes ya que al incremental del nivel mínimo al máximo la extracción de oro decrese y eso no es recomendable.
No existe interacción entre ambos factores, por lo que se puede manipular independientemente cada uno de ellos.
Contornos de la Superficie de Respuesta Estimada
25 30 35 40 45 50
NaCl
5
7
9
11
13
15
NaN
O3
Au-11000.0--10000.0
-10000.0--9000.0-9000.0--8000.0
-8000.0--7 000.0
-7000.0--6000.0
-6000.0--5000.0
-5000.0--4000.0-4000.0--3000.0
-3000.0--2000.0
-2000.0--1000.0-1000.0-0.0
Superficie de Respuesta Estimada
25 30 35 40 45 50NaCl
57
911
1315
NaNO3-11
-9
-7
-5
-3
-1(X 1000.0)
Au
Au
-11000.0--10000.0-10000.0--9000.0-9000.0--8000.0-8000.0--7000.0-7000.0--6000.0-6000.0--5000.0-5000.0--4000.0-4000.0--3000.0-3000.0--2000.0-2000.0--1000.0-1000.0-0.0
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
296
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
El óptimo de recuperación de oro es 92,0389, cuando se trabaja con un máximo de NaCl y un mínimo de NaNO3.
Problemas
(277) El estudio experimental que se presenta, estuvo orientado a determinar las granulometrías óptimas tanto en la etapa de Rougher como de Scanvenger. Se desea optimizar la recuperación y el grado de concentración en función de la molienda.
6868687066646670721=X
7676766868768484762=X
Para optimizar estas dos variables, se obtuvo los modelos matemáticos:
21
2
2
2
1211 034,0083,022,013,105,27411,1 XXXXXY −++−−=
21
2
2
2
1212 04,0063,0228,03,1215,34602,1 XXXXXY −−−+−−=Desarrolle el ANAVA y la superficie respuestaObtenga el óptimo cuando se alcanza un 66%
(278) Se estudia un experimento de flotación a nivel laboratorio siendo sus factores A: tiempo, B: espumante.
3,842,9086,903,899,813,838,886,899,93:
12,112,112,131,194,075,094,031,15,1:
22213,113,1287,287,22:
Y
B
A
Obtenga el modelo del procesoAnalice aplicando el ANAVA
(279) Se efectuó un proceso electrolítico de fabricación de ocre, cuyo rendimiento esta en función de dos variables A: cloruro de sodio, B: intensidad de corriente.
6,825,835,816,863,808,784,756,905,85:
5,425,425,423,273,275,427,577,575,42:
5,85,85,82,97,777,72,910:
Y
B
A
Obtenga el modelo del procesoAnalice aplicando él ANAVACree usted la temperatura influye en el procesoElabore el diagrama Eh-pHDe que color es el ocre producidoSin en vez de cloruro de sodio utiliza un electrolito de nitrato de sodio, cual es el producto final.
297
Palacios C. Severo
D. DISEÑO OCTOGONAL
Es un diseño utilizado en investigación, cuando en el proceso se estudian tan solo dos factores, debiendo ser estos siempre cuadráticos (dinámicos), si el proceso es lineal dicho diseño no es aplicable.
Si el proceso en estudio tuviera más de tres factores, no se puede desglosar y estudiar de par en par, es necesario para este caso desarrollar otra técnica de análisis de Diseño.
Es un diseño de segundo orden, corresponde a un octágono regular en el plano.
X2
X1
1, 0-1, 0
0, 1
0, -1
0,71; 0,71
0,71; -0,71-0,71; -0,71
-0,71; 0,71
0; 0
Representación esquemática del Diseño Octogonal
Diseño de amplia utilidad a nivel experimental, como su nombre lo indica, los puntos corresponden a un octágono considerando de tres a cinco puntos centrales, para evaluar el error experimental.
X1 X2
-0,710,71-0,710,71
1-1
-0,71-0,710,710,71
00
298
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
00000
1-1000
Ejemplo 6.83Se estudian dos factores dinámicos de un proceso en donde se desarrolla un novedoso trabajo, los cuales vienen establecidos mediante las funciones que a continuación se detallan.
A = 0,005X1 + 0,025B = 2X2 + 27,5
X1 X2 Y Ycal Y - Ycal (Y-Ycal)2
-1100
-0,71-0,710,710,71
0000
00-11
-0,710,71-0,710,71
0000
90,90
92,20
92,80
93,60
92,20
93,5093,3
094,0
094,1094,3
093,9
094,0
0
91,3892,5993,0
894,1991,8192,9
393,1093,4
994,0
294,2
094,0
294,0
2
-0,08-0,280,120,02
0,0060,080,010,02
-0,22 0,0964
[ ] 0834,04/22,00964,0 2 =−−=errorSC
[ ] 48667,1112/111894,104320 2 =−=totalSC
Tabla 6.93 Análisis de varianza de regresiónFuente SC GL CM Fo Ft(99
)
299
Palacios C. Severo
RegresiónError
11,40237
0,0843
83
1,4250,023
1
50,7 > 27,5
Total 11,48667
11 R2 = 0,99266%
Tabla 6.94 Análisis de varianza de ajusteFuente SC GL CM Fo Ft(99
)AjusteError
1,52570,084
3
13
1,52570,023
1
54,24 > 34,1
Total 1,61 4 R2 = 0,9476%
E. DISEÑO COMPUESTO CENTRADO
Si se desea cuantificar el efecto de una variable y sus interrelaciones para un producto dado, se puede hacer la suposición de que la respuesta que se quiere evaluar es una función de las variables más importantes que afectan el proceso y con base a ella se plantea un modelo matemático.
- ∞ + ∞
- ∞
+ ∞
1,1
1,-1
-1,1
*1,*1
0,0 X1
X2
Representación esquemática del Diseño Compuesto Centrado
El modelo matemático que relaciona la respuesta buscada y las variables estudiadas es del tipo.
∑∑ ∑ ∑∑ +++++= kjiijkjjjjjjjiijiiiiiio XXXAXAXXAXAXAAY 32
Donde:
Y Estimación del vector respuesta buscada
300
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Ao, Ai, Aii, Aij, Ajjj, Aijk Son los coeficientes del modeloXi, Xij Valores de las variables codificadas
Para estimar los coeficientes del modelo se utiliza el diseño compuesto centrado rotacional que se construye a partir de tres componentes.
a-1) Un bloque factorial de 2k puntos, donde cada variable toma los valores codificados -1 y +1, hasta cinco variables como máximo.
a-2) Un bloque factoriaI fraccionado 2k-1 puntos, donde cada variable toma los valores codificados -1 y +1, cuando hay más de cinco variables.
b) Un conjunto de puntos adicionales cuyo número es 2k donde cada variable toma los valores codificados -2k/4 y +2k/4. La figura formada por estos puntos se llama estrella.
c) Un punto central cuyos valores codificados es cero, este punto se repite las veces que sea necesario para la estimación del error experimental.
Para explicar el concepto de rotabilidad, supóngase que el punto (0, 0,..., 0) representa el centro de la región en la cual la relación entre la respuesta buscada Ycal Y las variables independientes Xi que están siendo investigadas, está dada por la ecuación general que representa una superficie de alto orden.
De los resultados de cualquier experimento se puede calcular S(Y) del error estándar de Ycal en cualquier punto de la superficie ajustada. Este error estándar será una función de las coordenadas del punto Xi, En un diseño rotacional, este error estándar es el número para todos los puntos que están a la misma distancia L del centro de la región; esto para todos los puntos tales que:
CtteLXXX k ==+++ 222
21 ...
Así para un diseño de tres variables se tiene que cada variable asume los siguientes valores codificados:
-1, +1, 0, -2k/4 y +2k/4
La ecuación del tipo:
211222222
211112211 XXAXAXAXAXAAY o +++++=
301
Palacios C. Severo
La codificación de las variables se obtiene de:
b
aVX i
i
−=
Donde:
Vi Nivel de la variable real escogidaa Valor de la variable en el punto centralb Amplitud del valor real
Podemos indicar que los valores -1 y +1 corresponden a los niveles inferior y superior de un rango de experimentación encontrada bien sea por investigación de referencias especializadas en el proceso estudiado o por experiencia propia.
Los puntos estrella -2k/4 y +2 k/4 son puntos por fuera del rango y se incluyen con propósitos exploratorios.
El punto central con valor cero representa un nivel en el proceso con el que se supone se obtiene buenos resultados.Supongamos que un proceso depende de tres variables, una de las cuales es la temperatura con un rango de nivel de 30 a 50, se tiene que:
a - 1 = 30a + 1 = 50
El valor medio se obtiene por;
[30+50]/2 = 40 = a
Luego
[ ][ ][ ] 8 2,5 61 0/4 02
1 8,2 31 0/4 02
1 0/4 03 01
224/
11
4/
=→−=+=→−=−
=→−=−
VV
VV
bb
k
k
Así tenemos los cinco valores de la temperatura, que se usarán en el bloque de experimentación; de igual manera se procede para las otras variables.
302
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Ejemplo 6.84Se estudia la lixiviación (lavado) de un suelo salino para utilizar dicho suelo en la siembra de hortalizas. Aplicaremos dos variables A: lavado alcalino y B: flujo de lavado.
X1 X2 A B Y-+-+
-1,41+1,41
0000000
--++00
-1,41+1,41
00000
23372337204030303030303030
1,31,32,72,7221322222
50,0085,6197,6285,7673,3976,9252,9282,5378,0284,6179,1264,8488,46
Tabla 6.95 Análisis de varianza de regresiónFuente SC GL CM Fo Ft(99
)RegresiónError
1759,2478,8
57
351,868,4
5,14 > 3,97
Total 2238 12 R2 = 0,786%
Ejemplo 6.85El efecto de las interacciones comparadas con los efectos del primer y segundo orden estimado. Los efectos de alto orden no se pueden ignorar. Por lo que efectuamos puntos extras para obtener un diseño de segundo orden.
A: 137 147 157B: 32,5 37,5 42,5C: 5,5 8,5 11,5
X1 X2 X3 Y02-20000
0002-200
000002-2
66,965,456,967,565,068,960,3
Para estimar los coeficientes bo, b11, b22, b33 obtenemos la ecuación correspondiente.
303
Palacios C. Severo
9,1041408816
1,105584816
3,1041884016
97616161615
332211
332211
332211
332211
=+++=+++=+++=+++
bbbb
bbbb
bbbb
bbbb
o
o
o
o
Obteniéndose
11,67=o
b 944,11 =b 906,02 =b 069,13 =b 539,111 −=b
264,022 −=b 676,033 −=b 088,312 −=b 188,213 −=b 212,123 −=b
Ejemplo 6.86Un investigador analiza un proceso en donde influyen dos factores: tiempo y temperatura.
Desea evaluar el efecto significativo de ambos factores.
A: tiempo (min.) 80 90B: Temperatura (°F) 170 180
A: tiempo
B: Temperatura Y
80908090
77,928992,0711
85858585858585
170170180180175175
167,929182,071
175175175175175
78,577,078,079,575,678,477,078,579,980,3
80,0
79,779,8
Efectos estimados para YEfectos e interacciones Cuadráticos
A: tiempo = 0,989949B: Temperatura = 1,03033AB: = 1,5
AA = 2,50248BB = -1,78252
Errores estándar con 7 GL
304
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Ambos factores tienen efecto sobre el proceso, pero el que tiene mayor efecto significativo es la temperatura, seguido del tiempo.
Existe interacción entre ambos factores, por lo que si se manipula un factor el otro también es modificado.
Tabla 6.96 Análisis de varianza de regresiónFuente SC GL CM Fo Ft(99)
A: tiempoB: TemperaturaAAABBBError
1,96001
2,121610,891
32,25
5,34129
3,7051
111117
1,96001
2,121610,891
32,25
5,34129
0,5293
3,704,01
20,584,25
10,09
<<><>
5,595,595,595,595,59
Total 24,5277
12 R2 = 84,8942%
En la tabla del análisis de varianza podemos establecer que para un 95% de la estadística de F, se puede notar que los dos factores principales no tienen influencia en dicho rango. Pero los efectos cuadráticos si tienen influencia en dicho rango para un coeficiente de correlación del 84,8942 por ciento.
aTemperaturtiempoaTemperatur
tiempoaTemperaturtiempoY
.03,0²03505,0
²05,082069,935742,3283,935
+−−++−=
En el modelo matemático se puede notar que la constante esta en su máximo, el cual deberá de minimizarse hasta el valor medio de los niveles. Se ve que ambos factores tienen influencia para incrementar la constante hasta un valor positivo, la interacción también tiene efecto significativo sobre el proceso.
Camino de Máximo Ascenso para Ytiempo Temperatura Y
85,086,087,088,0
175,000176,206177,825177,024
79,940080,098480,118680,0336
Al incrementar el tiempo en una unidad y la temperatura de igual manera, se nota que a un tiempo de 88 minutos y una temperatura de
305
Palacios C. Severo
177,024 °F se obtiene una respuesta de 80,0336, cercano al valor óptimo de la maximización.
Valor óptimo = 80,133Factor Bajo Alto Óptimo
tiempoTemperatura
77,9289167,929
92,0711182,071
86,6416177,174
Al maximizar el proceso, se nota que para llegar al óptimo se requiere un tiempo de 89,9415 minutos y una temperatura de 177,174 °F, para obtener un valor óptimo de 80,133.
80Temperatura
180
Gráfica de Efectos Principales para Y
78
78.4
78.8
79.2
79.6
80
80.4
Y
tiempo90 170 80
Temperatura=170
Temperatura=180
Gráfica de Interacción para Y
77
77.5
78
78.5
79
79.5
80
Y
tiempo90
Temperatura=170
Temperatura=180
Efectos significativos con tendencia cuadrática
Existencia de Interacción en proceso cuadrático
En la figura se puede notar que ambos efectos no tienden al máximo, ya que tienden al nivel promedio en ambos casos, al incrementar sobre el máximo la respuesta tiende a minimizarse, por lo que es necesario realizar el estudio hasta el valor medio.
En la figura de interacción esta entre el valor mínimo y el valor promedio en ambos factores, por lo cual se confirma que deberá trabajarse entre el valor medio y el promedio de ambos factores.En la figura del plano el óptimo esta a un tiempo de 87 minutos y una temperatura de 177 °F para obtener una respuesta sobre 80.
306
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Contornos de la Superficie de Respuesta Estimada
80 82 84 86 88 90
tiempo
170
172
174
176
178
180T
emp
era
tura
Y77.0-77.477.4-77.877.8-78.278.2-78.678.6-79.079.0-79.479.4-79.879.8-80.280.2-80.680.6-81.081.0-81.4
Superficie de Respuesta Estimada
8082
8486
8890tiempo 170 172 174 176 178 180
Temperatura
77
78
79
80
81
Y
Y77.0-77.477.4-77.877.8-78.278.2-78.678.6-79.079.0-79.479.4-79.879.8-80.280.2-80.680.6-81.081.0-81.4
Superficie respuesta estimada en el plano Superficie respuesta estimada en el espacio
En la figura del espacio se puede establecer que para llegar al óptimo, ambos factores tienden al valor promedio de los niveles para llegar al óptimo.
Ejemplo 6.87Se investiga un proceso con el fin de optimizar los factores X1 y X2 si son significativos y los rangos en donde están dichos valores óptimos.Se dan los niveles de dichos factores y el vector respuesta.
X1: 1,5 8,5X2: 0,1 0,3
X1 X3 Y1,58,51,58,5
0,05029,9497
5,05,05,05,0
0,10,10,30,30,20,2
0,05850,3415
0,20,2
1,231,8911,0851,0950,8481,1322,1691,2281,4131,139
Efectos estimados para YEfectos e interacciones Cuadráticos
A = 0,2682B = -0,5680AB = -0,3257
AA = -0,2954BB = 0,4130
Errores estándar con 4 GL
Tabla 6.97 Análisis de varianza de regresiónFuente SC GL CM Fo Ft(95)
ABAAABBBError
0,14390,64540,09970,106110,194990,0662
111114
0,14390,64540,09970,106110,1949
9
8,6938,946,026,4011,7
>><<>
7,717,717,717,717,71
307
Palacios C. Severo
9 0,01657
Total 1,46927 9 R2 = 95,4879%
2122
2121 4653,0653,200120,0774,82519,0711,1 XXXXXXY −+−−+=
El vector respuesta depende del factor X1 para llegar al óptimo, esto en forma lineal, pero el factores cuadráticos X1 y la interacción tienen efecto negativo sobre dicho vector.
Camino de Máximo Ascenso para YX1 X2 Y5,06,07,08,09,010,0
0,20,1152
20,0025-0,1193-0,244-0,372
1,2761,73092,8534,7417,41610,88
4
Valor óptimo = 2,31558Factor Bajo Alto Óptimo
X1
X2
0,050250,05857
9,94970,34142
9,31950,0585
1.5X2
0.3
Gráfica de Efectos Principales para Y
0.99
1.19
1.39
1.59
1.79
Y
X18.5 0.1 1.5
X2=0.1
X2=0.3
Gráfica de Interacción para Y
1
1.2
1.4
1.6
1.8
2
Y
X18.5
X2=0.1
X2=0.3
Efectos significativos con tendencia cuadrática
Interacción en proceso cuadrático
Contornos de la Superficie de Respuesta Estimada
0 2 4 6 8 10
X1
0.1
0.14
0.18
0.22
0.26
0.3
X2
Y0.7-0.850.85-1.01.0-1.151.15-1.31.3-1.451.45-1.61.6-1.751.75-1.91.9-2.052.05-2.22.2-2.35
Superficie de Respuesta Estimada
0 2 4 6 8 10X1
0.1 0.14 0.18 0.22 0.26 0.3
X2
0.7
1
1.3
1.6
1.9
2.2
Y
Y0.7-0.850.85-1.01.0-1.151.15-1.31.3-1.451.45-1.61.6-1.751.75-1.91.9-2.052.05-2.22.2-2.35
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
308
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Problemas
(280) Se estudian tres variables A: 6 - 10, B: 70 - 90 y C: 780 - 1080 rangos establecidos en base a experiencia.a) Analizar el bloque factorial: si existe curvatura, utilice el método de pendiente ascendente e incremente el bloque estrella.b) Analice el punto estacionario y el análisis canónico.
8359827679608062:FY737575787677:CY
747875708253:Yc) Obtenga el modelo correspondiente.d) Desarrolle el análisis de varianza.e) Analice, interprete y opine.
(281) Se estudian cuatro variables A: 1,5 - 3, B: 15 - 25, C: 0, 5 - 1, D: 800 - 1000.Evalué tal como el problema 256.
(282) Se quiere evaluar un proceso en donde se nota la influencia de dos factores A: 400 - 600 y B: 3,5 - 5.
88929193899785908999899892:YObtenga el modelo
ABBABAY 9,0²9,0²392 ++−++=Analice mediante los métodos de punto estacionario y canónico.
(283) Un proceso electrolítico, cuyo rendimiento esta en función de las variables A: 20 - 40 Y B: 1 - 3. Obtenga el modelo y analice.
82838180818078759085:1X(284) Con el estudio experimental se desea determinar las
condiciones óptimas siendo sus factores
686868706664667072:1X
687676686876848476:1XEl modelo es:
2122
2121 034,0083,022,013,105,27411,1 XXXXXXY −++−−=
(285) Se estudia un experimento a nivel laboratorio siendo sus factores.
13,113,113,131,194,075,094,031,15,1:1X
22213,113,129,29,22:2X3,892,909,903,899,813,838,887,899,93:Y
309
Palacios C. Severo
Siendo el modelo
2122
2121 16,101,349,2539,4298,30 XXXXXXYCu +−+−−=
(286) Se estudia la lixiviación con ácido sulfúrico, de una calcina, obtenida y de la tostación en presencia de aire, con adición de óxido de calcio, en horno monosolera Bach, de un concentrado de calcopirita rico en pirita. La calcina es de la siguiente composición: 15,91 % de cobre, 38,06% de hierro, 11,45% de azufre y 3,55% de insolubles.
(287) Se estudia las variables A: concentración de ácido; B: temperatura, C: velocidad de agitación. Siendo su vector respuesta.
7375757877778359826779608062:YObtenga el modeloAnalice el ANAVAAplique el método para evaluar la curvatura
(288) Dado el alto contenido de hierro de los licores de lixiviación, que se obtienen, se procede a la purificación del cobre con Lix 64N, a partir de licores con 3,59 g/l de cobre y 1,14 g/l de hierro, en lo que se relaciona con el efecto de alguna variables como el pH, concentración de extracción, relación de fases, agitación y concentración de ácido. Obteniéndose los modelos.
2122
2121 5,016,115,123,223,194,96 XXXXXXYCu +−−−+=
2122
2121 95,111,489,337,125,174,12 XXXXXXYFe +−−−−=
Analice mediante el ANAVAEstablezca los rangos de las variables
(289) Se quiere evaluar un proceso de tostación de un concentrado sulfuroso de zinc, se requiere evaluar la temperatura y la adición de aire, para la experimentación se evaluaron los factoresA: temperatura, B: aire. Siendo su vector respuesta.
6,884,921,918,932,898,977,855,901,895,999,895,984,92:YObtenga el modeloAnalice mediante el ANAVAEstablezca los rangos de las variables
(290) Considere el modelo de primer orden
21 8,05,150 XXY −+=Donde 11 ≤≤− iX . Determine la dirección de máximo ascenso y planifique un conjunto de experimentos siguiendo dicha dirección
310
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
(291) Los siguientes datos fueron recogidos por un ingeniero de planta. La respuesta Y es el tiempo de filtrado, X1 es la temperatura y X2 es la presión.
X1 X2 Y-1 -1 54-1 1 451 -1 321 1 47
-1,414 0 50-1,414 0 53
0 -1,414 470 1,414 510 0 410 0 390 0 440 0 420 0 40
Qué tipo de diseño usó el ingeniero, cuáles son sus ventajas.Ajuste un modelo de segundo orden, verifique su validez y analice la superficie ajustada.Cuáles serían sus recomendaciones si se desea minimizar el tiempo de filtrado.
(292) Se desea minimizar el valor de la ceniza en la pulpa de papel (una medida de las impurezas inorgánicas). Se estudian dos variables: temperatura en ºC y tiempo en horas. Estas variables se codifican como se indica a continuación:Estas variables se codifican como se indica a continuación:
115775
1
−= atemperaturX ,
5.13
2
−= tiempoX
Se lleva a cabo un experimento cuyos resultados se muestran a continuación:
X1 X2 Y-1 -1 2111 -1 92-1 1 2161 1 99
-1,5 0 2221,5 0 480 -1,5 1680 1,5 1790 0 1220 0 1750 0 1570 0 146
Qué tipo de diseño experimental se ha usado. Es rotable.El modelo cuadrático ajustado es
311
Palacios C. Severo
2122
2121 5,05829,105281,63529,347059,580445,150 XXXXXXY ++−+−=
Fuente SC GL CM Fo Ft(99)ModeloError
30688,71478,22
56
6137,74
246,37
24,91 > 8,75
Total 32166,92
11 R2 = 95,40
¿Es bueno el ajuste de este modelo?Calcule el punto estacionario. ¿Qué tipo de punto es?(puede usar que los autovalores de la matriz son -6,8982802 y 0,6201222)
1 0 . 5 8 2 9 50 . 2 5
0 . 2 5 6 . 5 2 8 1 5 8-
(293) Un ingeniero está investigando la influencia de la temperatura, la presión y la concentración del catalizador en tiempo que tarda una reacción en llevarse a cabo. Tras varios experimentos, el investigador ajustó la función
23
22
2132
3121321
717,312,5091,6706,4
078,78089,13165,12241,54989,6630
XXXXX
XXXXXXXY
−−−−
−++−+=
Usando un diseño central compuesto con cinco puntos centrales. Las variables codificadas son las siguientes:
8
350)(1
−°= CatemperaturX
20
612)(2
−= psipresiónX
03.0
15.03
−= iónconcentracX
Hágale al ingeniero las sugerencias que considere adecuadas.
312
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
F. DISEÑO EXPERIMENTAL COMERCIAL – EXCO
En muchos países latinoamericanos, existe una discontinuidad en el proceso de transferencia de tecnología en el sector agropecuario. En la mayoría de los casos los resultados de las investigaciones efectuadas a nivel de centros de investigación, estaciones experimentales, etc., no son sometidos a los diferentes pasos del proceso, los cuales conllevan a la adopción o revisión de la tecnología. Esta situación obedece a factores que casi siempre escapan al alcance de los investigadores. De allí se desprende la iniciativa de implementar procedimientos para la validación de resultados experimentales, que representen un avance en el proceso de investigación. En este contexto se enmarca la metodología del Diseño Experimental Comercial (EXCO).
El objetivo de el presente estudio es el de aplicar el Diseño EXCO en la validación de los resultados de un experimento en el que se investiga el efecto de la fertilización nitrogenada y la densidad de siembra en el cultivo de maíz.
Con el objetivo de determinar los mejores niveles de fertilización nitrogenada y densidad de siembra en el cultivo de maíz), se llevó a cabo un ensayo bajo el diseño experimental de bloques al azar con dos
313
Palacios C. Severo
repeticiones, y unidades experimentales de 30 m2 con 10 m2 de área efectiva. En cada bloque fueron distribuidos al azar 24 tratamientos, los cuales fueron el resultado de la superposición de los diseños Factorial 32, Compuesto Central Rotable (k=2, no=5) y Compuesto Central Rotable Doble Estrella con un nuevo núcleo estrella añadido (k=2, c=2, no=4).
Tratamientodiseño Nivel real
Tratamientodiseño
Nivel real
ensayo
32 DCR
DCRE
D N ensayo
32 DCR
DCRE
D N
123456789*
10*11*12*
------465555
123456789101112
1234131415169101112
6666949460100
808080808080
40200
40200
120120
0240
120120120120
13*14*15161718192021222324
55123789----
13-----------
--------5678
808066666694949470908080
120120
01202400
120240
12012060180
D: Densidad de siembra (Plantas/ha)x 103 ; N: Nitrógeno (kg/ha); * Tratamientos centrales
La situación antes descrita se aprecia fácilmente al observar la tabla anterior, en el que se ilustran las 24 combinaciones de los niveles reales de los factores, comunes y no comunes para los arreglos de tratamiento señalados.
De forma simultánea al establecimiento del experimento, se sembró una parcela comercial de 7000 m2 aproximadamente. A dicha parcela se le aplicó la combinación de niveles de los factores correspondientes al tratamiento central del ensayo.
Si la producción de la parcela arroja un valor comprendido en el intervalo de confianza generado a partir de las repeticiones del tratamiento central del experimento, se consideran validados los resultados. Este intervalo de confianza está dado por la siguiente expresión:
314
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
αµ −=
++<<− −∞−∞ 1
)1(2/)1(2/
o
TC
GLnTC
o
TC
GLnTC
n
StX
n
StXP
Donde:
STC Desviación típica de la variable para las no réplicas del tratamiento central.
no Número de réplicas del tratamiento central.
GLnt )1(2/ −∞ Valor tabulado de "t Student", a la derecha del cual hay un área de a/2.
1 – a Coeficiente de confianza.µ Parámetro a estimar.
Se realizó la validación general del experimento y para cada uno de los arreglos de tratamiento involucrados.
El la tabla 6.98 contiene la información del rendimiento obtenido para las réplicas del tratamiento central del ensayo, el cual, como se expresó en la metodología, es el mismo tratamiento aplicado a la parcela comercial.
Tabla 6.98. Rendimiento (kg/ha de maíz al 12 % de humedad) para las replicaciones del tratamiento central del ensayo experimental
tratamiento
Bloque Rendimiento
tratamiento
Bloque Rendimiento
91011121314
111111
388633202929375041463263
91011121314
222222
488359725281466342564517
TCX 4239 Kg/ha µ = 0,05
STC 886,6 kg/ha no = 12
Con estos datos se calcularon los promedios y desviaciones típicas necesarias para obtener los intervalos de confianza.
Intervalo de Confianza General
IC(95%): 3675,68 kg/ha 4082,32 kg/ha
Intervalo de Confianza para el Factorial 32
315
Palacios C. Severo
IC(95%): 2057,16 kg/ha 5586,70 kg/ha
Intervalo de Confianza para el Diseño Central Rotable
IC(95%): 3691,10 kg/ha 4799,51 kg/ha
Intervalo de Confianza para el Diseño Central Rotable Estrella
IC(95%): 3508,64 kg/ha 4912,36 kg/ha
El rendimiento de la parcela comercial fue de 3714 kg/ha, valor que está comprendido en todos los intervalos de confianza generados a partir de los datos experimentales, por lo tanto se consideran validados los resultados.
Ello implica que la respuesta obtenida a nivel experimental puede ser reproducida en una escala mayor, bajo las mismas condiciones de manejo del cultivo. Trabajando en el campo hortícola han llegado a conclusiones similares y satisfactorias al aplicar la metodología.
Estos resultados son muy favorables ya que permiten hacer inferencia sobre la posibilidad de aplicación de tecnologías en medio real, circunstancias en las que la inferencia a partir de los resultados experimentales solamente, se ve ciertamente limitada. El diseño EXCO es aplicable en ensayos con el cultivo de maíz, permitiendo la formulación de recomendaciones más cercanas a la realidad y facilitando el ajuste de los tratamientos con la finalidad de realizar una mejor caracterización de la región de exploración en experiencias futuras.G. DISEÑO SEVERO
Propuesto por el Autor, como un diseño de n-niveles para ajustar superficies respuestas lineales y polinomiales de una misma estructura de diseño.
Este diseño esta formado por los puntos medios de un cubo, dicha figura geométrica es establecida para el presente estudio.
La figura geométrica de un diseño convencional es un cubo de 1 unidad por 1 unidad, en el caso del diseño SEVERO al cubo normal de 1 por 1, se le achura los vértices, a partir del centro de los lados del cubo, tal como se visualiza en la figura.
316
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Al cubo de 1 por 1 se le achura las aristas al medio del cubo, es decir a la mitad (0,5) obteniéndose de esa manera la siguiente figura geométrica.
1
11
Estructura del Diseño SEVERO
El presente diseño no solo trabaja con los máximos y mínimos tal como los diseños convencionales (+1, -1), aquí se trabaja con el rango de +0,5 y -0,5 logrando con dicho rango disminuir en el consumo de reactivos, materiales, insumo, tiempo, etc.
Beneficiando de dicha manera cualquier proceso que se desarrolle en el ámbito experimental tanto a nivel de laboratorio como industrial.Es importante mencionar que el presente diseño nace como una herramienta para poder cuantificar los procesos productivos, ya que en estos momentos padecemos de insumos y sobre todo del tiempo necesario para desarrollar experimentos amplios.
Siendo los puntos extremos del nuevo vértice (puntos oscuros) los puntos factoriales y rotacionales y los puntos sobresalientes (puntos claros) los puntos estrellas para una rotacional n factorial.
Observemos que el Diseño SEVERO no tiene puntos en los vértices de la figura creada por los niveles inferior y superior para cada variable.
317
Palacios C. Severo
Esto es ventajoso cuando los puntos en los vértices representan combinaciones de factor-nivel por ser antieconómico e imposible de probar debido a restricciones del proceso.
Geometría del Diseño SEVERO
Los efectos de las interacciones de tercer orden no existen en el presente caso, por estar confundidos.
Los diseños descritos son de mucha utilidad en procesos en donde el insumo, personal y material son restringidos, ya que los niveles del proceso se acortan hasta en un cincuenta por ciento, siendo esto muy loable y económico para analizar cualquier investigación.
Se estudia en primer lugar el diseño factorial centrado con dos factores, en la tabla se muestran los valores codificados del diseño factorial centrado con dos factores, principio fundamental del denominado diseño Severo, además se ilustra gráficamente las coordenadas por donde se desarrolla el presente trabajo.
DISEÑO FACTORIAL CENTRADO DE DOS FACTORES
318
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
X1
- 0,5
0,5
0,5
X2 X1 X2
-0,5+0,5-0,5+0,5
000
-0,5-0,5+0,5+0,5
000
El diseño factorial centrado de dos factores, se crean las siguientes condiciones, al establecer los puntos de los vértices (puntos oscuros) y como punto central el vértice (punto claro), como podrá notar que los punto oscuros están configurados en los puntos extremos del nuevo vértice del cubo, por lo cual viene a ser el punto central del cubo principal (±0,5) (similar al diseño factorial) y el punto central (0, 0) el cual forma la campana de Gauss.
De acuerdo a ello podemos visualizar que el punto central no recae directamente en el plano sino que esta formando una campana de Gauss, con lo cual se establece que dicho punto no esta en el plano sino en el espacio, lo cual favorece notablemente en el análisis no es como en los diseños convencionales.
Esa pequeña diferencia entre el diseño convencional y el diseño presente es una nueva alternativa para demostrar que el punto central nos configura un diseño rotable directamente.
Ejemplo 6.88En un proceso de electrodeposición de cobre, se procedió a evaluar los factores a tres niveles:
FactoresNiveles
- 0 +A: Voltaje (Voltios)B: Densidad corriente (A/m²)
130
235
340
Prueba X1 X2 A B Y12345
-0,5+0,5-0,5+0,5
0
-0,5-0,5+0,5+0,5
0
1,52,51,52,52
32,532,537,537,535
8586989789
319
Palacios C. Severo
67
00
00
22
3535
8988
Los valores reales para desarrollar las pruebas experimentales, las obtenemos utilizando la siguiente expresión:
b
aVX i
i
−=
El análisis para el desarrollo del presente diseño fue se efectúo mediante el programa ESPC plus statistics experimental for PC
Efecto EstimadoX1:A 0,0X2: B 12,0AB -0,5
Errores estándar con 3 GL
Interpretación de los efectos3
Si visualizamos los signos de los efectos A y B, notamos que ambos son positivos, por lo tanto están en su nivel mínimo, por lo cual deberán ser maximizado, es decir que ambos factores son variables, y deberán ser optimizados y establecidos sus rangos de trabajo óptimo.
En este caso solamente estamos evaluando y no así optimizando, para desarrollar la optimización deberá seguirse otro camino, el cual será desarrollado en el próximo acápite.
El factor B es el que tiene mayor significancía por tener un mayor valor numérico.
a) Caso Maximización
(+)Indica que la variable se encuentra al nivel mínimo y debe ser maximizado hasta el óptimo y establecer su rango de trabajo.
(-)Indica que el factor ya no es una variable, por lo tanto viene a ser una constante en el proceso, por lo que se encuentra en el nivel máximo y debe mantenerse como tal.
b) Caso Minimización
(+) Indica que el factor ya no es una variable, por lo tanto viene a ser una
3 Análisis de signos de los coeficientes de los efectos, según el caso.
320
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
constante en el proceso, por lo que se encuentra en el nivel máximo y debe de mantenerse como tal.
(-)Indica que la variable se encuentra al nivel mínimo y debe ser maximizado hasta el óptimo y establecer su rango de trabajo.
A fin de ver la influencia de los factores, se analiza la interacción4 de los factores, esto quiere decir si, existe cruce de información entre los factores y a la vez estos puedan controlarse de una manera independiente a fin de manipular el proceso.
Interpretación de la interacción5
Notamos que el signo de la interacción AB es negativo, esto nos indica que no existe interacción, lo cual lo hemos deducido al visualizar que no existe intersección entre los valores numéricos, por lo tanto no existe cruce de información entre los factores en estudio.
a) Caso Maximización
(+)Indica que sí existe interacción entre las variables, uno depende del otro.
(-) Indica que no existe interacción entre las variables.
b) Caso Minimización
(+) Indica que no existe interacción entre las variables.
(-)Indica que sí existe interacción entre las variables, uno depende del otro.
Para corroborar los análisis desarrollados es que aplicamos el Análisis de Varianza del proceso.
Tabla 6.99 Análisis de varianzaFuente SC Gl CM Fo Ft(99%)
X1: A 0,0 1 0,0 0,0 < 98,49X2: B 144,0 1 144,0 436,37 > 98,49AB 0,25 1 0,25 0,75 < 98,49Curvatura 13,76 1 13,76 41,69 < 98,49Error total 0,66 2 0,33Total (corregido) 158,67 6 R2 = 90,2857%
4 Es importante que no exista interacción, y de esa manera podamos trabajar con los factores principales.
5 Análisis de signos de los coeficientes de las interacciones, según el caso.
321
Palacios C. Severo
El que tiene mayor significancía es B = X2, seguido de A = X1 para un coeficiente de correlación del 90,2857%, el factor A tiene valor cero, por lo cual se le considera una constante en el rango de trabajo.
La varianza del error viene a ser el cuadrado medio del error, siendo este igual a 0,333 dicho valor es menor que la unidad por lo cual la variabilidad de los datos es bastante adecuada para el trabajo realizado.
Él cálculo de la Suma de Cuadrados del Total se desarrolla mediante la siguiente relación:
( )∑ ∑−=
N
YYSC i
iTotal
2
2
La suma de cuadrados del total nos sirve para comprobar que los valores: suma de cuadrados de los factores e interacciones, más el error deben ser igual a dicho valor numérico.
El valor de F de tabla para un 99% de significancía es 98,49 vemos que el F experimental del factor principal B es mayor por lo tanto dicho factor es significativo, por lo que se corrobora que dicho efecto principal está en su mínimo debiendo ser maximizados y a la vez ambos son variables en el proceso.
Siendo el modelo matemático6 lineal para el presente análisis.
ABBAY 25,00,60,02857,90 −++=
La constante del modelo matemático, viene a ser el promedio de los valores del vector respuesta, así mismo es el valor inicial del proceso en estudio, el signo negativo de la constante nos indica que esta en el máximo y debe ser minimizado.
a) Caso Maximización
(+)Indica que dicho valor es el inicio del proceso y se encuentra en su mínimo y debe ser maximizado hasta el óptimo.
(-)Indica que es el máximo valor del vector respuesta, no se puede subir sobre dicho valor, más al contrario se puede bajar.
6 Análisis de signos de la constante del modelo matemático, según el caso.
322
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
b) Caso Minimización
(+)Indica que es el máximo valor de la vector respuesta, no se puede subir sobre dicho valor, más al contrario se puede bajar.
(-)Indica que dicho valor es el inicio del proceso y se encuentra en su mínimo y debe ser maximizado hasta el óptimo.
En el modelo matemático también podemos visualizar que la interacción es negativa, o sea que no tiene influencia en el proceso. Además podemos visualizar que los factores principales son positivos tal como se visualizo en el análisis de los factores principales.
Coeficiente de regresión para Y
ABBAY 25,00,60,02857,90 −++=
Interpretación del modelo matemático
Si A y B son iguales a cero, entonces el modelo será igual a la constante, si visualizamos el signo de dicha constante notamos que es positivo, lo cual nos indica que esta en su mínimo y debe maximizarse.
Optimizar Respuesta
Valor óptimo = 96,7857Factor Bajo Alto ÓptimoA -0,5 0,5 -0,5B -0,5 0,5 0,5
Gráfica de Efectos Principales para Y
84
87
90
93
96
99
Y
A-0.5 0.5
B-0.5 0.5
Gráfica de Interacción para Y
83
86
89
92
95
98
Y
A-0.5 0.5
B=-0.5B=-0.5
B=0.5B=0.5
Efectos significativos de factores principales
Interacción de factores principales
En la superficie respuesta visualizando el gráfico (isolíneas), podemos interpretar lo siguiente: el valor óptimo está a menor A y mayor B.
323
Palacios C. Severo
C onto rnos de la Superfic ie de Respuesta E stim ada
-0 .5 -0 .3 -0 .1 0 .1 0 .3 0.5
A
-0.5
-0.3
-0.1
0.1
0.3
0.5
B
Y8 3.0-84.58 4.5-86.08 6.0-87.58 7.5-89.08 9.0-90.59 0.5-92.09 2.0-93.59 3.5-95.09 5.0-96.59 6.5-98.09 8.0-99.5
S up e rf ic ie d e R e s p ue s ta E s tim ad a
-0 .5 -0 .3 -0 .1 0 .1 0 .3 0 .5A
-0 .5-0 .3
-0 .10 .1
0 .30 .5
B
8 3
8 6
8 9
9 2
9 5
9 8
Y
Y8 3 .0 -8 4 .58 4 .5 -8 6 .08 6 .0 -8 7 .58 7 .5 -8 9 .08 9 .0 -9 0 .59 0 .5 -9 2 .09 2 .0 -9 3 .59 3 .5 -9 5 .09 5 .0 -9 6 .59 6 .5 -9 8 .09 8 .0 -9 9 .5
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
La superficie respuesta a nivel espacial nos muestra la forma en que están ubicados los puntos experimentales, así mismo la dirección en la cual se orienta el proceso.
Notamos que la zona de mayor recuperación se ubica a menor A y mayor B.
DISEÑO FACTORIAL CENTRADO DE TRES FACTORES
X1
X2
X3
0,5
0,5
-0,5 0,5
X1 X2 X3
-0,5+0,5-0,5+0,5-0,5+0,5-0,5+0,50000000
-0,5-0,5+0,5+0,5
0000
-0,5-0,5+0,5+0,5
000
0000
-0,5-0,5+0,5+0,5-0,5+0,5-0,5+0,5
000
Este es una nueva estrategia estadística elaborada para los procesos donde se tiene tres factores, en este diseño se ahorra mucho tiempo, personal e insumo porque el factor de mayor orden no existe.
El presente es un aporte para que la industria logre mejorar su productividad y sea de gran provecho para los estudiosos.
Ejemplo 6.89
324
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Se evalúa el experimento del ejemplo anterior con tres factores a dos niveles.
FactoresNiveles
- 0 +A: Voltaje (Voltios)B: Densidad corriente (A/m²)C: Agitación (RPM)
130
700
235
1100
340
1500
Prueba X1 X2 X3 A B C Y123456789101112131415
-0,5+0,5-0,5+0,5-0,5+0,5-0,5+0,5
0000000
-0,5-0,5+0,5+0,5
0000
-0,5-0,5+0,5+0,5
000
0000
-0,5-0,5+0,5+0,5-0,5+0,5-0,5+0,5
000
1,52,51,52,51,52,51,52,52222222
32,532,537,537,535353535
32,532,537,537,5353535
11001100110011009009001300130090013009001300110011001100
858698978688989688899092898988
Interpretación de los efectos
Si visualizamos los signos de los efectos A, B y C, notamos que son positivos, por lo tanto están en su nivel mínimo, por lo cual deberán ser maximizado, es decir que dichos factores son variables, y deberán ser optimizados y establecidos sus rangos de trabajo óptimo.
Efecto Estimado
X1:A 0,0X2:B 7,25X3:C 27,75AB -0,25AC -0,5BC 0,125
Errores estándar con 8 GL
En este tipo de diseño el efecto de tercer orden no existe. Por lo tanto la suma de cuadrados para dichos efectos tampoco existe.
El que tiene mayor significancía es B, seguido de C para un coeficiente de correlación del 98,47%.
Tabla 6.100 Análisis de varianzaFuente SC GL CM Fo Ft(95%
325
Palacios C. Severo
)A: X1B: X2C: X3ABACBCCurvaturaError
0105,125
1540,1250,125
0,50,03125
13,140,66
11111112
0105,1251540,12
50,125
0,50,03125
13,140,33
0318,564667,0
50,381,51
0,09539.82
<>><<<<
98,4998,4998,4998,4998,4998,4998,49
Total 1659,71 9 R² = 90,6%
Siendo el modelo matemático para el presente caso:
BCACBCBAY 0625,025,0125,0875,13625,30,06,90 +−−+++=
Interpretación del modelo matemático
Si A, B y C son iguales a cero, entonces el modelo será igual a la constante, si visualizamos el signo de dicha constante notamos que es negativo, lo cual nos indica que esta en su máximo y debe minimizarse.
Valor óptimo = 109,378Factor Bajo Alto Óptimo
ABC
1,030,0
700,0
3,040,0
1500,0
1,20440,0
1500,0
El punto óptimo del presente proceso viene establecido por la tendencia de la hipótesis planteada en un principio, siendo esto que A está en el máximo debe de minimizarse, B y C deben de maximizarse y establecer el óptimo.
En la superficie respuesta visualizando el gráfico (isolíneas), podemos interpretar lo siguiente: el valor óptimo está a mayor B y C. Dejando constante al factor A.
A=2.0
B
C
Y
81.0-83.0
83.0-85.0
85.0-87.0
87.0-89.0
89.0-91.0
91.0-93.0
93.0-95.0
95.0-97.0
97.0-99.0
99.0-101.0
101.0-103.030 32 34 36 38 40700
900
1100
1300
1500 A=2.0
BC
Y
81.0-83.0
83.0-85.085.0-87.0
87.0-89.0
89.0-91.0
91.0-93.0
93.0-95.0
95.0-97.0
97.0-99.0
99.0-101.0
101.0-103.030 32 34 36 38 40 700
9001100
13001500
78
83
88
93
98
103
108
326
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
En el grafico espacial podemos visualizar el comportamiento de las isolíneas de igual manera, debe de incrementarse B y C, manteniendo constante el factor A.
DISEÑO ROTABLE CENTRADO DE n FACTORES
(-0.5, 0.5)
(0.5, -0.5)(-0.5, -0.5)
(-0.75, 0)
(0, -0.75)
(0, 0.75)
(0.75, 0)
(0.5, 0.5)
(0, 0)
X1 X2 X3
-0,50,5-0,50,5-0,50,5-0,50,5
-0,750,75
0000000
-0,5-0,50,50,5-0,5-0,50,50,500
-0,750,75
00000
-0,5-0,5-0,5-0,50,50,50,50,50000
-0,750,75
000
El presente diseño rotable para ajustar un modelo de segundo orden debe tener por lo menos tres niveles en cada factor. El presente diseño es una alternativa frente a los diversos diseños existentes.
El presente diseño es simple en el proceso de evaluación de factores desde K>2, el diseño rotable esta extraído de la figura geométrica.
Ejemplo 6.90En un proceso electrolítico para la fabricación de sales de aluminio se procedió a evaluar dos factores a tres niveles.
A: 0,75 1,25 1,5B: 1 2 3
Prueba X1 X2 A B Y12345678
-0,50,5-0,50,5
-0,750,75
00
-0,5-0,50,50,500
-0,750,75
1,001,501,001,500,881,631,251,25
1,501,502,502,502,002,001,252,75
95,293,497,295,792,598,193,595,7
327
Palacios C. Severo
91011
000
000
1,251,251,25
2,002,002,00
89,589,689,4
Si visualizamos los signos de los efectos A=X1, y B=X2, notamos que X2
tiene signo positivos, por lo tanto están en su nivel mínimo, por lo cual deberán ser maximizado, es decir que dicho factor es variable, y deberán ser optimizados y establecidos sus rangos de trabajo óptimo, y el factor X1 es una constante.
Efecto e interacciones
Efectos cuadráticos
A: X1 = -6,767B: X2 = 3,426AB = 0,45
AA = 12,572BB = 19,732
Errores estándar con 5 GL
El que modelo matemático así como la falta de ajuste son significativos y por lo tanto se ajustan al proceso con un coeficiente de correlación del 82,611%.
Tabla 6.101 Análisis de varianzaFuente SC Gl CM Fo Ft(95%)A: X1B: X2AAABBBError
18,48024,0733
52,20020,0225
40,666816,745
111115
18,48024,0733
52,20020,0225
40,66683,34899
5,521,22
15,590,0112,14
<<><>
6,616,616,616,616,61
Total 96,2964 10 R² = 82,611%
Tabla 6.102 Análisis de varianza de falta de ajusteFuente SC Gl CM Fo Ft(9
5%)Falta ajusteError
16,7250,02
32
5,5750,01
557,5 > 19,16
Total 16,745 5 R² = 82,611%
Siendo el modelo matemático para el presente caso:
21
2
2
2
1216,08617,9703,44426,38805,110097,194 XXXXXXY +++−−=
Si X1, y X2 son iguales a cero, entonces el modelo será igual a la constante, si visualizamos el signo de dicha constante notamos que es positivo, lo cual nos indica que esta en su mínimo y debe maximizarse.
Valor óptimo = 103,886Factor Bajo Alto Óptimo
328
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
X1 0,88 1,63 1,63X2 1,25 2,75 2,75
El punto óptimo del presente proceso viene establecido por la tendencia de la hipótesis planteada en un principio, siendo que X1 esta en su máximo y debe mantenerse constante y X2 tambien esta en su máximo y deben de minimizarse y establecer el óptimo.
Ambos factores tienen efecto significativo significativo en el proceso.
0.75B
3
Gráfica de Efectos Principales para Y
89
92
95
98
101
104
Y
A1.5 1
0.75
B=1
B=3
Gráfica de Interacción para Y
97
100
103
106
109
112
Y
A1.5
B=1
B=3
Efectos significativos con tendencia cuadrática
Interacción en proceso cuadrático
No existe interacción entre ambos factores, por lo que cada factor es independiente en el proceso, si se modifica el factor X1, se mantiene el factor X2, y así sucesivamente.
En la superficie respuesta visualizando el gráfico (isolíneas), podemos interpretar lo siguiente: el valor óptimo está a un valor máximo de X1
y un valor promedio de X2.
Contornos de la Superficie de Respuesta Estimada
0.75 0.95 1.15 1.35 1.55
A
1
1.4
1.8
2.2
2.6
3
B
Y89.0-91.491.4-93.893.8-96.296.2-98.698.6-101.0101.0-103.4103.4-105.8105.8-108.2108.2-110.6110.6-113.0113.0-115.4
Superficie de Respuesta Estimada
0.75 0.95 1.15 1.35 1.55
A
11.4
1.82.2
2.63
B89
93
97
101
105
109
113
Y
Y89.0-91.491.4-93.893.8-96.296.2-98.698.6-101.0101.0-103.4103.4-105.8105.8-108.2108.2-110.6110.6-113.0113.0-115.4
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
329
Palacios C. Severo
En el grafico espacial podemos visualizar el comportamiento de las isolíneas de igual manera, debe de incrementarse X1 y manteniendo constante el factor X2.
Problemas
(294) El estudio experimental que se presenta, estuvo orientado a determinar las granulometrías óptimas tanto en la etapa de Rougher como de Scanvenger. Se desea optimizar la recuperación y el grado de concentración en función de la molienda.
X1 X2 Y-0,5+0,5-0,5+0,5
000
-0,5-0,5+0,5+0,5
000
72706664686868
Para optimizar estas dos variables, se obtuvo los modelos matemáticos:
21211 0,06,0020,68 XXXXY +−−=Desarrolle el ANAVA y la superficie respuestaObtenga el óptimo cuando se alcanza un 68,4%
(295) Se estudia un experimento de flotación a nivel laboratorio siendo sus factores A: tiempo, B: espumante.
3,842,908,903,899,813,838,886,899,93:
12,112,112,131,194,075,094,031,15,1:
22213,113,1287,287,22:
Y
B
A
Obtenga el modelo del procesoAnalice aplicando el ANAVA
(296) Se efectuó un proceso electrolítico de fabricación de ocre, cuyo rendimiento esta en función de dos variables A: cloruro de sodio, B: intensidad de corriente.
6,825,835,816,863,808,784,756,905,85:
5,425,425,423,273,275,427,577,575,42:
5,85,85,87,97,777,72,910:
Y
B
A
Obtenga el modelo del proceso
330
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Analice aplicando él ANAVACree usted la temperatura influye en el procesoElabore el diagrama Eh-pHDe que color es el ocre producidoSin en vez de cloruro de sodio utiliza un electrolito de nitrato de sodio, cual es el producto final.
(297) Se quiere evaluar un proceso en donde se nota la influencia de dos factores A: 400 - 600 y B: 3,5 - 5.
88929193899785908999899892:YObtenga el modelo
ABBABAY 9,0²9,0²392 ++−++=Analice mediante los métodos de punto estacionario y canónico.
(298) Un proceso electrolítico, cuyo rendimiento esta en función de las variables A: 20 - 40 y B: 1 - 3.Obtenga el modelo y analice.
82838180818078759085:1X(299) Con el estudio experimental se desea determinar las
condiciones óptimas siendo sus factores686868706664667072:1X
687676686876848476:1XEl modelo que gobierna el estudio experimental es:
2122
2121 034,0083,022,013,105,27411,1 XXXXXXY −++−−=
(300) Se estudia un experimento a nivel laboratorio siendo sus factores.
13,113,113,131,194,075,094,031,15,1:1X
22213,113,129,29,22:2X3,892,909,903,899,813,838,887,899,93:Y
Siendo el modelo
2122
2121 16,101,349,2539,4298,30 XXXXXXYCu +−+−−=
(301) Se estudia la lixiviación con ácido sulfúrico, de una calcina, obtenida y de la tostación en presencia de aire, con adición de óxido de calcio, en horno monosolera Bach, de un concentrado de calcopirita rico en pirita. La calcina es de la siguiente composición: 15,91 % de cobre, 38,06% de hierro, 11,45% de azufre y 3,55% de insolubles.
331
Palacios C. Severo
(302) Se estudia las variables A: concentración de ácido; B: temperatura, C: velocidad de agitación. Siendo su vector respuesta.
7375757877778359826779608062:YObtenga el modeloAnalice el ANAVAAplique el método para evaluar la curvatura
(303) Dado el alto contenido de hierro de los licores de lixiviación, que se obtienen, se procede a la purificación del cobre con Lix 64N, a partir de licores con 3,59 g/l de cobre y 1,14 g/l de hierro, en lo que se relaciona con el efecto de alguna variables como el pH, concentración de extracción, relación de fases, agitación y concentración de ácido. Obteniéndose los modelos.
2122
2121 5,016,115,123,223,194,96 XXXXXXYCu +−−−+=
2122
2121 95,111,489,337,125,174,12 XXXXXXYFe +−−−−=
Analice mediante el ANAVAEstablezca los rangos de las variables
(304) Se quiere evaluar un proceso de tostación de un concentrado sulfuroso de zinc, se requiere evaluar la temperatura y la adición de aire, para la experimentación se evaluaron los factoresA: temperatura, B: aire. Siendo su vector respuesta.
6,884,921,918,932,898,977,855,901,895,999,895,984,92:YObtenga el modeloAnalice mediante el ANAVAEstablezca los rangos de las variables
(305) Considere el modelo de primer orden
21 8,05,150 XXY −+=Donde 11 ≤≤− iX .Determine la dirección de máximo ascenso y planifique el experimento siguiendo dicha dirección
(306) Los siguientes datos fueron recogidos por un ingeniero de planta. La respuesta y es el tiempo de filtrado, X1 es la temperatura y X2 es la presión.
X1 X2 Y-0,50,5-0,50,5
-0,75
-0,5-0,50,50,50
5445324750
332
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
0,7500000
0-0,750,75
000
534751413940
Ajuste un modelo de segundo orden, verifique su validez y analice la superficie ajustada.Cuáles serían sus recomendaciones si se desea minimizar el tiempo de filtrado.
(307) Se desea minimizar el valor de la ceniza en la pulpa de papel (una medida de las impurezas inorgánicas). Se estudian dos variables: temperatura en ºC y tiempo en horas. Estas variables se codifican como se indica a continuación:Estas variables se codifican como se indica a continuación:
115
7751
−= atemperaturX ,
5.1
32
−= tiempoX
Se lleva a cabo un experimento cuyos resultados se muestran a continuación:
X1 X2 Y-0,50,5-0,50,5
-0,750,75
0000000
-0,5-0,50,50,500
-0,750,75
00000
2119221699
222148168179122175157146130
Qué tipo de diseño experimental se ha usado. Es rotable.El modelo cuadrático ajustado es
2122
2121 5,05829,105281,63529,347059,580445,150 XXXXXXY ++−+−=
Fuente SC GL CM Fo Ft(99)ModeloError
30688,71478,22
56
6137,74
246,37
24,91 > 8,75
Total 32166,92
11 R2 = 95,04
¿Es bueno el ajuste de este modelo?Calcule el punto estacionario. ¿Qué tipo de punto es?(Puede usar que los autovalores de la matriz son -6,89 y 0,62)
333
Palacios C. Severo
1 0 . 5 8 2 9 50 . 2 5
0 . 2 5 6 . 5 2 8 1 5 8-
(308) Un ingeniero está investigando la influencia de la temperatura, la presión y la concentración del catalizador en tiempo que tar7
(309) da una reacción en llevarse a cabo. Tras varios experimentos, el investigador ajustó la función
23
22
2132
3121321
717,312,5091,6706,4
078,78089,13165,12241,54989,6630
XXXXX
XXXXXXXY
−−−−
−++−+=
Usando un diseño central compuesto con cinco puntos centrales. Las variables codificadas son las siguientes:
8
350)(1
−°= CatemperaturX
20
612)(2
−= psipresiónX
03.0
15.03
−= iónconcentracX
Hágale al investigador las sugerencias que considere. (310) Consideremos un experimento donde el objetivo es estudiar la
relación entre la frecuencia de oscilación de un reloj de cuarzo patrón y las condiciones de humedad y temperatura. En este caso el instrumento ya cuenta con un dispositivo para minimizar los cambios de temperatura, dado que los fabricantes conocen su impacto en la frecuencia de oscilación. Los factores seleccionados son temperatura (T) y humedad (H) y sus niveles de prueba se eligen de acuerdo a las condiciones del laboratorio; en este caso los niveles de temperatura son (22oC, 24oC) y para la humedad (20%, 50%). La variable de respuesta es la frecuencia de oscilación (Y). El diseño experimental seleccionado es un factorial completo 22 con punto central que se muestran a continuación.
PruebaTemperatura
(°C)Humedad
(%)Frecuencia
(Hz)123456789
-0,50,5-0,50,5
-0,750,75
000
-0,5-0,50,50,500
-0,750,75
0
99,70699,70699,70499,70299,70499,69299,71599,65799,687
334
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
1011
00
00
99,68999,688
En particular en el estudio presentado se muestra cómo evaluar experimentalmente la incertidumbre dada por el fabricante de un equipo para verificar su magnitud en las condiciones del propio laboratorio. Este tipo de estudios podrían llevar a mejoras tanto de los equipos como de las instalaciones del laboratorio, buscando tener un menor impacto de las fuentes de incertidumbre detectadas como las más importantes.
(311) En la definición de las variables de estudio de electrodeposición de oro se tuvo en cuenta las condiciones impuestas por el proceso previo de desorción de oro, sobre todo en aquellas que tienen que ver con el electrolito, como la concentración de oro, la concentración de cianuro de sodio e hidróxido de sodio, la conductividad, el pH y la temperatura. Con estas queda definida la referencia base para la selección y rango de las variables de estudio.Entre las variables mencionadas se seleccionaron el potencial aplicado, la concentración de hidróxido de sodio y la Densidad de corriente catódica como las de mayor interés para este estudio, y como variables de respuesta se consideraron la eficiencia de corriente, el consumo de potencia, la cinética de la deposición del oro y su recuperación.
Factores Niveles- +
Potencial (Vols)NaOH (g/L)DC (A/cm³)
2,510
0,025
3,520
0,075
Prueba
Potencial(Vols)
NaOH(g/L)
DC(A/cm³)
Consumo energía(Watt-h)
Tiempo
(min)123456789101112131415
-0,50,5-0,50,5-0,50,5-0,50,5
-0,750,75
00000
-0,5-0,50,50,5-0,5-0,50,50,500
-0,750,75
000
-0,5-0,5-0,5-0,50,50,50,50,50000
-0,750,75
0
3,439,384,3313,943,299,385,73
15,667,797,646,877,756,705,96,8
115,078,7
108,576,078,978,7173,9113,288,987,480,393,880,082,179,4
335
Palacios C. Severo
1617
00
00
00
6,96,7
79,879,6
Se pretende minimizar el tiempo del proceso, de consumo de energía (mayor eficiencia de corriente) y menor cantidad de hidróxido de sodio a fin de optimizar las condiciones por medio de las ecuaciones logradas. Esto redunda en un beneficio económico y practico para la recuperación electroquímica de oro.
(312) El reciclado electroquímico de los compuestos de partida en disolución ácido se ha monitorizado por análisis de la DQO (demanda química de oxígeno), cromatografía de placa fina, análisis de CG-MS y por espectroscopia de UV-VIS.El tiempo de cada electrólisis se ha calculado para circular la cantidad teórica de electricidad necesaria para oxidar completamente el sustrato, a partir de las leyes de Faraday, y una concentración de sustrato a tratar de 0,015 M en un volumen de 150 cm3. El tiempo de reacción se ha prolongado para aquellos casos en que se observó un mejor comportamiento de la disminución de la DQO (demanda química de oxígeno) al aumentar la carga eléctrica.El plan experimental escogido para estudiar la influencia de las principales variables de reacción es un diseño factorial completo 23 con ocho barridos experimentales, donde las variables escogidas y sus niveles fueron la temperatura (25 y 40ºC), la concentración de electrolito (50 y 96%) y la densidad de corriente (500 y 1000 A/m2).
FactoresNiveles
- +X1: Temperatura (°C)X2: Concentración (%)X3: DC (A/m²)
2550
500
4096
1000
PruebaTemperatura
(°C)
Concentración
(%)
DC(A/m²
) DQO123456789101112
-0,50,5-0,50,5
-0,750,75
000000
-0,5-0,50,50,500
-0,750,75
0000
0000
-0,5-0,5+0,5+0,5-0,5+0,5-0,5+0,5
32487725
3075285227756525867
44256320897
45606871
336
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
La tecnología propuesta se presenta como una técnica universal para degradar compuestos nitratados aromáticos en contra de la biodegradación, en la que las especies microbianas encargadas de degradar son específicas para cada contaminante concreto y mucho más versátil y cómoda de escalar y diseñar a nivel industrial que tecnologías basadas en sistemas fotocalíticos.Del estudio experimental de la degradación de los sustratos de partida se realizó en base al diseño de experimentos detallados en la tabla adjunta. La influencia de las variables tenidas en cuenta, temperatura, densidad de corriente y concentración de electrolito, así como las interacciones entre ellas, se han estudiado estadística y comparativamente.Se pide demostrar la influencia de dichos factores
(313) El propósito de este estudio fue evaluar la remoción de sólidos totales, presentes en la vinaza (destilado del alcohol), mediante procesos de electrocoagulación-electroflotación utilizando electrodos de aluminio y como variables de operación pH inicial, concentración de electrolito y densidad de corriente.Las variables evaluadas fueron densidad de corriente (DC), pH inicial y concentración de NaCl como soporte electrolítico, todas las variables en dos niveles.Los niveles usados para cada variable fueron: DC 20, 40 y 60 mA/cm2; pH 4, 7 y 9; [NaCl] 0, 2000 y 4000 ppm.
FactoresNiveles
- 0 +X1: DC (mA/cm²)X2: pHX3: [NaOH] (ppm)
2040
407
2000
609
4000
PruebaDC
(mA/cm²) pH[NaOH](ppm)
Al(g)
% Sólidos totalesClarificado Espuma
123456789101112131415
-0,50,5-0,50,5-0,50,5-0,50,5-0,50,5-0,50,5-0,50,5-0,5
-0,5-0,50,50,5-0,5-0,50,50,5-0,5-0,50,50,5-0,5-0,50,5
-0,5-0,5-0,5-0,50,50,50,50,5-0,5-0,5-0,5-0,50,50,50,5
-0,5-0,5-0,5-0,5-0,5-0,5-0,5-0,50,50,50,50,50,50,50,5
19,8120,9522,5922,0921,7315,0514,5615,2322,0016,8820,1621,0122,1523,4218,96
22,7323,4924,0023,7722,7717,2517,9218,6923,1216,8019,1518,1518,7519,2117,65
337
Palacios C. Severo
1617181920212223242526
0,5-0,750,75
00000000
0,500
-0,750,75
000000
0,50000
-0,750,75
0000
0,5000000
-0,750,75
00
17,8712,0119,0113,515,712,614,815,617,215,715,8
15,2312,5417,2513,5714,2314,7816,7514,8919,2414,714,9
Que factor influye en el mayor desprendimiento de aluminio al desarrollar la electrocoagulación-electroflotación.En que región del pH ocurre mejor el proceso.
(314) La investigación se desarrolló con las aguas residuales de una industria láctea de la región. Se tomaron muestras tanto del tanque de descargas, como del tanque de homogeneización; este último toma las aguas del tanque de descarga de las aguas residuales de la empresa y las mezcla. A éstas se le analizaron: pH, DQO, conductividad eléctrica, grasas y aceites. Los análisis se realizaron el mismo día del muestreo; de acuerdo con los resultados, se decidió que las muestras de agua para la investigación serían recolectadas sólo del tanque de homogenización, por ser éste el más representativo en las características fisicoquímicas del agua residual láctea. La experimentación se llevó a cabo en un sistema para electrólisis. Este sistema opera como reactor discontinuo a escala prototipo, con capacidad para tratar dos litros de aguas residuales. Consta de una celda electrolítica de dos litros en la que están sumergidos los electrodos; estos electrodos son placas rectangulares metálicas de hierro y aluminio, dispuestas en paralelo y conectadas a una fuente de voltaje de corriente continua que proporciona la corriente eléctrica requerida para la electrocoagulación.
FactoresNiveles
- 0 +X1: pHX2: DC (A/m²)X3: tiempo (min)
532,43
5
737,83
10
843,23
15
Prueba pHDC
(A/m²)tiempo(min)
DQO(%)
12345
-0,50,5-0,50,5-0,5
-0,5-0,50,50,5-0,5
-0,5-0,5-0,5-0,50,5
75,7362,3646,5593,9970,83
338
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
67891011121314151617
0,5-0,50,5
-0,750,75
0000000
-0,50,50,500
-0,750,75
00000
0,50,50,50000
-0,750,75
000
51,4477,2993,9943,8845,7942,1544,2647,2548,2647,6248,0148,06
La electrocoagulación se vislumbra como un tratamiento eficiente para la remoción de contaminantes en las aguas residuales industriales, específicamente en el caso de la industria láctea como se muestra en esta investigación. Los tres factores bajo estudio (pH, densidad de corriente y tiempo) tienen efecto significativo sobre la remoción de DQO. El diseño de tres factores es bastante ajustado a los datos. En particular, si se tienen niveles óptimos del estudio para pH, tiempo y densidad de corriente.
(315) La planificación de los experimentos se realizó aplicando el diseño experimental factorial 2n; se analizó la influencia de la temperatura, la relación líquido/sólido y tiempo en la depuración de especies metálicas de efluentes, manteniendo fija la velocidad de agitación. Las variables de respuesta consideradas fueron: porcentaje de extracción de especies metálicas (E) y selectividad (S). Esta última, se determinó como la relación entre la recuperación de un componente dado y el grado de dilución del mineral. La extracción de Ni, Co, Fe y Mn como residuo de la depuración de efluentes. Las condiciones experimentales y niveles de las variables se muestran en la tabla.
FactoresNiveles
- 0 +X1: Temperatura (°)X2: tiempo (h)X3: Líquido/Sólido (L:S)
3018
452
10
60312
Condiciones fijas del experimento: Velocidad de agitación 600 rpm; pH 4,06.Los modelos que regulan el proceso son:
9058,87²765,20625,01325,44475,62433,72 21321 =+−++= RXXXXXYNi
5456,96²165,23425,0255,258,30333,81 21321 =++++= RXXXXXYCo
339
Palacios C. Severo
0524,90²61125,151625,10613,1724125,522625,636,71 3221321 =−−−++= RXXXXXXXYFe
9567,95²2425,34925,06675,45,62356,70 21321 =++++= RXXXXXYMn
Elabore un diseño experimental que satisfaga la depuración del efluente
(316) Los residuos sólidos de la lixiviación o colas constituyen un gran problema para el ecosistema de la región industrial; su tratamiento, disposición y manejo son objeto de estudios con el fin de encontrar alternativas para minimizar los impactos negativos al medio ambiente. Una cuestión de interés lo constituye la recuperación de plata y el cobre contenidos en las colas residuales, las cuales son consideradas un mineral de baja ley. Con el objetivo de recuperar especies metálicas de las colas de los procesos de lixiviación, ya sean las resultantes del proceso ácido o del proceso amoniacal, se han realizado estudios de biolixiviación y lixiviación química con ácidos orgánicos producidos por los microorganismos en sus procesos metabólicos.
(317) En la tabla aparece la matriz experimental correspondiente al plan 23, y un experimento en el nivel central. Con este diseño de experimento se obtuvo el comportamiento de las variables de respuesta Selectividad y Extracción de Ag y Cu. La selectividad se consideró como la relación entre la recuperación de un componente dado y el grado de disolución total del mineral. En todos los experimentos se mantuvieron fijos los parámetros siguientes: relación líquido: sólido: L/S=12/1 cm3 de solución/g de cola; velocidad de agitación: 630 rpm; tamaño de partículas (-0,149+0,074) mm. Se realizó el estudio del comportamiento cinético de la disolución del Ag y Cu. Las muestras de licor de lixiviación se colectaron a determinados intervalos de tiempo, se filtraron y analizaron por espectroscopia de absorción atómica.
FactoresNiveles
- 0 +X1: Temperatura (°)X2: tiempo (h)X3: Líquido/Sólido (L:S)
3011
4535
6059
PruebaT
(°)t
(h)L/S
(cm³/g)% Extracción
Ag Cu1234
-0,50,5-0,50,5
-0,5-0,50,50,5
-0,5-0,5-0,5-0,5
62,9671,6069,0782,40
77,3880,5377,9387,39
340
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
567891011121314151617
-0,50,5-0,50,5
-0,750,75
0000000
-0,5-0,50,50,500
-0,750,75
00000
0,50,50,50,50000
-0,750,75
000
64,2470,4563,7287,1278,6376,3577,2579,5677,9578,4579,3679,4679,58
77,5880,0977,3990,9180,1085,2689,0189,9087,5488,6589,7489,8789,95
(318) Se controlaron 3 variables que permitieron conocer las condiciones óptimas del reactor para obtener altos porcentajes de descontaminación y realizar el escalamiento del reactor a nivel industrial. Las variables escogidas para el estudio fueron:
FactoresNiveles
- 0 +X1: [H2O2] (ml/L)X2: Volumen a tratar (L)X3: [TiO2] (mg/L)
040
18
100
212
200
Prueba[H2O2](ml/L)
Volumen
(L)
[TiO2](mg/L) Radiación
(W/m²)pH Degradación
(%)1234567891011121314151617
-0,50,5-0,50,5-0,50,5-0,50,5
-0,750,75
0000000
-0,5-0,50,50,5-0,5-0,50,50,500
-0,750,75
00000
-0,5-0,5-0,5-0,50,50,50,50,50000
-0,750,75
000
36,544,518,0
44,8326,0361,8352,8335,4140,1750,8334,1756,2557,256,355,755,955,2
3,853,915,775,413,725,738,435,124,244,24,124,254,723,984,254,264,28
23,5246,197,39
33,0343,3431,8714,86,6216,819,8
14,8418,3622,1521,8518,2518,9218,75
Para el estudio de estas variables se realizaron una serie de experimentos donde la variable de respuesta fue el porcentaje de degradación medido como el porcentaje de reducción en la DQO.Del análisis de los datos obtenga el ANAVA, estime la respuesta óptima, además de la superficie de respuesta, que permiten obtener un modelo estadístico que describe el comportamiento
341
Palacios C. Severo
del sistema de fotodegradación respecto a las variables experimentales estudiadas y que permitan establecer el grado de confiabilidad de los datos obtenidos.
(319) Se seleccionaron modelos lineales del tipo 2n, en los que n representa el número de variables a estudiar. Para un diseño experimental con 3 variables (pH, dosis de coagulante y floculante), el número de experimentos a realizar es igual a 8.En la tabla se especifica los niveles de cada experimento para una pareja coagulante-floculante determinada. Como se observa en esta tabla los valores probados para el pH son 6 y 9, las dosis de coagulante fueron 20 y 100 mg/L y las del floculante de 0,1 y 1,0 mg/L.
PruebaFloculante
(mg/L)Coagulante
(mg/L)pH
Concentración residualColor DQO
1234567891011121314151617
-0,50,5-0,50,5-0,50,5-0,50,5
-0,750,75
0000000
-0,5-0,50,50,5-0,5-0,50,50,500
-0,750,75
00000
-0,5-0,5-0,5-0,50,50,50,50,50000
-0,750,75
000
47,04513
22,5188,5180,540,540,5
35,4633,2536,8739,4842,645,442,143,642,9
84,575,060,555,5
105,5138,582,542,5
36,8942,1545,2446,7844,746,847,847,948,0
Debido a la buena calidad del efluente obtenido bajo las condiciones óptimas determine el modelo de remoción de los parámetros y, con el fin de disminuir el volumen de lodos y los costos del proceso, utilice dicho modelos para realizar un análisis de sensibilidad de respuesta con respecto a la variación de dosis para poder reducir la cantidad de coagulante a aplicar, de tal manera de conservar niveles de remoción aceptables para los derivados.
342
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
§7SUPERFICIE DE RESPUESTA
En estadística, lo que desaparece detrás de los números es la muerte. Günter Grass
I. INTRODUCCIÓN
La metodología de superficie de respuesta es un conjunto de técnicas matemáticas y estadísticas utilizadas para modelar y analizar problemas en los que una variable de interés es influenciada por otras. El objetivo es optimizar las variables de interés. Esto se logra al determinar las condiciones óptimas de operación del sistema.
II. SUPERFICIE DE RESPUESTA
La relación Y=f(X1, X2,…, Xk), entre Y y los niveles de los k factores representa una superficie. Con k factores la superficie está en k+1 dimensiones. Por ejemplo cuando se tiene Y=f(X1) la superficie esta en dos dimensiones como se muestra en la superficie de respuesta lineal, mientras que si tenemos Y=f(X1, X2) la superficie está en tres dimensiones, esto se observa en la superficie de respuesta.
343
Palacios C. Severo
X
Y
0 1 2 3 4 5
5
4
3
2
1
0Yo
Superficie de R espuesta Estim ada
0 2 4 6 8 1 0X 10 .1 0 .1 4 0 .1 8 0 .22 0 .26 0 .3
X 2
0 .7
1
1 .3
1 .6
1 .9
2 .2
Y
Y0 .7-0 .850 .85 - 1 .01 .0 -1 .1 51 .1 5- 1 .31 .3- 1 .451 .45 - 1 .61 .6- 1 .751 .75- 1 .91 .9- 2.0 52 .0 5 - 2 .22 .2 -2 .35
Superficie respuesta lineal Superficie respuesta espacialGráfica de contorno
La grafica de contornos facilita la visualización de la forma de una superficie de respuesta de tres dimensiones. En esta las curvas de los valores iguales de respuesta se grafican en un plano donde los ejes coordenados representan los niveles de los factores. Cada curva representa un valor específico de la altura de la superficie es decir un valor especifico de Y. Esto se muestra en el grafico de contornos. Esta grafica nos ayuda a enfocar nuestra atención en los niveles de los factores a los cuales ocurre un cambio en la altura de la superficie.
Región experimental
La región experimental especifica la región de los valores para los niveles de los factores. Esto se puede hacer empleando los niveles actuales de operación para cada factor, si se desea explorar el vecindario se incrementa y decrece el valor del nivel en una cantidad determinada.
III. POLINOMIO DE PRIMER ORDEN
Generalmente se desconoce la relación entre la respuesta y las variables independientes, por ello requieren un modelo que aproxime la relación funcional entre Y y las variables independientes. Este modelo provee las bases para un nuevo experimento que nos lleva hacia un nuevo modelo y el ciclo se repite. Si la respuesta se describe adecuadamente por una función lineal de las variables independientes se utiliza el modelo de primer orden.
ε++++= kko XAXAXAAY 2211
344
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Contornos de la Superficie de Respuesta Estimada
0 2 4 6 8 10
X1
0.1
0.14
0.18
0.22
0.26
0.3
X2
Y0.7-0.850.85-1.01.0-1.151.15-1.31.3-1.451.45-1.61.6-1.751.75-1.91.9-2.052.05-2.22.2-2.35
Grafico contornosLos parámetros del modelo se estiman mediante el método de mínimos cuadrados. Una vez que se tiene los estimadores se sustituyen en la ecuación y obtenemos el modelo ajustado.
kko XAXAXAAY +++= 2211
Este modelo se utiliza cuando queremos estudiar el comportamiento de las variables de respuesta únicamente en la región y cuando no conocemos la forma de la superficie.
IV. PRUEBA DE SIGNIFICANCÍA
Para estimar los coeficientes se requieren N>k+1 valores de respuesta Y. El análisis de los datos de las corridas se presenta en una tabla de análisis de varianza. La tabla presenta las diferentes fuentes de variación que contribuyen a la variación total de los datos.
La variación total recibe el nombre de la Suma de Cuadrados Total SC, se calcula de la siguiente manera:
( )2∑ −= YYSC ij
Donde
Yij es el valor observado de la ij-ésima corrida.
La suma de cuadrados se compone por la suma de cuadrados debido a la regresión y la suma de cuadrados no toma en cuenta el modelo ajustado. La formula de la suma de cuadrados debido a la regresión es.
345
Palacios C. Severo
( )2
∑ −= YYSCcregresión
La suma de cuadrado error, que corresponde a la no tomada en cuenta, se calcula de la siguiente manera.
( )2∑ −=cijerror
YYSC
En la tabla se observa un análisis de varianza, en ella p representa el número de términos del modelo ajustado
Tabla 6.103 Análisis de varianzaFuente SC Gl CM
RegresiónError
SCregresión
SCerror
p-1N-p
SCR/p-1SCE/N-p
Total SCtotal N-1
La prueba de significancía de la ecuación de regresión ajustada tiene la siguiente hipótesis nula Ho: Todas las As (excluyendo Ao) son cero contra la alternativa HA: al menos una de las As (excluyendo Ao) es diferente de cero.
La prueba supone que el error se comporta normalmente, en ésta se utiliza la prueba estadística F, el cual se calcula.
pN
SCp
SC
Ferror
regresión
−
−= 1
Se compara con una F de tabla (95 ó 99%), si F calculada excede este valor la hipótesis nula se rechaza con un nivel de confianza de γ. Esto significa que la variación explicada por el modelo es significativamente mayor que la variación inexplicable.
Además de esta prueba se puede hacer un análisis de ajuste del modelo con la R² que es la proporción total de la variación de las Ys
con respecto a la media que se puede explicar con la ecuación de regresión ajustada. Esta se calcula de la siguiente manera.
346
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
total
regresión
SC
SCR =2
V. PRUEBA DE FALTA DE AJUSTE
La falta de ajuste se presenta por la no linealidad o la curvatura de la superficie de respuesta, ésta no se detecta debido a la exclusión de los
términos cuadráticos como 2iii XB o de los términos de productos
cruzados kjiijk XXXB que se refieren al efecto de la interacción entre los factores.
La prueba de falta de ajuste requiere que el diseño del experimento satisfaga:
1. El número de los distintos puntos del diseño n, debe exceder el número de términos en el modelo ajustado, es decir n>k+1, y
2. Al menos e réplicas deben recolectar en uno o más puntos del diseño para estimar la varianza del error.
Además, los valores del error aleatorio deben asumir una distribución normal e independiente con una varianza común σ².
Al cumplirse las condiciones anteriores la suma de cuadrados del error se compone de dos fuentes de variación. La primera es la falta de ajuste del modelo ajustado (por la exclusión del término de mayor orden) y la segunda es la variación del error puro.
Para calcularlas necesitamos la suma de cuadrados calculada de las replicas que recibe el nombre de error puro de la suma de cuadrados y sustraer de la suma de cuadrados del error éste para obtener la suma de cuadrados de la falta de ajuste.
( )∑ −= 2jijerrorpuro YYSC
Donde
Yij es la i-ésima observación del j-ésimo punto del diseño
errorpuroerrorefaltaajust SCSCSC −=
347
Palacios C. Severo
( )2∑ −= iiefaltaajust YYrSC
La prueba adecuada del modelo ajustado es:
nN
SCpn
SC
Ferrorpuro
efaltaajust
−
−=
La hipótesis de suficiencia de ajuste con un nivel γ de significancía se rechaza cuando el valor calculado del estadístico es mayor a Ftabla.
Cuando F calculada no es mayor al cuadrado medio residual es utilizado para estimar σ² y también se usa para probar la significancía del modelo ajustado.Cuando la hipótesis de suficiencia de ajuste se rechaza, se debe de elevar el grado del modelo aumentando términos de productos cruzados y/o términos de mayor grado en X1, X2, … , Xk. Si se quieren puntos adicionales para estimar todos los coeficientes éstos se añaden. Se colocan los datos y se vuelve a hacer el análisis.
Si no se rechaza la hipótesis podemos inferir que la superficie es lineal. Una vez que se tiene la ecuación y se ha comprobado el ajuste se buscan niveles que mejoren los valores de respuesta.
VI. MÁXIMA PENDIENTE ASCENDENTE
Frecuentemente la estimación inicial de las condiciones de operación óptima está alejada del óptimo real, en este caso se desea moverse rápidamente a la vecindad del óptimo. El método de máxima pendiente ascendente es un procedimiento para recorrer secuencialmente la trayectoria de la máxima pendiente, que nos lleva en dirección del máximo aumento de la respuesta. Cuando se desea la minimización se habla de la mínima pendiente de descenso.
La dirección de ascenso máximo es en la que Y aumenta más rápido, ésta es paralela a la normal de la superficie respuesta ajustada. Los incrementos a lo largo de la trayectoria son proporcionales a los coeficientes de regresión A1, A2, A3.
Los experimentos se llevan a cabo hasta que deje de observarse un incremento en la respuesta, entonces se ajusta un nuevo modelo de
348
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
primer orden con el que se determina una nueva trayectoria y se continúa con el procedimiento. Finalmente, se consigue llegar a la cercanía del óptimo, esto ocurre cuando existe falta de ajuste del modelo de primer orden.
Determinar trayectoria de máxima pendiente ascendente
Supongamos que el punto X1=X2=…= Xk=0
1. Se elige un tamaño de incremento en una de las variables del proceso, digamos ∆Xj, usualmente se elige la variable de la que más se sabe, o la que tiene el mayor coeficiente de regresión.
2. El tamaño de incremento en las otras variables es
j
j
ii
X
AA
X
∆
=∆
3. Se convierte ∆Xi de variable codificada a variable naturalEjemplo 7.91Un investigador desea determinar las condiciones de operación que maximicen el rendimiento de una reacción. Dos variables controlables influyen en éste: tiempo y temperatura de reacción. Actualmente el proceso opera con un tiempo de reacción de 35 minutos y una temperatura de 155 °F, lo que produce un rendimiento del 40%. El investigador decide que la región de exploración sea de 30 a 40 minutos y 150 a 160 °F.
En la tabla se muestran los datos, se utiliza un diseño factorial 2² aumentado en cinco puntos centrales. Las observaciones centrales sirven para estimar el error experimental y permiten probar la adecuación del modelo de primer orden.
Variables codificadas Variables naturalesX1 X2 t T Y-+-+00000
--++00000
304030403535353535
150150160160155155155155155
39,340,040,941,540,340,540,740,240,6
349
Palacios C. Severo
Por método de mínimos cuadrados se obtiene:
21 325,0755,044,40 XXY ++=
En la tabla se muestra el análisis de varianza, donde se observa que F de regresión es significativa al 99%
Tabla 7.104 Análisis de varianza para el modelo de primer ordenFuente SC Gl CM Fo Ft(95%)RegresiónResidual
Falta ajusteError puro
2,8250,1772
(0,0052) (0,1720)
2624
1,4125
0,00260,0430
32,84
0,06
>
<
18,00
18,00
Total 3,0022 8 R² = 94,0976%
El modelo indica que hay que trasladarse 0,775 unidades en dirección de X1 por cada 0,325 unidades en dirección de X2. Sabemos que la trayectoria pasa por el punto (X1=0, X2=0) y tiene pendiente 0,325/0,775. En el ejemplo se decide usar 5 minutos como incremento en el tiempo de reacción lo que equivale a la variable codificada ∆X1=1.Los incrementos a lo largo de la trayectoria son:
42,0)755,0/325,0(1 21 ==∆=∆ XyX
El investigador calcula puntos a lo largo de esta trayectoria y observa el rendimiento en cada punto hasta notar un decremento en la respuesta. Los resultados aparecen la siguiente tabla. Los incrementos de muestran tanto para las variables codificadas como para las naturales, esto es porque las codificadas son más fáciles de manejar matemáticamente y las naturales son las que utilizamos para llevar a cabo el proceso.
Tabla 7.105 Pendiente ascendenteVariable codificada Variable natural
incremento X1 X2 t T YOrigen
∆Origen + ∆
Origen + 2∆Origen + 3∆Origen + 4∆Origen + 5∆Origen + 6∆Origen + 7∆
01,001,002,003,004,005,006,007,00
00,420,420,841,261,682,102,522,94
355
40455055606570
1552
157159161163165167169
41,0042,9047,1049,7053,8059,9065,00
350
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Origen + 8∆Origen + 9∆Origen +1o∆Origen + 11∆Origen + 12∆
8,009,0010,0011,0012,00
3,363,784,234,625,04
7580859095
171173175177179
70,4077,6080,3076,2075,10
Se observa un incremento en la respuesta hasta el décimo incremento, a partir del decimoprimero se produce un decaimiento en el rendimiento. Por lo tanto se debe ajustar otro modelo de primer orden en la cercanía del punto (t=85, T=175)
Se ajusta un nuevo modelo de primer orden alrededor del punto (t=85, T=175). La región de exploración para t es 80 a 90 y para T es 170 a 180. Por lo tanto las variables codificadas son:
5/)175(
5/)85(
2
1
−=−=
TX
tX
Nuevamente se utiliza un diseño 2² con cinco pruebas centrales, los datos se adjuntan en la siguiente tabla.
Variables codificadas Variables naturalesX1 X2 t T Y-+-+00000
--++00000
809080908585858585
170170180180175175175175175
76,577,078,079,579,980,380,879,979,8
El modelo de primer orden ajustado es:
21 50,000,197,79 XXY ++=
En la tabla se muestra el análisis de varianza.
Tabla 7.106 Análisis de varianza para el modelo de primer ordenFuente SC Gl CM Fo Ft(95%)RegresiónResidual
Falta ajusteError puro
5,0011,12
(10,908)(0,212)
2624
2,50
5,4540,053
47,16
102,91
>
>
18,00
18,00
Total 16,1200 8 R² = 31,01%
351
Palacios C. Severo
El resultado de la prueba de falta de ajuste implica que el modelo de primer orden no es una aproximación adecuada, por lo que se trata de una superficie con curvatura y logramos llegar a la cercanía del óptimo.
VII. POLINOMIO DE SEGUNDO ORDEN
El modelo de segundo orden es:
∑ ∑ ∑ ++++= εjiijiiiiio XXAXAXAAY 2
En éste caso los Ai son los coeficientes de regresión para el término de primer orden, los Aii son los coeficiente para los términos cuadráticos, los Aij son los coeficientes para los términos con interacciones y ε es el término del error aleatorio.
Los términos cuadráticos y las interacciones son de segundo orden. El número de términos en la ecuación esta dado por p=(k+1)(k+2)/2
Los parámetros del modelo se estiman mediante el modelo de mínimos cuadrados. Una vez que se tienen los estimadores se sustituyen en la ecuación y obtenemos el modelo ajustado con valore óptimos de respuesta.
∑ ∑ ∑+++= jiijiiiiio XXAXAXAAY 2
La significancía de los coeficientes estimados y el ajuste del modelo se prueban con la estadística F.
Una vez verificado que el modelo tiene suficiente ajuste y que los coeficientes son significativos, se procede a localizar las coordenadas del punto estacionario y se lleva a cabo un análisis más detallado del sistema de respuestas.
Punto estacionario
Suponiendo que se desea maximizar la respuesta, el máximo, si es que existe, será el conjunto X1, X2, …, Xk tal que las derivadas parciales
0...21
=∂∂==
∂∂=
∂∂
kX
Y
X
Y
X
Y
352
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Dichos puntos X1,o, X2,0, …, Xk,0 se denominan puntos estacionarios. El punto estacionario puede ser:
a) Un punto de máxima respuestab) Un punto de mínima respuestac) Un punto silla
a) Pendiente descendente
5 6 7 8 9 10
X1
30
35
40
45
50
55
60
X2
Y44.0-47.047.0-50.050.0-53.053.0-56.056.0-59.059.0-62.062.0-65.065.0-68.068.0-71.071.0-74.074.0-77.0
b) Pendiente ascendente
5 6 7 8 9 10
X1
30
35
40
45
50
55
60
X2
Y130.0-154.0154.0-178.0178.0-202.0202.0-226.0226.0-250.0250.0-274.0274.0-298.0298.0-322.0322.0-346.0346.0-370.0370.0-394.0
d) Silla de montar
4 6 8 10 12 14
X1
8
9
10
11
12
X2
Y86.0-87.087.0-88.088.0-89.089.0-90.0
90.0-91.091 .0-92.092.0-93.0
93.0-94.094.0-95.095.0-96.0
96.0-97.0
Grafica de punto estacionario de superficie respuesta de segundo orden ajustadoa) Máxima b) Mínima c) Silla de montar
Podemos obtener el punto estacionario usando la notación matricial para el modelo de segundo orden.
aBXaXAY o ++=
353
Palacios C. Severo
=
=
=
k kkk
k
k
kK AkAA
M
AkAA
AkAA
Ay
A
M
A
A
a
X
M
X
X
X
2/2/
2/2/
2/2/
21
22 22 1
11 21 1
2
1
2
1
En otras palabras, a es el vector (kx1) de coeficientes de regresión de primer orden, y A es una matriz simétrica (kxk) cuya diagonal principal está formada por los coeficientes de los términos cuadráticos puros (Aii), mientras que los elementos fuera de ésta corresponden a un medio del valor de los coeficientes cuadráticos mixtos (Aij, i≠j).
La derivada de Y con respecto al vector X igualando a cero es:
02 =+=∂∂
AxaX
Y
El punto estacionario es la solución de la ecuación, es decir:
354
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
aAX o1
2
1 −−=
Sustituyendo ésta en la ecuación matricial para el modelo de segundo orden tenemos:
aXAY ooo 2
1+=
VIII. CARACTERIZACIÓN DE SUPERFICIE DE RESPUESTA
Habiendo encontrado el punto estacionario es necesario caracterizar la superficie de respuesta es decir determinar si se trata de un punto de respuesta máximo, mínimo o silla. La forma directa de hacer esto es mediante la gráfica de contornos del modelo ajustados, sin embargo es útil un análisis más formal.
Como una alternativa se puede expresar la forma de la superficie respuesta usando un nuevo conjunto de variables Z1, Z2, …, Zk cuyos ejes representan los ejes principales de la superficie de respuesta, los cuales se interceptan en el punto estacionario como se observa. Esto da por resultado el modelo ajustado.
2222
211 ... kko ZZZYY λλλ ++++=
Donde:
Zi Son las variables independientes transformadas, yλi Son constantes
Dicha ecuación se llama forma canónica.
Las λi son los valores propios y se obtienen de la matriz A.
355
Palacios C. Severo
6070
8090
ópt im o
Superficie de respuesta en forma canónica
La naturaleza de la superficie de respuesta puede determinarse a partir del punto estacionario y del signo y magnitud de las λ i. Si todas las λi son positivas, entonces es un punto de respuesta mínima, si todas las λi son negativas, entonces es un punto de respuesta máxima y si las λi tienen signos distintos entonces es un punto de respuesta silla.
Ajuste de superficie de respuesta
El ajuste y análisis de una superficie de respuesta se facilita con la elección apropiada de un diseño experimental.
Un diseño es el conjunto específico de combinaciones de los niveles de las k variables que se utilizan al llevar a cabo el experimento.
Ajuste del modelo de primer orden
Una clase única de diseño que minimiza la varianza de los coeficientes de regresión son los diseños ortogonales de primer orden. Por ortogonal se entiende que los elementos fuera de la diagonal de la matriz son iguales a cero, lo cual implica que los productos cruzados de la columna de la matriz x son igual a cero.
Ajuste del modelo de segundo orden
Un diseño experimental para ajustar un modelo de segundo orden debe tener al menos tres niveles de cada factor (-1, 0 +1). Así como el diseño de primer orden se desea la ortogonalidad, en éste se desea que sea un diseño rotable. Se dice que un diseño es rotable cuando la varianza de la respuesta en algún punto es función solo de la distancia del punto al centro y no es una función de la dirección.
356
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
La rotabilidad es una propiedad importante, dado que la finalidad de la superficie de respuesta es optimizar y desconocemos la localización del óptimo, tiene sentido utilizar un diseño que proporcione estimaciones precisas en todas las direcciones.
Ejemplo 7.92La conversión de un proceso factorial con superficies de respuesta lineal se ilustran con dos factores, presión y temperatura.
El diseño de tratamientos fue un factorial 22 con rango de temperatura de 130 y 160°C y presión de 325 y 475 psi como factores principales, además se realizaron cuatro pruebas centrales a temperatura de 145°C y presión de 400 psi para proporcionar una estimación de la varianza del error experimental y evaluar si el modelo de respuesta lineal es adecuado. Las combinaciones de tratamientos y el porcentaje de conversión se muestran en la tabla 7.107.
Tabla 7.107 Conversión de un proceso con temperatura y presión
X1 X2Temperatura
(°C)Presión
(Psi)% conversión
-+-+0000
--++0000
130160130160145145145145
325325475475400400400400
824163221232024
Niveles de factores codificados
Los niveles de factores codificados proporcionan un marco de trabajo uniforme para investigar los efectos de los factores en cualquier contexto experimental, ya que los valores reales de los niveles dependen de los factores específicos en el estudio. Los niveles codificados de los factores de un diseño factorial 2n son:
b
aVX i
i
−=
Donde:
Vi Viene a ser el valor real del factor principala Viene a ser el valor promedio del factor principal
357
Palacios C. Severo
b Viene a ser el salto o rango entre el mínimo nivel y el promedio
Los niveles codificados de temperatura (T) y presión (P) en la tabla 7.107.
15
1451
−= TX
75
4002
−= PX
Estimaciones de las respuestas lineales
Las estimaciones de los coeficientes para el modelo de primer orden son:
( ) 2032162484
1 =+++=oA
( ) 832162484
11 =+−+−=A
( ) 432162484
12 =++−−=A
Las estimaciones de los coeficientes lineales, A1 y A2, es la media de las estimaciones del efecto factorial para una factorial 2n.
La varianza del error de las cuatro observaciones centrales del diseño y una estimación del error estándar para las estimaciones de los coeficientes es
( )( )11
222
−∑−
−∑=
NN
Y
N
YS ii
( )334,3
12
88
3
24202321 222222 =−+++=S
2
2S
N
NS =β
358
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
91,0334,34
42
==βS
Es importante el hecho de que la varianza del error tenga una estimación adecuada, con réplicas centrales del factorial. Si la varianza de la respuesta depende en alguna forma del nivel de factor, entonces se recomienda la réplica del diseño con las combinaciones a niveles alto y bajo del factor para detectar cualquier variabilidad heterogénea entre las combinaciones del mismo.
Las estimaciones de los coeficientes de regresión indican que el incremento de la temperatura o la presión, aumentará el porcentaje de conversión. La ecuación estimada del modelo de primer orden es:
21 4820 XXY ++=
La interacción entre temperatura y presión TxP mide la falta de ajuste con el modelo lineal y se representa mediante el término A12X1X2 en el modelo cuadrático. La estimación del coeficiente A12 es un medio de la interacción TxP, es decir:
( ) 032162484
112 =+−−=A
El error estándar de A12 es 0,91, el mismo que para los coeficientes lineales. La componente de interacción estimada de 0 indica que temperatura y presión son independientes sobre el porcentaje de conversión.
Puntos centrales del diseño para curvatura de la superficie
Las pruebas centrales del diseño no sólo proporcionan una estimación del error experimental, también proporcionan un mecanismo para medir el grado de curvatura en la región experimental. Sea FY el
promedio de las combinaciones del tratamiento del factorial 22 y CY el promedio de los puntos centrales; existe evidencia de curvatura en la superficie de respuesta si la respuesta promedio en las coordenadas del centro del diseño, CY es mayor o menor que la respuesta
promedio en los niveles extremos de los factores, FY . La diferencia
359
Palacios C. Severo
del valor absoluto CF YY − es una estimación de β11+β22, donde β11
y β22 son los coeficientes de regresión cuadrática.
Las medias observadas son 20=FY y 22=cY , con una diferencia
de 2=− CF YY . El error estándar de la diferencia se estima como
29,1)4/14/1(334,3 =+ ; la respuesta lineal parece describir de manera adecuada la superficie de la zona.
En la gráfica de las curvas de nivel para la ecuación de respuesta lineal estimada. Los valores de los contornos ascienden conforme aumentan los niveles de temperatura y presión, las curvas de nivel crecientes indican que puede existir una combinación de temperatura y presión para maximizar la conversión en una dirección perpendicular a las curvas.
Pendiente ascendente hacia una respuesta óptima
Por último, el investigador querrá determinar la zona de respuesta óptima; para hacerlo, se requiere localizar la región de niveles de los factores que producen las condiciones óptimas. El método de pendiente ascendente es un procedimiento desarrollado para llevar la región experimental de la respuesta variable en una dirección de cambio máximo hacia el óptimo.
Con base en la ecuación lineal estimada 21 4820 XXY −+= , la trayectoria de mayor pendiente, perpendicular a las curvas de igual respuesta, traslada 4 unidades en la dirección de X2 por cada 8 unidades en la dirección de X1. De manera equivalente, la trayectoria tiene un movimiento de 4/8 = 0,5 unidades en X2 por cada unidad de movimiento en X1.
La trayectoria de mayor pendiente inicia en el centro del diseño con (X1, X2) = (0, 0). En la grafica de curvas de nivel, el centro del diseño para los valores de temperatura y presión es (T, P) = (145, 400). Un cambio de ΔX1 = 1 unidad en la dirección X1 es un cambio de 15°C en la temperatura y ΔX2= 0,5 unidades en la dirección X2 es un cambio de 37,5 psi en la presión.
El objetivo es moverse a lo largo de la trayectoria de mayor pendiente hasta que se observe una respuesta máxima. El investigador realizará experimentos con las combinaciones de temperatura y presión a lo largo de la trayectoria de mayor pendiente.
360
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
P
325 400 475
160
145
130
T
8 16
24 32
20
Y=3 0
Y=25
Y=20
Y=15
Puntos pendie nte ascendente
Puntos diseño origi nal
Gráfica de curvas de nivel para la respuesta lineal del % de conversión para temperatura (T) y presión (P)
En la tabla 7.108 se muestran, los niveles de temperatura y presión, a partir de (T, P) = (145, 400), puntos centrales del diseño, con cambios de 1 unidad en X1, y de media en X2, en el supuesto de que el investigador desea realizar los cambios relacionados con la modificación de una unidad en X1.
Tabla 7.108 Pendiente ascendente de región de respuesta máxima en % de conversiónPaso X1 X2 T P
01234
.
.
.
01234
.
.
.
00,51,01,52,0
.
.
.
145160175190205
.
.
.
400,0437,5475,0512,5550,0
.
.
.
Conforme el investigador avanza por la trayectoria de la pendiente ascendente, el aumento en la respuesta es menor hasta que observa una disminución real en ella, lo que indicará que la región de respuesta máxima está en la proximidad de esas condiciones de temperatura y presión. En este punto del proceso, se puede diseñar un experimento para estimar una ecuación polinomial cuadrática que aproxime la superficie de respuesta.
IX. DISEÑOS DE SUPERFICIE RESPUESTA CUADRÁTICO
361
Palacios C. Severo
Una vez que se identifica la región de respuesta óptima, debe diseñarse un nuevo experimento para caracterizar la superficie de respuesta. En general, la superficie se aproxima por medio de una ecuación cuadrática para determinar la curvatura de la superficie.
Los factoriales 2n o sus fracciones son diseños útiles para identificar los efectos significativos y las regiones de respuesta óptima. Sin embargo, en la región de respuesta óptima, estos diseños no proporcionan información suficiente para estimar las ecuaciones de respuesta cuadrática, pues se requieren al menos tres niveles para cada factor y el diseño debe tener ( ) 2/121 −++ nnn puntos distintos para estimar los parámetros con un modelo de regresión cuadrática para aproximar la curvatura.
Las propiedades de los diseños experimentales convenientes para la estimación de superficies de respuesta incluyen la capacidad para estimar el error experimental y tener en cuenta una prueba de la falta de ajuste del modelo. Los diseños también deben proporcionar estimaciones eficientes de los coeficientes del modelo y predecir las respuestas.
En esta sección se estudian varias clases de diseños desarrollados con las propiedades convenientes para la aproximación de la superficie de respuesta de segundo orden.
Factoriales 3n para estimar superficies cuadráticas
Los factoriales 3n se pueden usar para estimar las ecuaciones polinomiales cuadráticas, pero el número de combinaciones de tratamientos que requieren produce un experimento poco práctico de gran tamaño; pues mientras los diseños 3n con dos factores requieren sólo 9 combinaciones de tratamientos, un diseño con tres factores requiere 27, y uno con cuatro factores requiere 81.
Diseños centrales compuestos a los factoriales 3n
Box y Wilson (1951) propusieron diseños centrales compuestos, que requieren menos combinaciones de tratamientos que los factoriales 3n, para estimar las ecuaciones de la superficie de respuesta cuadrática. Los diseños centrales compuestos son diseños de tratamientos factoriales 2n con 2n combinaciones adicionales, llamadas puntos
362
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
estrella, a lo largo de los ejes coordinados de los niveles de factor codificados. Las coordenadas de los puntos estrella de los ejes del factor codificado son (±α, 0, 0, …, 0), (0, ±α, 0, …, 0), . . ., (0, 0, 0, …, ±α). En general, se agregan m réplicas al centro del diseño en las coordenadas (0, 0, …, 0).
Los diseños centrales compuestos se usan para aprovechar la experimentación secuencial, el primer paso de la secuencia consiste de una serie de pruebas realizadas a lo largo de la trayectoria de mayor pendiente, como la mostrada en la tabla 7.108 En algún momento, las pruebas conducen hacia un conjunto de niveles de factores que proporciona un máximo aparente en la trayectoria. Por ejemplo, suponiendo que las respuestas en la trayectoria de mayor pendiente son las que se muestran en la grafica de mayor pendiente, con una respuesta máxima de 36 observada en T = 190°C y P = 512,5 psi.
P325 400 475 550 625
220
190
160
130
T
8 16
2432
36
34
α−
α+
α− α+
20
Diseño original
Trayectoria de pendiente ascendente
Factorial con puntos centrales
Puntos estrella del diseño central compuesto
30
32
Trayectoria de mayor pendiente y un diseño central compuesto
Como segundo paso en la secuencia, el investigador realiza un nuevo experimento factorial 22, con varias réplicas al centro del diseño (T, P) = (190; 512,5).
Si la diferencia CF YY − calculada en el nuevo experimento indica un alto grado de curvatura en la superficie, el tercer paso en el experimento secuencial consiste en pruebas adicionales del experimento en lo puntos estrella (±α, 0) y (0, ±α), mostradas con cuadros en la grafica de mayor pendiente. Este último conjunto de
363
Palacios C. Severo
combinaciones de tratamientos en los ejes, junto con el factorial 22 y los puntos centrales, constituye el diseño central compuesto como resultado de la experimentación secuencial.
Una réplica de un diseño central compuesto consiste de nFN 2=
combinaciones de tratamientos del factorial 2n, nN 2=α combinaciones de tratamientos en los puntos estrella del diseño y m réplicas en el centro para obtener un total de mNNN F ++= α observaciones.
Las coordenadas en los ejes codificados X1 y X2, para el diseño central compuesto con dos factores se muestra en la tabla 7.108, y la gráfica donde se describe la localización de las coordenadas para los niveles de factores codificados del diseño central compuesto de dos y tres factores. Debido a que cada factor tiene cinco niveles, se puede estimar una ecuación cuadrática a partir de este diseño.
CodificadoDiseño
X1 X2
-+-+
--++
Factorial
α−α+00
00α−α+
Estrella
0 0 Central
Además, como se vera en la siguiente sección, se puede evaluar cualquier desviación significativa de la aproximación cuadrática.
Las mnN n ++= 22 unidades experimentales necesarias para el diseño central compuesto con n factores son menos que las requeridas por los factoriales 3n con tres factores o más. Así, los diseños centrales compuestos son más económicos en cuanto al uso de materiales y proporcionan la capacidad de estimar las ecuaciones de respuesta. Se pueden usar fracciones de los diseños 2n con interacciones de orden mayor con alias como base del diseño 2n cuando hay más factores en el estudio.
Diseños rotatorios exploratorio de superficie de respuesta
364
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Una propiedad deseable al establecer cualquier diseño es la misma precisión para todas las estimaciones de las medias. Sin embargo, la precisión de los valores estimados sobre la superficie de respuesta basada en la ecuación de regresión estimada no será constante en toda la región experimental. Una propiedad rotatoria desarrollada para los diseños centrales compuestos requiere que la varianza de los valores estimados sea constante en puntos equidistantes del centro del diseño con coordenadas codificadas (0,0, ..., 0).
(-1, 1) (1, 1)
(-1, -1) (1, -1)
(0, α)
(0, -α)
(+ α, 0)(-α, 0)X1
X2
a)
X1
X3
X2
b)
Diseños centrales compuestos a) dos factores y b) tres factores
La rotación de un diseño es importante en la exploración de una superficie respuesta porque la precisión de la superficie estimada no depende de la orientación del diseño con respecto a la superficie respuesta real o a la dirección de la búsqueda de las condiciones óptimas. Los factoriales 2n usados como diseño exploratorios para aplicar el método de búsqueda de la mayor pendiente en zonas de respuestas óptimas son diseños rotatorios. Así, la orientación del diseño no dificulta el método de búsqueda de la pendiente ascendente porque algunas respuestas se estiman con menor precisión que otras.
El diseño central compuesto es rotatorio estableciendo los valores de
los puntos estrella como ( ) 4/12n=α , El valor de α para un diseño de
dos factores es ( ) 414,124 4/1 ±===±α , y para un diseño de tres
factores ( ) 682,18 4/1 ±==±α . Si hay rF réplicas del factorial 2n y rα,
réplicas de las combinaciones estrella, una forma más general para α
365
Palacios C. Severo
es ( ) 4/1/2 αα rr n
F= , si se usa un factorial fraccionario 2n-p como base
para el diseño central compuesto, entonces ( ) 4/1/2 αα rr pn
F−= .
Ejemplo 7.93Establecida la trayectoria de mayor pendiente para el estudio de % de conversión en la tabla 7.109 se proporcionó una respuesta máxima en T = 190°C y P = 512,5 psi y debe construirse un diseño central compuesto con centro en (T, P) = (190; 512,5); y que la relación entre las coordenadas del diseño (X1, X2) y los niveles de temperatura y presión (T, P) se conservan como antes, donde un cambio de una unidad en X1, es 15°C y un cambio de una unidad en X2 es 75 psi. Con
2=α , las coordenadas del diseño y la temperatura y presión requeridas serán:
Codificado OriginalDiseño
X1 X2 T P-+-+
--++
175205175205
437,5437,5587,5587,5
Factorial
2−2+
00
00
2−2+
168211190190
512,5512,5406,
4618,6
Estrella
0 0 190 512,5 Central
Punto estacionario en el centro del diseño
Como se estableció antes, la varianza de la superficie estimada no es constante para toda la superficie. Box y Hunter (1957) mostraron que el número de puntos centrales en los diseños centrales compuestos rotatorios puede elegirse de manera que proporcione un diseño con precisión uniforme para la superficie estimada de una unidad alrededor de las coordenadas del centro del diseño en la escala codificada.
Tabla 7.109 Diseños centrales compuestos rotatorios con precisión uniformeFactores 2 3 4 5 5 6 6Factor 2n 1 1 1 1 ½ 1 ½
αFN
1,4144
1,68286
2,00168
2,378
3210
2,001610
2,828
6412
2,378
3212
366
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
αNm
5 6 7 10 6 15 9
N 13 20 31 52 32 91 53
Su razonamiento fue que el investigador está más interesado en la superficie de respuesta cerca del centro del diseño cuando un punto estacionario de la superficie se localiza cerca del centro; el punto estacionario es un punto de respuesta máxima, mínima o con forma de silla. En la tabla 7.109 se muestran algunos diseños centrales rotatorios compuestos con precisión uniforme.Los diseños centrales compuestos requieren cinco niveles de cada factor, codificados como - a, - 1, 0, 1, +a. En algunos casos, preparar cinco niveles para algunos factores puede ser difícil, costoso y mucho tiempo. El diseño de cubo con cara centrada es una variación del diseño central compuesto con a = 1 que requiere sólo tres niveles de cada factor. Si se sustituye a = 1 en la tabla 7.109, el diseño de dos factores se convierte en un factorial 32, diseño más atractivo cuando la región de interés tiene forma de cubo producida por este diseño en lugar de la región esférica producida por el diseño central compuesto.
El diseño no es rotatorio, pero la ausencia de esta propiedad se compensa por el deseo de poder hacer inferencias cuboidales y por el ahorro en recursos experimentales.
El cubo con cara centrada requiere menos corridas en el punto central que el diseño central compuesto para lograr una varianza estable de los valores estimados en la región del diseño, pero debe recordarse que se necesitan corridas réplica en algún punto o puntos del diseño para estimar la varianza del error experimental.
Un diseño de cubo con cara centrada para tres factores o más requiere menos combinaciones de tratamientos que los factoriales 3n; entonces, ésta es otra alternativa para los diseños 3n que requiere menos unidades experimentales.
Diseños Box-Behnken, alternativa para los factoriales 3n
Box y Behnken (1960) propusieron una clase de diseños de tres niveles para estimar las superficies de respuesta de segundo orden. Los diseños son rotatorios, o casi rotatorios, con menor número de unidades experimentales en comparación con los diseños 3n. Se forman con la combinación de diseños 2n y diseños de bloques
367
Palacios C. Severo
incompletos; los detalles de la construcción se encuentran en Box y Draper (1987) y los niveles de factores codificados para las combinaciones de tratamientos necesarios en un diseño para tres factores, donde se presenta un conjunto completo de las combinaciones de tratamientos para un factorial 2n para cada par de factores acompañados por el nivel 0 de los factores restantes. Se incluyen varias réplicas del centro del diseño (0, 0, ..., 0).
Estos diseños son esféricos más que cuboidales puesto que los puntos del diseño se encuentran en las orillas de un cubo en lugar de las esquinas como los del diseño de cubo con cara centrada. El diseño de Box-Behnken sólo debe usarse si no se tiene interés en predecir las respuestas en las esquinas de la región cuboidal.
Factor A B CNivel codificado X1 X2 X3
Factorial 22
para A y B
-+-+
--++
0000
Factorial 22
para A y C
-+-+
0000
--++
Factorial 22
para B y C
0000
-+-+
--++
Central000
000
000
Diseños de bloques incompletos
Los diseños de bloques incompletos son útiles para reducir la varianza del error experimental cuando el número de tratamientos es grande o cuando las condiciones experimentales impiden la ejecución de réplicas completas bajo circunstancias constantes.
Box y Hunter (1957) presentaron las condiciones de bloques de los diseños de superficie de respuesta de segundo orden, de manera que los efectos de los bloques no afectan las estimaciones de los parámetros para la ecuación de la superficie de respuesta. Mostraron que deben satisfacerse dos condiciones para que los bloques sean ortogonales a las estimaciones de los parámetros de la ecuación de la
368
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
superficie de respuesta. Sea nb, el número de tratamientos en el b-ésimo bloque; las dos condiciones necesarias son:
1. Cada bloque debe ser un diseño ortogonal de primer orden. Para cada bloque debe cumplirse la siguiente relación para cada par de variables de diseño x, y x,:
∑=
=≠=b
kk
n
kji njiXX
1
,...,1,1,00
2. La fracción de la suma de cuadrados total para cada variable de diseño que aporta cada bloque debe ser igual a la fracción de las observaciones totales colocadas en el bloque. Entonces, debe cumplirse la siguiente relación entre las variables de diseño y el número de observaciones para cada bloque:
niN
n
XX
Xb
N
ki
n
ki
k
b
k
,...,2,1
1
2
1
2
==∑ ∑
∑
=
=
Una estrategia sugerida para los bloques de diseños centrales compuestos coloca los tratamientos NF para el diseño 2n y mF puntos centrales en un bloque, y los N, tratamientos axiales con m, puntos centrales en un segundo bloque. Este arreglo de bloques satisface la primera condición.
El diseño rotatorio central compuesto para dos factores dispuestos en dos bloques se muestra en el siguiente cuadro. El primer bloque se compone de NF = 4 combinaciones de tratamientos del factorial de 2n
más mF = 2 puntos centrales, y el segundo bloque consiste en Nα = 4 combinaciones de tratamientos estrella más mα = 2 puntos centrales. Los cálculos necesarios para evaluar la primera condición de un diseño de bloques ortogonal son las sumas de los productos cruzados entre X1, y X2 en cada bloque. Es sencillo verificar que ΣX1X2 = 0 en ambos bloques.
Factor A BNivel codificado X1 X2
Bloque I -+-
--+
369
Palacios C. Severo
+ +
Bloque II
+1,414-1,414
00
00
+1,414-1,414
Central000
000
Para el diseño completo:
∑ ∑= =
==12
1
12
1
22
2 8k k
i kkXX
y tanto para el bloque 1 como el bloque 2:
∑ ∑= =
==6
1
6
1
22
2 4k k
i kkXX
El número de observaciones del tratamiento en los bloques 1 y 2 es n1 = n2 = 6 y el número total de observaciones es N = 12, con una razón n1/N = 6/12 = 1/2. La segunda condición, requiere de la razón de las sumas de cuadrados de X1 y X2 en cada bloque para que todo el experimento sea igual a ni/N. Para ambos bloques la razón de la suma de cuadrados es 4/8 = 1/2, que es equivalente a la razón para ni/N, por tanto, el diseño es ortogonal.
Para que se satisfaga la segunda condición, debe cumplirse la siguiente relación:
++=
Fp
pn
1
12 αα
Donde:
pα = ma/Nα y pF = mF/NF.
Para que el diseño satisfaga las dos condiciones y sea rotatorio
( ) 4/1/2 αα rrF
n= . No siempre es posible encontrar un diseño que
370
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
cumpla con exactitud con ( )
)1(
²
1²
2
−∑−
−∑=
NN
Y
N
YS ii , pero en la
práctica, los valores del número de observaciones del diseño se pueden determinar de forma que se obtengan diseños con bloqueos casi ortogonales y rotatorios. Box y Draper (1987) ofrecen las proporciones relativas de rF y rα necesarias para los diseños rotatorios y bloques ortogonales cuando pα=pF.
Para el diseño rotatorio central compuesto, la fracción de observaciones centrales en cada bloque es pα=pF=1/2 y 2=α .
Al evaluar la condición de rotabilidad y ortogonalidad se tiene:
22/11
2/112
1
12 =
++=
++=
Fp
pn αα
Y 2=α como lo requiere la rotabilidad.
Los diseños centrales compuestos rotatorios enumerados en la tabla 7.110 se pueden colocar en diseños de bloques incompletos útiles para obtener diseños centrales compuestos casi ortogonales y rotatorios. El factorial 2n o el factorial fraccionario 2n-p se coloca en uno o más bloques incompletos y las combinaciones de tratamiento axiales se colocan en un bloque separado. En la tabla 7.108 se muestran el número de bloques y el número de puntos centrales sugeridos en cada bloque para el factorial 2n o el factorial fraccionario.
Tabla 7.110 Diseño de bloques incompletos para diseños centrales compuestosNúmero factores 2 3 4 5 5 6 6Fraccionado 2n 1 1 1 1 ½ 1 ½ NF
mF
42
82
162
324
162
642
322
Número bloques 1 2 2 4 1 8 2aNα
mα
1,41442
1,68262
2,0081
2,378101
2,00104
2,828121
2,378124
Reducción del número de puntos de diseño
El costo, la dificultad y el tiempo con cierto tipo de experimentos pueden obligar a reducir el tamaño del experimento, pero tal reducción está limitada por el modelo estadístico que estima la
371
Palacios C. Severo
superficie de respuesta. La ecuación de la superficie de respuesta de segundo orden para n factores tiene un término constante, n términos lineales, n términos cuadráticos y n(n-1)/2 términos de interacción, con un total de (n+1)(n+2)/2 términos. Así, el número mínimo de puntos de un diseño para estimar la superficie de respuesta de segundo orden es (n+1)(n+2)/2.
La mayoría de los diseños se basan en factoriales fraccionarios 2n-p
incrementados con puntos de diseño para estimar los modelos de superficie de respuesta de segundo orden. En muchos casos los diseños se saturan con puntos de diseño con pocas o ninguna réplica y se requiere una estimación independiente del error experimental para probar la eficacia del modelo de la superficie de respuesta, a menos que el diseño tenga réplicas. Además, los diseños saturados no permiten probar la falta de ajuste del modelo hipotético de la superficie de respuesta de segundo orden.
Evaluación de los diseños de superficie de respuesta
Myers et al. (1992) usaron la predicción de la varianza de la ecuación de la superficie de respuesta de segundo orden para evaluar muchos de los diseños conocidos de esta superficie, considerando que un diseño era superior si la varianza de los valores pronosticados era menor que la de los otros diseños.
Los diseños centrales compuestos fueron superiores en general para superficies esféricas cubiertas por puntos de diseño. Cuando los diseños se restringieron a las regiones cuboidales (a=1), el diseño de cubo con cara centrada formado por el diseño central compuesto, en general, era superior que el diseño de Box-Behnken en la región cuboidal.
X. SUPERFICIE DE RESPUESTA CUADRÁTICA
Cuando se ha identificado la región de respuesta óptima mediante el método de la pendiente ascendente o algún otro método de experimentación, suele ser necesario determinar la superficie de respuesta en esa región de los factores. Con los diseños descritos en la sección anterior, se pueden realizar experimentos y obtener datos para estimar una aproximación cuadrática de la superficie de respuesta.
372
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
La ecuación de respuesta estimada permitirá al investigador localizar un punto de respuesta estacionario que quizá sea un máximo, un mínimo o un punto de deflexión en la superficie. Un examen de las curvas de nivel indicará qué tan sensible es la variable de respuesta a cada factor y el grado en que los factores afectan a las variables de respuesta.
Ejemplo 7.94Una compañía usaría una nueva herramienta de corte que ofrece un proveedor, éste asegura que la nueva herramienta reducirá los costos de producción porque durará más que el modelo anterior y el costo de reemplazo de la herramienta se reducirá. La vida de una herramienta de corte de metales depende de varias condiciones de operación como la velocidad del torno y la profundidad de corte.
Tabla 7.111 Duración de una herramienta, en función de la velocidad del torno y la profundidad de corte como factores de tratamiento, en un diseño central compuesto
Codificados Originales Vida de herramientaX1 X2 Velocidad Profundida
d++--
2−
2+00000000
+-+-00
2−
2+000000
600600200200683117400400400400400400400400
0,1000,0500,1000,0500,0750,0750,1100,0400,0750,0750,0750,0750,0750,075
1541321668315614416691
167175170176156170
El ingeniero de planta había determinado mediante estudios anteriores que la vida máxima de la herramienta se lograba, para la herramienta actual, con una velocidad de 400 y una profundidad de corte de 0,075. El ingeniero, que deseaba determinar la situación óptima para la nueva herramienta, usó un diseño central compuesto en un experimento para determinar la vida de la nueva herramienta al variar las velocidades del tomo y las profundidades de corte dentro de la región de condiciones de operación óptimas urgentes para la vida máxima de la herramienta. Los datos del experimento se muestran en la tabla 7.111.
373
Palacios C. Severo
Ecuación de superficie de respuesta estimada
El modelo de la superficie de respuesta de segundo orden se ajusta a los datos mediante los procedimientos de regresión de mínimos cuadrados.
La ecuación se puede estimar con un programa de computadora para análisis de regresión. La ecuación de la superficie de respuesta de segundo orden estimado para los datos de la vida de la herramienta de la tabla 7.111 es:
2122
2121 25,15625,21875,10385,26747,6169 XXXXXXY −−−++=
Sumas de cuadrados para el análisis de regresión
La suma de cuadrados en el análisis de varianza para el modelo de regresión se muestra en la tabla 7.112. Las sumas de cuadrados para el modelo de segundo orden completo son:
( ) 946,1021
22
2121
,,,,=
XXXXXXRSC
Se hace una partición de la suma de cuadrados de regresión en reducciones para el modelo lineal y las componentes cuadráticas del modelo, con el principio de particiones de sumas de cuadrados del modelo reducido y el modelo completo.
La partición para las componentes lineales del modelo, X1 y X2, o:
( ) 933,521
, =XXRSC
Tabla 7.112 ANAVA para modelo se superficie respuesta cuadráticoFuente SC Gl CM Fo(99%
)Regresión Lineal CuadráticoError Falta de ajuste Error puro
10946 593
3 5013
371 111
260
5 2 3
8 3 5
2189,22966,51671,046,437,052,0
>>>
47,1863,9336,01
Total 11317 13 R² = 96,7217%
374
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Es la suma de cuadrados de la regresión para el modelo reducido de primer orden ε+++= 2211 XAXAAY o . La partición para las componentes cuadráticas es la diferencia entre la suma de cuadrados de regresión para el modelo completo y el modelo reducido, es decir:
5013593310946)( 2121
22
21
=−=XXXXXXR
SC
Se hace una partición de la suma de cuadrados para el error, SCE = 371 en dos partes. La suma de cuadrados para el error puro, SCE(error
puro) = 260, con 5 grados de libertad se calcula a partir de las seis réplicas observadas en el centro del diseño con coordenadas de factor (V, D)=( 400; 0,075). Las suma de cuadrados para el error con los 3 grados de libertad restantes, SCE(falta de ajuste) = 111, se pueden atribuir al error en la especificación del modelo de superficie de respuesta. Como los seis puntos centrales del diseño proporcionan una estimación del error experimental puro, la suma de cuadrados designada como falta de ajuste se puede usar para probar la significancía de la falta de ajuste en el modelo cuadrático.
Pruebas de hipótesis para el modelo de segundo orden
Las hipótesis de interés en el análisis son:
Significancía del modelo completo de segundo orden:
0: 12221121 ===== AAAAAHo
1,4252
2,2189 ==oF
Ho se rechaza, ya que Fo > F(95%) = 5,05
Significancía de las componentes lineales para el modelo:
0: 21 == AAHo
04,5752
56,2966 ==oF
Ho se rechaza, ya que Fo > F(95%) = 5,0579
375
Palacios C. Severo
Significancía de las desviaciones cuadráticas del modelo lineal:
0: 122211 === AAAH o
1,3252
1671 ==oF
Ho se rechaza, ya que Fo > F(95%) = 5,41
Significancía de la falta de ajuste al modelo cuadrático:
71,052
37 ==oF
Ho se rechaza, ya que Fo > F(95%) = 5,41
El modelo de regresión cuadrática completo es significativo y la falta de ajuste al modelo cuadrático no lo es; entonces se puede concluir que el modelo de segundo orden es una aproximación adecuada a la superficie de respuesta real. Una gráfica de curvas de nivel del modelo de superficie de respuesta cuadrático descrito en la grafica de curvas de nivel muestra una superficie máxima con la máxima duración de la herramienta en el centro de las curvas.
Las coordenadas de la gráfica de las curvas de nivel se despliegan para los valores codificados de los dos factores. La orientación de los contornos indica cierta interacción entre la velocidad del torno X1 y la profundidad de corte X2; por ejemplo, la vida de una herramienta de corte de 150 se puede mantener para velocidades mayores, si se incrementa X1 y se disminuye la profundidad de corte, X2.
376
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
-1,50 -0,75 0 ,0 0 ,75 1 ,50
1,50
0,75
0,00
-0,75
-1,50
X1
X2
Z1
Z2
Gráfica de curvas de nivel de la superficie de respuesta para la ecuación de respuesta en el experimento de la vida de la herramienta.
Las curvas también indican la sensibilidad relativa de la vida de la herramienta a los niveles de los factores codificados X1 y X2. Las curvas de la vida de la herramienta aumentan con mayor rapidez cerca del máximo sobre el eje de profundidades codificadas X2 que sobre el eje de las velocidades codificadas X1.
XI. EXPLORACIÓN DE SUPERFICIES DE RESPUESTA
La ecuación cuadrática significativa y la gráfica de curvas de nivel de la ecuación proporcionan un panorama general de la relación entre la vida de la herramienta y los dos factores del diseño, velocidad del torno y profundidad de corte.
Las estimaciones de las coordenadas del punto estacionario en la superficie y una estimación de la respuesta en ese punto proporcionan una definición más específica de la superficie de respuesta. En ocasiones, es útil conocer la dirección y cantidad de cambio hecho en uno o varios niveles de los factores para lograr el cambio máximo en la respuesta.
Es posible determinar de manera más específica la sensibilidad de la respuesta a los factores del diseño con la forma canónica de la ecuación de respuesta. Localizar las coordenadas del punto estacionario y derivar la forma canónica de la ecuación de respuesta requieren cierto conocimiento de cálculo y álgebra matricial.Sin embargo, los resultados de los cálculos se entienden cuando se presentan con la forma gráfica de curvas de nivel.
377
Palacios C. Severo
Punto estacionario de la superficie de respuesta
Las coordenadas X1 y X2 del punto estacionario se obtienen de las derivadas parciales de la función de respuesta estimada respecto a X1
y X2. La respuesta estimada para la duración de la herramienta es:
2122
2121 250,15625,21875,10385,26747,6169 XXXXXXY −−−++=
Las derivadas parciales se igualan a 0:
01
=∂∂X
Y
02
=∂∂X
Y
para producir las ecuaciones:
( ) ( )( ) ( ) 385,26625,212250,15
747,6250,10875,102
21
21
−=−+−−=−+−
XX
XX
Las soluciones de las ecuaciones para X1 y X2 son X1S=-0,156 y X2S=-0,665. Estos valores son las coordenadas de la respuesta máxima sobre la superficie en el punto estacionario indicado en la Gráfica de curvas de nivel.
La respuesta estimada en el punto estacionario se encuentra al sustituir X1S=-0,156 y X2S=0,665 en el modelo; la respuesta estimada en el punto estacionario es.
( ) ( ) ( ) ( )( )( ) 25,177665,0156,0250,15
665,0625,21156,0875,10665,0385,26156,0747,6169 22
=−−−−−+−+=SY
Dado:
( ) 200/4001 −= VX
( ) 025,0/075,02 −= DX
378
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Los valores de la velocidad del torno (V) y la profundidad de corte (D) en el punto estacionario son:
( ) 8,368400200156,0 =+−=V
( ) 092,0075,0025,0665,0 =+=D
Análisis canónico para simplificar la ecuación cuadrática
La forma canónica de una ecuación cuadrática es eficaz para visualizar la superficie y determinar la sensibilidad relativa de las variables de respuesta a cada factor.
Es difícil visualizar la superficie mediante el examen de los coeficientes estimados para la forma normal de la ecuación de respuesta cuadrática. De la misma manera, es difícil determinar los cambios necesarios en los niveles de los factores para producir un cambio específico en la respuesta.
El análisis canónico gira los ejes de las variables Xi a un nuevo sistema de coordenadas y el centro de este nuevo sistema se coloca en el punto de respuesta estacionario de la superficie. La forma canónica de la ecuación con dos variables es:
222
211 ZZYY S λλ ++=
Donde:
Z1 y Z2 son las variables de los ejes rotados.
Observe que sólo se incluyen los términos cuadráticos de las variables canónicas Z1 y Z2 en la forma canónica de la ecuación de respuesta.
La forma canónica para la ecuación de respuesta de la vida de la herramienta es:
22
21 92,658,2525,177 ZZY −−=
Donde el centro del nuevo sistema de coordenadas se localiza en X1=-0,156 y X2=0,665 en el sistema de coordenadas original mostrado en
379
Palacios C. Severo
la gráfica de curvas de nivel. Se determinó que la relación entre los dos sistemas de coordenadas es:
5185,08877,04603,0 211 −+= XXZ
4446,04603,08877,0 212 +−= XXZ
Observe que los ejes canónicos Z1 y Z2 están orientados junto con las curvas de nivel de la superficie. Los tamaños y signos de las λ, indican el tipo de superficie de respuesta cuadrática que se estimó.
Los coeficientes λ, para la superficie de la vida de la herramienta son λ1 =-25,58 y λ2 = -6,92, un examen de la superficie en la Gráfica de curvas de nivel revela que cualquier movimiento que se aleja del centro del sistema de coordenadas Z1, Z2 tiene como resultado una disminución en la respuesta. Así, cuando todos los coeficientes λ, son negativos la superficie es máxima, como en el caso de la superficie de la vida de la herramienta.
Si los coeficientes λ, son positivos, entonces el resultado de cualquier movimiento que se aleja del centro del sistema de coordenadas Z1, Z2
es un incremento en la respuesta y la superficie es mínima como se muestra en la figura 7.2a. Si un coeficiente es positivo y los demás negativos, digamos λ1 > 0 y λ2 < 0, entonces cualquier movimiento que se aleja de (0, 0) a lo largo del eje Z, aumenta la respuesta y si se aleja por el eje Z, la disminuye. Así, la superficie es minimax o con forma de silla en el punto estacionario. Si una de las λ1 = 0, la superficie es una cresta estacionara porque la respuesta no cambia en los ejes Z1.
Las longitudes de los ejes principales de las elipses formadas por las curvas de nivel son proporcionales a 2/1−λ . Para la superficie de la
vida de la herramienta 20,058,252/1 =− − y 38,092,6
2/1 =− − , y la superficie ajustada se atenúa a lo largo del eje Z, como se ve en la gráfica de curvas de nivel.
Para explicarlo, supongamos que la velocidad del torno y la profundidad de corte para una vida máxima en las coordenadas
156,01 =X y 665,021 =X no eran prácticas. El menor cambio en la duración de la herramienta cuando cambian la velocidad del torno y la profundidad de corte se exhibe en la superficie en la dirección del eje Z2 cuando Z1 = 0. Las coordenadas X1 y X2 en el eje Z2 cuando Z1 = 0
380
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
se pueden obtener de la primera ecuaciones canónica. La pérdida mínima en la vida de la herramienta se encuentra en los valores de X1
y X2 que satisfacen 0,4603X1 + 0,887X2 - 0,5185 = 0.Los coeficientes de X1 proporcionan información acerca de las relaciones de velocidad del torno y la profundidad de corte con la vida de la herramienta.
Considerando que los coeficientes para la ecuación que relacionan Z2
con X1 y X2, Z2 = 0,887X1 – 0,4603X2 + 0,4446. El par de coeficientes (0,8877; -0,4603) indican una compensación entre la velocidad del torno y la profundidad de corte en la vida útil, porque en cierto grado, un incremento en la velocidad del torno se puede compensar con una disminución en la profundidad de corte sobre el eje Z2.
La ecuación de respuesta estimada en forma original o en forma canónica sólo es válida para la zona de los niveles de los factores incluida en el experimento.
Cualquier intento para estimar la vida de la herramienta fuera de los límites acotados por las velocidades de 117 a 683 y las profundidades de 0,04 a 0,1 1 será engañoso, por lo que es necesario un modelo de respuesta por completo diferente para determinar la duración de la herramienta fuera de la región de este estudio.
Ejemplo 7.95Se estudian dos factores a tres niveles, con la finalidad de maximizar la recuperación de iones metálicos contaminantes que se encuentran presentes en un efluente natural a través de la resina AO, así mismo se requiere minimizar dicha contaminación natural.
El tercer nivel (central) sirve para evaluar la varianza del error de las pruebas desarrolladas experimentalmente. De esa manera también evaluamos el error que cometemos cada uno de nosotros.
FactoresNiveles
- 0 +Resina Orgánica AOpH
0.42.5
0.63
0.83.5
En este caso se quiere optimizar el proceso por lo que deberá desarrollarse los siguientes pasos:
381
Palacios C. Severo
Primero: visualizamos los factores y vemos el comportamiento individual de cada uno de ellos, en función del tiempo, con la finalidad de poder establecer la influencia que tienen las variables sobre el proceso y de esa manera desarrollar el análisis que nos reafirmara lo acontecido.
AO
t
La Resina Orgánica AO en función del tiempo varía en forma polinomial, por lo tanto es un factor cuadrático.
El pH de cualquier proceso en función del tiempo es siempre lineal.
pH
t
Por lo tanto como una función cuadrática tiene mayor influencia sobre una función lineal entonces el proceso es cuadrático.
Segundo: verificamos sí existe o no interacción en el proceso. Sí no existe interacción entonces dicha prueba será acumulada en el análisis en el error.
Tercero: analizamos la varianza del error mediante las pruebas repetidas los cuales deberán ser mayores de 3 y menores de 6 experimentos para cualquier caso. La evaluación de la varianza del error se desarrolla aplicando la siguiente relación:
382
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
( )( )1
²
1²
2
−−
−= ∑∑
NN
Y
N
YS ii
Cuarto: visualizamos los valores del vector respuesta, tan solo los valores del factorial, los puntos (1,3) y (2,4), intercalado, si los valores son ascendentes el proceso es lineal, pero si los valores son descendentes el proceso el cuadrático. Lo cual confirmará o rechazará nuestra hipótesis planteada en primer término.
Prueba AO pH Y1234
5A5B5C
0.40.80.40.80.60.60.6
2.52.53.53.5333
75.9394.5830.3362.3470.8271.2869.71
Nota: al analizar el vector respuesta, solo los valores del factorial, tendremos en cuenta las siguientes características con el fin de poder establecer la linealidad o cuadratura del proceso en estudio.
1...
100
100...1
ComportamientoAscendente
Lineal
Descendente
Cuadrático
Como notamos los valores del vector respuesta nos da una idea que el proceso es cuadrático, debiendo de confirmar dicho análisis numéricamente, ver Análisis de Linealidad de los Factores.
Calculo de varianza
Para el cálculo de varianza deberá procesar los valores repetidos del vector respuesta:
( )64745,0
6
²81,211
2
²71,69²28,71²82,70² =−++=S
383
Palacios C. Severo
( ) ( ) 2949,1264745,01²
21
==−==−=
NSSC
NGL
error
error
Interpretación: notamos que el valor de la varianza del error es pequeño 0,64745, (tal como se visualiza en la campana de Gauss el error debe fluctuar entre 0 a 1 para desarrollar un trabajo óptimo) por lo tanto las pruebas del error demuestran que el proceso esta siendo desarrollado de una manera adecuada.
1
Aceptación
Recha zo
0
La campana Gauss, nos indica que el valor de la varianza del error se encuentra dentro del área de aceptación, si se ubica fuera de esta entonces el error que se comete no es aceptable para poder comparar valores con los factores.
Al realizar pruebas experimentales factoriales y centrales (error), se establece la existencia de curvatura o linealidad, debiendo desarrollar la siguiente ecuación en valor absoluto a fin de comprobar lo establecido.
CF YY −
Existen dos casos:
> 1, cuando es mayor de uno es cuadrático< 1, cuando es menor de uno es lineal
FY Representa el promedio de los valores del vector respuesta del factorial.
CY Representa el promedio de los valores del vector respuesta de las pruebas centrales.
384
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Como primera fase a fin de determinar cual de las variables son más significativas a cierto nivel, desarrollamos primeramente un diseño factorial simple.
Con el fin de evaluar la variabilidad de los datos se corren pruebas centrales con la finalidad de evaluar el error cometido y establecer si existe curvatura o linealidad, y posteriormente debe desarrollarse una nueva técnica denominado Diseño Central Compuesto a fin de desarrollar el análisis estadístico.
Calculo de efectos e interacciones:
Efectos InteraccionesA = +25,33B = -38,92
AB = +6,68
Error estándar con 3 GL
Interpretación de los efectos
Como se quiere maximizar la extracción de los iones metálicos a través de la resina AO, desarrollamos el siguiente análisis: visualizamos los signos de los efectos de AO y pH.
El factor AO es positivo, por lo tanto está en su nivel mínimo, por lo cual deberá ser maximizado, es decir que este factor es una variable, y deberán ser optimizado y establecido su rango de trabajo óptimo.
AO0,4 0,8
p H
Y
2,5 3,5
88
78
68
58
48
Efectos med ios pa ra Y
AO0,4
p H=2,5
Y
112
9 2
7 2
52
32
In te r a c c ión p a r a Y
0,8
p H=3,5
p H=2,5
p H=3,5
Efectos significativos de factores principales
Interacción de factores principales
El factor pH es negativo, por lo tanto está en su máximo, ósea esta en su punto óptimo, dicho factor viene a ser una constante con el valor máximo de su nivel, si incrementamos dicho factor en el proceso el vector respuesta decae.
385
Palacios C. Severo
Entonces debemos evaluar con mayor amplitud el factor AO para establecer el rango óptimo donde debe trabajar con mayor eficiencia.
Interpretación de la interacción
Notamos que el signo de la interacción AB es positivo, esto nos indica que no existe interacción en el rango estudiado, por estar minimizando la contaminación en el efluente natural.Análisis de linealidad de los factores
Seguidamente evaluamos la curvatura del proceso lo cual quedo establecido a simple vista, cuando analizamos de una manera objetiva los valores del vector respuesta, por lo que debemos reafirmarlo desarrollando los cálculos necesarios, aplicando la siguiente relación, sí:
CF YY − Es pequeño no existe curvatura
CF YY − Es grande existe curvatura
795,65=FY 6033,70=CY
La diferencia es 4,8083 siendo este valor grande, por lo tanto existe curvatura
Lineal
Curv
a tura
1-2 3-4
5
Curva tura
Análisis: los puntos factoriales de las pruebas los visualizamos de frente (1-2, 3-4), el punto central, de las pruebas repetidas, lo vemos de canto (5) con la finalidad de observar que no siempre se encuentra en el plano sino que este varía de acuerdo al trabajo desarrollado (observamos que la curva de Gauss varia de 0 a 1), por lo que el valor de la diferencia entre los promedios de los puntos factoriales y centrales deben estar dentro de dicho rango. Visualizando nuestro
386
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
experimento verificamos que no se encuentra dentro del rango 0-1 por lo tanto es un proceso cuadrático.Por consiguiente
Los puntos centrales nos sirven para verificar la Linealidad supuesta de los factores en el experimento. Así mismo nos sirve para analizar la varianza del error experimental desarrollado durante el experimento, de tal manera de poder conocer cuanto error cometemos al desarrollar los trabajos experimentales.Como existe curvatura en nuestro proceso experimental, entonces debemos adicionar pruebas con la finalidad de desarrollar un análisis espacial. Dicho incremento de pruebas se denomina puntos estrella, la adición de dichas pruebas al diseño factorial con pruebas centrales se le denomina Diseño Compuesto Central.
Ejemplo 7.96De acuerdo al ejemplo 7.94, complementamos los puntos estrella o axiales, los cuales están representados en el cuadro siguiente, seguidamente analizamos el diseño
Pruebas AO pH Y78910
0,3170,883
0,60,6
33
2,2933.707
50,6087,3489,9934,75
El hecho de haber adicionado pruebas estrella al diseño factorial con pruebas centrales, el nuevo diseño se denomina compuesto central, un diseño rotable que nos proporciona mucho más información que un diseño factorial simple.
El presente caso es con la finalidad de incrementar el rango de los niveles a ambos lados sin tener que mover los datos originales y a la vez establecer las condiciones necesarias del proceso a fin de visualizar los efectos, interacciones y cuadraturas en el amplio rango en estudio.
El rango de 0,317157 a 0,882843 de estudio para la resina (AO), nos amplia el ámbito al cual es importante desarrollar el proceso, así mismo el rango del pH de 2,29289 a 3,70711, como se podrá visualizar en el grafico, se puede establecer que el rango real en el cual estamos estudiando, ya que en el análisis inicial del diseño factorial el rango era muy pequeño y con este nuevo diseño tenemos el rango real de trabajo.
387
Palacios C. Severo
Del valor total de pruebas del Diseño Compuesto Central vamos a analizar los efectos principales, interacciones y cuadraturas los cuales se muestran a continuación en el cuadro adjunto:
Efectos e interaccione
s
Efectos cuadráticos
A =25,6545B =-38,990AB = +6,68
AA = -1,5708BB = -8,1707
Errores estándar con 5 GLInterpretación de los efectos:
Visualizamos los signos de los efectos de AO y pH:
Notamos que el factor AO es positivo, por lo tanto está en su nivel mínimo, el cual deberá ser maximizado, es decir que este factor es una variable, y deberán ser optimizado y establecido su rango de trabajo óptimo.
El factor pH es negativo, por lo tanto está en su máximo, ósea esta en su punto óptimo, dicho factor viene a ser una constante con el valor máximo de su nivel.
AO0,4 0,8
Y
97
87
77
67
57
47
Efectos medios para Y
0,8pH
2,5 3,5AO
Y
110
90
70
50
30
Interacción para Y
0,80,4
pH=2,5
pH=3,5
pH=2,5
pH=3,5
Efectos de factores principales Interacción de factores principales
Interpretación de la interacción:
Notamos que el signo de la interacción AB es positivo, esto nos indica que dicha interacción esta en su mínimo, por lo tanto hay que maximizarlo, entonces no existe intersección entre los valores numéricos.
Análisis de las cuadraturas:
388
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Notamos que el signo de la cuadratura AO y pH son negativos, esto nos indica que ambas cuadraturas están en su máximo, entonces están en el rango óptimo, con el valor máximo, por lo que viene a ser una constante en el proceso, además esto nos indica que existe curvatura, lo cual lo hemos deducido al desarrollar la diferencia entre los valores promedios del factorial y la prueba central.
El análisis de varianza nos confirma lo desarrollado, así mismo el coeficiente de correlación establece que el modelo matemático se ajusta al proceso, la varianza del error (cuadrado medio del error CM) esta dentro de la curva de Gauss, podemos decir el trabajo esta bien desarrollado y se puede reconfirmar dicho proceso cuantas veces sea.
Tabla 7.113 Análisis de varianzaFuente SC Gl CM Fo Ft(99%)ABAAABBBError
1316,313040,493,4836
44,622494,2531,5546
111115
1316,313040,493,4836
44,622494,2530,3109
4233,599778,97
11,20143,52303,14
>><>>
16,2616,2616,2616,2616,26
Total 4498,3 10 R² = 99,9654%
El hecho de haber adicionado pruebas estrella al diseño factorial con pruebas centrales, el nuevo diseño se denomina Compuesto Central, un diseño rotable que nos proporciona mucho más información que un diseño factorial simple.
El presente caso es con la finalidad de incrementar el rango de los niveles a ambos lados sin tener que mover los datos originales y a la vez establecer las condiciones necesarias del proceso a fin de visualizar los efectos, interacciones y cuadraturas en el amplio rango en estudio.
El rango de 0,317157 a 0,882843 de estudio para la resina, nos amplia el ámbito al cual es importante desarrollar el proceso, así mismo el rango del pH de 2,29289 a 3,70711, como se podrá visualizar en el grafico, se puede establecer que el rango real es el cual estamos estudiando, ya que en el análisis inicial del diseño factorial el rango era muy pequeño y con este nuevo diseño tenemos el rango real de trabajo.
Modelo matemático
389
Palacios C. Severo
El primer paso consiste en desarrollar un modelo matemático, el cual debemos analizarlo. Debido a la curvatura de la superficie respuesta, el experimento requiere un modelo cuyo grado sea mayor e igual a 2, para aproximar la respuesta cuando se encuentre relativamente cercana al óptimo.
AOpHpHAOpHAOY 4,33²3416,16²6356,190191,395009,120693,55 +−−+−=
Determinación de condiciones óptimas
Se define las condiciones de operación óptima, maximizando o minimizando los resultados del mismo. Una condición inicial es remover los niveles de operación y determinar los resultados óptimos mediante la aplicación de técnicas para determinar los nuevos niveles operacionales (pendiente ascendente o descendente).
Valor óptimo = 8,47071Factor Bajo Alto Óptimo
AOpH
0,317157
2,29289
0,882843
3,70711
0,317157
3,70711
El problema consiste en eliminar el contaminante del efluente, por lo que se tiene que minimizar el contenido metálico de dicho efluente y maximizar la extracción con la resina, por lo que optimizando el proceso se puede dejar hasta un 8,47071% del contenido metálico y además maximizando la capacidad de adsorción de la resina se llega hasta un 99,8925% de eficiencia, lo cual es loable para la eliminación de contaminante metálico del efluente que se quiere reutilizar.
Si en la optimización intervienen dos o más variables independientes, frecuentemente puede prepararse superficies que muestren la relación existente entre las variables.
Uno de los métodos de amplia aplicación es la máxima pendiente ascendente o descendente.
XII. PUNTO ESTACIONARIO
Si se desea maximizar las respuestas del modelo ajustado, si existe, serán el conjunto de las Xi tal que las derivadas parciales sean iguales a cero. Dicho punto, es decir X1S, X2S, X3S ... XiS se denomina punto estacionario
390
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
132121111
aXaXaX
Y ++=∂∂
232221212
aXaXaX
Y ++=∂∂
Desarrollando las derivadas parciales obtenemos la siguiente relación:
0191,396832,324000,33
5009,124000,332712,39
21
21
−=−++=+−
XX
XX
Desarrollando matricialmente, obtenemos el punto estacionario:
X1 = 5,327X2 = 6,6377R(P) = 151,27
Una vez obtenido el punto estacionario (ósea la intersección del nuevo eje de planos Zi) debemos hallar el ángulo de giro de las nuevas coordenadas, aplicando la siguiente relación:
2211
122AA
ATan
−=θ
Reemplazando valores obtenemos:
"5,12´2621°−=θ
R(P)
Z2
Z1
X2
X1
θ
Donde
391
Palacios C. Severo
R(P) viene a ser el punto estacionario, así mismo viene a ser el punto de intersección del nuevo eje real en el cual está inscrito el modelo matemático.
XIII. CRITERIO DE FORMAS CUADRÁTICAS
Se requiere como condición necesaria y suficiente para que la forma cuadrática sea definida positiva es que se cumpla:
02221
1211 >aa
aa
Para desarrollar la matriz derivamos por segunda vez la ecuación diferencia parcial, obteniéndose:
2712,39²
11
−=∂∂
∂XX
Y4,33
²
21
+=∂∂
∂XX
Y
4,33²
12
+=∂∂
∂XX
Y6832,39
²
22
−=∂∂
∂XX
Y
Entonces:
94,1672221
1211 >aa
aa
Análisis del coeficiente de regresión:
La relación AO está en su mínimo por lo tanto tiende a ascender, el pH del medio esta en su máximo por lo tanto tiende a bajar, dicho análisis lo desarrollamos con la finalidad de poder establecer los niveles de ascendencia o descendencia hasta llegar al valor óptimo. Al visualizar los signos de las cuadraturas notamos que ambos tienen el signo negativo por lo tanto deducimos que es una elipse o cáscara de huevo, y un elipsoide en el espacio.
Si la relación AO y el pH del medio fuesen cero, la recuperación del proceso está en su mínimo (R = 55,0693), por lo tanto hay que desarrollar la pendiente ascendente hasta llegar al óptimo (para el caso de maximizar la capacidad de adsorción de la resina, y si fuere el
392
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
caso de minimizar la contaminación se tendrá que desarrollar la pendiente descendente).
Camino de Máximo Ascenso para yAO pH Y0,6
0,6350,67
0,7050,740,775
3,02,872,742,632,532,44
70,60377,46283,19987,90491,68594,659
Visualizamos el gráfico espacial que representa a un sector de la elipse estando la región óptima de recuperación en una relación AO a 0,8 y un pH de 2,5 lo cual confirma el análisis establecido, cuando es el caso de maximizar la capacidad de adsorción de la resina, si fuere el caso de eliminar el contaminante metálico se tendrá que trabajar con el valor mínimo de AO y el valor máximo de pH. Se debe de analizar de acuerdo si se quiere maximizar o minimizar el proceso.
E stim ated R esponse Surface
A O
p H
Y
3 0 .0 -38 . 0
3 8 .0 -46 . 0
4 6 .0 -54 . 0
5 4 .0 -62 . 0
6 2 .0 -70 . 0
7 0 .0 -78 . 0
7 8 .0 -86 . 0
8 6 .0 -94 . 0
9 4 .0 -10 2 .00 .4 0 .5 0 .6 0 .7 0 .8 2 .5
2 .72 .9
3 .13 .3
3 .5
3 0
5 0
7 0
9 0
11 0
C o nto u rs o f E stim ate d R espo n se S u rfac e
A O
pH
Y
3 0. 0 -3 8 .0
3 8 . 0 -4 6 .0
4 6 . 0 -5 4 .0
5 4 . 0 -6 2 .0
6 2 . 0 -7 0 .0
7 0 . 0 -7 8 .0
7 8 . 0 -8 6 .0
8 6 . 0 -9 4 .0
9 4 . 0 -1 0 2 .0
0 .4 0 . 5 0 . 6 0 . 7 0 .82 .5
2 .7
2 .9
3 .1
3 .3
3 .5
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
Tal como establecimos que la relación AO tiene que subir y el pH del medio tiende a bajar con la finalidad de llegar a una alta capacidad de adsorción de la resina. En este caso se ha establecido que en un cuarto paso se llega a una recuperación de 99,743 variando la relación AO en forma ascendente con 0,87 y un pH descendente en 2,25 de esa manera se obtiene dicha máxima capacidad de la resina.
En el presente grafico en el plano, se puede establecer claramente que la máxima capacidad de adsorción de la resina se ubica cuando se mantiene constate en el mínimo nivel el pH y en el máximo nivel el AO, pero si se quiere la eliminación del contaminante metálico se tiene que
393
Palacios C. Severo
trabajar con el máximo nivel del pH y con el mínimo nivel del AO, con el fin de desarrollar un trabajo acorde al proceso a desarrollar.
El modelo matemático nos demuestra que inicialmente la contaminación se encuentra sobre 55,0693%, así que el factor de mayor significancía para eliminar dicho contenido metálico es la resina con una pendiente negativa de -19,6356, lo cual hace disminuir dicha contaminación hasta un porcentaje adecuado para rehusar dicho producto acuífero.
Ejemplo 7.97Se desarrolla una investigación sobre la flotabilidad de un mineral sulfurado, se desea conoce los niveles óptimos de dos factores tiempo de acondicionamiento y pH con la finalidad de optimizar la recuperación del mineral
NivelesFactores - 0 +
A: Tiempo (min)B: pH
5,08,5
6,59,5
8,010,5
Para n = 2 factores, se ha de utilizar un diseño central compuesto equivalente a 2²+2*2+5 = 13 pruebas experimentales, con cinco pruebas centrales a fin de evaluar el error experimental y el error cometido por el investigador.
Prueba A B Y12345678910111213
5.08.05.08.0
4.378688.62132
6.56.56.56.56.56.56.5
8.58.510.510.59.59.5
8.0857910.9142
9.59.59.59.59.5
75,97278
79,578,475,672
79,979,585,185
79,179,8
Efectos e interacciones
Efectos cuadráticos
A = -1,59B = 5,193AB = 2,70
AA = -4,762BB = -5,812
Errores estándar con 7 GL
394
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Tabla 7.114 Análisis de varianzaFuente SC Gl CM Fo Ft(95%)ABAAABBBError
5,05553,93539,445
7,2958,75638,304
111117
5,05553,93539,445
7,2958,7565,472
0,929,867,211,33
10,74
<><<>
5,595,595,595,595,59
Total 191,304 12 R² = 80,0199%
Camino de Máximo Ascenso para yA B Y
6,56,466,426,406,396,436,386,236,25
9,59,599,689,779,869,95
10,0410,1310,22
81,781,9282,0982,2082,2682,2882,2482,1481,97
Y
5
B=8.5
B=10.5
Gráfica de Interacción para y
71
73
75
77
79
81
83
A8
B=8.5
B=10.5
Y
5
B=8.5
B=10.5
Gráfica de Interacción para y
71
73
75
77
79
81
83
A8
B=8.5
B=10.5
Efectos significativos de factores principales
Interacción de factores principales
ABBABAY 9,0²906,2²058,1965,51678,4953,190 +−−++−=
A
B
Contornos de la Superfic ie de Respuesta Estim ada
5 5.5 6 6.5 7 7.5 88.5
8.9
9.3
9.7
10.1
10.5 y71.0-72.272.2-73.473.4-74.674.6-75.875.8-77.077.0-78.278.2-79.479.4-80.680.6-81.881.8-83.083.0-84.2
AB
Y
S up er f ic ie d e R e s pu es ta E s t im a da
5 5 .5 6 6 .5 7 7 .5 88 .5
8 .99 .3
9 .710 .1
1 0 .5
7 1
7 3
7 5
7 7
7 9
8 1
8 3
y7 1.0 -7 2 .27 2.2 -7 3 .47 3.4 -7 4 .67 4.6 -7 5 .87 5.8 -7 7 .07 7.0 -7 8 .27 8.2 -7 9 .47 9.4 -8 0 .68 0.6 -8 1 .88 1.8 -8 3 .08 3.0 -8 4 .2
395
Palacios C. Severo
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
Valor óptimo = 82,2841Factor Bajo Alto Óptim
oAB
4,3788,085
8,62110,914
6,4359,936
Ejemplo 7.98Se desea evaluar un lecho de filtración, para lo cual se estudian dos factores, altura de lecho y velocidad de flujo
FactoresNiveles
- +A: Altura de lechoB: Velocidad de flujo
20140
30220
A B Y20302030252525
140140220220180180180
6,225,579,518,156,156,186,12
Efectos InteraccionesA = -1,005B = 2,935
AB = -0,355
Errores estándar con 3 GL
Tabla 7.115 Análisis de varianzaFuente SC Gl CM Fo Ft(95%)ABABError
1.010028,61423
0,1260252,52207
1113
1.010028,61423
0,1260250,84068
1,2010,250,15
<><
10,1310,1310,13
Total 12,2723 6 R² = 79,4492%
ABBAY 00088,0058,0059,024,1 −++−=
Camino de Máximo Ascenso para yA B Y25
25,526
26,527
180167,73153,93137,72116,82
6,846,345,805,194,43
396
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
27,528
28,529
72,2966,68
230,66223,15
2,872,688,197,87
Valor óptimo = 82,2841Factor Bajo Alto Óptim
oAB
20140
30220
20220
20B
220
Gráfica de Efectos Principales para Y
5.3
6.3
7.3
8.3
9.3
Y
A30 140 20
B=140
B=220
Gráfica de Interacción para Y
5
6
7
8
9
Y
A30
B=140
B=220
Efectos de factores principales Interacción de factores principales
Contornos de la Superficie de Respuesta Estimada
20 22 24 26 28 30
A
140
160
180
200
220
B
Y5.0-5.45.4-5.85.8-6.26.2-6.66.6-7.07.0-7.47.4-7.87.8-8.28.2-8.68.6-9.09.0-9.4
Superficie de Respuesta Estimada
20 22 24 26 28 30A
140160
180200
220
B
5
6
7
8
9
Y
Y5.0-5.45.4-5.85.8-6.26.2-6.66.6-7.07.0-7.47.4-7.87.8-8.28.2-8.68.6-9.09.0-9.4
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
Ejemplo 7.99Se desea estimar el efecto del SO2 sobre la población cercana a una fábrica de tostación de concentrados sulfurosos, con el fin de monitorear dicho contaminante se han considerando los siguientes factores: Tasa de emisividad Q del contaminante a la salida de la chimenea y la altura de la chimenea.
FactoresNiveles
- +
397
Palacios C. Severo
A: Tasa de emisividad (g/s)B: Altura (m)
530
1060
A B Y5
105
103,9611,03
7,57,57,57,57,57,57,5
303060604545
2,3766,21
4545454545
140180200310130320170300280270265275266
Efectos e interacciones
Efectos Cuadráticos
A = 104,675B = 93,4619AB = 35,000
AA = -57,4506BB = -47,4500
Errores estándar con 7 GL
Tabla 7.116 Análisis de varianzaFuente SC Gl CM Fo Ft(95%)ABAAABBBError
21913,617470,35740,031225,03915,652937,24
111117
21913,617470,35740,031225,0
3915,65419,605
52,2241,6313,682,929,33
>>><>
5,595,595,595,595,59
Total 52110,9 12 R² (%) = 94,3635
ABBABAY 466,0²105,0²596,41054,98757,68558,340 +−−++−=
Camino de Máximo Ascenso para YA B Y
7,58,59,510,511,512,5
45,0050,6556,9964,1372,2381,78
271,2304,43328,08340,43338,87318,71
Valor óptimo = 341,554Factor Bajo Alto Óptim
oAB
3,96423,786
11,03533,213
10,85466,213
398
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
5B
60
Gráfica de Efectos Principales para Y
190
210
230
250
270
290
310
Y
A10 30
5
B=30
B=60
Gráfica de Interacción para Y
130
170
210
250
290
330
370
Y
A10
B=30
B=60
Efectos de factores principales Interacción de factores principales
Contornos de la Superficie de Respuesta Estimada
5 6 7 8 9 10
A
30
35
40
45
50
55
60
B
Y130.0-154.0154.0- 178.0178.0-202.0202.0-226.0226.0-250.0250.0-274.0274.0- 298.0298.0-322.0322.0-346.0346.0-370.0370.0-394.0
Superficie de Respuesta Estimada
5 6 7 8 9 10A
30354045505560
B130
170
210
250
290
330
370Y
Y130.0-1 54.0154.0-1 78.0178.0-202.0202.0-226.0226.0-250.0250.0-274.0274.0-298.0298.0-322.0322.0-346.0346.0-370.0370.0-394.0
Superficie respuesta estimada en el plano con punto óptimo
Superficie respuesta estimada en el espacio
Ejemplo 7.100Los experimentos de lixiviación con sales oxidantes en medio acido a minerales auríferos procedentes de la Concesión Minera Huaracane – Moquegua - Perú, fueron realizados para establecer el efecto de los factores de los agentes lixiviantes y el ácido sobre la disolución del oro metálico.
Todas las pruebas se desarrollaron a temperatura ambiente y con agitación constante, y a un tiempo establecido.
El mineral previamente fue molido con la finalidad de liberar el oro que se encuentra incrustado, ya que dicho material se encuentra en forma microscópica encapsulado en cuarzo, con una ley promedio de 15 g/t, las sales oxidantes en medio ácido sirven para desarrollar el proceso y son de calidad comercial (fertilizantes).
En todas las pruebas se llegan a desarrollar reacción exotérmica (espontánea) con el fin de acelerar el proceso de disolución del oro (cinética).
399
Palacios C. Severo
El contenido de oro en la solución lixiviada se analizo por electrogravimétria. Para determinar el efecto de los factores se estudio a dos niveles la concentración de las variables con el fin de no interferir en el análisis del oro.
FactoresNiveles
- +A: H2SO4
B: NaNO3
C: NaCl
1002070
1203090
Resultados y discusión
Al concluir con las pruebas experimentales, se procedió analizar la extracción de oro de l material aurífero, para lo cual se utilizó el programa estadístico Statgraphics Plus, de cuyo tratamiento de datos se obtuvo la estimación de los efectos de cada uno de los factores siendo este el resultado de dicho análisis:
Acido sulfúrico
El efecto de la concentración de ácido sulfúrico se estudia en el rango de 110 a 120, manteniendo constante la temperatura, el tiempo de lixiviación así como la agitación del proceso.El efecto de la concentración de ácido sulfúrico es positivo con una pendiente pequeña, evaluando dicho factor podemos llegar a la siguiente conclusión, que dicho factor está en su mínimo nivel, debiendo ser maximizado hasta llegar al óptimo, pero no deberá de exceder de un rango ya que el exceso de dicho producto también es perjudicial y antieconómico, con el fin de poder obtener una máxima extracción de oro del material aurífero.
Efectos einteracciones
EfectosCuadráticos
A: H2SO4 0.885365B: NaNO3 1.48441C: NaCl -12.7076AB 0.25AC 4.75BC 11.25
AA -7.32279BB -8.73692CC -18.6366
Nitrato de sodio
Los resultados obtenidos al desarrollar el experimento factorial con el fin de establecer el efecto de dicho factor, se llegan a la siguiente
400
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
conclusión, si se incrementa fuera del rango establecido se genera gases tóxicos de dióxido de nitrógeno, altamente contaminante para el medio ambiente.
El objeto de adicionar nitrato de sodio es la generación de ácido nítrico, el cual al interactuar con el ácido clorhídrico genera agua regia in situ, compuesto altamente corrosivo, debiendo de controlarse la dosificación de dicha sal a fin de evitar la formación de gases tóxicos.
El efecto de la concentración del nitrato de sodio esta en su nivel mínimo, debiendo maximizarse hasta llegar al óptimo y obtener buenas extracciones del material valioso.
Cloruro de sodio
La dosificación del cloruro de sodio es con la finalidad de producir cloruro de nitrosilo y cloro naciente in situ, los experimentos se llevaron a cabo manteniendo constante la temperatura, el tiempo de lixiviación así como la agitación.
La disolución del oro se incrementa al incrementarse la dosificación de dicha sal, la concentración tiene efecto significativo sobre la solubilidad del oro, debido a que el ión cloro tiene habilidades de formar especies complejas con el oro.El efecto de dicha sal nos indica que esta en su nivel máximo, indicándonos que al incrementarse sobre el máximo se disminuye la recuperación de oro.
M ain Effects Plo t fo r Au
8 2
8 5
8 8
9 1
9 4
9 7
100
Au
H 2S O 41 00 1 2 0
N aN O 32 0 30
N aCl70 90
Interaction Plot for Au
72
77
82
87
92
97
102
Au
A B100 120
- -+ +
A C100 120
-
-
+
+
BC20 30
-
-
+
+
Efectos medios de los factores en recuperación de oro, Proceso SEVERO
Interacciones de factores principales, Proceso SEVERO
Tal como visualizamos el análisis gráfico del efecto medio podemos establecer que la mayor recuperación para el ácido sulfúrico y nitrato
401
Palacios C. Severo
de sodio este cercano al promedio, en cambio el cloruro de sodio esta en su máxima concentración debiendo de ser disminuido hasta llegar al óptimo.
Tabla 7.117 Análisis de varianzaFuente SC Gl CM Fo Ft(95%)
A; H2SO4
B: NaNO3
C: NaClAAABACBBBCCCError
2,67637,5231
551,334182,993
0,12545,125
260,497253,1251185,25604,753
1111111119
2,67637,5231
551,334182,993
0,12545,125
260,497253,1251185,2567,1948
0,040,118,212,720,003,883,77
17,64
<<><<<<>
5,125,125,125,125,125,125,125,12
Total 2827,15 18 R² = 78,6091%
Entre los factores en estudio existe interacción, por lo que no es posible manipular cada factor independientemente, ya que todos los factores están entrelazados para poder desarrollar el Proceso SEVERO.
El análisis de varianza (ANAVA) confirma la importancia que tienen los factores, así mismo las interacciones y cuadraturas del proceso.
El modelo matemático, con un coeficiente de correlación aceptable, si igualamos a cero los tres factores, nos indica que la extracción de oro está en su máximo, debiendo ser regulado este por las dosificaciones del ácido sulfúrico y las sales oxidantes.
NaClNaNONaClSOHNaNOSOHNaCl
NaNOSOHNaClNaNOSOHAu
*112,0*023,0*002,0²093,0
²174,0²0366,0848,8389,0136,686,556
342342
342342
+++−+−+−+−=
En el análisis gráfico se visualiza que la máxima recuperación de oro en encuentra señalada por el signo más que esta dentro de la zona azul (98 a 99% Au). Debiendo de dosificarse adecuadamente con el fin de llegar a dicha recuperación.
402
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
C o n to u r s o f E s t im a t e d R e s p o n s e S u rfa c eN a C l= 8 0 . 0
H 2 S O 4
NaNO
3
A u8 9 .0 - 9 0 . 09 0 .0 - 9 1 . 09 1 .0 - 9 2 . 09 2 .0 - 9 3 . 09 3 .0 - 9 4 . 09 4 .0 - 9 5 . 09 5 .0 - 9 6 . 09 6 .0 - 9 7 . 09 7 .0 - 9 8 . 09 8 .0 - 9 9 . 0
1 0 0 1 0 4 1 0 8 1 1 2 1 1 6 1 2 02 0
2 2
2 4
2 6
2 8
3 0E s t im a te d R e sp o n se S u rfa c e
N a C l= 8 0 .0
H 2 S O 4 N a N O 3
Au
1 0 01 0 41 0 81 1 21 1 61 2 02 0 2 2 2 4 2 6 2 8 3 08 9
9 19 3
9 59 79 9
8 9 .0 - 9 0 .09 0 .0 - 9 1 .09 1 .0 - 9 2 .09 2 .0 - 9 3 .09 3 .0 - 9 4 .09 4 .0 - 9 5 .09 5 .0 - 9 6 .09 6 .0 - 9 7 .09 7 .0 - 9 8 .09 8 .0 - 9 9 .0
Respuesta en el Plano de extracción de oro con punto óptimo
Respuesta espacial de extracción de oro con punto óptimo
Ejemplo 7.101Se desea evaluar un proceso de lixiviación por agitación de un mineral refractario de oro, para lo cual se estudian tres factores que son los que influyen en el proceso de disolución del oro, siendo estos: temperatura, concentración del agente lixiviante y tiempo de agitación. Desarrollándose replicas en la respuesta de recuperación, a fin de contrastar el grado de solubilidad del material valioso.
FactoresNiveles
- +A: Temperatura (°C)B: Concentración (%)C: Tiempo Agitación (Hr)
200,5
0,25
6011
En la tabla se muestra las dosificaciones con sus respectivos resultados de recuperación del material valioso tanto para la prueba original como para la replica, todos bajo las condiciones establecidas de variables (factores) y constantes.
Temperatura (oC)
Concentración (%)
Tiempo agitación (Hr)
Y
2060206020602060
0,50,5
11
0,50,5
11
0,250,250,250,25
1111
42,8356,9378,9281,0064,1772,1387,1788,25
206020
0,50,5
1
0,250,250,25
41,6756,1478,33
403
Palacios C. Severo
6020602060
10,50,5
11
0,251111
80,0063,3370,3786,6787,72
Los tres factores tienen efectos sobre el proceso, pero el de mayor efecto significativo es la concentración seguido del tiempo de agitación y finalmente la temperatura. Por lo que tengo que tener mucho cuidado con los dos primeros factores.
-Efectos InteraccionesA = 6,18B = 25,06C = 12,99
AB = -4,711AC = -1,898BC = -5,108Bloque = -0,896
Error estándar con 8 GL
El block de pruebas desarrollado no tiene efecto significativo sobre el proceso, el hecho de haber corrido pruebas replicadas no tiene efecto sobre el proceso.
Tabla 7.118 Análisis de varianzaFuente SC Gl CM Fo Ft(99%)ABCABACBCBloqueError
152,832515,27675,8788,7814,42
104,393,219,53
11111118
152,832512,27675,8788,7814,42
104,393,211,19
128,192107,15566,8874,4712,1087,562,69
>>>>>><
11,2611,2611,2611,2611,2611,2611,26
Total 3561,32 15 R² = 99,7322%
El análisis de varianza nos confirma la interpretación obtenida del los efectos principales sobre el proceso, si nos fijamos en F-Ratio, las fuentes de los tres factores principales notamos que la concentración es el que tiene mayor efecto significativo seguido del tiempo de agitación y finalmente la temperatura.
Notamos así mismo que el R2 es 99,7322 %, un coeficiente de correlación optimo para el proceso.
En referencia al valor del Error 1,19226, nos confirma que en el experimento se han debido de realizar pruebas centrales a fin de establecer un error experimental de mayor utilidad en el experimento, en vez de las replicas realizadas.
404
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
BCACABCBAY 246,271265,0471,083,42996,855869,0698,13 −−−+++−=
En el modelo matemático nos fijamos en las constantes de los factores principales, si A = B= C = 0, entonces Y = -13,6988. Nos indica que el valor que ha de hacer crecer este valor hasta un valor positivo y se incremente hasta un máximo esta en función directa de la concentración, seguido del tiempo de agitación y por último de la temperatura.
Camino de Máximo Ascenso para y
A B C Y40
41,6642,6442,8842,3441,0340,10
0,750,850,951,051,151,251,3
0,6250,6890,7310,8130,8520,8770,885
70,9777,2282,7387,2792,3496,8599,14
Partiendo del punto central de cada factor, se pude llegar al óptimo variando la concentración de 0,05 en 0,05 y se llega a un optimo del 99,1413.
Valor óptimo = 87,6669Factor Bajo Alto Óptim
oABC
200,5
0,25
6011
2011
Como hemos establecido en las opiniones desde un comienzo, se llega a la conclusión que el óptimo del proceso para llegar en el presente caso hasta un 87,6669 se tiene que trabajar con el valor mínimo de la temperatura, con una máxima concentración y un tiempo de agitación máximo.
M ain E ffects Plo t for Y
58
63
68
73
78
83
88
Y
T em peratura2 0 60
Co ncen tracion0 .5 1
Tiem po ag itacion0.2 5 1
405
Palacios C. Severo
Efectos significativos de factores principales
Tal como hemos establecido en el análisis numérico, podemos visualizar gráficamente lo que hemos establecido en la parte analógica, se puede observar que la mayor pendiente para poder obtener una máxima reucperación lo tiene la concentración seguido del tiempo de agitación y finalmente la temperatura, por lo cual el que tiene mayor efecto significativo es la concentración, al cual hay que controlarlo en todo el proceso, esto no quiere decir que los otros factores no influyan en el proceso, por lo que se tiene que controlar hasta llegar al óptimo de la recuperación.
Contours of Estimated Response SurfaceTiempo agitacion=0.625
Temperatura
Con
cent
raci
on
Y53.0-57.057.0-61.061.0-65.065.0-69.069.0-73.073.0-77.077.0-81.081.0-85.0
20 30 40 50 600.5
0.6
0.7
0.8
0.9
1
Contours of Estimated Response SurfaceConcentracion=0.75
Temperatura
Tie
mpo
agi
taci
on
Y57.0-61.061.0-65.065.0-69.069.0-73.073.0-77.077.0-81.0
20 30 40 50 600.25
0.45
0.65
0.85
1.05
Contours of Estimated Response SurfaceTemperatura=40.0
Concentracion
Tie
mpo
agi
taci
on
Y53.0-57.057.0-61.061.0-65.065.0-69.069.0-73.073.0-77.077.0-81.081.0-85.085.0-89.0
0.5 0.6 0.7 0.8 0.9 10.25
0.45
0.65
0.85
1.05
Superficie respuesta estimada en el plano, manteniendo constante una variable
Para un tiempo de agitación constante en el promedio, se puede llegar a un máximo de extracción manteniendo en su mínimo a la temperatura y en su máximo a la concentración.
Estimated Response SurfaceTiempo agitacion=0.625
TemperaturaConcentracion
Y
53.0-57.057.0-61.061.0-65.065.0-69.069.0-73.073.0-77.077.0-81.081.0-85.0
20 30 40 50 60 0.50.6
0.70.8
0.91
53
63
73
83
93
Estim ated R esp o nse S urfaceConcentracion =0.75
TemperaturaT iem po agitacion
Y
57 .0-61 .061 .0-65 .065 .0-69 .069 .0-73 .073 .0-77 .077 .0-81 .0
20 30 40 50 60 0.250.45
0.650.85
1.05
60
64
68
72
76
80
84
406
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Estimated Response SurfaceTemperatura=40.0
ConcentracionTiempo agitacion
Y
53.0-57.057.0-61.061.0-65.065.0-69.069.0-73.073.0-77.077.0-81.081.0-85.085.0-89.0
0.5 0.6 0.7 0.8 0.9 1 0.250.45
0.650.85
1.05
49
59
69
79
89
Superficie respuesta estimada en el espacio manteniendo constante una variable
Para una concentración constante en el promedio, se puede llegar al máximo de extracción manteniendo en su mínimo a la temperatura y en su máximo al tiempo de agitación.
Para una temperatura constante en el promedio, se puede llegar al máximo de extracción manteniendo en su máximo al tiempo de agitación y en su máximo a la concentración.
407
Temperatura (oC)
Concentración (%)
Tiempo agitación (Hr) Y
2060206020602060
0,50,5
11
0,50,5
11
0,250,250,250,25
1111
42,8356,9378,9281,0064,1772,1387,1788,25
2060206020602060
0,50.5
11
0,50,5
11
0,250,250,250,25
1111
41,6756,1478,3380,0063,3370,3786,6787,72
6,3673,64
40404040
0,750,750,331,170,750,75
0, 6250,6250,6250,625
-0,00571,26
61,2585,3668,4796,5938,7192,57
404040
0,750,750,75
0,6250,6250,625
85,3685,0285,47
Palacios C. Severo
El proceso es cuadrático, por lo tanto se tienen que realizar complementariamente tres pruebas centrales para evaluar el error y seis pruebas estrella a fin de completar el modelo cuadrático.
Ejemplo 7.102Diseño compuesto centrado para ejemplo 7.101
Efectos e interacciones
Efectos cuadráticos
A = 9,631B = 21,465C = 20,886AB = -4,725AC = -1,785BC = -5,26
AA = -9,226BB = -2,703CC = -14,647
Error estándar con 7 GL
Tabla 7.119 Análisis de varianzaFuente SC Gl CM Fo Ft(99%)ABCAAABACBBBCCCError
316,7231573,081489,42239,94644,65136,372420,60655,3352604,631420,001
1111111117
316,7231573,081489,42239,94644,65136,372420,60655,3352604,63160,0002
5,2826,2224,824,000,740,110,340,92
10,08
>>><<<<<<
12,2512,2512,2512,2512,2512,2512,2512,2512,25
Total 4608,82 13 R² = 90,887%
BCACAB
CBACBAY
053,28119,0742,0
²078,52²631,21²0115,0746,118811,111592,11058,55
−−−−−−+++−=
Camino de Máximo Ascenso para yA B C Y
40,041,042,0
0,750,7790,813
0,6250,6650,705
85,39387,85890,148
408
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
43,044,045,0
0,8550,9190,583
0,7440,7840,772
92,35394,80282,541
Valor óptimo = 100,868Factor Bajo Alto Óptim
oABC
6,3640,329-0,005
73,6351,1701,255
41,0791,1700,776
Gráfica de Efectos Principales para Y
67
72
77
82
87
92
97
Y
A20 60
B0.5 1
C0.25 1
Gráfica de Interacción para Y
52
62
72
82
92
102
Y
AB20 60
-
-
+
+
AC20 60
-
-
+
+
BC0.5 1
-
-+
+
Efectoo de factores principales Interacción de factores principalesSuperficie de Respuesta Estimada
C=0.625
20 30 40 50 60A
0 .50 .6
0.70.8
0.91
B61
7 1
81
91
10 1
Y
Y
61.0 -66.066.0 -7 1 .07 1.0 -7 6.07 6.0 -81 .081.0 -86.086.0 -91 .091.0 -96.096.0 -1 01 .01 01 .0-1 0 6.01 06.0-1 1 1 .01 1 1 .0-1 1 6.0
Superficie de Respuesta EstimadaB=0.75
20 30 40 50 60A
0.250.45
0.650 .85
1.05
C
57
67
7 7
87
97
Y
Y
61.0-66.066.0-7 1 .07 1.0-7 6.07 6.0-81 .081.0-86.086.0-91 .091.0-96.096.0-1 0 1 .0101 .0-10 6.0106.0-1 11 .011 1 .0-1 1 6.0
Superficie de Respuesta EstimadaA=40.0
0.5 0.6 0.7 0.8 0.9 1
B
0.250.45
0.650.85
1 .05
C
52
62
7 2
82
92
102
Y
Y
61.0-66.066.0-71.071.0-76.076.0-81.081.0-86.086.0-91.091.0-96.096.0-101.0101.0-1 06.0106.0-111.0111 .0-11 6.0
Superficie respuesta estimada en el espacio manteniendo constante una variable
409
Palacios C. Severo
Contornos de la Superficie de Respuesta Estimada
C=0.625
20 30 40 50 60
A
0.5
0.6
0.7
0.8
0.9
1
B
Y
61 .0-65 .0
65.0-69.069.0-7 3.0
7 3.0-7 7 .0
7 7 .0-81 .0
81 .0-85 .0
85.0-89.089.0-93.0
93.0-97 .0
97 .0-1 0 1 .0
1 01 .0 -1 05.0
Contornos de la Superficie de Respuesta Estimada
B=0.75
20 30 40 50 60
A
0.25
0.45
0.65
0.85
1.05
C
Y
6 1 .0 -6 5 .0
6 5 .0 -6 9 .06 9 .0 -7 3 .0
7 3 .0 -7 7 .0
7 7 .0 -81 .0
81 .0 -85 .0
85 .0 -89 .089 .0 -9 3 .0
9 3 .0 -9 7 .0
9 7 .0 -1 0 1 .0
1 0 1 .0 -1 0 5 .0
C ontorno s de la Superficie de R espuesta Estimada
A=40.0
0 .5 0 .6 0.7 0.8 0.9 1
B
0.25
0.45
0.65
0.85
1.05
C
Y
6 1 .0 -6 5 .0
6 5 .0 -6 9 . 0
6 9 .0 -7 3 . 0
7 3 .0 -7 7 . 0
7 7 .0 -8 1 .0
81 .0 -8 5 .0
85 .0 -8 9 . 0
89 .0 -9 3 . 0
9 3 .0 -9 7 . 0
9 7 .0 -1 0 1 .0
1 0 1 . 0 -1 0 5 .0
Superficie respuesta estimada en el plano manteniendo constante una variable
410
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
ANEXO
411
Palacios C. Severo
p = 0.1 (99%)1 2 3 4 5 6 7 8 9 10
1 4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980.95 6022.40 6055.932 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.403 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.234 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.555 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.056 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.877 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.628 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.819 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.8511 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.5412 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.3013 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.1014 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.9415 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.8016 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.6917 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.5918 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.5119 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.4320 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.3721 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.3122 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.2623 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.2124 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.1725 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.1326 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.0927 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.0628 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.0329 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.0030 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.9831 7.53 5.36 4.48 3.99 3.67 3.45 3.28 3.15 3.04 2.9632 7.50 5.34 4.46 3.97 3.65 3.43 3.26 3.13 3.02 2.9333 7.47 5.31 4.44 3.95 3.63 3.41 3.24 3.11 3.00 2.9134 7.44 5.29 4.42 3.93 3.61 3.39 3.22 3.09 2.98 2.8935 7.42 5.27 4.40 3.91 3.59 3.37 3.20 3.07 2.96 2.8836 7.40 5.25 4.38 3.89 3.57 3.35 3.18 3.05 2.95 2.8637 7.37 5.23 4.36 3.87 3.56 3.33 3.17 3.04 2.93 2.8438 7.35 5.21 4.34 3.86 3.54 3.32 3.15 3.02 2.92 2.8339 7.33 5.19 4.33 3.84 3.53 3.30 3.14 3.01 2.90 2.8140 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.8060 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63
100 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47∞ 6.64 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32
p = 0,25 (97,5%)1 2 3 4 5 6 7 8 9 10
1 647.79 799.48 864.15 899.60 921.83 937.11 948.20 956.64 963.28 968.632 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.403 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.424 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.845 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62
412
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.467 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.768 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.309 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.7211 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.5312 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.3713 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.2514 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.1515 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.0616 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.9917 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.9218 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.8719 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.8220 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.7721 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80 2.7322 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.7023 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81 2.73 2.6724 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.6425 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.6126 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.5927 5.63 4.24 3.65 3.31 3.08 2.92 2.80 2.71 2.63 2.5728 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.5529 5.59 4.20 3.61 3.27 3.04 2.88 2.76 2.67 2.59 2.5330 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.5131 5.55 4.16 3.57 3.23 3.01 2.85 2.73 2.64 2.56 2.5032 5.53 4.15 3.56 3.22 3.00 2.84 2.71 2.62 2.54 2.4833 5.51 4.13 3.54 3.20 2.98 2.82 2.70 2.61 2.53 2.4734 5.50 4.12 3.53 3.19 2.97 2.81 2.69 2.59 2.52 2.4535 5.48 4.11 3.52 3.18 2.96 2.80 2.68 2.58 2.50 2.4436 5.47 4.09 3.50 3.17 2.94 2.78 2.66 2.57 2.49 2.4337 5.46 4.08 3.49 3.16 2.93 2.77 2.65 2.56 2.48 2.4238 5.45 4.07 3.48 3.15 2.92 2.76 2.64 2.55 2.47 2.4139 5.43 4.06 3.47 3.14 2.91 2.75 2.63 2.54 2.46 2.4040 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.3960 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27
100 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18120 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16
∞ 5.03 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05
p = 0.05 (95%)1 2 3 4 5 6 7 8 9 10
1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.882 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.403 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.794 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.965 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.746 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.067 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.648 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.359 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.9811 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.8512 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.7513 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67
413
Palacios C. Severo
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.6015 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.5416 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.4917 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.4518 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.4119 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.3820 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.3521 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.3222 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.3023 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.2724 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.2525 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.2426 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.2227 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.2028 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.1929 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.1830 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.1631 4.16 3.30 2.91 2.68 2.52 2.41 2.32 2.25 2.20 2.1532 4.15 3.29 2.90 2.67 2.51 2.40 2.31 2.24 2.19 2.1433 4.14 3.28 2.89 2.66 2.50 2.39 2.30 2.23 2.18 2.1334 4.13 3.28 2.88 2.65 2.49 2.38 2.29 2.23 2.17 2.1235 4.12 3.27 2.87 2.64 2.49 2.37 2.29 2.22 2.16 2.1136 4.11 3.26 2.87 2.63 2.48 2.36 2.28 2.21 2.15 2.1137 4.11 3.25 2.86 2.63 2.47 2.36 2.27 2.20 2.14 2.1038 4.10 3.24 2.85 2.62 2.46 2.35 2.26 2.19 2.14 2.0939 4.09 3.24 2.85 2.61 2.46 2.34 2.26 2.19 2.13 2.0840 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.0860 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99
100 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91∞ 3.84 3.00 2.61 2.37 2.21 2.10 2.01 1.94 1.88 1.83
Distribución Chi - Cuadradoalfa = área a la derecha de x2 (GL, alfa)
X~X2 (GL) P(X > X2(GL, alfa))
GLalfa
0.100 0.050 0.025 0.010 0.0051 2.7055 3.8415 5.0239 6.6349 7.87942 4.6052 5.9915 7.3778 9.2104 10.59653 6.2514 7.8147 9.3484 11.3449 12.83814 7.7794 9.4877 11.1433 13.2767 14.86025 9.2363 11.0705 12.8325 15.0863 16.74966 10.6446 12.5916 14.4494 16.8119 18.54757 12.0170 14.0671 16.0128 18.4753 20.27778 13.3616 15.5073 17.5345 20.0902 21.95499 14.6837 16.9190 19.0228 21.6660 23.5893
10 15.9872 18.3070 20.4832 23.2093 25.188111 17.2750 19.6752 21.9200 24.7250 26.756912 18.5493 21.0261 23.3367 26.2170 28.299713 19.8119 22.3620 24.7356 27.6882 29.8193
414
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
14 21.0641 23.6848 26.1189 29.1412 31.319415 22.3071 24.9958 27.4884 30.5780 32.801516 23.5418 26.2962 28.8453 31.9999 34.267117 24.7690 27.5871 30.1910 33.4087 35.718418 25.9894 28.8693 31.5264 34.8052 37.156419 27.2036 30.1435 32.8523 36.1908 38.582120 28.4120 31.4104 34.1696 37.5663 39.996921 29.6151 32.6706 35.4789 38.9322 41.400922 30.8133 33.9245 36.7807 40.2894 42.795723 32.0069 35.1725 38.0756 41.6383 44.181424 33.1962 36.4150 39.3641 42.9798 45.558425 34.3816 37.6525 40.6465 44.3140 46.928026 35.5632 38.8851 41.9231 45.6416 48.289827 36.7412 40.1133 43.1945 46.9628 49.645028 37.91
T~t(GL) P(T > t(GL, alfa))
GLalfa
0.1000 0.0500 0.0250 0.0100 0.0050 0.0010 0.00051 3.078 6.314 12.706 31.821 63.656 318.289 636.5782 1.886 2.920 4.303 6.965 9.925 22.328 31.6003 1.638 2.353 3.182 4.541 5.841 10.214 12.9244 1.533 2.132 2.776 3.747 4.604 7.173 8.6105 1.476 2.015 2.571 3.365 4.032 5.894 6.8696 1.440 1.943 2.447 3.143 3.707 5.208 5.9597 1.415 1.895 2.365 2.998 3.499 4.785 5.4088 1.397 1.860 2.306 2.896 3.355 4.501 5.0419 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 1.372 1.812 2.228 2.764 3.169 4.144 4.58711 1.363 1.796 2.201 2.718 3.106 4.025 4.43712 1.356 1.782 2.179 2.681 3.055 3.930 4.31813 1.350 1.771 2.160 2.650 3.012 3.852 4.22114 1.345 1.761 2.145 2.624 2.977 3.787 4.14015 1.341 1.753 2.131 2.602 2.947 3.733 4.07316 1.337 1.746 2.120 2.583 2.921 3.686 4.01517 1.333 1.740 2.110 2.567 2.898 3.646 3.96518 1.330 1.734 2.101 2.552 2.878 3.610 3.92219 1.328 1.729 2.093 2.539 2.861 3.579 3.88320 1.325 1.725 2.086 2.528 2.845 3.552 3.85021 1.323 1.721 2.080 2.518 2.831 3.527 3.81922 1.321 1.717 2.074 2.508 2.819 3.505 3.79223 1.319 1.714 2.069 2.500 2.807 3.485 3.76824 1.318 1.711 2.064 2.492 2.797 3.467 3.74525 1.316 1.708 2.060 2.485 2.787 3.450 3.725
415
Palacios C. Severo
26 1.315 1.706 2.056 2.479 2.779 3.435 3.70727 1.314 1.703 2.052 2.473 2.771 3.421 3.68928 1.313 1.701 2.048 2.467 2.763 3.408 3.67429 1.311 1.699 2.045 2.462 2.756 3.396 3.66030 1.310 1.697 2.042 2.457 2.750 3.385 3.64631 1.309 1.696 2.040 2.453 2.744 3.375 3.63332 1.309 1.694 2.037 2.449 2.738 3.365 3.62233 1.308 1.692 2.035 2.445 2.733 3.356 3.61134 1.307 1.691 2.032 2.441 2.728 3.348 3.60135 1.306 1.690 2.030 2.438 2.724 3.340 3.59136 1.306 1.688 2.028 2.434 2.719 3.333 3.58237 1.305 1.687 2.026 2.431 2.715 3.326 3.57438 1.304 1.686 2.024 2.429 2.712 3.319 3.56639 1.304 1.685 2.023 2.426 2.708 3.313 3.55840 1.303 1.684 2.021 2.423 2.704 3.307 3.55160 1.296 1.671 2.000 2.390 2.660 3.232 3.460120 1.289 1.658 1.980 2.358 2.617 3.160 3.373
∞ 1.282 1.645 1.960 2.327 2.576 3.091 3.291
REFERENCIAS(1) Aguirre, Y.C.; S.Z. Marrero M. 1991. Efecto de la
fertilización química y orgánica sobre el rendimiento de lechuga (Lactuca sativa L.) bajo un diseño compuesto central rotable a cinco niveles. Trabajo presentado para optar al título de Ingeniero Agrónomo Facultad de Agronomía, Universidad Central de Venezuela. 151 p.
(2) Álvarez J., Bases del Diseño Experimental(3) American Public Health Association, apha; American
Water Association, awwa; Water Pollution Control Federation, WPCF. Métodos normalizados para el análisis de aguas potables y residuales, 1994.
(4) Ascanio, M., F. Chacin, & W. Machado, 1996.- Comparison between the orthoghonal central composite designs (OCCD) and the rotable central composite design (RCCD) in experiments with vegetable tissue culture. Biometric Bulletin International Biometric Society 13: 2.
(5) Aymerich, S. M. Conceptos para tratamiento de residuos lácteos. CNp. Costa rica. p.12 (2000)
(6) Bowker, A.H., Lieberman, G.J., 1981, Estadística para ingenieros, Prentice Hall Internacional.
(7) Box, G.E.P. y Draper, N.R., 1969, Evolutionary operation Wiley
(8) Box, G.E. and Wilson, K. B., 1951. On Experimental Attainment of Optimum Conditions J. R. S. S. B. 13 1-45.
416
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
(9) Box, G.E. P. y J.S. Hunter (1951): Multifactor experimental designs for exploring response surfaces. J.R.S.S. ser. B, vol. 13, No. 1, 195-240.
(10) Box, G. E. P., Hunter, W. G., and Hunter, J. S. 1978. Statistics for Experimenters. New York: John Wiley & Sons, Inc.
(11) Bacon, D.W., Collection and Interpretation of Industrial Data
(12) Bernard O., Evolutionary Operation(13) Bergoña M., Martín-García, D. Bellido-Milla, A.
Jiménez-Jiménez and Hernández-Artiga, María P.. (1999) Application of factorial design to the determination o lubricating oil by continuous flow hydride generation atomic absorption spectrometry J. Anal. Chem. 364: 527-532.
(14) Bradley, E.L. and Blackwood, L. G. 1989. Comparing paired data: A simultaneous test for means and variances. The American Statistician, 43, pp 234-235.
(15) Brito, M.; F. Rocha. 1991. Efecto de la fertilización con N, K, Caliza agrícola y materia orgánica, sobre algunas características del cultivo de ajo (Allium sativum L.) sobre la población del nematodo (Ditylenchus dipsaci) bajo un diseño de superficie compuesto central rotable. Trabajo presentado para optar al título de Ingeniero Agrónomo Facultad de Agronomía, Universidad Central de Venezuela. 167 p.
(16) Brown, M.B. and Forsythe, A. B. 1974. Robust Tests for Equality of Variances. Journal of the American Statistical Association, 69, pp 364 - 367.
(17) Box G.E.P., Statistics for Experimenters(18) Box, G.E.P. y Wilson, K.B. 1951.On the Experimental
Attainment of Optimum Conditions Surfaces. Journal of the Royal Statistical Society. 13 (1):1-45.
(19) Box, G.E.P. y Hunter, J.S. 1957. Multifactor Experimental Designs for Exploring Response Surfaces. Annals of Mathematical Statistics. 28:195-241.
(20) Box, G. E. P., Hunter, W. G. y J. S. Hunter, Statistics for Experimenters, Wiley, New York, 1978.
(21) Brown, M. B. and Forsythe, A. B. 1974. Robust Tests for Equality of Variances. Journal of the American Statistical Association, 69, pp 364 - 367.
(22) Brownlee, K.A. 1957. The Principies of Experimental Design Industrial Quality Control, 13, pp 1-9.
417
Palacios C. Severo
(23) Candal, R., Bilmes, S. Y BlesA, M. Semiconductores con Actividad Fotocatalítica: Eliminación de Contaminantes por Fotocatálisis Heterogénea. Editor: Miguel Blesa, Red CYTED VIII-G, 79-101, 2001.
(24) Cirelli, A.F. y Portier, C. Evaluación de la condición del agua para consumo humano en Latinoamérica, En: Tecnologías solares para la desinfección y descontaminación del agua. Solar Safe Water, 11-26, 2005.
(25) Carroll Croakin, M. y Tobias, P., Engineering Statistics Handbook. http://www.itl.nist.gov/div898/ handbook.
(26) Carroll Croakin, M., Statistics and Measurements, Journal of Research of the NIST 106, 2001, pp. 279-292.
(27) Chacín, F. 1991. Planificación experimental y comercial (Diseño EXCO) para ensayos con fertilizantes. En: Reuniáo Anual da Regiáo Brasileira da Sociedade Internacional de Biometría, 36a. Simpósio de Estadística Aplicada á experimentaçáo agronómica, 4to. Goiánia Gaias (Brasil). Jul. 15-19.1991. Resúmenes. Goiánia. p. 32.
(28) Chacín, L. F., 1998.- Análisis de regresión y superficie de respuesta. UCV. Facultad de Agronomía. Maracay, Venezuela. 274 pp.
(29) Cochran, W.G. and Cox, G. M. 1957. Experimental Designs. Second Edition, New York. John Wiley & Sons.
(30) Cochran, W.G. y Cox, G. M. 1974. Diseños Experimentales. Editorial Trillas, México.
(31) Cochran – Cox, Experimental Designs Second Edition, New York.
(32) Conover, W. J., Johnson, M. E., and Johnson, M. M. 1981. A Comparative Study of Tests for Homogeneity of Variances, with Applications to the Outer Continental Shelf Bidding Data. Technometrics, 23, pp 351 - 361.
(33) Cornell, John A,. (1990.): How to apply response surface methodology. Milwaukee, WI.
(34) Cornell, J. A., Experiments with Mixtures, Wiley, New York, 1990.
(35) Cox, D.R. 1958. Planning of experiments. John Wiley and Sons. New York.
(36) Cramer, S. G. and Swanson, M. R. 1973. Evaluation of Ten Pairwise Multiple Comparison Procedures by Monte-Carlo
418
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Methods. Journal of the American Statistical Association, 68, pp 66 - 74.
(37) Davies, O., Aplicación de la Técnica Experimental de la Superficie Respuesta
(38) Davies C., The Design and Analysis of Industrial Experimental, Oliver and Boyd. London 2da. Edit. 1967. 636 p.
(39) Díaz, M.; A. Mijares. 1991. Efecto de diferentes niveles de fertilización química y orgánica sobre el rendimiento de remolacha (Beta vulgaris L.) bajo un diseño compuesto central rotable a cinco niveles. Trabajo presentado para optar al título de Ingeniero Agrónomo Facultad de Agronomía, Universidad Central de Venezuela. 153 p.
(40) Doménech X., Jardim W.F. Y Litter M. Procesos Avanzados de Oxidación para la eliminación de contaminantes, En: Eliminación de Contaminantes por Fotocatálisis Heterogénea. Editor: Miguel Blesa, Red CYTED VIII-G, 3 – 26, 2001.
(41) Douglas C. Montgomery.- Diseño y Análisis de experimentos.- Editorial iberoamericana 1991.
(42) Draper, N.R. and Smith, H. 1998. Applied Regression Analysis. Third Edition. New York: John Wiley & Sons, Inc.
(43) Duncan, D.B. 1975. t Tests and Intervals for Comparisons Suggested by the Data. Biometrics, 31, pp 339 - 359.
(44) Dunnett, C.W. 1955. A Multiple Comparisons Procedure for Comparing Several Treatments with a Control. Journal of the American Statistical Association, 50, pp 1096 - 1121.
(45) Dunn, O.J. and Clark, V. A. 1987. Applies Statistical Analysis of Variance and Regression. 2da edition, John Wiley and Sons. New Cork.
(46) Dunnett, C.W. 1980. Pairwise Multiple Comparisons in the Homogeneous Variance, Unequal Sample Size Case. Journal of the American Statistical Association, 75, pp 789 - 795.
(47) Einot, I. and Gabriel, K. R. 1975. A Study of the Powers of Several Methods of Multiple Comparisons. Journal of the American Statistical Association, 70, pp 574-583.
(48) Eisenhart, C. 1947. The Assumptions Underlying the Analysis of Variance. Biometrics, 3, pp 1 - 21.
419
Palacios C. Severo
(49) Eisenhart, C. 1984. The assumptions Underling Analysis of Variance. Biometrics 3,1.
(50) Esplugas, S. Y Ollis, D.F. Economical Aspects of Integrated (Chemical + Biological) Processes for Water Treatment, Journal of Advanced Oxidation Technologies, 4 (2), 197 – 202, 1997.
(51) Federek, W.T. 1955. Experimental Design Theory and Applications. McMillan Company.
(52) Finney, D.J. 1955. An Introduction to the Theory of Experimental Design. The University of Chicago Press. Chicago.
(53) Finney, D.J. 1960. An introduction to the theory of experimental design. The university of Chicago Press. Chicago.
(54) Fisher, R.A. 1925. Statistical Methods for Research Workers. Edinburgh: Oliver & Boyd.
(55) Fisher, R.A. 1935. The Design of Experiments. Edinburgh: Oliver and Boyd.
(56) Fisher, R.A. and Yates, F. 1957. Statistical tables for biological, agricultural and medical research. 5th edition. New York: Hafner Public Co., Inc.
(57) Folks, J.S. 1958. Comparison of Designs of Exploration of Relation Ships. Disertación Doctoral no publicada. Iowa State University.
(58) Gill, J.L. 1978. Design and analysis of experiments. Vols 1 and 2. Ames Iowa: Iowa State University Press.
(59) Grossa, H. Disponibilidad y características de la radiación solar en Sudamérica: Tecnologias solares para la desinfección y descontaminación del agua. Solar Safe Water, 85-92, 2005.
(60) Hashemi P., Baheri S., Reza Fat’hi M. Factorial design optimization of experimental variables in preconcentration of cooper by a chromotropic acid loaded Q-Sepharose adsorbent. Talanta 68 (2005) 72-78. Published by Elsevier B.V. (2005).
(61) Heckman, J.; Smith, J. Experimental and nonexperimental evaluation. En: Schmid, G. et al. (Eds.) International handbook of labour market policy and evaluation. New York: Elsevier Science, 1996.
(62) Herrmann, J.M. Destrucción de contaminantes orgánicos por Fotocatálisis Heterogénea, En: Tecnologías
420
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
solares para la desinfección y descontaminación del agua. Solar Safe Water, 147-164, 2005.
(63) Hopkins, K.D, Hopkins, B.R. y Glass, G.V., Estadística básica para las ciencias sociales y del comportamiento (3a
Edición)(64) Hunter, W.G., 1976, Some ideas about teaching design
of experiments with 25 examples of experiments conducted by students, American Statistician, 31, 12.
(65) ISO TAG4 WG3: Guide to the Expression of Uncertainty in Measurement, 1992.
(66) John, R.C. and Draper, N.R. 1975. D-optimality for Regression Designs: A Review. Technometrics. 17 (1):15-23.
(67) Kackar, R. N., Off-Line Quality Control, Parameter Design and the Taguchi Method, Journal of Quality Technology 17, 1985, pp. 176-188
(68) Khuri, André I. y John A. Cornell. (1996): Response surfaces: designs and analyses. Marcel Dekker, New York.
(69) Kiefer, J. 1959. Optimum Experimental Designs. Journal of the Royal Statistical Society.B21 (2):272-319.
(70) Koroliuk, Manual de la Teoría de Probabilidad y Estadística Matemática.
(71) Machado, W. 1992. Comparación teórica y práctica de algunos diseños de tratamiento utilizados para estimar superficies de respuesta en ensayos de fertilización nitrogenada y densidad de siembra en el cultivo de maíz (Zea mays L.) y su validación comercial. Trabajo presentado para optar al título de Ingeniero Agrónomo Facultad de Agronomía, Universidad Central de Venezuela. 151 p.
(72) Machado, W.; F. Chacín; M. Ascanio.1997. El Diseño EXCO aplicado en la validación de ensayos de fertilización nitrogenada y densidad de siembra en el cultivo de maíz (Zea mays L.). Rev. Fac. Agron. (Maracay) 23:61-66.
(73) Machado, W. 1998. Planificación y análisis de experimentos de campo en grandes parcelas sin repetición. Tesis Magister Scientiarum. Facultad de Agronomía, Universidad Central de Venezuela. Maracay, Venezuela. 84 p.
(74) Madriz, P. 1996. Caracterización y evaluación de genotipos de frijol mungo (Vigna radiata (L.) Wilczek). Trabajo de ascenso. Facultad de Agronomía. Universidad Central de Venezuela. Maracay. 149 p.
421
Palacios C. Severo
(75) Martínez Garza, Ángel. 1988. Diseños Experimentales. Métodos y Elementos de Teoría. Editorial Trillas México.
(76) Marin, J.M; Montoya, J.F; Monsalve, E; Granda, C.F; Rios, L.A; Restrepo, G.M. Degradación de Naranja de Metilo en un Nuevo Fotorreactor Solar de Placa Plana con Superficie Corrugada; Scientia et Technica, XIII (34), 435-440, 2007.
(77) Matthews, R. Kinetics of Photocatalytic Oxidation or Organic solutes over Titanium Dioxide, Journal of Catalysis, 111, 264-272, 1987.
(78) Ministerio del Medio Ambiente. Normatividad 1594-1984.pdf.
(79) Montgomery, 2003, Diseño y Análisis de Experimento México, Segunda Edición, Grupo Editorial Limusa, S. A.
(80) Montgomery, D. C., Design and Analysis of Experiments, Wiley, New York, 2001.
(81) Mothes. J., 1960, Estadística aplicada a la ingeniería, Ariel.
(82) Montoya Vargas, A., Diseño de Experimentos en la Metrología, Taller de Metrología, CIMAT.
(83) Myers, Raymond H. y Douglas C. Montgomery.(1995.): Response surface methodology : process and product optimization using designed experiments. Wiley, New York.
(84) Myers, R.H. 1971 Response Surface Methodology. Allyn and Bacon, Boston.
(85) Palacios C.S., Diseño y Análisis de Experimentos Industriales
(86) Palacios C.S., Curso Postgrado “Diseño Experimental”(87) Palacios C.S., Estadística Aplicada(88) Palacios C.S., 2004 Diseño Experimental (Aplicado a
ciencia e ingeniería), CONCYTEC (89) Peterson Roger G., 1985. Design and analysis of
experiments.(90) Scott, J.P. Y Ollis, D.F. Integration of Chemical and
Biological Oxidation Processes for Water Treatment: Review and Recommendations, Environmental Progress, 14 (2), 88 – 103, 1995.
(91) Statgraphics, Manugistics Inc. and Statistical Graphics Corporation
422
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
(92) Scheffe, H., 1959. The Analysis of variance. John Wiley & Sons, Inc. New York.
(93) UNESCO. Water for people, water for lives – UN World Water Development Report. Paris, 2004.
(94) Villasmil, J.J. 1978. Estructura, Eficiencia Relativa y Análisis Estadístico del Diseño San Cristóbal Ortogonalizado. Universidad del Zulia, Facultad de Agronomía. Maracaibo.
(95) Voller, V.R. and Prakash C., 1987, A fixed grid numerical modeling methodology for convection diffusion mushy region phase-change problems. Int. J. Heat Mass Transfer, Vol. 30, No 8, pp 1709 - 1719.
(96) Winer, B.J., 1991. Statistical Principles in Experimental Design. Mc Graw Hill.
(97) Wine R.L., Statistics for Scientists and Engineers.(98) Wu, J. C. F y M. Hamada, Experiments, Wiley, New
York, 2000.(99) Yates, F., 1934. Design and analysis of factorial
experiments. London: Tech Communication. No 35, Imperial Bureaus of Soil Sciences.
(100) Young H., Statistical Treatment of Experimental data.
423
Palacios C. Severo
424
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería
Se termino de imprimir en los talleresGráficos de …………………………, ubicado en laAv. …………………….., Teléfono …………………..
Con un tiraje de 1000 librosNoviembre 2010
425
top related