53951479 estadistica experimental

ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniería

ESTADÍSTESTADÍSTICACAEXPERIMENEXPERIMENTAL

Aplicada a ciencia eAplicada a ciencia e ingingenieríaniería

Edición Edición CONCCONCYTECTEC

PALACIOS C. PALACIOS C. SSEVEROVERO

Palacios C. Severo

ESTADÍSTICAEXPERIMENTALAplicada a ciencia e ingeniería

Primera edición:

ISBN: Hecho el Depósito Legal en la Biblioteca Nacional del Perú N°

Subvención CONCYTEC N°

Consejo Nacional de Ciencia, Tecnología e Innovación Tecnológica-CONCYTEC

Presidente: Dr. Augusto Mellano MéndezAv. Del Aire 485, San Borja, Lima – PerúTelefax: (51) 01-2251150www.concytec.gob.pe

Impreso por:

La presente obra esta dedicada a la Memoria de:

Juan de la Cruz Palacios AvendañoAdelaida Calisaya Flores

Luz Lucila Zeballos ArgandoñaCamila Palacios Zeballos

Ceferina Chambilla ChambillaGustavo Vallenas Casaverde

“Con mucho amor a quienes amor nos dio, que Dios lo tenga en su gloria y nosotros en nuestro corazón”

Palacios C. Severo

Un reconocimiento muy especial al Rector de la Universidad Nacional Micaela Bastidas de Abancay

Dr. Leoncio Carnero Carnero

CONTENIDO

CONTENIDO Página

§1I.II.III.IV.V.VI.VII.VIII.IX.

X.XI.XII.

XIII.XIV.XV.XVI.XVII.XVIII.XIX.

§2I.II.III.IV.V.VI.VII.VIII.IX.

PrólogoIntroducciónEstadística básicaIntroducciónRecopilación de datosCuestionario como fuente de datosPresentación de datosAnálisis de datosDistribución de frecuenciaCriterios de distribución de frecuenciaMedias de tendencia centralMedidas de disepersiónProblemasEstimación de parámetrosDiferencias significativasDispersión de los datos problemasProblemasDistribucionesIntervalos de confianzaMuestreoMétodos de muestreoToma de decisionesPrincipios para la toma de decisiónPlanificaciónProblemasAnálisis de regresiónIntroducciónMétodos de mínimos cuadradosModelos de regresiónModelo de regresión lineal con k variablesRegresión lineal simpleRegresión lineal múltipleRegresión polinomialRegresión polinomial cuadráticaRegresión no linealCoeficiente de correlación múltiple R²

91113131415151617191926293939404350545555596262646767677070717374757677

Palacios C. Severo

§3I.II.III.IV.V.VI.VII.VIII.IX.X.XI.XII.XIII.XIV.

§4I.II.III.IV.a)b)c)

XI.XII.§5

Prueba de significancíaProblemasPrincipios de diseño experimentalIntroducciónTipo de experimentosUnidades experimentales y muéstralesFuente de variaciónControl de la variación del no tratamientoPropiedades del diseño estadísticoReplicaciónAleatorizaciónControl localClasificación de los diseñosEstrategia del diseñoDiseño de tratamientosDiseño de muestreoEstudio experimentalProblemasDiseño experimental aplicado a cienciasIntroducciónLimitacionesPredicciónDiseño experimentalDiseño aleatorizadoDiseño unifactorial con n nivelesDiseño de parcelas divididasProblemasDiseño totalmente aleatorizadoProblemasDiseño de bloques aleatorizadosProblemasDiseño cuadrado latinoProblemasDiseño cuadrado greco – latinoProblemasPrueba de intervalos múltiples de DuncanDiseño doble reversoProblemasEstimación de parámetros del modeloPolinomio ortogonalMétodos de análisisIntroducción

778183838486879092969799101103104105106110111111111112113113114118121129131134141143147151153154154157158159161161

I.II.III.IV.V.VI.

II.III.IV.

V.VI.VII

X.XI.XII.XIII.XIV.XV.

XVI.XVII.XVIII.

XXI.XXII.A.B.

Métodos no paramétricosPrueba U de Mann – WhitneyPrueba H de Kruskal – WallisMétodos multivariablesCorrelación de SpearmanProblemasDiseños experimentales aplicado a ingenieríaIntroducciónProblemasDiseños bifactorialesComparación múltipleDiseño anidadoProblemasDiseños factorialesDiseño factorial 2n

Diseño factorial 2²ProblemasDiseño factorial 2³ProblemasDiseño factorial 2k replicadoProblemasDiseño 2k con pruebas centralesDiseño confundidoDiseño factorial 2k con dos bloquesDiseño factorial 2k con cuatro bloquesDiseño factorial 2k con bloques replicadosAlgoritmo de YatesProblemasDiseño factorial fraccionadoMedio fraccionado del diseño 2k

Cuarto fraccionado del diseño 2k

ProblemasDiseño Plackett – BurmanProblemasDiseños factoriales 3n

ProblemasDiseños rotablesDiseños rotables con dos factoresDiseño trigonalDiseño pentagonalDiseño hexagonalProblemas

162162165166168171173173176177180182184186188189195205221225228231233233235236237239244245247250258263266270275275275276276280

Palacios C. Severo

§7I.II.III.IV.V.VI:VII:VIII:IX.X.XI.XII.XIII.

Diseño octogonalDiseño compuesto centradoProblemasDiseño experimental comercial – EXCODiseño SeveroDiseño factorial centrado de dos factoresDiseño Factorial centrado de tres factoresDiseño rotable centrado de n factoresProblemasSuperficie respuestaIntroducciónSuperficie respuestaPolinomio de primer ordenPrueba de significanciaPrueba de falta de ajusteMáxima pendiente ascendentePolinomio de segundo ordenCaracterización de la superficie respuestaDiseño de superficie respuesta cuadráticoSuperficie de respuesta cuadráticaExploración de superficie respuestaPunto estacionarioCriterio de formas cuadráticasAnexoReferencias

281282291295298300305308311323323323324325326328331333340350354367368387393

PRÓLOGO

El objetivo primordial del presente libro es presentar los conceptos para diferentes situaciones reales que se ven a diario en el campo social, industrial y experimental. Se ha concebido primordialmente como un texto introductorio en planificación y control de operaciones a nivel laboratorio, bach e industrial. También se ha proyectado como un libro de referencia para agronomomos, alimentarios, pesqueros, biologos, medicos, civiles, geógrafos, ambientalistas, mecánicos, mineros, metalurgistas y químicos de Pre, Postgrado y Maestría, practicantes y científicos encargados de la planificación y operación de sistemas productivos tanto en la ciencia como en la ingeniería.

El libro es el resultado de conferencias ofrecidas en diferentes centros académicos latinoamericanos. Se ha intentado resaltar los conceptos técnicos y afirmando sin duda y sin excusas que la presentación es exactamente fidedigna. Se presentan los conceptos que considero pueden contribuir más a la comprensión de los principios, con referencia a los que pueden realizarse con los conocimientos básicos y las posibilidades e instrumentos de la tecnología actual.

Se ha intentado presentar un marco conceptual que estimule la habilidad del lector de las diversas ramas del saber (Biología, Medicina, Ciencias Sociales, Economía, Administración, Ingenierías y áreas Técnicas) para entender la manera en que los factores (variables) interactúan en un sistema real de trabajo.

La orientación del libro, no esta matemáticamente sofisticado. Los conocimientos previos necesarios como el cálculo, probabilidades y estadística descriptiva. En algunas secciones se realiza el uso de operaciones elementales de matrices.

El libro está diseñado como un manual dividido en partes con capítulos para su mejor comprensión. Se propone servir como fuente de referencia para tratar casos específic0s de los lectores.

Los ejemplos resueltos (fueron desarrollados aplicando los programas estadísticos Statgraphics Centurion y ESPC elaborado para el

Palacios C. Severo

presente libro), sirven para ilustrar y ampliar las teorías, sin lo cual el lector sentiría un vació. Las demostraciones de procesos industriales se incluyen en ello. Los problemas suplementarios completan la revisión del material tratado en cada tema.

El material cubre un curso habitual con el fin de flexibilizar, ampliar y mejorar los sistemas curriculares, siendo este un libro de consulta para interés de otros temas.

No deseo finalizar sin agradecer a mi amigo Luis Solórzano Espinola por la revisión minuciosa y detallada de la presente edición del presente libro, su tiempo y esfuerzo es un aporte a la ciencia y tecnolgía como él siempre viene desarrollando en las aulas con los estudiantes de pre grado.

Finalmente deseo agradecer a CONCYTEC por tan importante aporte a la educación a nivel de nuestro país, así mismo estoy en deuda con muchas universidades latinoamericanas gubernamentales como privadas por la cooperación para la elaboración del presente, de igual manera con prestigiosos colegas por su colaboración para la culminación de tan importante tema.

Palacios C. SeveroCEO Proceso SEVEROMóvil: (+511) 996696214espc02@yahoo.com

INTRODUCCIÓN

Si su trabajo tiene que ver con la investigación científica – tecnológica (ciencias e ingeniería). Probablemente se ha dado cuenta que la mayoría de los libros de estadística (básica y avanzada) son abstractos y no ayudan mucho en el tratamiento de la base de datos, pero usted sabe que el proceso al cual estudia funciona (de manera eficiente y sin problemas), es por ello que se tuvo que realizar el esfuerzo a fin de brindar al amable lector un texto con características nuevas a fin de poder llenar muchos vacíos, los cuales son parte de la experiencia.

Lo que desea saber el investigador es como analizar e interpretar los datos de un proceso para tomar una decisión sobre los rangos óptimos, pero necesita saber cómo llevar a cabo una prueba experimental (laboratorio, bach e industrial); sabe que la estadística experimental le ayudara a seleccionar los rangos (niveles) y variables (factores) significativas del procesos innovativo, pero requiere ideas sobre como seleccionar estos. En la presente obra le explicaremos y despejaremos sus dudas.

La palabra estadística se origina, en las técnicas de recolección, organización, conservación, y tratamiento de las diversas bases de datos propios, con que los antiguos gobernantes controlaban sus súbditos y dominios económicos. Estas técnicas evolucionaron a la par con el desarrollo de las matemáticas utilizando sus herramientas en el proceso del análisis e interpretación de la información.

Estadística Experimental aplicada a ciencia e Ingeniería, el libro que en esta ocasión presento a los lectores de habla hispana, es un importante aporte. Por lo útil y por la novedad de su enfoque, a la falta de bibliografía. Para comprender los beneficios que pueden derivarse de la utilización de los conceptos (fundamentos) presentados, conviene tener presente la complejidad creciente de nuestras industrias (automatización), impuesta por los diferentes factores que están incidiendo en el cambio vertiginoso que caracteriza a nuestra época (competitividad) y que, en mayor o menor grado, con mayor o menor velocidad, llega a todas las regiones y países del mundo. Veamos algunos de los factores de complejidad en operaciones

Palacios C. Severo

industriales. La planta recibe órdenes de producción que deban ser procesados y cumplidos en un lapso determinado, utilizando recursos internos y externos casi siempre escasos.

La importancia de los resultados, anticipado en la toma de decisiones, empieza a buscar respuestas a otro tipo de preguntas ¿Qué es lo mejor? ¿Cómo optimizar un determinado conjunto de variables para alcanzar un fin específico? Que significan nuestros datos y que grado de confianza podemos tener en ello visto una predicción.

El mundo actual requiere otras herramientas analíticas, aquellas que nos permitan crear modelos (lenguaje de comunicación) y definir relaciones entre diversos factores (interacciones). Esto requiere entre otras cosas que podamos guardar conjuntos particulares de datos aparte de las rutinas de análisis (numérico y sostenible) que se realicen en base a ella.

El presente texto no pretende teorizar el saber estadístico, desde luego, no es un libro para estadísticos, ya que, adrede se obvia el rigor científico de lo expuesto en beneficio de la sencillez necesaria para el neófito; con un lenguaje coloquial se conduce al lector a través del contenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados.

El avance tecnológico en la informática ha contribuido enormemente al desarrollo de la estadística, sobre todo en la manipulación de la información, pues en el mercado existen paquetes estadísticos de excelente calidad, como el SAS, SPSS, SCA, Statgraphics, amén de otros, que corren en un ordenador sin mayores exigencias técnicas, permitiendo el manejo de grandes volúmenes de información y de variables.

§1ESTADÍSTICA BÁSICA

(...) Conseguimos obtener así la fórmula estadística para conocer aproximadamente la posición de un electrón en un instante determinado. Pero, personalmente, no creo que Dios juegue a los dados.

Albert Einstein

I. INTRODUCCIÓN

En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de incursionar en la totalidad de las ciencias e ingeniería; inclusive, en la lingüística se aplican técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más relevantes de un idioma.

La estadística es una ciencia auxiliar para todas las ramas del saber humano; su utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre y la estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de confianza.

Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa que sucede en la naturaleza, lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los métodos estadísticos. Sin embargo muchos investigadores tendenciosos han cometido abusos con la estadística, elaborando investigaciones de intención, teniendo previamente los resultados que les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que conducen al rotundo fracaso de sus investigaciones.

Palacios C. Severo

A veces nuestras vidas parecen estar controladas por estadísticas. De informes sobre el tiempo, lectura de las presiones sanguíneas, todos tenemos que ver rutinariamente con una amplia variedad de medidas estadísticas.El análisis estadístico es útil para la investigación (tecnológica y científica), pues ayuda a resumir e interpretar el gran volumen de cifras que resultan aún en la encuesta más pequeña. Los principios estadísticos que se usan en la investigación provienen en gran escala de las ciencias sociales, economía e ingeniería.

Como resultado hay gran cantidad de libros enteros sobre estadística, probablemente más que sobre cualquier otro aspecto de la investigación.

El propósito de la presente obra es darle a usted una visión panorámica de los tipos de medidas estadísticas más importantes que se usan. Si usted requiere información más detallada, consulte algunos de los muchos libros buenos en estadística que están disponibles1.

Aunque existen centenares de medidas y pruebas estadísticas que pueden utilizar los investigadores, nosotros estudiaremos los de amplia aplicación para desarrollar los trabajos prácticos.

II. RECOPILACIÓN DE DATOS

El primer paso para describir un fenómeno natural es reunir los datos estadísticos necesarios. La fuente de los datos puede clasificarse como internas o externas.

Los datos internos incluyen estadísticas sobre las operaciones de la empresa, tales como estadísticas de producción, comercialización, transformación, etc.

Los datos estadísticos no vinculados con el funcionamiento de la empresa propiamente dicha se llaman datos externos.

La gerencia de producción de una fábrica de fundición puede necesitar información sobre la cantidad de cierto metal en el mercado nacional, con el propósito de estimar las ventas a 10 años plazo.

1 Ver referencias bibliográficas

Hay enormes cantidades de datos comerciales, empresariales, farmacéuticos, que pueden consultarse en las bibliotecas públicas y en las universidades.

El gobierno es el mayor editor de estadísticas anuales, mensuales, semanales, diarias. Una publicación anual del Instituto Nacional de Estadística contiene más de mil páginas de datos sobre precios, educación, producción y otros puntos, que son de utilidad para los que procesan datos: economistas, analistas y demás profesionales.

III. CUESTIONARIO COMO FUENTE DE DATOS

Los datos estadísticos relativos a la opinión corriente de los consumidores sobre determinados programas de televisión, nuevos productos, candidatos políticos y otros, no pueden hallarse en publicaciones. Por ello, este tipo de información debe reunirse a través de la entrevista personal, por cuestionarios o algún otro medio. La ventaja de ello es el alto porcentaje de respuestas posibles. Sin embargo, es por regla general más costosa que enviar cuestionarios por correo.

Las firmas de analistas y consultores saben que es inconveniente el formulario postal como instrumento para recopilar datos por ser relativamente bajo el porcentaje de respuestas a ciertos cuestionarios.

La conveniencia principal del cuestionario como técnica de recopilación de datos es sus costos relativamente bajo.

IV. PRESENTACIÓN DE DATOS

Gráfica de líneas simples y de barras simples. Cualquiera de estos dos tipos de gráfico puede utilizarse ventajosamente para representar la tendencia general de la producción.

El cúmulo de datos estadísticos dentro de una empresa, de fuentes publicadas, o recopilados por entrevistas personales, no está usualmente apta para un análisis. Los datos deben organizarse y presentarse en una tabla o gráfico, antes de efectuar ningún análisis ni interpretación. Si se necesitan cifras exactas de un informe convendría presentar los datos en una tabla. En caso contrario, es preferible un gráfico para atraer la atención del lector.

Palacios C. Severo

Gráfico de líneas múltiples y de barras múltiples. La tendencia o movimiento de las exportaciones de dos comercializadoras se pueden representar gráficamente.

Gráfico de barras de componentes. El gerente de ventas de una embotelladora desea graficar el total de ventas en tres años y también la variedad de los productos en relación con el total. Podría utilizar un gráfico de líneas o un gráfico de barras.Gráfico de barras bi direccionales. Para indicar los cambios porcentuales puede utilizarse un gráfico bi direccional, que también es útil para ilustrar ganancias y pérdidas, producción o ventas cobre lo normal o bajo lo normal de un período a otro. Por ejemplo, se representan los cambios porcentuales de ventas correspondientes a cinco años de ventas:

SucursalesVentas Cambio

Porcentual2005 2010Mercado Central 10 8 -20Mercado Sur 5 7 +40Mercado Norte 2 4 +100Mercado Este 6 3 -50Mercado Oeste 10 11 +10

V. ANÁLISIS DE DATOS

Un análisis de datos suele seguir los siguientes pasos:

Análisis exploratorio de datos: Estadística descriptiva de cada variable por separado. Se obtienen medidas de tendencia central, variabilidad, representación gráfica, etc. Se pretende conocer cada variable así como detectar errores, valores extremos.

Estadística Bivariable: Estudia las relaciones entre pares de variables, utilizando estadísticos como el coeficiente de correlación Chi–cuadrado, t de Student, etc. y representaciones gráficas diversas.

Análisis Multivariante: Analiza simultáneamente dos o más variables. Los métodos pueden ser predictivos cuando existe una variable criterio o independiente que se explica o identifica por un conjunto de variables independientes, predoctoras o explicativas (Regresión lineal, Regresión cuadrática, análisis discriminante, análisis de varianza) o reductivos cuando se estudian las relaciones entre un conjunto de variables o casos sin que exista una variable a

identificar (componentes principales, análisis factorial, correspondencia binaria, correspondencia múltiple).

Usos de variables en el análisis

Las variables pueden ser definidas para medir una determinada salida o respuesta o bien para explicar por que se obtiene una determinada salida. Por ejemplo en el estudio de una enfermedad, las variables edad, antecedentes, severidad del estado, tratamiento son variables explicativas o independientes. Las variables discretas sana/no sana es la variable dependiente.

En ciertos análisis exploratorios todas las variables se usan como un único conjunto, sin distinción entre independientes y dependientes.

Análisis apropiado de datos

Son dos motivos por lo que resulta difícil la elección de la técnica estadística adecuada para un investigador con datos reales.

El primero es que los libros de estadística y los cursos curriculares se presentan en un orden lógico desde el punto de vista de la enseñanza de las materias, pero desde el punto de vista del proceso del análisis de datos.

La segunda es que los datos reales contienen mezcla de tipos de datos que hacen la elección del análisis arbitrario.

Una buena estrategia consiste en aplicar diferentes análisis al mismo conjunto de datos, lo que nos proporcionará información variada sobre el fenómeno en estudio.

Para decidir el análisis apropiado se clasifican las variables como:

Independiente frente a dependientesNominal u ordinaria frente intervalos

VI. DISTRIBUCIÓN DE FRECUENCIA

Los problemas industriales abarcan una gran masa de datos cuantitativos a los que deben darse ciertas formas significativas antes de poder efectuar ningún análisis e interpretación. Una forma de uso

Palacios C. Severo

corriente es la distribución de frecuencia. Existen dos tipos de variables, a saber: discretas y continuas. El análisis de la distribución de frecuencia se refiere a datos continuos.

Ordenamiento

Los datos que se haya sin agrupar son difíciles de analizar. Sea, por ejemplo, determinar los ingresos bajos y los elevados y un punto central de concentración, si lo hubiere.Por lo tanto es esencial, para analizar las entradas, organizar los datos que están sin agrupar en una forma agrupada llamada distribución de frecuencia.

Según la naturaleza de la variable estudiada las distribuciones de frecuencias pueden ser:

Datos no agrupados: se presentan cuando el número de valores que puede presentar la variable no es muy elevado, y en ese caso podemos observar todos los valores de esa variable. Este caso se presenta cuando la variable es discreta y continua no presenta excesivos valores.

Datos en intervalos: se presenta cuando la variable es continua o cuando es discreta pero con elevado número de valores. En esta situación se agrupan dichos valores en intervalos o clases. Los intervalos se notan: ii ee −−1 es intervalo i-ésimo. Se llama amplitud del intervalo a la distancia que existe entre los extremos.

1−−= iii eea

Se llama marca de clase al punto medio de un intervalo. Este punto es importante porque es el representante del intervalo.

211 +− +

Se llama densidad de frecuencia de un intervalo a la frecuencia correspondiente a cada unidad de la variable en dicho intervalo.

Los intervalos se suelen tomar abiertos por la izquierda y cerrados por la derecha, salvo el primero que se toma cerrado por los dos lados. En este tipo de distribuciones se pierde parte de la información al agruparlas en intervalos, ya no se puede hablar de valores concretos sino de intervalos.

Cuanto mayor sea la amplitud de los intervalos menos intervalos habrá, y por tanto menos precisión tendremos. En cambio, cuanto menor sea la amplitud de los intervalos menos intervalos habrá, y mayor será la precisión, sin embargo la distribución será mas grande y más difícil de manejar.

Intervalo de clase

Con el propósito de preparar una distribución de frecuencia a partir del ordenamiento y el apuntado, los ingresos podrían agruparse arbitrariamente en clases con un intervalo digamos 250 dólares. Este valor se denomina amplitud de clase. El intervalo de clase es, sencillo, la amplitud de los ingresos mensuales para cada clase. Una manera conveniente de determinarlo es encontrar la diferencia entre los límites inferiores de dos clases adyacentes o la diferencia entre las marcas de clase adyacente.

VII. CRITERIOS DE DISTRIBUCIÓN DE FRECUENCIA

En la práctica, la cantidad total de clases varía usualmente de un mínimo de 5 a un máximo de 20. El hecho de que sean muy pocas o muchas clases no nos aclara la característica esencial de los datos. Por ejemplo, si organizamos los ingresos de los operadores de computadoras solamente en dos clases:

Ingreso Mensual (US$) Cantidad de operariosDe 250 a 400De 400 a 600

Un análisis de distribución de frecuencia no revelaría mucho acerca de la estructura de los ingresos de los operarios.

Palacios C. Severo

Siempre que sea posible, el intervalo entre todas las clases se la distribución de frecuencia deberá ser igual. Los intervalos desiguales originan problemas al graficar y al calcular promedios y otras medias estadística.

VIII. MEDIDAS DE TENDENCIA CENTRAL

Una medida de tendencia central es un número que representa el valor central de un conjunto de valores. Habitualmente, estas medidas se llaman promedios. He aquí algunos ejemplos: el ingreso promedio de una familia, es de US$ 1500 por año; para el peso promedio de 60 fardos de fibra de llama utilizados para el tejido de alfombras y un diámetro promedio de pistones maquinados durante un jornal.

En el presente se consideran las herramientas estadísticas que más comúnmente se usan:

Media aritmética

Generalmente se le llama media o promedio. La media es simplemente la suma de una serie de datos numéricos dividida por el número total de ellos.

Es apropiado usar la media cuando los resultados son simétricos y tienen una distribución normal. Pero existen casos que estudiaremos a continuación:

Datos no agrupados: Si los datos no están agrupados la media aritmética se calcula tomando todas las mediciones y dividiendo la suma por el número de éstos.

Datos agrupados: La resistencia a la tracción de varios filamentos son 6, 6, 7, 7, 8, 8, y 9,4. Estos valores se agrupan en una distribución de frecuencia.

El punto medio de cada clase se usa para representar la clase. El punto medio de la clase se multiplica entonces por el número de frecuencia en esa clase. La suma de estos productos se divide por la cantidad total de datos para obtener la media aritmética.

Ejemplo 1.1

La tabla 1.1 muestra los puntajes de tres artículos en una prueba de degustación, usando preguntas cualitativas de escalas, a fin de cuantificar los valores.

Todos los productos probados tienen la misma media. La media de 20 es esta escala es bastante descriptiva de la distribución normal del producto 1, pero sería engañoso si se usara para describir el producto 2 ó el producto 3. La mayoría de los resultados en una investigación tienen una distribución normal (es decir, en forma de campana alrededor de un punto medio) pero otras distribuciones son lo bastante comunes como para que se deba verificar siempre, antes de usar la media, si ésta es en realidad descriptiva.

XX i∑= ni ,...2,1=

La media tiene otra debilidad sobre la que se debe estar alerta: se ve afectada por las observaciones extremas.

Tabla 1.1 Puntaje de tres productos en preguntas de degustaciónNivel de

degustaciónProducto

1 2 354321

2020202020

0505000

Media 20 20 20

Ejemplo 1.2Si los ingresos de dos profesionales se promedian con los ingresos de diez peones, el ingreso para todos los doce será de más de US$ 250, que obviamente es una cifra engañosa, si se evita usar la media para datos que no tengan una distribución normal o para datos que incluyan observaciones extremas, ésta es la medida estadística más útil para describir el promedio.

Tabla 1.2 Mano de obra por día para cada producto

Personal Jornal (US$)

Producto 1 Producto 2

CalificadoSemi calificadoNo calificado

Media aritmética ponderada

Palacios C. Severo

Permite calcular un promedio que toma en cuenta la importancia o el factor que tiene cada valor sobre el total. Todas las medias aritméticas son ponderadas. Si no se dan factores específicos a todos y cada uno de los valores de la serie.

∑∑=

Ejemplo 1.3Una empresa desea contratar tres tipos de personal: calificado, semi calificado y no calificado, para la producción de ciertos artefactos. La gerencia desea conocer el costo promedio de mano de obra por día para cada producto.

El promedio aritmético simple es:

21 0160,0661,1644,0 XXY ++=

El costo de mano de obra promedio del producto 1 es,

( ) $72,18735867,11 US=++

Y para una unidad del producto 2 es,

++ +↓→+ 222 FeAgOFeAg

El análisis de esta manera es incorrecto, ya que no se toma en cuenta que se trabaja con diferente personal.

Ejemplo 1.4Se compra material de construcción a tres empresas comercializadoras siendo sus costos: 80 kilo a 0,5 dólares por kilo, 20 kilo a 0,7 dólares y 10 kilos a 0,9 dólares.

Determine el precio promedio por kilos de alambrón.

Tabla 1,3 Precio por kilo de alambrónPrecio por kilo (Xi) Kilo comprado (mi)

0,50,70,9

802010

Total 110

Aplicando la fórmula

∑∑=

( ) ( )[ ] ( ) ( )[ ] kiloUSX /$5727,0110/10...110/80/110/109,0...110/8,05,0 =++++=

Comparando con el promedio simple

[ ] 10/9001 −= XX

( ) ( ) ( ) ( ) ( ) ( )[ ] k i l oU SX /$5 7 2 7,01 1 0/1 09,02 07,08 05,0 =++=

Media armónica

Es el inverso del valor medio, se la utiliza con frecuencia para la medición y análisis de flujos volumétricos.

∑=iX

Ejemplo 1.5Calcular el flujo volumétrico medio (FVM) de dos bombas que entregan combustible 10000 litros a razón de 500 litros por minuto y 10000 litros a razón de 100 litros por minuto, n = 2

min/7,166100/1500/1

12 litrosH =

El resultado también puede obtenerse calculando el tiempo necesario para bombear 10000 litros con los dos flujos volumétricos y dividiendo el resultado por el número total de litros bombeados, es decir:

r1 = 10000/500 = 20 minr2 = 10000/100 = 100 minFVM = (10000 + 10000)/120 = 166,7 l/min

Palacios C. Severo

Obsérvese que el valor medio es de 300 litros por minuto, casi el doble de la media armónica.

Media geométrica

La media geométrica Xg es la n-raíz de los productos de la n observaciones medidas, de amplia utilidad en economía.

nig XX ∑=

En forma logarítmica

∑∑=

n L o g XXL o g i

Una aplicación importante es determinar el incremento porcentual promedio en ventas, producción u otras variables correspondientes a un lapso dado.Una modificación de la fórmula es:

Lapsoimer

LapsoÚltimoLog

nXLog g

Ejemplo 1.6Supongamos que durante cinco años de una economía inflacionaria, las entidades crediticias pagan tasas altas de interés de 10, 20, 25, 30 y 40 por ciento.

Hallar la tasa de interés promedio anual de un depósito de 1000 dólares.

Tabla 1.4 Economía inflacionariaAño Tasa de interés Factor de crecimiento Ahorro al final de año (US$)

1020253040

1000*2 = 20002000*3 = 6000

6000*3,5 = 2100021000*4 = 84000

84000*5 = 420000

El factor de crecimiento anual, será:

[ ] a ñ oc a d av e c e sX 5,35/545,332 =++++=

Pero 3,5 = 1 + 25/10

Corresponde a una tasa de interés promedio de 20% anual.

Entonces, el depósito de 1000 dólares crecerá en cinco años:

( ) ( ) 75,216/1584/41394137 22222 =−+++=columnaSC

Este es un valor excedente al real en más de US$ 10521 - 8,75 un error muy considerable.

Usando la media geométrica, el factor de crecimiento promedio Anual corresponde a una tasa de interés promedio de 235% anual o 3,35 = 1 + 235/100 entonces el depósito de 1000 dólares crecerá en cinco años a:

( ) ( ) 25,9416/1584/36563135 22222 =−+++=ootratamientSC

Siendo está la media más apropiada para el caso.

Media cuadrática

De un conjunto de números Xn es denotado por la raíz cuadrada de la media cuadrática y es definida como:

Ejemplo 1.7Evalué los datos que se muestran a continuación 1, 5, 7 y 9

2 4,6=qX

Mediana

Se llama mediana de una variable estadística a aquel valor de la variable tal que el número de observaciones menores que él es igual que el número de observaciones mayores. Se nota Me y se puede considerar como el punto de abscisas cuya ordenada en la curva vale ½.

Palacios C. Severo

ei-1 Me e

C”B”A

−+=⇒=−−⇒= −

−−

− 11

Datos no agrupados: La mediana es el valor correspondiente a un punto de una escala con respecto al cual la mitad superior agrupa igual cantidad de valores que la mitad inferior. Para determinar la mediana de datos no agrupados se ordenan, en primer lugar, de menor a mayor.Datos agrupados: Ordenar algunas observaciones no agrupadas de menor a mayor y elegir el valor central representa poco trabajo. Sin embargo, si son muchas las observaciones siempre es un problema ordenarla y encontrar el punto medio. En cambio, en datos cuantitativos es posible clasificarla directamente en clases y hallar una aproximación de la mediana en función de la distribución de frecuencia resultante.

La mediana se puede clasificar con la fórmula siguiente:

FnLM e d i a n a

−+= 2/

Donde:

L Límite inferior de la clase en que se ubica la medianan Cantidad de datosF Frecuencia acumulativa para la clase inmediata inferiorf Frecuencia en la clase mediai Amplitud del intervalo de clase

Ejemplo 1.8

Ordene los valores por su magnitud, obtenga la mediana. 92,3 92,6 92,5 92,8 92,4.

Resulta ser la mediana 92,5

La moda es la única medida que se puede definir para caracteres cualitativos. Se define la moda de una distribución como aquel valor que se ha presentado más veces, es decir, es aquel que su frecuencia absoluta es máxima.

Si la distribución es agrupada en intervalos se habla de intervalo modal.

Una moda en una distribución no tiene por qué ser única, puede haber más de una en una misma distribución, y entonces se habla de distribuciones bimodales, trimodales, o en general plurimodales.

Datos no agrupados: El modo se define como el valor de la observación que aparece con mayor frecuencia. Cuando existe solo un modo, la distribución se llama unimodal, si existen dos valores que aparecen con frecuencia, la distribución recibe la denominación bimodal.

Datos agrupados: El modo observado para datos agrupados en una distribución de frecuencia es el punto medio de la clase en donde se encuentra el mayor número de frecuencia.

IX. MEDIDAS DE DISPERSIÓN

Las medidas de dispersión nos van a informar sobre el grado de esparcimiento de la distribución, es decir, nos van a decir si los valores que aparecen están más o menos concentrados. Por tanto, nos van informar también sobre el grado de representatividad de la medida de posición, pues cuanto más concentrados estén los valores que toma la variable mejor representará un solo valor a toda la distribución.

Varianza

La varianza es una medida de dispersión que mide el grado de esparcimiento de una distribución alrededor de la media aritmética.

Palacios C. Severo

Cuanto más grande sea la varianza más esparcidos estarán los valores de la variable. La varianza se suele notar σ2 y se calcula:

( ) ( ) iiii fXX

²² ∑∑ −=

−=σ

Al igual que en la media aritmética los Xi representan a los valores de la variable si es una distribución no agrupada y a las marcas de clase si es una distribución agrupada en intervalos.

La varianza es la suma de las desviaciones de los valores de la variable sobre la media aritmética ponderada por las frecuencias. Por lo tanto, cuanto menor sea la varianza más agrupada estará la distribución en torno a su media aritmética. La varianza viene expresada en las mismas unidades que la variable pero al cuadrado.

Desviación típica

La desviación típica se define para obtener una medida de dispersión que venga expresada en las mismas unidades que la variable. Se define como la raíz cuadrada de la varianza.

²σσ =

Coeficiente de variación

Tanto la varianza como la desviación típica son medidas de dispersión absoluta, es decir, nos hablan de la dispersión de la variable que estamos estudiando, pero no nos permiten comparar la dispersión de dos distribuciones distintas.

El coeficiente de variación es una medida de dispersión relativa que nos va permitir comparar dos distribuciones distintas, se define como el cociente entre la desviación típica y la media aritmética.

El coeficiente de variación es un coeficiente adimensional y solo se puede definir cuando la media aritmética es distinta de cero.

Para comparar la dispersión de dos distribuciones basta con comparar sus coeficientes de variación, aquella que su coeficiente de variación sea menor es la que esta más concentrada en torno a su media aritmética.

Problemas

(1) Un operario que trabaja a jornal gana por mes US$ 150, otro mes US$ 120 y otro mes US$ 140.¿Cuánto gana en promedio mensualmente?

(2) Los ingresos sobre ventas en una tienda comercial se evalúan cada semestre. Los siguientes datos representan, los ingresos (en dólares) por cada mes: 300, 280, 350, 320, 290 y 325Determine el ingreso medio de la muestra.

(3) Durante dos semanas se ha observado la temperatura en °C al medio día, siendo los resultados:

12 10 14 18 9 8 108 9 11 10 11 10 11

Determine la temperatura media de la muestra.(4) Calcular la media de los datos agrupados:

Y 40 41 42 43 44 45 46 47 48 49 50n 3 4 6 2 2 3 1 1 2 2 4

(5) Un grupo de micro empresarios, trabajan con obreros eventuales. Ciertos días trabajan con seis, ocho y cuatro.

Palacios C. Severo

En la mayoría de las veces trabajan con siete obreros, siendo en total ocho micro empresas.Cuál es el promedio de obreros por micro empresa

(6) Supongamos que se han registrado 50 observaciones referentes a los pesos de 50 garrafas de gas licuado, la muestra fue obtenida de la producción por hora y las unidades están dadas en kilogramo9.8 9.3 9,5 9,2 9,4 9,2 9,3 9,3 9,5 9,49,2 9,3 9,5 9,3 9,4 9,3 9,2 9,1 9,3 9,39,4 9,5 9,4 9,4 9,2 9,4 9,6, 9,6 9,3 9,19,4 9,2 9,5 9,3 9,2 9,3 9,2 9,3 9,4 9,69,4 9,3 9,4 9,3 9,4 9,3 9,3 9,4 9,2 9,4

Calcule el peso promedio de las garrafasSi el peso estándar es de 10 kilos cuanto de gas falta en promedio

(7) La temperatura registrada en un vivero, a cierta hora de un día cualquiera, en grados centígrados, fueron 30, 32, 39, 32, 33, 31, 38, 37, 32 y 31.Determine la media en grados Fahrenheit.

(8) Un proyecto económico muestra que el consumo de alimentos de un barrio marginal de 350 personas es en promedio de US$ 120 mensuales. Halle la media del gasto diario en alimentación.

(9) El ingreso percapite mensual en un país es US$ 250. El sector del magisterio constituye el 60% de la población que percibe el 2/5 del ingreso total. Calcule el ingreso medio por habitante del sector.

(10) Una empresa A tiene 80 empleados con un sueldo promedio mensual de 180 dólares por empleado. La empresa B tiene 120 empleados con un sueldo promedio mensual por empleado de 200 dólares por empleado, calcular:Cuál es el sueldo promedio mensual de las dos empresas en conjuntoSe agrega una tercera empresa con 40 empleados y un sueldo promedio mensual de 250 dólares por empleado.¿Cuál es el sueldo promedio de las tres empresas en conjunto?

(11) Se compran 100 kilos de carne de res a 2,3 dólares por kilo, 50 kilos de carne de cerdo a 2,8 dólares por kilo y 20 kilos de carne de cordero a 1,8 dólares por kilo. Un plato de Buffet tiene un costo de 8 dólares en donde se incluyen los tres tipos de carnes a razón de 1:0,5:0,2 respectivamente.¿Determine el promedio de platos Buffet que podrán prepararse y cuanto de carne sobra?

(12) Una empresa industrial fabrica azulejos a 60 dólares por metro cuadrado, jarrones a 20 dólares la unidad y floreros a 5 dólares por unidad. Un decorador desea adquirir dichos productos pero cuenta tan sólo con 500 dólares y tiene un ambiente de 20 metros cuadrados.¿Determine el promedio de cada producto para la decoración del ambiente?

(13) Un proyecto minero posee cuatro ingenios auríferos. El ingenio A tiene una ley de cabeza de 8 gramos por tonelada y trabajan 20 mineros. El ingenio B tiene una ley de cabeza de 4 gramos por tonelada y trabajan 12 mineros. El ingenio C tiene una ley de cabeza de 12 gramos por tonelada y trabajan 25 mineros. El ingenio D tiene una ley 2 gramos por tonelada y trabajan 25 mineros.¿Determine la media aritmética y la media geométrica de la ley de cabeza?Si el costo real del oro es de 30,2 dólares por gramo.¿Evalué el costo de mano de obra, siend0 la relación de producción de A=2B, C=5D, A=3D en cada ingenio?¿En que ingenio se trabaja a perdida?

(14) Se tiene sospecha de que en las aguas subterráneas las concentraciones de nitritos superan las normas establecidas para la crianza de peces, dicha concentración es de 0,03 mg NO2/l. Para tratar de verificar la sospecha, se midieron los niveles de nitritos en diez puntos aleatorios del acuífero y se obtuvieron los siguientes datos.

0,02 0,05 0,03 0,05 0,04 0,06 0,07 0,03 0,04 0,03Estime el nivel de confianza al 90% que las concentraciones de nitritos superan las normas establecidas para que sea factible la existencia de vida piscícola en la zona.

(15) Los datos obtenidos de una muestra aleatoria simple de tamaño 30 de la distribución X, porcentaje de incremento del contenido de alcohol en la sangre de una persona, después de ingerir cuatro cervezas es.

2,41=X 1,2=sCalcular un intervalo de confianza del 90% para el porcentaje medio de alcohol en la sangre de una persona, después de tomar cuatro cervezas.Si se calcula un intervalo de confianza del 95%, cual será el de mayor o menor amplitud.

Palacios C. Severo

(16) El 2000 se reforestaron más de 3 millones de acres con dos mil millones de plantas de viveros. Una grave sequía durante las siguientes estaciones mató a muchas de estas plantas. Se obtuvo una muestra de 1000 plantas y se descubrió que 300 estaban muertas. Obtener un intervalo de confianza del 90% de la proporción de plantas del vivero muertas. Utilizar dicha información para estimar el número de plantas muertas en la población.

(17) La capacidad de los equipos de vidrio producido en una determinada empresa de vidrio tiene una distribución normal. Una muestra aleatoria de 7 de ellas dio como resultado un varianza de 62 mililitros. Dar una estimación, mediante un intervalo de confianza del 95% de la varianza de la capacidad del equipo de vidrio que fabrica dicha empresa.

(18) Se quiere estudiar la eficacia de un tratamiento para eliminar una bacteria de un pino. En una muestra aleatoria de 150 pinos sometidos al tratamiento, 118 resultaron sanos. En otra muestra aleatoria de 130 pinos no tratados, los pinos sanos fueron 91.Construir un intervalo de confianza del 95% para la diferencia en la taza de pinos sanos entre los tratados y los no tratados.A que conclusión llega respecto a la efectividad del tratamiento.

(19) Para estudiar el rendimiento de dos tipos de cereales se hacen 20 determinaciones en parcelas donde se ha sembrado cereal del tipo A y 18 determinaciones en parcelas con cereales tipo B con los resultados siguientes.

áreaKgX A /5,14= áreaKgsA /23,3=áreaKgX B /3,15= áreaKgsB /85,1=

Son igualmente efectivos para el cultivo los cereales A y B al nivel de confianza del 90%

(20) Se realizó un estudio para comparar en lácteos el contenido de sodio en el plasma y en leche. Se obtuvieron las siguientes observaciones sobre el contenido de sodio (mili moles por litro de leche), en 10 envases aleatoriamente seleccionadas.

Envase 1 2 3 4 5 6 7 8 9 10LechePlasma

104157

Hallar un intervalo de confianza del 95% de la diferencia media de los niveles de sodio en los fluidos del lácteo

(21) En el departamento de control de calidad de una empresa, se quiere determinar si ha habido un descenso significativo de la

calidad de su producto entre las producciones de dos semanas consecutivas a consecuencia de un incidente ocurrido durante el fin de semana. Deciden tomar una muestra de la producción de cada semana, si la calidad de cada artículo se mide en una escala de 100, obtienen los resultados siguientes:

Semana I 93 86 90 90 94 91 92 96Semana II 93 87 97 90 88 87 84 93

Suponiendo que las varianzas de la puntuación en las dos producciones son iguales, construye un intervalo de confianza para la diferencia de medias al nivel de 95%. Interpreta los resultados obtenidos.

(22) Sospechamos que nuestro cromatógrafo está estropeado, y queremos determinar si los resultados que nos proporciona son lo suficientemente precisos. Para ello, realizamos una serie de 8 mediciones del contenido de una solución de referencia que, sabemos, contiene 90% de un determinado compuesto. Los resultados que obtenemos son:

93,3 86,8 90,4 90,1 94,9 91,6 92,3 96,5Construir un intervalo de confianza al nivel de 95% para la varianza poblacional. ¿Qué conclusiones podemos realizar?

(23) Se ha hecho un estudio sobre la proporción de enfermos de cáncer de pulmón detectados en hospital que fuman, obteniéndose que de 123 enfermos 41 de ellos eran fumadores. Obtener un intervalo de confianza para dicha proporción. Estudiar si dicha proporción puede considerarse igual a la proporción de fumadores en la población si ésta es de un 29%.

(24) Para estudiar la efectividad de un medicamento contra la diabetes se mide la cantidad de glucemia en sangre antes y después de la administración de dicho medicamento, obteniéndose los resultados siguientes:

Antes 7,2 7,3 6,5 4,2 3,1 5,3 5,6Después

5,2 5,4 5,3 4,7 4,1 5,4 4,9

Estimar la reducción producida por el medicamento.(25) Eres el encargado de un departamento de producción en una

fábrica y recibes un lote de 2000 piezas necesarias para la fabricación de un artículo. Tienes la responsabilidad de aceptar o rechazar el lote, si estimas que la calidad de éste no es suficiente. El fabricante te asegura que, en este lote, no hay más de 100 piezas defectuosas, pero decides tomar una muestra para estimar la proporción de las mismas.

Palacios C. Severo

a) ¿Cuántas piezas decides examinar para que, con un nivel de confianza del 95%, el error que cometas en la estimación de la proporción poblacional de defectuosas no sea mayor que 0.05?b) Si decides tomar una muestra de 100 artículos escogidos al azar en el lote y realizas el recuento de piezas defectuosas en esta muestra, encontrado 4 artículos defectuosos.Construye para la proporción de defectuosos en el lote, un intervalo de confianza al nivel de 95% de confianza. ¿Se debe rechazar el lote?

(26) Los tiempos de reacción, en mili segundos, de 17 sujetos frente a una matriz de 15 estímulos fueron los siguientes:

514 488

592 490

507 513 492

534 523 452 464

562 584

507 461

Suponiendo que el tiempo de reacción se distribuye Normalmente, determine un intervalo de confianza para la media a un nivel de confianza del 95%.

(27) Se considera una población representada por una variante ε, de suerte que la media poblacional es igual a 25 y la varianza poblacional es igual a 240. Supuesto extraídas muestras de tamaño 100, muestreo aleatorio simple, determinar la probabilidad de que el estadístico media muestral, Ax, este comprendido entre los valores 23; 55 y 28,1.

(28) La duración aleatoria de las unidades producidas de un artículo, se distribuye según la ley normal, con desviación típica igual a seis minutos. Elegidas al azar cien unidades, resulto ser la duración media de 14,35 minutos. Elaborar el intervalo de confianza del 99% para la duración media de las unidades producidas.

(29) Se estudiaron 40 muestras de aceite crudo de determinado proveedor con el fin de detectar la presencia del níquel mediante una prueba que nunca da un resultado erróneo. Si en 5 de dichas muestras se observo la presencia de níquel ¿podemos creer al proveedor cuando asegura que a lo sumo el 8% de las muestras contienen níquel?

(30) La resistividad eléctrica de ciertas barras de aleación de Cromo- molibdeno es una variable N(12,5; 4,1).Un investigador acaba de calibrar un aparato que mide dicha resistividad y para comprobar que lo ha hecho bien utiliza el sistema consistente en medir cuatro barras y aceptar que el calibrado es

bueno si encuentra al menos un valor inferior y otro superior a 12,5.Determinar el nivel de significación del contraste que esta llevando a cabo. ¿Es sensible el contraste a una mayor o menor dispersión de la variable resistividad?

(31) En una muestra de 65 sujetos las puntuaciones en una escala de extroversión tienen una media de 32,7 puntos y una desviación típica de 12,64.a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la población.b) Indique, con un nivel de confianza del 95%, cual sería el máximo error que podríamos cometer al tomar como media de la población el valor obtenido en la estimación puntual.

(32) En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas. Se obtiene 132=X mg/dl y s2=109. Construir el intervalo de confianza al 95%.

(33) Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se eligen 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la gripe. Construir un intervalo de confianza al 95% para la probabilidad de pasar la gripe si se esta vacunado. En los otros 100 pacientes sin vacunar la pasan 20. ¿Es eficaz la vacuna?

(34) Se analizan 9 zumos de fruta y se ha obtenido un contenido medio de fruta de 22 mg por 100 cc de zumo. La varianza poblacional es desconocida, por lo que se ha calculado la desviación típica de la muestra que ha resultado ser 6,3 mg de fruta por cada 100 cc de zumo. Suponiendo que el contenido de fruta del zumo es normal, estimar el contenido medio de fruta de los zumos tanto puntualmente como por intervalos al 95% de confianza.

(35) Una firma comercial encuesta a 100 individuos para conocer sus opiniones sobre la elección de dos productos alternativos A y B recientemente fabricados. El resultado de la encuesta arroja que el producto A lo han elegido 55 individuos y el producto B 45. Hallar un intervalo de confianza al 95% para la proporción de individuos que eligen cada producto.

(36) En un proceso de fabricación de pilas alcalinas se sabe que su duración media es de 1100 horas y que dicha duración sigue una distribución normal. El nuevo proceso busca reducir la dispersión de la duración de las pilas por lo que se hace

Palacios C. Severo

necesario construir intervalos de confianza para la citada dispersión con coeficientes de confianza 90% y 98%.Construir dichos intervalos a partir de una muestra de tamaño 20 cuya dispersión es 2240 horas.

(37) Se sabe que la longitud de los diámetros de los tornillos fabricados por una máquina sigue una distribución normal y se busca un intervalo en el cual se encuentre la variabilidad de las longitudes de los tornillos fabricados por la máquina con una probabilidad del 80%.Construir dicho intervalo sabiendo que una muestra de 16 tornillos presenta una variabilidad cuantificada en 30.

(38) Un granjero dispone de dos criaderos diferentes A y B con varias granjas cada una para la cría de pollos. Con el objetivo de estudiar la mortalidad de los pollos en las dos criaderos observa el número de pollos muertos tomando una muestra de 4 granjas en el criadero A y otras 4 granjas en el criadero B obteniendo los siguientes resultados:

Nº de pollos muertos en las granjas del criadero A: 16 14 13 17Nº de pollos muertos en las granjas del criadero B: 18 21 18 19

Suponiendo normalidad en los criaderos, se trata de estudiar si la mortalidad de los pollos puede considerarse diferente en los dos criaderos con un nivel de confianza del 95%.Resolver el problema bajo la hipótesis adicional de varianzas iguales en los criaderos.

(39) Al analizar 40 muestras de una aleación de bajo punto de fusión de tipo “babit” se ha detectado ausencia de cadmio en 12 de ellas. Determinar un intervalo de confianza para la proporción de muestras de dicha aleación que no contienen cadmio.

(40) La cantidad de azufre encontrado en plantas secas de mostaza sigue una distribución normal X. se ha observado una muestra de extensión 9 con los siguientes resultados

0,7 0,8 0,6 0,95 0,65 1 0,9 0,2 0,55.Si aceptamos como valor de σ el valor calculado de la desviación típica muestral S ,¿Cuál sería el tamaño mínimo de la muestra que habría de ser considerada para que el intervalo de confianza al 95% para el nivel medio de azufre tenga una longitud inferior a 0,1?

(41) La pérdida de peso de un determinado producto dietético en 16 individuos después de un mes fue (en kg):

3,2 2 2,5 3,3 5 4,3 2,9 4,1

3,6 2,7 3,5 4,2 2,8 4,4 3,3 3,1Determinar un intervalo de confianza para la varianza con nivel de confianza del 99%, si la pérdida de peso es aproximadamente normal.

(42) Se consideran lo siguientes tiempos de reacción de un producto químico, en segundos:

1,4 1,2 1,2 1,3 1,5 1,3 2,2 1,4 1,1Obtener un intervalo de confianza del 90% para el tiempo de reacción. Suponer la variable normal con desviación típica poblacional conocida σ = 0,4.

(43) El tiempo, en minutos, que esperan los clientes de un determinado banco hasta que son atendidos sigue distribución normal de media desconocida y desviación típica igual a 3. Los tiempos que esperaron diez clientes elegidos al azar fueron los siguientes:

1,5 2 2,5 3 1 5 5,5 4,5 3 3Determinar un intervalo de confianza de coeficiente de confianza 0,95, para el tiempo medio de espera.

(44) La duración en minutos de un determinado viaje es una variable aleatoria con distribución normal de media desconocida y desviación típica igual a 3. En una muestra tomada al azar de diez realizaciones del viaje en cuestión se obtuvieron los siguientes tiempos:

10,1 6,5 5,5 7,9 8,2 6,5 7,0 8,1 6,9 7,7a) Realizar la estimación de máxima verosimilitud de la duración media del viaje.b) Calcular la probabilidad de que, en valor absoluto, la diferencia entre media estimada la real sea menor que 1 minuto.

(45) Las velocidades de difusión del bióxido de carbono a través de la porosidad del suelo son distintas.

Arenoso 20

27 22 23 23 28

23 26 22 26 20

Arcilloso 19 30

15 26 35 18 25 35

Comprobar si se puede afirmar que las velocidades de difusión son distintas al nivel de confianza del 95%

(46) Una transformadora de productos lácteos recibe diariamente la leche de dos granjas. Se desea estudiar la calidad del producto acopiado, se extraen dos muestras al azar y se analiza el contenido en materia grasa, obteniéndose los siguientes resultados.

Palacios C. Severo

Granja A %7,8=AX 22 %02,1=As 33=An

Granja B %9,10=BX 22 %73,1=Bs 27=BnSe pide construir un intervalo de confianza del 95% para la diferencia del contenido medio en grasa de leche de ambas granjas.

(47) En una determinada raza de ganado vacuno los terneros incrementan 12 kg. de peso cada semana, en los primeros meses de vida. Para comprobar se sometió al pesado de ocho terneras al cumplir las cuatro semanas y posteriormente dos semanas.Ternero 1 2 3 4 5 6 7 8Peso 4 semanasPeso 6 semanas

130138

125140

128139

127141

129137

123137

131142

130142

Comprobar si la suposición es cierta calculando los intervalos de confianza al 95% para la diferencia media de peso.

(48) Se ha realizado un estudio sobre la tasa de supervivencia de pájaros adultos en trópico y en zonas templadas. Inicialmente se marcaron 500 pájaros adultos en las patas y se liberaron a una región tropical. Un año después, se volvió a capturar 445. Suponiendo que los no recuperados fueron victimas de un depredador, la tasa de supervivencia estimada de un año para los pájaros adultos en la región es 0,80. Un experimento similar en otra zona templada, dio como resultado de 252 de los 500 pájaros con una tasa de supervivencia estimada de 0,504.Hallar un intervalo de confianza del 90% de la diferencia en las tasas de supervivencia de un año para las dos zonas.

(49) Una muestra de tamaño 10 de una población de mujeres presenta una altura media de 172 cm. y una muestra de 12 varones de otra población presenta una altura media de 176,7 cm. Sabiendo que ambas poblaciones son normales con varianzas 225 y 256 respectivamente, se trata de analizar si con una probabilidad del 95% se puede asegurar que los varones son más altos en media que las mujeres o viceversa.

(50) Los responsables municipales de la salud miden la radiactividad en el agua de una fuente natural en una zona abundante en granito. Realizadas 12 mediciones en diferentes fechas del año se observó una media de 3,6 picocurios con una desviación típica de 0,82.Determinar, al 95% y al 99%, intervalos de confianza para la radiación media y para la varianza.

(51) En una muestra de 65 sujetos las puntuaciones en una escala de extroversión tienen una media de 32,7 puntos y una desviación típica de 12,64.a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la población.b) Indique, con un nivel de confianza del 95%, cual sería el máximo error que podríamos cometer al tomar como media de la población el valor obtenido en la estimación puntual.

(52) Los tiempos de reacción, en mili segundos, de 17 sujetos frente a una matriz de 15 estímulos fueron los siguientes:

448, 460, 514, 488, 592, 490, 507, 513, 492, 534, 523, 452, 464, 562, 584, 507, 461

Suponiendo que el tiempo de reacción se distribuye normalmente, determine un intervalo de confianza para la media a un nivel de confianza del 95%.

(53) De una población cuya distribución se desconoce se obtiene una muestra aleatoria de 2000 valores en que la media muestral resulta ser 225 y la desviación típica muestral 10.Suponiendo que la varianza muestral coincida con la de la población, estimar un intervalo para la media de la población con un nivel de confianza del 95%

(54) En una muestra de 100 personas de un barrio de Lima se ha observado una proporción de 0,18 personas que leen el periódico diariamente. ¿Puede ser que la verdadera proporción de personas que leen el periódico en ese barrio sea 0,20?

Palacios C. Severo

X. ESTIMACIÓN DE PARÁMETROS

Otra cosa que los investigadores tratan de hacer con frecuencia es obtener inferencias sobre la población con base en los resultados de una experiencia a partir de una muestra. El hecho de que 50 personas en una prueba prefieran el producto A al producto B por un margen de dos a tres, es importante solo en la medida en que le permita concluir en que la población como un todo también prefiere el producto A. Esto es se llama inferencia estadística, tomar una decisión sobre la población entera en base a las características de una muestra.

Para hacer una inferencia sobre la población, usted debe de aplicar un límite de confianza o un intervalo de confianza al resultado que encontró en el estudio.

Ejemplo 1.9En un estudio X se encontró que el 30% de los informantes tienen conocimiento del producto A, es poco factible que exactamente el 30% de la población entera tenga ese conocimiento del producto A, pero la cifra de la población deberá estar cerca del 30%. Sí la muestra es lo suficientemente grande y estuvo bien tomada. A la diferencia entre los resultados de la muestra y la población se la llama error muestral.

El intervalo que se conexa al resultado de la encuesta para estimar o inferir la cifra de la población se llama intervalo de confianza.

XI. DIFERENCIAS SIGNIFICATIVAS

A veces en un proyecto de investigación se propone comparar resultados entre dos muestras. Las comparaciones más comunes son:

Dos o más subgrupos dentro de una misma muestra

¿Tienen las personas con ingresos superiores de US$ 10000, opiniones diferentes de las que tienen las personas con ingresos por debajo de Sus 10000? ¿Son distintas las evaluaciones de productos confeccionados por los varones a las evaluaciones hechas por las mujeres?

Muestras tomadas en diferentes puntos en el tiempo

¿Aumentó el conocimiento del producto durante el año pasado? ¿Es la participación en las Universidades mayor de lo que era hace cinco años? Lo primero que usted hace, es observar los resultados en forma simple y directa.Si las respuestas de los hombres y mujeres son iguales, usted no necesita de una prueba estadística adicional. Si la participación en las Universidades no ha cambiado desde hace cinco años usted ya tiene una respuesta.

Pero si los resultados son distintos entre cualquiera de sus sub-grupos entonces usted tiene que confrontar dos preguntas básicas ¿Es la diferencia de los resultados tan pequeña como para sugerir que ésta probablemente ocurrió por azar? está si usted repite la prueba. ¿Hay una buena probabilidad de que el resultado sea el contrario? ¿Es el resultado lo bastante grande como para que probablemente sea el resultado de una verdadera diferencia? sí usted repite la prueba varias veces, ¿Es muy factible que ésta resulte igual cada vez?

Antes de hacer una prueba estadística, usted debe tener una hipótesis es decir una relación que usted querrá probar como verdadera o falsa. En estadística, usualmente se supone que dos poblaciones son iguales hasta que se pruebe lo contrario. Esto se llama hipótesis nula.

Empezamos con la hipótesis nula, si la diferencia entre dos muestras es lo bastante pequeña como para que fácilmente pudiera haber ocurrido por azar, entonces la hipótesis nula no puede ser rechazada y usted debe concluir que la diferencia entre las dos muestras no es estadísticamente significativa al nivel de significación del 95 por ciento (o cualquier nivel de, significación que usted elige). En cambio, si la diferencia en los resultados de la toma de datos es tan grande que no es factible que esto haya ocurrido por azar, usted rechaza la hipótesis nula y concluye que la diferencia entre las dos muestras es estadísticamente significativa al nivel de significación del 95 por ciento.

Palacios C. Severo

Además de estas medidas de la diferencia en dos muestras, hay otras pruebas estadísticas que son útiles para evaluar diversas clases de resultados.

XII. DISPERSIÓN DE LOS DATOS PROBLEMAS

La varianza mide la dispersión de los datos con respecto a la media aritmética y la desviación estándar es simplemente la raíz cuadrada positiva de la varianza. Daremos las definiciones para su aplicación.

Datos no agrupdos: La varianza también se basa en desviaciones a partir de medias. Para hallar la varianza a de un producto, se eleva al

cuadrado las desviaciones a partir de las medias ( )2

XX − , luego

también se suman ( )2

∑ −XX y se promedian dividiendo por el

número total de productos, o sea n.

XXi∑ −

Como la media verdadera no se conoce prácticamente, la desviación estándar verdadera es una magnitud teórica. Sin embargo a puede obtenerse aproximadamente a partir de la desviación estándar estimada S(X).

( ) ( )1

−∑ −

XXXS i

En el análisis estadístico se utiliza una cantidad denominada grados de libertad que designaremos para el futuro como GL. Esta cantidad permite tener en cuenta y corregir, desde el punto de vista matemático, las restricciones impuestas a los valores. En este caso al calcular la desviación estándar, el número n de observaciones ésta fijado y la desviación estándar estimada se puede calcular a partir de la media. De la n observaciones sólo n-1 pueden variar, el último valor queda determinado por X y n. Por lo tanto al estimar la desviación estándar a partir de una muestra de la población de datos, solo hay n-1 grados de libertad. Elevando al cuadrado la desviación estándar

estimada se tiene la varianza estimada ( ) 2XS .

Ejemplo 1.10Se han realizado cinco análisis de un producto para determinar la concentración de un componente X. Los resultados fueron: 98 97,7 87 96 y 93 32,94=X

( ) 54,45

6,4719396877,9798 222222

=−++++=XS

Datos agrupados: Para ilustrar el cálculo de la desviación estándar para datos agrupados veamos los siguientes jornales de obreros. En primer término se hallan los puntos medios ( )X de cada clase de

jornal. Luego se eleva al cuadrado las ( )2XX se multiplican por el

número adecuado de frecuencia de clase para dar 2Xf .

( ) 22

fXXS −∑=

Jornal (US$) Cantidad (f) X 2X

2Xf Xf

3 a 55 a 77 a 9

163664

32180192

Total 10 404 62

( ) $4,110

USXS =

La desviación estándar puede emplearse como denominador común para colectar la dispersión de las dos distribuciones y la representatividad de las dos medias.

Otra aplicación es la desviación estándar como instrumento de análisis se da en su relación con la media de una distribución normal. Una relación se halla en función del porcentaje de observaciones dentro de una desviación estándar debajo de la media y una desviación estándar incluye un 95% de las observaciones. La

Palacios C. Severo

)(3 SX ± incluye

alrededor de 99,7% de las observaciones.

Desviación media

Otra medida de la dispersión de los valores es la desviación media real, se trata simplemente de la media aritmética de las desviaciones de las medias sin tener en cuenta lo siguiente:

∑ −= iXXmd

medianaX∑−

Para una desviación normal, la desviación estándar verdadera es aproximadamente igual 1,25 veces la desviación media.

Ejemplo 1.11Calcular la desviación media del ejemplo 1.10.

md = 3,456

La dispersión de los resultados será ±3,456Problemas

(55) Calcule el valor medio, mediana y moda de la siguiente distribución de datos:

X Y110 -119

100 – 10990 – 9980 – 8970 – 7960 – 6950 – 5940 – 4930 – 3920 – 2910 - 19

101394501

(56) Se recibe materia! de dos fuentes de abastecimiento. Los análisis de muestras provienen de las dos fuentes que se indican a continuación. Se desea saber si se justifica que existe diferencia entre las dos fuentes.

Fuente 1 85 74 76 88 73 84 77Fuente 2 79 71 75 77 79 77 78

(57) El análisis de gas natural indica el siguiente concentrado de CO2 en volumen: 24,6 23,7 23,4 23,8 24,1 23,9 ¿Calcule el intervalo de confiabilidad de la media verdadera?

(58) En una refinería de plata, se analiza el contenido de plata en los residuos para establecer su concentración en los lingotes. Las muestras obtenidas durante dos turnos dieron los resultados.

Hora 1 2 3 4 5 6 7 8Turno 1 89 92 98 97 98 97 97 98Turno 2 87 87 97 97 97 98 97 97

Trate de saber si la diferencia entre los análisis de los dos turnos es significativa.

(59) La información obtenida de cuatro reactores químicos diferentes, acerca del efecto de la temperatura sobre cierta reacción es la siguiente:

Temperatura (°C)

Rendimiento del reactor1 2 3 4

800900980

10,410,912,1

12,910,811,6

11,710,612,8

13,513,510,2

Determinar mediante análisis de varianza de dos caminos, si la varianza entre los reactores y entre la temperatura es altamente significativo.

(60) Un fabricante de hipoclorito sabe que la cantidad de cloro contenido en su producto decrece con el tiempo y eventualmente

Palacios C. Severo

se estabiliza en torno al 0,3%. El fabricante desea estimar la cantidad de cloro en el hipoclorito para un tiempo dado, con el fin de informar a los vendedores y retirar el producto caducado. Para ello se analizan sobre los porcentajes de cloro disponible por unidad de producto restante de 8 a 42 semanas después de fabricado.

Semanas desde la fabricación

Cantidad disponible de cloro (%)

81012141618202224262830323436384042

0,490,480,460,450,440,460,420,410,420,410,410,40,410,400,410,400,390,39

0,490,470,460,430,430,450,420,410,400,400,400,400,40

0,380,40

0,480,450,430,43

0,430,400,400,41

0,470,43

Realizar el análisis de regresión y anotar la ecuación del modelo lineal, el coeficiente de correlación.

(61) Se sabe por experiencia, que el incremento de peso de los embriones de pollo al transcurrir el tiempo sigue la ley de tipo exponencial.En un experimento se obtuvieron los pesos (gramos) de un embrión desde el sexto día de su nacimiento hasta e decimosexto que aparecen a continuación.

Día 6 7 8 9 10 11 12 13 14 15 16Pes

Crear una tabla con la variable días y peso con datos anteriores.Realizar un análisis de regresión para comprobar que valores siguen la ley exponencial.Gráfique los datos y la línea de regresión ajustada.Estime el peso de un pollo a los 7,5 a los 16 y a los 18 días de su nacimiento. Justificar si alguna de las estimaciones obtenidas es poco fiable.

(62) En la siguiente tabla se refiere al número Y de bacterias por unidad de volumen presentes en un cultivo después de X horas.

X 0 1 2 3 4 5 6Y 32 47 65 92 132 190 275

Ajustar los datos a una curva del tipo Y = aXb

Calcular los valores del coeficiente de correlaciónVisualizar la línea de regresión y los datos obtenidosEstimar el valor de Y para un valor de X = 3,5

(63) La tabla adjunta muestra cinco observaciones de un fenómeno cinético

U 103 102 10 1 0,1T 0 1 2 3 4

El investigador sugiere un modelo de ajuste del tipo U = ke-bT

Estimar los parámetros k y b.(64) La presión de un correspondiente a diferentes volúmenes V se

dan en la tabla.V (cm³) 50 60 70 90 100P (Kg/cm²) 60 54 46 24 10

Obtenga por regresión el coeficiente de correlación de los modelos lineales, exponenciales y cuadráticos.

(65) En una reunión medica se probo con una droga fue tomada por 14 personas, de las cuales 6 lo hacen por primera vez y 8 ya son habituales de ella. La droga produjo en el primer grupo sueños de duración 11, 12, 13, 16, 17 y 15 horas, mientras que en el segundo grupo 8, 7, 9, 10, 6, 7, 9 y 8 horas.a) Media y desviación típica de cada grupob) Formar el estadístico que se distribuye según una t de Student de 12 grados de libertad, sabiendo que las poblaciones tienen la misma media y desviación típica.

(66) Según una encuesta realizada sobre una muestra de 2500 personas elegidas al azar, el 80% está decidido a votar en las últimas elecciones.a) ¿Puede ser cierto que llegue a votar el 85% de la población?b) Con un 99% de nivel de confianza ente qué valores estará el porcentaje de los votantes de la población

(67) Suponga que de una población consistente en los valores 0, 2, 4, 6 y 8, se toman muestras de tamaño 2 con reemplazo.

X Frecuencia Frecuencia relativa02468

1/5 = 0,21/5 = 0,21/5 = 0,21/5 = 0,21/5 = 0,2

Palacios C. Severo

Demostrar que es razonable aproximar la distribución muestral de por una distribución normal, una vez que se conoce la media y la desviación estándar de la distribución muestral.

(68) En un experimento de laboratorio se mide el tiempo de una reacción química. Se ha repetido el experimento 98 veces y se obtiene que la media de los 98 experimentos es de 5 segundos con una desviación de 0,05 segundos. ¿Cuál es la probabilidad de que la media poblacional m difiera de la media muestral en menos de 0,01 segundos?

(69) Se establece un control de calidad para un proceso de producción de balas. Se ha dispuesto que cuando el proceso está bajo control, el diámetro de las balas es de 1 cm., con una desviación típica de 0,003 cm. Cada hora se toman muestras de nueve balas y se miden sus diámetros. Los diámetros de media de diez muestras sucesivas, en centímetros, son:

1,0006 0,9997 0,9992 1,0012 1,00081,0012 1,0018 1,0016 1,0020 1,0022

Establecer cuáles son los límites de control y explicar qué concluyes sobre el proceso de producción en estos instantes.

(70) Un investigador quiere estimar la media de una población usando una muestra suficientemente grande para que la probabilidad de que la media muestral no difiera de la media poblacional en más del 25% de la desviación típica sea 0,95. Hallar el tamaño de muestra necesario.

(71) La efectividad en días de un determinado antibiótico, sigue una distribución normal de media 14 días y desviación típica desconocida. Fue administrada a 16 enfermos, obteniéndose una desviación típica muestral de 1,4 días. Determinar la probabilidad de que la efectividad media en la muestra no supere los 3 días, que es el tiempo mínimo de efectividad requerido.

(72) Se realiza un análisis de la duración de 40 pilas alcalinas obteniéndose los siguientes resultados:

Duración Xi Frecuencia absoluta nj

1,55 – 1,951,95 – 2,452,45 – 2,952,95 – 3,453,45 – 3,953,95 – 4,454,45 – 4,95

214151053

Ajustar las duraciones de las pilas alcalinas a una distribución normal con media 3,5 y desviación típica 0,7.

(73) Un estudio de genética con reses consistió en varios machos apareados con grupos separados de hembras.Cuando nacían terneros, se usaban en un estudio de pesos hereditarios. En la siguiente tabla se presentan los pesos al nacer de ocho terneros de cada uno de los cinco grupos de apareamiento.

Macho Peso al nacer177200201202203

6175585759

100102605646

56956067

1131035759115

99985758115

1031155912196

759854101105

10010175

Escriba el modelo lineal, explique cada término, calcule el análisis de varianza y muestre los cuadrados medios esperados.Pruebe la hipótesis nula Ho: σ2 = 0 para los machos.

(74) Los datos del ejercicio 3.5 corresponden a las concentraciones de colesterol en análisis de laboratorio a 2 muestras de cada uno de 8 pacientes.Suponga un modelo aleatorio para el estudio. Escriba el modelo lineal, explique cada término, calcule el análisis de varianza y muestre los cuadrados medios esperados.Estime las componentes de la varianza para pacientes y muestras y determine intervalos de confianza medios al 90%.

(75) Un patólogo de plantas tomó cuatro muestras, de 3 libras cada una, de lotes de 50 toneladas de semilla de algodón acumulada en varias cosechas durante la temporada de limpia. Las muestras se analizaron en el laboratorio para buscar aflatoxin, que es una toxina producida por organismos asociados con las semillas.A continuación se proporcionan las concentraciones de aflatoxin en partes por billón para las muestras de ocho lotes.

Lote Afloxin (ppb)3469 – 723849 – 523721 – 243477 – 803669 – 723873 – 763777 – 803461 - 64

3956642938112310

571383556649011

6325882153345

6631715181102037

(76) Suponga que los lotes y sus muestras son efectos aleatorios. Escriba el modelo lineal para el estudio, explique los términos, calcule el análisis de varianza completo y muestre los cuadrados medios esperados.

Palacios C. Severo

(77) Piense en problemas de investigación en su área de interés que requieran muestras (u observaciones) de la unidad experimental debido a que no sea posible medir la unidad en su totalidad.Escriba un modelo lineal para su estudio; identifique los términos y bosqueje el análisis de varianza, muestre las fuentes de variación, los grados de libertad y los cuadrados medios esperados.

(78) Se realizó en conjunto un estudio sobre cartuchos para filtrado de partículas de alta energía, usados en respiradores comerciales para protección contra partículas de materia. Una prueba específica incluyó tres filtros elegidos al azar de cada uno de dos fabricantes, se hicieron tres réplicas de prueba independientes de cada filtro, las medidas fueron el porcentaje de penetración por medio de una prueba estándar de aerosol.

Fabricante I Fabricante IIFiltro 1 2 3 4 5 6

1,121,101,12

0,160,110,26

0,150,120,12

0,910,830,95

0,660,830,61

2,171,521,58

Escriba un modelo lineal para este estudio, explique los términos, calcule el análisis de varianza y muestre los cuadrados medios esperados.Pruebe la hipótesis de que no existen diferencias entre la penetración porcentual promedio de los filtros de los dos fabricantes.Calcule las medias, sus errores estándar y las estimaciones del intervalo de confianza de 95% para las medias de cada fabricante.

(79) Un científico de suelos estudió el crecimiento de plantas de cebada en tres niveles diferentes de salinidad en un medio controlado. Tenía dos contenedores réplica de cada tratamiento, en un diseño totalmente aleatorizado y midió tres plantas de cada réplica. Los pesos en seco de las plantas, en gramos, son los siguientes:

Salinidad Contenedor

Peso (g)

Control

6 barras

12 barras

123456

7,375,644,204,833,28

6,555,983,344,772,16

8,505,694,215,662,69

Escriba un modelo lineal para un análisis de datos, explique los términos, calcule el análisis de varianza y muestre los cuadrados medios esperados.Pruebe la hipótesis de que no hay diferencia entre las medias de los niveles salinos.Calcule el error estándar de una media de nivel salino.Haga una partición de las sumas de cuadrados para la salinidad en dos sumas de cuadrados polinomiales ortogonales (lineal y cuadrática), cada una con 1 grado de libertad y pruebe la hipótesis nula de que no hay regresión lineal o cuadrática.

(80) El índice de porosidad es una medida usada por los científicos de suelos para ayudar en la predicción del movimiento, almacenamiento, disponibilidad del agua y las condiciones de oxigenación del subsuelo. Un científico de suelos usó un diseño de muestreo especial para tomar muestras del suelo de una de las granjas experimentales de la universidad para medir el índice de porosidad del suelo. Se hizo una partición de la granja en campos de aproximadamente 4 hectáreas, cada una con 8 secciones. El plan de muestreo incluyó una selección aleatoria de los campos dentro de las secciones. A continuación se presenta el índice de porosidad de cada sub muestra:Camp

oSecció

nPorosidad Camp

oSecció

nPorosidad

12345678910111213141516

3,8465,6295,0874,6214,4113,3573,9915,7665,6773,3334,3554,94

02,9834,3965,6033,683

3,7122,021

6,2924,810

1718192021222324252627282930

5,9425,0145,1434,0613,8354,5844,1934,1253,0743,4833,8674,2126,2474,730

2,9644,398

Suponga que todos los efectos son aleatorios. Escriba un modelo lineal para el estudio, explique cada término, calcule el análisis de varianza para los datos y muestre los cuadrados medios esperados.Estime las componentes de la varianza para campos, secciones y muestras.

Palacios C. Severo

XIII. DISTRIBUCIONES

Al tratar con grandes cantidades de datos, es conveniente ordenarlos de tal manera que la frecuencia de la aparición de rangos de valores dados, puedan ser tabuladas y graficadas.

Este ordenamiento se realiza estableciendo rangos llamados intervalos de clase la frecuencia relativa de los intervalos de clase se denomina distribución empírica y se utilizan para estimar las distribuciones teóricas.

Ensayos estadísticos

Existen varios tipos de ensayos estadísticos que se emplean para determinar si la diferencia entre dos conjuntos de valores es real y significativa o a errores azarísticos.

Ensayo t

La distribución t de Student aparece al comprobar la hipótesis de la media de una totalidad general de distribución normal siendo incógnita la varianza.

Ejemplo 1.12Consideremos los datos del ejemplo 1.10, se trata de saber si la diferencia entre el valor medio y el supuesto valor medio 96 es significativa.

( )( )

Hipótesis

( )82,0±=

−=XS

Xt oµ

El valor tabulado de t para un nivel de significación del 99% y 4 GL, es igual 3,75, como el valor calculado de t es inferior al valor tabulado, la hipótesis no es rechazada.

Chi-cuadrado

Esta prueba puede utilizarse para comparar los resultados de una encuesta con frecuencia teórica o esperada.

∑ −=

Ejemplo 1.13La alimentación de flujo continuo que se realiza a cuatro reactores industriales que han sufrido un total de cuarenta fallas durante un año, la distribución de las fallas, por bombas fue:

Bomba 1: 16Bomba 2: 9Bomba 3: 6

Palacios C. Severo

Bomba 4: 9

El capataz de mantenimiento sostiene que la bomba 1 ha sufrido un número excesivo de fallas, en comparación con los resultados posteriores se trata de saber si esta afirmación es justificada.

Como hay cuatro categorías posibles de números y como el número total está dado, el número de GL es tres. Esto corresponde a un número de probabilidades aproximadamente igual a 0,25 e indica que, si todas las bombas operan en las mismas condiciones, el valor del Chi-cuadrado sería de 5,4 es decir una vez cada cuatro, por la sola acción del azar. Por lo tanto la probabilidad que la hipótesis de mantenimiento esta equivocado es del 25 por ciento en la población, La prueba puede usarse siempre que los resultados, las respuestas o los encuestadores se pueden organizar en varias categorías.

Distribución F

El análisis de varianza que se realiza mediante el ensayo F permite la separación de la varianza total de un proceso, en sus componentes.

Con el ensayo F el número de GL correspondiente a las dos varianzas no necesita ser idénticas.La mayoría de los textos de estadística tabulan valores de F para los niveles de probabilidad 0,05 y 0,01. El número de GL, con la varianza en el numerador, se indica normalmente en la parte superior de la tabla, mientras que el número de GL con la varianza en el denominador se encuentra en la columna de la izquierda.

Ejemplo 1.14Para un ensayo de laboratorio de rutina, se ha propuesto un procedimiento analítico simplificado. Es necesario determinar si el procedimiento propuesto arroja los mismos resultados que el convencional, es decir, si los valores medios de un ensayo por duplicado son iguales y si la precisión del ensayo propuesto es igual al antiguo.

Convencional Propuesto89,789,689,589,689,8

89,889,689,489,590,0

89,789,2

013,0)(

07,0)(

Los valores medios de las muestras con los dos métodos son similares pero la diferencia con la varianza es significativa al nivel del 0,05 de probabilidad. Consultado la tabla de valores F indica el valor de 6,2 para el nivel de probabilidad correspondiente y el número de GL existente.

Para determinar si los valores de varios conjuntos de medición, es necesario el cálculo de varianza de los valores medios de los conjuntos. Si la varianza de los valores medios es sólo normal resulta.

Ejemplo 1.15Tres reactores ubicados en diferentes lugares, que emplean sin embargo el mismo proceso. Se desea saber si los valores medios correspondientes a los tres reactores son similares.

Entre valores medios

( ) 825,32 =XS

Entre conjuntos

( ) 3988,02

( )( )

Reactor 1 2 310,410,011,811,2

11,612,412,911,9

9,8010,910,410,1

Suma de conjunto 43,4 48,8 41,2Media 10,85 12,2 10,3

∑ = 61,1490/2 KSC

∑ = 96,1482/2 KX

Palacios C. Severo

∑ = 2,14922X

La tabla F para los GL establecido indica los valores de 4,26 y 8,02 respectivamente. Como el valor calculado es mayor que el valor tabulado, se concluye que los valores medios de los tres reactores son significativamente diferentes.

Logaritmo normal

La distribución logarítmica normal es de amplio uso en la física estadística, geología estadística, estadística económica, biología.

Logística

La función de distribución se diferencia un poco de la función normal de distribución, se utiliza en las investigaciones médico-biológicas para analizar la eficiencia de diferentes medicamentos, nutrientes, venenos, etc.

Pareto

La distribución de Pareto encuentra amplia aplicación en los problemas de la estadística económica.

Weibull-Gnedenko

Se usa con frecuencia en la teoría de fiabilidad para describir el tiempo de funcionamiento sin fallo de los instrumentos.Pearson

Se usa ampliamente en la estadística matemática para suavizar las distribuciones de los datos empíricos.

XIV. INTERVALOS DE CONFIANZA

El desarrollo del análisis estadístico implica la determinación teórica de la distribución de ciertos valores, como el valor medio, la desviación estándar y la varianza, que se puede esperar si sólo actúa al azar. La teoría estadística constituye una herramienta poderosa, para determinar, en un grado razonable de certidumbre, si las diferencias observadas son debidas al azar. Por definición:

Reordenando Intervalo de

confianza

Z +±= σµn

XZ/σµ−=±

Por lo tanto, para un cierto nivel de probabilidad que determina el valor de Z, puede afirmarse que el intervalo de confiabilidad de µ estará dado por,

σµσ +<<−

Si no se conoce la desviación estándar verdadera, aún puede determinarse un intervalo de confiabilidad. Esta estimación utiliza la distribución t en lugar de la distribución Z porque el concepto t incluye la variación adicional introducida por la estimación de la desviación estándar, reordenando:

( ) ( )n

XtSX +<<− µ

Ejemplo 1.16Establecer el intervalo de confiabilidad para la media verdadera de los datos del ejemplo 1.10.

Nivel Intervalo

%95 ( )( ) 68,8896,995/54,478,232,94 −+=± y

%99 ( )( ) 94,8465,1035/54,460,432,94 −+=± y

Se observa que para un nivel de confiabilidad del 95% será más correcto afirmar el resultado del análisis como ± 5,64 por ciento en lugar de 94,32%.

XV. MUESTREO

Palacios C. Severo

Nadie necesita beber todo un vaso de leche dañada para poder decir que esta mala - una muestra es suficiente.

Realizar un muestreo es más barato y más rápido que hacer un censo de toda una población. Y en la mayoría de los casos, desde luego, tomar una muestra es la única alternativa factible para la investigación simplemente no es práctico pensar siquiera en encuestas a toda la población. Pero si la muestra se desarrolla con propiedad, ésta puede proporcionar suficiente precisión para propósitos de toma de decisiones.

El muestreo en la investigación requiere estas dos dimensiones:

a) Seleccionar las unidades de la población que se incluirá en el estudio.b) Interpretar los resultados del estudio con el fin de estimar los parámetros de la población a partir de los datos de la muestra y probar hipótesis, usualmente sobre la diferencia entre dos muestras o entre una muestra y un resultado esperado.

XVI. MÉTODOS DE MUESTREO

Hay dos grandes métodos de muestreo: Probabilístico y no probabilístico.

a) Muestreo probabilístico

Este es el tipo de muestreo más objetivo y científico. Un requisito del muestreo probabilístico es que cada unidad en la población tenga una probabilidad igual y conocida a ser seleccionada para la muestra. El criterio de investigador no debe influir en la selección de los informantes. Hay varias formas de muestreo:Muestreo simple al azar

Es el tipo más básico. Implica seleccionar informantes completamente al azar; es tal como si los nombres se sacarán de un sombrero. Obviamente, esto requiere un marco de muestreo perfecto; es decir, una lista completa de todas las unidades en el universo.

Muestreo estratificado al azar

Implica primero agrupar la población en segmentos homogéneos y luego hacer el muestreo de datos de cada segmento o estrato.

Muestreo de agregados

Implica tomar muestras de grupos de entrevistados como unidad y no como elemento individual. Con el fin de lograr eficiencia en entrevistas de muestreo a muestreo.

Muestreo sistemático

Se incluye cada n-ésimo elemento de la población en la muestra. Este es un procedimiento común que se puede combinar con un muestreo de agregados y muestreo estratificado.

La ventaja principal del muestreo probabilística es su precisión. Es el mejor camino para desarrollar una muestra que sea perfectamente representativa de la población. El muestreo probabilística tiene varias desventajas importantes que resulta su utilización amplia:

a) Para seleccionar una muestra probabilística es necesario tener una lista o un marco de muestreo, correspondiente a toda la población.b) A pesar de los mejores intentos de muestreo, los errores de no respuesta pueden afectar la precisión del resultado.c) El muestreo probabilística es muy costoso de realizar, es especial para estudios de muestra a muestra.

Errores

Si bien es cierto que buenos métodos de muestreo pueden producir resultados muy costosos, ninguna muestra es absolutamente precisa.

Ejemplo 1.17Supongamos que una muestra probabilística local indica que el 40% de los hogares entrevistados se tiene un gato para erradicar las ratas transmisoras del virus Hanta. Es poco probable que un censo de todos los hogares revele que exactamente en el 40% de ellos haya un gato. Si la muestra original fue bien tomada, bien ejecutada y fue suficientemente grande hay una buena probabilidad de que el número

Palacios C. Severo

real de hogares con gatos, revelado al censo esté cerca del 40%; pero probablemente no será exacta mente esa cifra.

Estos errores o diferencias entre los resultados de la encuesta y las cifras comparables de la población, viene de dos fuentes: factor de muestreo y factor no muéstrales.

Error de muestreo

En el ejemplo 1.17 sobre posesión de gatos es posible medir el error muestral del estudio y anexar un límite de confianza a la cifra de la encuesta, a fin de estimar los datos de la población total.

Supongamos que el estudio sobre la posesión de gatos ha utilizado una muestra probabilística de 1000 hogares. En este caso la cifra de 40 por ciento de poseedores de gatos tendría un intervalo de más o menos 3 por ciento a un nivel de confianza del 95 por ciento. En otras palabras las probabilidades son 95 en 100 de que el intervalo de confianza incluya el verdadero porcentaje de hogares que poseen gatos, en la población total.

Eso es el error de muestreo: el intervalo que debe anexarse a cualquier resultado de una encuesta, debido a que proviene de una muestra.

Las muestras grandes tienen menos errores de muestreo que las muestras pequeñas.

Error no muestral

La importancia y el impacto del error no muestral generalmente son sub-estimados por los investigadores, Entre los errores no muéstrales se pueden mencionar lo siguiente:

a) Incapacidad de localizar informantes correctos.b) Negativa de los informantes a empezar la investigación.c) Terminación de la encuesta por los informantes durante la investigación porque consideran que es muy larga, muy tediosa.d) Mentiras intencionales de los informantes. e)Mala memoria, suposiciones insesgadas.f) Mal entendimiento del procedimiento.g) Manipulación por parte del investigador.

h) Sesgos introducidos por el investigador.i) Errores de anotación.j) Errores de codificación.

Es decir, la precisión de los mejores métodos de muestreo probabilístico pueden anularse por algún problema de alguna de estás áreas. Sin embargo, el impacto de estos errores potenciales no muéstrales en mayor parte se pasa por alto en todo muestreo. Para solucionar los errores muéstrales, consiste básicamente en una planeación cuidadosa y una atención estrecha a los detalles de realización del proyecto.

Error en la predicción

En un diagrama de dispersión en el que no todos los puntos caen en la línea de regresión. Si todos los puntos hubiesen caído sobre la recta y si la cantidad de observaciones hubiera sido lo suficientemente grande, no se habría dado error en la predicción del proceso. La predicción perfecta es prácticamente inexistente. Aún en los casos que nos ocupa, existen factores que no son de predicción perfecta, quizás se deba a causas de imperceptibilidad en la composición de los factores.

Lo que necesita, entonces, es una medida que pudiera indicar hasta qué punto es precisa la predicción de Y, basada en X, o viceversa, cuán imprecisa podría ser. Esta medida se llama error de estimación.

( )( )2

−∑ −

Syx representa la desviación estándar de las Y sobre la base de las X.

Esta medida de error es similar a la desviación estándar que mide la dispersión alrededor de un promedio; el error de la estimación mide la dispersión alrededor de una línea promedio, llamada línea de regresión.

b) Muestreo no probabilístico

Existen tres tipos de muestreo no probabilística:Muestreo por conveniencia

Palacios C. Severo

Deja la selección de los informantes primordialmente a los investigadores.

Muestreo por criterio

Implica seleccionar únicamente cierto tipo de informantes para participar en el estudio.

Muestreo por cuotas

Se estructura la muestra de tal modo que incluya números específicos de informantes con características que se sabe o se cree que afecta al tema de la investigación.

XVII. TOMA DE DECISIONES

Los ejecutivos de muchas empresas están empezando a tomar en serio la importancia de las aproximaciones cuantitativas en la toma de decisiones.

Este es un cambio importante. Así probablemente no es por puro accidente que el tema esté ganando importancia en la gestión empresarial - investigación - consultoría.

El énfasis se debe a las herramientas estadísticas que reducen la incertidumbre de la toma de decisiones, con problemas que pueden ser parcialmente estructuradas.

Estas herramientas intentan ir más allá que simplemente proporcionen información del que tome la decisión. El fin es el de ayuda a que se pueda alcanzar una decisión reconociendo, por supuesto, el juicio profesional.

Los problemas que se ajustan bien a los sistemas de toma de decisiones son aquellas en las que existe suficiente estructuración de forma que las ayudas analíticas sean de gran utilidad requiriendo siempre el juicio del profesional.

Un aspecto muy importante de toma de decisiones es que se da la efectividad más que la eficiencia. Entonces hay que aumentar el número de posibles soluciones para que el ejecutivo pueda mejorar la efectividad de una decisión.

El informe sobre evaluación de los distintos resultados para la toma de decisiones como un punto clave para la implementación de los grupos de trabajo que han de compartir la información. Distinguiendo especialmente las tareas administrativas - gestión de calendario - planificación - agenda.

Principios de decisión

Cuando existe una situación en el cual se pueden distinguir dos o más alternativos, una decisión consiste en seleccionar una de estas alternativas de acción excluyente el otro a los otros.

Con esta definición podemos proceder a examinar el proceso completo de toma de decisiones, el cual puede concebirse integrando por las siguientes etapas:

a) Recolección de datos.b) Establecimiento de alternativas.c) Asignación de medidas de utilidad para cada alternativa en relación con algún criterio de efectividad.d) Decisión (selección de una alternativa).e) Aplicación de la alternativa.

Este proceso de complemento general, podría descomponerse en decisión de diseño y operativo y para dicho propósito, decisiones personales.

Ejemplo 1.18Consideremos un proceso de una persona que está próximo a salir de su casa, para ir al trabajo un día cualquiera de agosto y desea determinar si ponerse abrigo y, en tal caso cual de ellos.

Recolección de datos

Nuestro individuo se asoma a la ventana y observa que el sol brilla pero a través de nubes espesas. A través del noticiero de su televisor se informa que la temperatura actual es de 8°C y que se predice alcanzará un máximo de 12°C. La oficina metereológica menciona un 40% de probabilidad de lluvia.

Palacios C. Severo

Sabe que ira y volverá en movilidad al trabajo y que tendrá que caminar dos cuadras entre la ruta y su oficina. No tiene paraguas para protegerse.

Establecimiento de alternativa

La alternativa del individuo basado en su disponibilidad de vestuario:

a) Usar un sobre todo.b) Usar un impermeable, yc)No usar ningún abrigo.

Asignación de medidas con algún criterio de efectividad

El criterio de efectividad del individuo, será en este caso el de comodidad personal, que es una medida subjetiva. El determinará a continuación, de alguna manera intuitiva, la utilidad de su comodidad personal para cada alternativa.

Decisión (selección de la alternativa)

Supongamos que el individuo, en camino al trabajo, ha asignado medidas de utilidad para cada alternativa, de tal manera que una de ellas posee una utilidad mayor que cualquiera de las otras, la decisión o selección de una alternativa, se tomará en favor de aquella que tenga la mayor medida de utilidad.

Si dos alternativas tienen igual medida de utilidad y esta es mayor que la de la tercera, se deberá emplear entonces algún método aleatorio de selección. En este caso el lanzamiento de una moneda podría servir.

Ejecución de la alternativa escogida

En nuestro ejemplo la ejecución es sencilla. El hombre toma el abrigo escogido de su armario o simplemente se va al trabajo si ha decidido no llevar abrigo.

Visto de esta manera el proceso de decisión entramos ahora a establecer algún principio general de utilidad en el diseño de la estructura de las decisiones en un sistema Montecarlo. Alguno de estos

principios puede aparecer obvios o triviales, y sin embargo no violados con frecuencia en el diseño.XVIII. PRINCIPIOS PARA LA TOMA DE DECISIONES

1. Los datos son base necesaria para la decisión. Sin algún dato es imposible establecer alternativas o asignar medidas de utilidad a las mismas.2. Los datos recolectados deben ser de dos clases: aquellos que sirven para establecer las alternativas y los que se pueden usara para fijar las medidas de utilidad.3. Los datos recolectados deben se directamente aplicables o tales que, mediante una transformación, puedan hacerse aplicables para el criterio de efectividad que se usan.4. Suponiendo que se ha establecido alternativas y asignado medidas de efectividad, los datos adicionales serán útiles que afectan las utilidades asignadas.5. La recolección de datos deberá tomarse antes de establecer alternativas y averiguar utilidades. Aunque este principio parece obvio, realce la exigencia frecuentemente escuchada acerca de la oportuna recolección de datos.6. La exactitud que se requiera en los datos en función de las técnicas utilizadas parece asignar medidas de utilidad a las alternativas. Este principio refuerza el análisis de la sensibilidad de los modelos matemáticos. Sin un modelo dado es relativamente sensible a un parámetro dado, o si este parámetro es ponderado ligeramente, se disminuye la exigencia de exactitud.7. Asumiendo que, para una decisión determinada, las cinco etapas del proceso de decisión están bien definidas y que esta decisión es de naturaleza repetitiva, la totalidad del proceso de decisión puede delegarse a un nivel más bajo de la organización. Nótese que en cada uno de estos casos debe tomarse una decisión de diseño. Las alternativas son: Retorne al proceso de decisión o delegarlo a un sistema automático. AL tomar la decisión, el diseñador del sistema deberá asignar medidas de utilidad a las alternativas.

XIX. PLANIFICACIÓN

Palacios C. Severo

La planificación de una operación propone asegurar que todos los recursos necesarios para producir, se encuentran y en las cantidades necesarias y, además, que el desperdicio de los recursos sea mínimo.

El plan de operaciones suministra solo el marco general dentro del cual las actividades específicas habrán de desarrollarse. En torno al plan de operaciones asigna recursos disponibles a los diferentes requerimientos de producciones.

Tipos de planificación

Existen diferentes categorías de planeamiento para diferentes períodos:

Planificación a largo plazo

Se relaciona con el mantenimiento de la línea apropiada por medio de la investigación y desarrollo, y en el suministro de las factibilidades para las actividades. El plan incluye planeamiento para al expansión, modernización.

Planificación intermedia

Se relaciona con la asignación de recursos a las necesidades del proyecto, tales como la adquisición de materiales, equipos y nuevos productos.

Planificación a largo plazo

Establece programas que asignan recursos, a los proyectos actuales. Este tipo de plan, que usualmente cubre seis meses a dos años, establece el nivel general de actividades.

Problemas

(81) Calcular los valores tα correspondientes a una distribución t de Student en los siguientes casos:a) El área a la derecha de tα es 0,20 y n = 10b) El área a la izquierda de tα es 0,40 y n = 8c) El área a la derecha de tα es 0,05 y n = 50

(82) Calcular los valores de Fα correspondientes a una distribución F de Snédecor en los casos siguientes:a) α = 0,01 y (2,8) grados de libertadb) α = 0,05 y (7,3) grados de libertad

(83) Elegidas 26 personas al azar de una población y sometidas a un test de modernismo dan como media 40=X y 6=S . Se quiere saber si la verdadera media de la población puede ser tan alta como 44.

(84) El fabricante de una dieta de adelgazamiento dice que su producto permite una reducción media de peso de 3,5 kg. Con objetivo de investigar su eficacia, se seleccionaron al azar 40 personas, observando en ellas el peso antes de aplicar la dieta, X y el peso después de acabar el tratamiento, Y, lo que proporcionó una varianza para la diferencia de

( ) ( )[ ]∑ =−−−= 40

23 8,139

1YXYXS iid

Si suponemos que tanto X como Y siguen distribuciones normales, determinar la probabilidad de que los individuos de la muestra haya una reducción media de masa de 3 kg.

(85) La efectividad en días de un determinado antibiótico, sigue una distribución normal de media 14 días y desviación típica desconocida. Fue administrada a 16 enfermos, obteniéndose una desviación típica muestral de 1,4 días. Determinar la probabilidad de que la efectividad media en la muestra no supere los 3 días, que es el tiempo mínimo de efectividad requerido.Preocupados por una posible subestimación de la varianza poblacional, que podría llevar a subestimar la probabilidad de

Palacios C. Severo

que no se alcance la efectividad mínima, se desea determinar la probabilidad de que con una muestra de 16 enfermos se subestime la varianza en más de un 20%. Si la muestra es de 61 pacientes, esta probabilidad ¿aumenta o disminuye?Determinar el tamaño de muestra necesario para que la probabilidad anterior sea 0,05.

(86) En una muestra de 19 individuos se observa que un determinado trastorno emocional se produce a partir de una edad media de 50 años y una desviación típica de 6 años. Se supone que estamos ante un fenómeno que sigue la ley normal.Fijar los límites del intervalo de confianza para la varianza con un nivel de confianza del 99%Realizar lo mismo que en el apartado anterior para n = 200

(87) En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan más a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar. Explicar qué procedimiento de selección sería más adecuado utilizar: muestreo con o sin reposición. Como los gustos cambian con la edad y se sabe que en el barrio viven 2500 niños, 7000 adultos y 500 ancianos, posteriormente se decide elegir la muestra anterior utilizando un muestreo estratificado. Determinar el tamaño muestral correspondiente a cada estrato.

(88) Sea la población de elementos 22 24 26Escriba todas las muestras posibles de tamaño dos, escogidas mediante muestreo aleatorio simple. Calcule la varianza de la población.

(89) La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribución normal de media 1,62 m y la desviación típica 0,12 m. Cuál es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1,60 m

(90) Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios:

95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.

Suponiendo que los precios de este producto se distribuyen según una ley normal de varianza 25 y media desconocida:¿Cuál es la distribución de la media muestral?

Determine el intervalo de confianza, al 95%, para la media poblacional.

(91) La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria que sigue una distribución normal con varianza σ2 = 0,16 m2. Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la población. Cuál sería el mínimo tamaño muestral necesario para que pueda decirse que la verdadera media de las estaturas está a menos de 2 cm de la media muestral, con un nivel de confianza del 90%

(92) Las ventas mensuales de una tienda de electrodomésticos se distribuyen según una ley normal, con desviación típica US$ 900. En un estudio estadístico de las ventas realizadas en los últimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son US$ 4663 y US$ 5839. ¿Cuál ha sido la media de las ventas en estos nueve meses? ¿Cuál es el nivel de confianza para este intervalo?

(93) Se desea estimar la proporción, p, de individuos daltónicos de una población a través del porcentaje observado en una muestra aleatoria de individuos, de tamaño n. Si el porcentaje de individuos daltónicos en la muestra es igual al 30%, calcula el valor de n para que, con un nivel de confianza de 0,95, el error cometido en la estimación sea inferior al 3,1%. Si el tamaño de la muestra es de 64 individuos, y el porcentaje de individuos daltónicos en la muestra es del 35%, determina, usando un nivel de significación del 1%, el correspondiente intervalo de confianza para la proporción de daltónicos de la población.

(94) En una población una variable aleatoria sigue una ley normal de media desconocida y desviación típica 2. Observada una muestra de tamaño 400, tomada al azar, se ha obtenido una media muestra al igual a 50. Calcule un intervalo, con el 97 % de confianza, para la media de la población. Con el mismo nivel de confianza, ¿qué tamaño mínimo debe tener la muestra para qué la amplitud del intervalo que se obtenga sea, como máximo, 1?

Palacios C. Severo

(95) Una marca de nueces afirma que, como máximo, el 6% de las nueces están vacías. Se eligieron 300 nueces al azar y se detectaron 21 vacías.Con un nivel de significación del 1%, ¿se puede aceptar la afirmación de la marca? Si se mantiene el porcentaje muestral de nueces que están vacías y 1-α = 0,95, ¿qué tamaño muestral se necesitaría para estimar la proporción de nueces con un error menor del 1% por ciento?

(96) La duración de las bombillas de 100 W que fabrica una empresa sigue una distribución normal con una desviación típica de 120 horas de duración. Su vida media está garantizada durante un mínimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de significación de 0,01, ¿habría que rechazar el lote por no cumplir la garantía?

§2ANÁLISIS DE REGRESIÓN

La falacia del cuadro estadístico estriba en que es unilateral, en la medida en que representa sólo el aspecto promedio de la realidad y excluye el cuadro total. La concepción estadística del mundo es una mera abstracción, y es incluso falaz, en particular cuando atañe a la psicología del hombre.

Carl Jung

I. INTRODUCCIÓN

Las técnicas estadísticas estudiadas hasta ahora tenían por objeto fundamental la comprobación de ciertas hipótesis.

Un campo más útil e importante del análisis estadístico en el diseño consiste en el desarrollo de modelos matemáticos que representen situaciones físicas. Este tipo de análisis se denomina análisis de regresión, se ocupa de desarrollar una cierta relación matemática que incluye el modelo matemático, su significación estadística y su confiabilidad.

Se puede demostrar que está íntimamente relacionada con el modelo del análisis de varianza.

II. MÉTODOS DE MÍNIMOS CUADRADOS

Se predice una variable dependiente en función de una variable independiente simple; en muchos problemas de este tipo la variable independiente se observa sin error o con error que es despreciable se compara con el error de la variable independiente.

Ejemplo 2.19Al medir la cantidad de óxido formado en la superficie de un menaje de aluminio, las variables de anodinado electrolítico suelen ser cantidades, pero la medición del espesor del óxido anodizado esta sujeto a variables aleatorias consideradas.

Así, a pesar que la variable independiente puede ser estable en X, las mediciones repetidas de ella pueden atribuirse a diversas causas, principalmente a errores de medición y a la existencia de otras variables incontrolables capaces de influir en el valor de X cuando este fija. En esta forma la medición del espesor de la capa anodizada pueden variar en toda la superficie para el mismo período a la misma variable ejecutada.

Estudiemos el caso de regresión Y sobre X lineal, esto es, para cualquier X dada la media de la distribución de las Y esta dada por:

εβα ++= XYε es el valor de una variable aleatorizada y podemos elegir a tal que la media de la distribución de esta variable aleatoria sea igual a cero.

Ejemplo 2.20Consideremos una regresión de Y sobre X sea lineal, suponiendo un fenómeno físico de tensores, se flexiona variando la carga.

X 1 2 3 4 5 6Y 35 64 96 124 156 182

Palacios C. Severo

Consideremos n pares de observaciones (Xi,Yi), deseamos determinar la línea que de el mejor ajuste. Si predecimos y por medio de la ecuación:

ε++= bXbY o

iIi YY −=εPuesto que no podemos minimizar cada εi por separado, debemos tratar de hacer una sumatoria Σεi; tan cerca de cero como sea posible, minimicemos la suma de cuadrados de las εi.

( )[ ]2∑ +− ioi bXbY

Nótese en la figura, que la minimización de la suma de cuadrados de las distintas verticales a partir de los puntos respecto a la línea. Una condición necesaria para que exista un mínimo relativo es la acumulación de las derivadas parciales con respecto a bo y b.

( )[ ]( ) 02 =−∑ +− iioi XbXbY

( )[ ] ( ) 012 =−∑ +− ioi b XbY

Siendo las ecuaciones normales,

∑ ∑+=ioi

XbnbY1

∑ ∑+∑= 2

1 iiojiXbXbYX

Este conjunto de ecuaciones lineales con la incógnita bi denominados casos normales, da los valores para la línea con el mayor ajuste a un conjunto de datos.

Ejemplo 2.21Ajuste una línea recta a los datos por el método de mínimos cuadrados, utilice para estimar el coeficiente de evaporación de una gota de combustible, cuando la velocidad del aire proveniente de una turbina es de 190 cm/seg.

X 20 60 100 140 180 220 260 300 340 380Y 0,18 0,37 0,35 0,78 0,56 0,75 1,18 1,36 1,17 1,65

∑ = 2000X

∑ = 532000²X

∑ = 35,8Y

∑ = 4,2175XY

53200020004,2175

20001035,8

Resolviendo

bo = 0,069, b = 0,0038

segmmY /²79,0)190(0038,0069,0 =+=

III. MODELOS DE REGRESIÓN

En las aplicaciones de la estadística se exige estimar el carácter de la dependencia entre las variables estadísticas observadas.

Ejemplo 2.22Entre los parámetros de los procesos tecnológicos, la producción acabada, la luminosidad de las estrellas y sus dimensiones, la cantidad de precipitación fluvial en sectores, el rendimiento de

Palacios C. Severo

cosecha, el engorde de ganado, la recuperación de material valioso de un mineral, la transformación de un producto, etc.

[ ][ ]

bLogXbLogY

bXbLogY

XbXbXbbY

XbXbbY

XbXbXbbY

XbXbbY

bLogXbY

XbXbXbbY

ijijijijiio

ijijiiiiiio

∑ ∑+++=∑ +++=

∑+∑+∑+=

∑+∑+∑+=∑+=

En este caso, el problema fundamental consiste en el aislamiento de los datos experimentales con ayuda de curvas especialmente elegidas llamadas líneas o superficie de regresión que con mayor o menor seguridad caracteriza la dependencia de correlación entre las variables en observación.Las funciones más usadas en el análisis de regresión estadística son:

IV. MODELO DE REGRESIÓN LINEAL CON K VARIABLES

Generalizando el modelo de regresión lineal de dos y tres variables, el modelo de regresión de K-variables que tiene la variable dependiente Y y K- 1 variables independientes X1, X2, …, Xk, puede escribirse de siguiente manera.

ikkiio XbXbbY ε++++= −− 11...

Donde:

bo es el interceptobi a bk-1 son las pendientes, y

εi la perturbación

La regresión lineal se debe interpretar como ya se ha visto, nos proporciona la media o valor esperado de Y condicional a los valores fijos (en muestras repetidas) de X1, X2, ..., Xk-1 es decir E(Y/X1,X2, ..., Xk-

V. REGRESIÓN LINEAL SIMPLE

Determina la relación entre una sola variable de regresión X y la respuesta Y. Usualmente se supone que la variable X es continua y controlada por el investigador. Si el experimento esta diseñado se eligen los valores X y se observan los valores correspondientes a Y.

El valor esperado de Y para cada valor de X es:

bXbXYE o +=)/(

En donde los parámetros de la recta bo son constantes desconocidas. Se supone que cada observación Y puede describirse mediante el modelo,

ε++= bXbY o

Donde ε es un error aleatorio con media cero y varianza δ2.

Los parámetros del modelo bo y b pueden estimarse mediante mínimos cuadrados si se tiene n pares de datos.Ejemplo 2.23El forjado de hierro a cierta temperatura afecta en la dureza del templado, para investigar esta relación se ha tomado las siguientes muestras:

X 6 9 11 13 22 26 28 33 35Y 68 67 65 53 44 40 37 34 32

Palacios C. Severo

23232²

4665²

∑ =∑ =∑ =∑ =∑ =

Suma de cuadrados de los factores:

( )[ ] 118²1839/146658/12 =+=XS

( )[ ] 11,215²4409/1232328/12 =−=YS

Suma de cuadrados de los productos cruzados

( )[ ] 71,155)440(1839/177018/1 −=−=XY

( )[ ] 11,215²9/440232328/1 =−=YY

La pendiente es:

32,1118/71,1551

−=−=b

En el origen:

89,48==Ybo

( )XXbYY i −=−

( )33,2032,189,48 −−=− XY

XY 23,173,75 −=La prueba de significancía de regresión de los datos, es:

Tabla 2,5 Análisis de varianzaFuente SC GL CM Fo Ft(99%

)RegresiónError

205,539,58

205,531,3688

150,153 > 12,2

Total 215,11 8 R² = 95,54%

VI. REGRESIÓN LINEAL MÚLTIPLE

Muchos problemas de regresión en la vida real son con más de dos variables.

El problema general se ajusta al modelo lineal,

kko XbXbXbbY ++++= ...2211

Se conoce como regresión lineal múltiple.El método de mínimos cuadrados se usa para estimar los coeficientes de regresión, las ecuaciones normales en el método son:

∑=∑+∑+∑+∑∑=∑+∑+∑+∑∑=∑+∑+∑+∑∑=∑+∑+∑+

YXbXbXXbXXbX

YXbXXbXbXXbX

YXbXXbXXbXbX

YbXbXbXNb

33232321313

23322221212

133122112

332211

Ejemplo 2.24Determine la función múltiple de la relación entre dos factores X1 y Xz

a partir de los siguientes datos:

1X2X Y 21X 2

2X 21 XX YX1 YX 2

7121720

164981

4144546

2884153240

16032 16 56 290 94 159 505 276

81 =X 42 =X 14=Y

Ecuación normal

2769415916

50515929032

5616324

=++=++=++

Palacios C. Severo

Resolviendo la determinante obtenemos los coeficientes:bo = 0,6440b1 = 1,6610b2 = 0,0169

Resultando el modelo lineal múltiple

21 0160,0661,1644,0 XXY ++=

El procedimiento para el análisis de varianza es:

Tabla 2.6 Análisis de varianzaFuente SC GL CM Fo Ft(95%

)RegresiónError

95,5562,444

47,778

19,55 > 19

Total 98,000

3 R² = 97,51%

Se concluye que al menos una variable afecta significativamente a la regresión.

)Regresiónbo

95,556784,00

011,0360,0012,444

47,778784,00

011,0360,0012,444

19,55320,7

84,52<1

19161161

Total 894,007

VII. REGRESIÓN POLlNOMIAL

La aplicación práctica de la regresión polinomial tiene un objeto esencial el incremento de los grados de alisamiento que exige realizar de nuevo todos los cálculos.

En este caso es útil emplear los polinomios ortogonales en el modelo:

∑++∑+∑+= ijijijijiio XbXbXbbY 2

Aplicando el criterio de mínimos cuadrados, igualando a cero las derivadas parciales de Y con respecto a los coeficientes bo, b1,.. .,b12, reacomodando algunos términos, se tiene las k+1 ecuaciones normales.

Resolviendo el sistema, por cualquier método, se obtiene bo, b1, b2,..., b12 que son los estimadores mínimos cuadrados que nos permiten estimar Y a partir de la ecuación matriz.

∑ ∑=∑ ∑+∑ ∑+∑ ∑+∑ ∑+∑ ∑+∑ ∑

∑=∑ ∑+∑+∑ ∑+∑+∑ ∑+∑

∑=∑ ∑+∑ ∑+∑+∑ ∑+∑+∑

∑=∑ ∑+∑+∑ ∑+∑+∑ ∑+∑

∑=∑ ∑+∑ ∑+∑+∑ ∑+∑+∑

∑=∑+∑+∑+∑+∑+

YXXXXbXXbXXbXXbXXbbXX

YXXXbXbXXbXbXXbbX

YXXXbXXbXbXXbXbbX

YXXXbXbXXbXbXXbbX

YXXXbXXbXbXXbXbbX

YXXbXbXbXbXbNb

321222

222112

2222112

11222122

3111212

21122222

21112211

Las pruebas estadísticas son las mismas que para los casos de regresión múltiple con sólo dos cambios en los grados de libertad, en lugar de un F con (r-2, n-r) grados de libertad tendremos una F con (r-k-1, n-r) grados de libertad, donde k es el grado del polinomio que se ajusta.

VIII. REGRESIÓN POLINOMIAL CUADRÁTICO

Un polinomio de grado k en una variables

∑+∑+∑+= ijijiiiiiio XbXbXbbY 2

que se aplica para estimar los efectos polinomiales de un factor cuantitativo.

Ejemplo 2.25Ajustar los siguientes datos a un polinomio de segundo orden restando mil al factor X y 23,2 al factor Y, para facilitar los calculas:

870 890

890 900 910 920 930 940 950

Y 0 8,2 16,6

27 39,7

108,5 128,5

desarrollando un artificio matemático para X, siendo

Palacios C. Severo

[ ] 10/9001 −= XX

X1 -5 -4 -3 -2 -1 0 1 2 3 4 5Y 0 8,2 16,

627 39,

∑ = 0X

∑ =1102X

∑ = 8,1429XY

92092∑ =YX

∑ = 8,886Y

92901958011

8,14290110

8,886110011

=++=++=++

resultando los coeficientes

bo = 76,64b1 = 13b2 = 0,3974

el modelo polinomial de segundo orden es:

²3974,01664,76 XXY ++=

reemplazando con el valor original

²003474,08,1378,11952 XXY +−=

IX. REGRESIÓN NO LINEAL

Es una práctica común de la ingeniería bosquejar parejas de datos sobre varias clases de hojas para graficar, con el fin de determinar si para una escala de transformación adecuada, los puntos caerán cerca de una línea recta. De ser así el tipo de transformación nos lleva a una forma funcional de la ecuación de regresión y las constantes

necesarias pueden determinarse aplicando el método de mínimos cuadrados a los datos transformados. Sí un conjunto de datos que consta de n puntos se linealiza cuando son graficados sobre el papel semi logarítmico indica que la curva de regresión es exponencial para cualquier X considerada, la medida de la distribución de las Y está dada por αβX, entonces la ecuación predictiva será:

βα XLogLogLogY +=

Ejemplo 2.26Una fabrica de llantas decide analizar una variedad de sus productos para saber cuanto tiempo se puede usar después de un recorrido estándar.

Recorrido 1 2 5 10 20 30 40 50Porcentaje 98,2 91,7 81,3 64 36,4 32,8 17,7 11,3

ΣX = 158ΣX² = 5530ΣLog Y = 130312ΣXLog Y = 2121224

LogbLogb

55301582121224

1588130312

cuya solución es

XLogY 0188,0002,2 −=

en forma exponencial: XY )96,0(100=

X. COEFICIENTE DE CORRELACIÓN MÚLTIPLE R2

En el caso de dos variables se define R2 como la bondad de ajuste de la ecuación de regresión; es decir, nos da la proporción o porcentaje de variación total en la variable dependiente Y explicada por las variables independiente X.

Este sentido de R2 puede fácilmente extenderse a modelos de regresión de más de dos variables. Por consiguiente, en el modelo de tres variables estamos interesados en conocer la proposición de las variables en Y explicada conjuntamente con las variables X1 y X2. El valor que nos da esta información se conoce como el coeficiente de

Palacios C. Severo

correlación múltiple y se denota por R2, conceptualmente es igual que R2.

La suma total de cuadrados es igual a la suma de cuadrados de las dependientes más la suma de cuadrados residuales. Por definición.

totalerror SCSCR /² =

Dado que los valores de la ecuación son generalmente computados en forma rutinaria, R2 puede calcularse fácilmente. Note que R2 esta comprendido entre 0 y 1. Si es uno, significa que la línea de regresión ajustada explica el ciento por ciento de la variación de Y. De otro lado, si es cero, el modelo no explica nada de la variación en Y. Típicamente, sin embargo, R2 esta entre estos valores extremos.

Se dice que el ajuste del modelo es mejor mientras más cerca de uno está R2.

XI. PRUEBAS DE SIGNIFICANCIA

No podemos utilizar la prueba t para verificar la hipótesis conjunta según la cual las pendientes de las distintas variables son simultáneamente cero. Sin embargo esta hipótesis conjunta puede verificarse mediante la técnica de ANAVA y puede demostrarse del modo siguiente.

Recordemos la identidad (ver el libro Manual de la Teoría del Diseño Experimental publcado por el Autor).

SCtotal tiene como es costumbre N-1 grados de libertad.

SCresidua tiene N-3 grados de libertad por motivos ya conocidos ySCerror tiene 2 grados de libertad en razón de que es función de b1 y b2.

Por lo tanto, siguiendo el procedimiento ANAVA, podemos elaborar las tablas.

( )[ ] )3/(/2/ 22211 −∑∑ ∑+= NXYbXYbF iiiii ε

Tabla 2.8 Cálculo de análisis de varianzaFuente SC GL CM Fo

residualerrortotal SCSCSC +=

RegresiónError ∑ ∑+ iXYbXYb i 222111

∑ 2iε

23−N

GLSC / ( ) 2// σGLSC

Total ∑ 2iY 1−N

∑ ∑+ iXYbXYb i 222111

/ ∑ 2iY

Puede demostrarse ahora que bajo el supuesto de que los εi

distribuidos normalmente y de que la hipótesis nula b1=b2=0, la variable.

La aplicación práctica de la regresión tiene por objeto esencial el incremento de los grados del modelo, el alizamiento exige realizar calculas precisos.

Para estimar los parámetros:

1312221121,...,,...,,,...,,,, bbbbbbbY

Para obtener los coeficientes aplicamos las matrices aquí detalladas,

FUNCIÓN MATEMÁTICA: DISEÑO FACTORIAL 22

Y oX1X 2X 2

1X 22X 21 XX YX 1 YX 2

∑Y 4 4 4 YX∑ 1 YX∑ 2

∑=∑+∑+∑∑=∑+∑+∑∑=∑+∑+

YXXbXXbbX

YXXXbXbbX

YXbXbNb

222112

Ejemplo 2.27Evalué los datos

4bo = 300 bo = 754b1 = 30 b1 = 7,74b2 = 10 b2 = 2,5

Y X1Y X2Y6580

- 65+ 80

- 65- 80

Palacios C. Severo

- 70+85

+ 70+ 85

Σ 300 Σ 30 Σ 10

Resultando el modelo

( ) ( ) 18,116/4,1532,1010...4,93,9 22222 =−++++=totalSC

FUNCIÓN MATEMÁTICA: DISEÑO FACTORIAL 23

Y oX1X 2X 3X 2

1X 22X 2

3X YX 1 YX 2 YX 3

11111111

-+-+-+-+

--++--++

----++++

11111111

-+-+-+-+

----++++

∑Y8 8 8 8 YX∑ 1 YX∑2YX∑ 3

∑=∑+∑+∑+∑∑=∑+∑+∑+∑∑=∑+∑+∑+∑∑=∑+∑+∑+

YXXbXXbXXbbX

YXXXbXbXXbbX

YXXXbXXbXbbX

YXbXbXbNb

333223113

222112

1313212

332211

Ejemplo 2.28Evalué los datos

8bo = 548,74 bo = 68,598b1 = - 0,86 b1 = - 0,118b2 = 4,24 b2 = 0,538b3 = - 2,48 b3 = - 0,31

Y X1Y X2Y X3Y68,7269,0669,4467,7567,9368,7368,7268,39

Σ 548,74

- 0,86 4,24 - 2,48

el modelo es:

32131,053,011,059,68 XXXY −+−=

FUNCIÓN MATEMÁTICA: DISEÑO HEXAGONAL

Y oX1X 2X 2

1X 22X 4

1X 42X 2

1 XX YX 21 YX 2

2YX 1 YX 2 YXX 21

111111111

∑Y9 0 0 3 2,9 2,3 2,3 0,75 Σ Σ Σ Σ Σ

Para mayor detalle ver el tópico de Diseño Hexagonal.

FUNCIÓN MATEMÁTICA: DISEÑO COMPUESTO CENTRADODE DOS FACTORES

Y oX1X 2X 2

1X 22X YX 2

1 YX 22

YX 1 YX 2 YXX 21

1111111111111

∑Y13 0 0 8 8 Σ Σ Σ Σ Σ

Problemas

(97) Se dan los datos correspondientes al tiempo de secado de cierto barniz y a un aditivo que reduce el tiempo de secado, al aplicarlo sobre un producto que es novedoso.Barniz 0 1 2 3 4 5 6 7 8Secad

o12 10,

510 8 7 8 7,5 8,5 9

(98) Se realiza un tratamiento a un cierto tipo de aleación, requiriendo cierta fuerza de ruptura, dicho producto es una pieza como parte de un componente de autopartes.

Fuerza 38 48 85 59 40 60 68 53

Palacios C. Severo

Aleación 1 2 3 4 1 2 3 4Fuerza 31 35 42 59 18 34 29 42Aleación 1 2 3 4 1 2 3 4

(99) Los datos corresponden al tiempo que tardan diez técnicos en ensamblar computadoras por las mañanas, los cuales trabajan 8 horas como jornada laboral.

Tiempo 11,1 10,3 12,0 15,1 13,7 18,5 17,3 14,2 14,8 15,3Maquina 10,9 14,2 13,8 21,5 13,2 21,1 16,4 19,3 17,9 19,0

(100) Al problema (98) adicione otra aleación siendo los datos:Aleación 5 5 5 5 10 10 10 10Aleación 15 15 15 15 20 20 20 20

(101) Al problema (99) adicione los datos de trabajo en la tardeTarde 9,6 15,1 12,6 24,5 12,8 22,1 15,6 21,6 16,9 20,6

(102) Un gerente de ventas tiene la responsabilidad de seleccionar nuevos vendedores.Con el fin de lograr una mejor selección posible de un grupo de aspirantes, diseño un test. Su objeto era predecir el volumen de ventas de un individuo sobre la base del puntaje. Sin embargo para determinar si existía alguna relación entre su test y las ventas pidió a varios vendedores antiguos que se sometieran al test. En la tabla se registran los puntajes de sus respectivos test y sus ventas semanales.

Vendedor Test Venta semanalNatanielAlbertoHugoEmilioCarlos

a) Cuál es la variable dependienteb) Represente gráficamente con las variables independientes y

dependientes.c) Determine la ecuación de la recta.d) Si Nataniel es un aspirante al puesto a vendedor. Obtuvo 3

puntos en el test, sobre la base de la ecuación de regresión. ¿Cuál será la cifra de sus ventas semanales medias según pronóstico?

e) Obtenga el coeficiente de correlación e interprete.(103) Supongamos que una ecuación de regresión múltiple es:

EDCBAY 7,047,314,218,2106,018,16 +++++= Qué significa el coeficiente 3,47

Qué significa cada uno de los coeficientes de los factoresQué significa 16,18 en la ecuación de regresión

Si todos los factores se hacen cero cual es el valor inicial con que se empieza el desarrollo de la ecuación de regresión.

(104) Interprete un coeficiente de correlación igual a 0,99 0,98 0,88 0,79 0,67 0,56 0,45 -0,89 -0,78 -0,06

§3PRINCIPIOS DE DISEÑO

EXPERIMENTAL

Palacios C. Severo

(...) Demostrar que la realidad nos pasa delante de los ojos como un relato, en el que hay diálogos, enfermedades, amores, además de estadísticas y discursos.

Tom Wolfe

I. INTRODUCCIÓN

Diseñar estadísticamente un experimento, es realizar una prueba o una serie de pruebas, buscando caracterizar las variables o factores de mayor influencia en un ensayo de interés, evaluado a través de varias variables respuesta tal que, si deliberada o sistemáticamente se introducen cambios controlados en algunas de las variables explicativas del proceso, siempre sea posible observar o cuantificar los cambios que éstos generan en las variables respuesta buscando adicionalmente, minimizar el efecto de las variables no controlables, procurando con ello estabilizar y minimizar la variabilidad de las respuestas.

Aunque la aplicación o uso del diseño experimental se da en cualquier área del conocimiento, este debe cumplir las siguientes fases:

1. Caracterización de un proceso. En esta fase, se busca determinar los rangos de las variables o factores controlables de mayor influencia en las variables respuesta que a la vez minimizan el efecto de las variables no controlables (factores o variables).

2. Depuración y optimización de un proceso ya caracterizado. En esta fase se hallan los niveles de los factores estudiados que proporcionan la respuesta óptima a la solución del proceso caracterizado en la fase anterior.

En cualquier aplicación de la estadística en el diseño y análisis de un experimento, es necesario que quienes lo desarrollen entiendan claramente el problema objeto de estudio, que posean un amplio conocimiento del material experimental a usar, que conozcan las posibilidades existentes para procesar los datos y además posean el conocimiento estadístico necesario para interpretar adecuadamente los resultados del experimento.

II. TIPOS DE EXPERIMENTOS

Se clasificó los experimentos como pertenecientes a dos tipos.

a) El experimento absoluto en el cual el interés principal es la estimación y las propiedades físicas de la población a ser estudiada. Estas propiedades se esperan que sean constantes, de acá el término absoluto. En estos experimentos un factor singular es estudiado frecuentemente para examinar un número reducido de niveles de un factor. La selección de los tratamientos se hace generalmente mediante procesos aleatorios, por tanto, si el experimento puede ser repetido, el mismo grupo de tratamientos no necesariamente será utilizado.Por esta razón, el tratamiento es considerado una variable aleatoria y el modelo señalado es un modelo de efectos aleatorios o Modelo II, bajo el cual se detectan y estiman componentes de variación asociada a una población compuesta.b) El experimento comparativo. Frecuentemente cuando se estudia un grupo de tratamientos, los resultados absolutos varían erráticamente mientras que los resultados relativos permanecen razonablemente estables. En tales situaciones es posible establecer, que en circunstancias similares se espera que ciertos tratamientos sean sustancialmente mejores que otros. En tales campos de la experimentación, los experimentos tienden a ser comparativos y tienen un interés secundario dado por los resultados absolutos. La teoría estadística del diseño de experimentos se relaciona inicialmente con este tipo de experimentos.

Los experimentos comparativos son básicamente experimentos en los cuales los tratamientos se comparan por sus efectos medios sobre una variable respuesta con el objeto principal de determinar cuál de ellos es mejor en algún sentido. El propósito de este tipo de experimento es proveer información necesaria para tomar decisiones administrativas satisfactorias. La principal característica de este tipo de experimentación es que todos los tratamientos de interés están incluidos en el experimento. Consecuentemente, la estructura matemática básica es el modelo de efectos fijos ya que bajo experimentos repetidos se seleccionarían los mismos tratamientos. En este caso, es de interés la detección y estimación de relaciones constantes entre las medias del universo de objetos considerados, Para estos modelos, el interés primordial es probar varias hipótesis relacionadas con las medias de los tratamientos.

Palacios C. Severo

El experimento comparativo comienza con un planteamiento exacto del problema a ser resuelto. Esto es, se debe hacer una especificación detallada de los objetivos del experimento con una formulación precisa de la hipótesis a probar.

Es insuficiente solamente establecer en forma simple comparar estos tratamientos. Esta especificación define la población a la cual las conclusiones serán aplicadas, determina los factores, tratamientos y sus niveles, especifica las variables respuesta a ser medidas y establece las diferencias críticas a ser detectadas. Sin estas especificaciones, ningún experimento podrá ser diseñado adecuadamente.

Como lo fundamental en la decisión sobre las hipótesis son los experimentos planeados, es necesario que se tenga en cuenta las siguientes características generales para estos ensayos.

1. Simplicidad: Acá se debe tener en cuenta que tanto la selección de los tratamientos como la disposición experimental deberá hacerse lo más simple posible.2. Grado de precisión: El experimento deberá tener la capacidad de medir diferencias entre tratamientos con los grados de precisión que desee el investigador. Para cumplir con este propósito se deberá tener entonces un diseño apropiado y un número de repeticiones adecuado.3. Ausencia de error sistemático: Se debe planear un experimento con el propósito de asegurar que las unidades experimentales que reciban un tratamiento no difieran sistemáticamente de aquellas que reciben otro, procurando de esta manera obtener una estimación insesgada del efecto de tratamientos.4. Rango de validez de las conclusiones: Las conclusiones deberán tener un rango de validez tan amplio como sea posible. Los experimentos que contribuyen a aumentar éste rango son los experimentos replicados y los experimentos con estructuras factoriales.5. Cálculo del grado de incertidumbre: En todo experimento existe algún grado de incertidumbre en cuanto a la validación de las conclusiones. El experimento deberá ser concebido de modo que sea posible calcular la posibilidad de obtener los resultados observados debidos únicamente al azar.

III. UNIDADES EXPERIMENTALES Y MUÉSTRALES

El elemento básico en los experimentos comparativos es la unidad experimental. Este concepto se usará en la siguiente definición.

Los elementos sobre los cuales se hacen las mediciones y a los cuales un tratamiento puede ser asignado independientemente se denomina unidad experimental y al conjunto de unidades experimentales se les denomina material experimental. Cada unidad experimental contiene una o más unidades muéstrales en las cuales las condiciones experimentales planeadas previamente se realizan.

Ejemplo 3.29a) En un experimento agrícola para evaluar el rendimiento de algunas variedades de olivo, la unidad experimental puede ser una porción de terreno de tamaño óptimo preestablecido, usualmente denominada parcela, o un número de plantas o un número de mazorcas.b) En un estudio farmacéutico, un paciente sometido a un tratamiento de un fármaco puede ser considerado como una unidad experimental.c) En un trabajo de plaguicida la unidad experimental puede ser un insecto, una colonia o toda una especie. En general la definición de la unidad experimental depende de los objetivos de la investigación.

Por definición, las unidades experimentales deben estar en capacidad de recibir diferentes tratamientos.

En la conducción del experimento existen dos grupos de variables.

1) Las variables respuestas que proporcionan las mediciones del experimento, las cuales varían debido a la diversidad presente entre las unidades experimentales.2) Las variables explicativas que influyen en las respuestas y que se denominan factores. Entre estos existen los denominados factores de clasificación que según sus valores definen los niveles de clasificación sobre los cuales se hace la inferencia.

Por su naturaleza las unidades muéstrales de la misma unidad experimental deben recibir el mismo tratamiento, consecuentemente

Palacios C. Severo

la asignación del tratamiento a estas unidades muéstrales no es independiente.Esta distinción es importante dado que para hacer inferencia sobre los efectos del tratamiento, se requiere tener un conocimiento de la estimación de la variabilidad inherente al material experimental, esta variabilidad es conocida como el error experimental. Esta estimación es dada por la variación entre unidades idénticamente tratadas las cuales inicialmente pudieron haber sido tratadas de manera distinta. Solo la unidad experimental considerada como un todo satisface este requisito. La variación entre las unidades experimentales provee una estimación del error experimental. En general, la variación entre unidades muéstrales dentro de las unidades experimentales es un valor muy pequeño al calcular los errores de estimación de los efectos del tratamiento.

IV. FUENTES DE VARIACIÓN

Los tratamientos se asignan a las unidades experimentales para determinar si tienen un efecto sobre la respuesta de interés. Cualquier efecto podrá resultar en diferencias sistemáticas de respuesta entre unidades experimentales. Será obvio que para detectar estas diferencias, las unidades experimentales deberán ser lo más homogéneas posibles; esto es, que la variación entre unidades experimentales uniformemente tratadas va a ser menor en relación con las diferencias de tratamiento. Si esto no ocurre, la variación de las unidades experimentales pueden resultar en un fracaso para encontrar diferencias de tratamientos; los cuales van a ser importantes para la investigación.

Desafortunadamente, las unidades experimentales generalmente no serán homogéneas porque, ellas poseen diferentes propiedades físicas inherentes para una o más características. Frecuentemente detrás del control del experimentador, estos factores inherentes causan diferencias sistemáticas entre las unidades experimentales creando fuentes de variación no deseadas. Estas fuentes son de escaso interés práctico y no están relacionadas con el estudio. Por esta razón, se conocen como fuentes extrañas de variación. No es necesariamente cierta que todas estas fuentes de variación sean conocidas por el experimentador. Sabemos que estos factores pueden ser usados para clasificar las unidades experimentales en subgrupos más homogéneos, aunque también son conocidos como factores de clasificación, hasta tanto ellos sean de interés para el experimentador.

Mientras el error experimental es una variación aleatoria, no toda variación aleatoria es error experimental.

La variación entre unidades muéstrales dentro de las unidades experimentales es también una variación aleatoria, pero, no debe dársele mucho valor al juzgar los efectos de los tratamientos. Los tratamientos son parte de la estructura de la unidad experimental y hay una diferencia básica entre la clasificación y los factores de tratamiento. Los factores de clasificación son propiedades inherentes a la unidad experimental y solo raramente pueden ser cambiados por el experimentador.

Cada combinación específica de niveles de factores se denomina tratamiento.

Ejemplo 3.30Se planea un experimento para evaluar el rendimiento de un tubérculo en función del tipo de variedad V1, V2 y V3 y los nutrientes N y P a los niveles (10; 30) y (20; 40) respectivamente. Los posibles 12 tratamientos VNP son:

)40,30,(

)40,10,(

)40,30,(

)40,10,(

)40,30,(

)40,10,()20,30,()20,30,()20,30,(

)20,10,()20,10,()20,10,(

El concepto de tratamiento implica que:

1. Cualquier unidad experimental esta en capacidad de recibir cualquier tratamiento.

2. La asignación de tratamientos a la unidad experimental esta bajo el control del experimentador.

Bajo esta definición, en un experimento que compare medicamentos por ejemplo, el género nunca podrá ser considerado como un factor (tratamiento). El género de un sujeto particular es una propiedad intrínseca del sujeto que no podrá ser asignado al experimentador. Los medicamentos, sin embargo, constituyen un tratamiento dado que a cada sujeto incluido en el estudio (unidad experimental) se le puede asignar un medicamento.

Palacios C. Severo

La distinción entre tratamiento y factores de clasificación no es absoluta. Estos tratamientos serán aplicados a muestras de madera con superficies ásperas o suaves. La superficie de madera no representa un factor tratamiento a menos que el experimentador pueda especificar los tipos de superficies de las piezas. Así, si el experimentador tiene una oferta de pedazos ásperos de madera y puede decidir cuales son suaves, entonces el tipo de superficie será un factor tratamiento. Si el tipo de superficie es una propiedad intrínseca de las especies maderables elegidas, entonces será un factor de clasificación.

Como afirman Cochran y Cox (1957), los tratamientos deben tener las siguientes particularidades:

1. Presentar la finalidad, es decir si pretende simplemente mostrar al ganador entre los diferentes tratamientos o si además se desean encontrar indicios acerca del comportamiento de los tratamientos. Un caso particular, es el ensayo con un fertilizante compuesto de dos sustancias A y B principalmente. El resultado no muestra si la efectividad del fertilizante se debe a alguno de los dos componentes o a los dos conjuntamente. Será necesario un experimento más extenso, con tratamientos adicionales que den luces sobre éste hecho. Si el propósito es encontrar el mejor de los tratamientos prácticos, entonces ciertos tratamientos pueden omitirse por su no practicidad.

2. La respuesta en algunos casos, puede deberse a las condiciones bajo las cuales se aplica un tratamiento dependiendo del medio circundante a este, tal vez habrá un favorecimiento en su efecto sobre las unidades experimentales. Esta situación es muy frecuente en trabajos con sustancias químicas aplicadas sobre suelos, en los que su efecto sobre las plantas se ve comprometido con los componentes del terreno, o de las plantas mismas. Luego debe decirse si habrá controles sobre el terreno, por ejemplo homogenizando el suelo mediante la aplicación de estos componentes en cantidades considerables (estas decisiones se toman previo un análisis de suelos). No se debe perder de vista la población sobre la cual se desea hacer inferencia, porque un procedimiento como el descrito, tal vez cambie la población objetivo.

3. Los tratamientos propuestos, generalmente no son los que en la práctica se prueban. Por desconocimiento, por descuido,

por materiales, instrumentos, etc., se obtienen tratamientos diferentes a los de interés. Un caso muy común es cuando un tratamiento está definido para ser aplicado de una forma específica y resulta aplicándose de otra; por ejemplo una sustancia para controlar plagas, la cantidad aplicada puede ser alterada, o el momento de su aplicación puede ser diferente. Aquí, de una parte se ha modificado la dosis, y de otra, el tiempo hace que los animales a controlar estén posiblemente en una etapa de su desarrollo diferente a la prevista. Siendo extremistas, se puede afirmar que la mayoría de los tratamientos en el acto no corresponden a la definición original; por más cuidado que se tenga en mantener una cámara de muchas temperaturas, se procura naturalmente, que estas estén muy cerca de 20oC durante el ensayo, por ejemplo.

4. En muchos experimentos se presenta la necesidad de un tratamiento testigo o control. Este término se refiere a un tratamiento en el que no se tiene un interés particular, pero puede servir de comparación para revelar si los demás tratamientos son efectivos. Se recomienda la inclusión de un testigo cuando las condiciones físicas, químicas, ambientales, etc., donde se apliquen los tratamientos enmascaran la relevancia de éstos; por ejemplo, el caso donde la fertilidad de un terreno sea muy alta tenderá a esconder el efecto del nutriente adicional. Otras situaciones se presentan en animales, en los cuales sus rasgos genéticos, condiciones fisiológicas o morfológicas, no revelarán claramente la efectividad de las dietas en la ganancia de peso. Otra justificación para la consideración de un testigo suele ser cuando existe un desconocimiento muy alto acerca de la efectividad de los tratamientos objetos de estudio.

V. CONTROL DE LA VARIACIÓN DEL NO TRATAMIENTO

Para hacer valida la comparación entre tratamientos, se deben separar los efectos de fuentes extrañas de variación de los efectos de tratamientos y de la estimación del error experimental. Si esto no se puede hacer, se obtendrán estimaciones sesgadas tanto de las diferencias de tratamientos como del error experimental.

Lo que se necesita son métodos a través de los cuales la variación debida a fuentes distintas a los tratamientos sea controlada, de tal

Palacios C. Severo

forma que los efectos de tratamiento puedan ser estimados en forma segura y adecuada. Los métodos que hacen esta distinción, están referenciados en forma conjunta como control del error.

El objetivo principal de estos métodos, es obtener un estimador insesgado del error experimental resultante de mejorar la precisión asociada con la estimación de diferencias de tratamiento. Estos métodos pueden ser técnicos (experimentales) o estadísticos.

Los métodos técnicos son aquellos impuestos por el experimentador.Selección de más unidades experimentales homogéneas. Esto incluye hacer condiciones ambientales más uniformes para mantener las variables potenciales constantes. El criterio para la selección del material deberá ser el de obtener el máximo beneficio con unos recursos dados (generalmente escasos). Sin embargo, el experimentador esta limitado a la disponibilidad de material con el cual debe realizar el estudio, aunque tenga pocas alternativas de elección en la unidad experimental a ser usada. Consecuentemente, el uso de más unidades experimentales homogéneas no siempre es posible. Las unidades experimentales deben ser lo más representativas de la población para la cual el experimento va a sacar conclusiones.

Por esta razón, controlando experimentalmente algunos factores extraños y manteniéndolos constantes en algún valor específico puede seriamente limitar la aplicabilidad de los resultados experimentales.

La técnica experimental es responsabilidad del experimentador y debe ser siempre examinada para asegurar que esta sea lo más precisa posible. En la mayoría de ocasiones, la variabilidad asociada con una técnica determinada es relativamente pequeña, y hasta ahora solo se ha podido obtener un muy limitado mejoramiento en la precisión del experimento. Hay casos, donde los errores de técnica aumentan considerablemente la variabilidad. Tales errores deben prevenirse pero no sobredimensionarse.

Las técnicas estadísticas son métodos que deben obtener ventajas de las características de las unidades experimentales (diseño experimental) y cuando hay información disponible adicional de tipo cuantitativo o cualitativo se tienen más ventajas. Una función básica de los diseños de experimentos es la de reducir la necesidad de control exacto del ambiente experimental, dado que el control de dichos factores es costosa y tediosa. Es a través del diseño de experimentos que las fuentes conocidas de variabilidad se controlan. Esto se

consigue arreglando las unidades experimentales en subgrupos más homogéneos conocidos como bloques los cuales están basados en valores comunes de los factores de clasificación. Haciendo esto, algunas de las variaciones naturales entre unidades experimentales son asociadas con otro factor cuya contribución a la estimación del error experimental puede ser eliminada.

En muchos experimentos la precisión de la comparación de tratamientos puede ser aumentada usando variables concomitantes y/o auxiliares, este tipo de análisis, conocido como el análisis de varianza se recomienda usar cuando la variación entre unidades experimentales es, en parte, debida a la variación en algún otro carácter medible no suficientemente controlable, para ser usada en la asignación de unidades experimentales a los bloques sobre las bases de resultados similares. Frecuentemente, la agrupación de estas variables cuantitativas en bloques, construidos a partir de rangos de valores no es efectiva ya que la variación dentro de bloques puede ser más grande. Más aún, se puede requerir mucho más grados de libertad para controlar este factor. Este aumento de los grados de libertad puede ser usado para estimar el error experimental.

El control estadístico a través del uso del bloqueo y/o el análisis de la varianza elimina la variación debida a fuentes extrañas conocidas. Es a través de la aplicación de la aleatorización, como las fuentes de variación desconocidas para el experimentador pueden ser controladas. El concepto de aleatorización y su función se discuten mas adelante.

Como última consideración, el incremento en la repetición, no reduce el error de la varianza, pero mejora la precisión de las estimaciones dado que el error estándar se disminuye proporcionalmente a la raíz cuadrada del tamaño de la muestra. Este incremento en la cantidad de reducción que debe realizarse aumentando las replicaciones, solo deberá realizarse cuando todas las demás opciones han sido eliminadas y la precisión deseada no ha sido obtenida.

VI. PROPIEDADES DEL DISEÑO ESTADÍSTICO

Finney (1955) establece que por el diseño de experimentos se entiende:

a) Especificaciones de las unidades experimentales a las cuales los tratamientos han sido aplicadas.

Palacios C. Severo

b) Especificaciones de mediciones que pueden ser tomadas en cada unidad experimental.

Selección de un grupo de tratamientos para comparación. Mientras la responsabilidad principal es del experimentador, la estadística contribuye respecto a la elección óptima de las combinaciones de tratamientos a ser usadas, por ejemplo, en un experimento factorial fraccionado o en la exploración de superficies de respuesta. Esto se conoce como un diseño de tratamientos.

La asignación de los tratamientos a las unidades experimentales (aleatorización), esto es lo que caracteriza el diseño estadístico de experimentos.

El diseño estadístico de experimentos es esencialmente el plan para poner a funcionar el experimento, especificando el arreglo de las unidades experimentales en el tiempo y/o espacio y el patrón de observaciones que van a reportar información.

El diseño, por lo tanto, es una secuencia compleja de etapas tomadas para garantizar que los datos serán obtenidos de la forma que permitan un análisis objetivo, soportado en inferencias válidas respecto al planteamiento del problema, el cual debe ser lo más preciso posible y además viable económicamente.

El diseño de un experimento es una función importante, dado que ninguna técnica estadística puede revelar información no implícita inicialmente en los datos.

Para cualquier grupo de datos, el análisis apropiado de los mismos es determinado por el diseño de experimentos. La habilidad, por lo tanto, de obtener un análisis significativo se basa inicialmente en la forma en que se han recolectado los datos. Un buen diseño experimental, es aquel que proporciona la información requerida con el mínimo esfuerzo experimental. Muchos criterios han sido propuestos para contar con un experimento estadísticamente válido. En general, los requisitos estadísticos para el buen diseño de experimentos son:

Proveer estimaciones insesgadas para los efectos del tratamiento. Hasta donde es posible la comparación de tratamientos deben estar libres de sesgos sistemáticos. Es la comparación de tratamientos el interés principal, por lo tanto es de primordial importancia que estas comparaciones reflejen

diferencias debidas a los tratamientos, y no a las diferencias inherentes a las unidades experimentales. Es importante que el experimento este diseñado para asegurar que las unidades experimentales que reciban un tratamiento especifico no difieran de otros tratamientos.

Requerir que la precisión asociada con la estimación de efectos este de terminada al mismo tiempo que las estimaciones mismas. En este sentido, el experimento esta auto contenido. Para esto, debe haber una medición del error experimental. Esta estimación es necesaria para asegurar la significancía estadística de las diferencias de tratamientos. Si esta estimación no es insesgada, se presentará una pérdida de eficiencia del experimento lo cual conllevara a un desperdicio de tiempo, materiales y dinero. Si el experimento no provee una estimación del error experimental, será necesario usar una estimación de un experimento previo. La validez del procedimiento se basa en el hecho que la magnitud del error experimental deberá permanecer invariante desde el último experimento (un supuesto que frecuentemente es insostenible).

Las comparaciones de tratamientos, deben de ser lo suficientemente precisas para detectar las mínimas diferencias de importancia práctica para el investigador. Cuando se comparan tratamientos, si existen unas mínimas diferencias esto proveerá una ganancia real. Así, si un tratamiento debe ser cambiado por otro, este debe ser mejor, aunque sea por una mínima diferencia. Claramente el experimento deberá tener suficiente precisión para detectar tales diferencias o de lo contrario no tiene sentido realizarlo. La precisión de un determinado experimento dependerá de:

1. La variabilidad intrínseca del material experimental y de la precisión del trabajo experimental.2. La cantidad de replicaciones del tratamiento, y3. El diseño del experimento.

Las conclusiones tienen un rango amplio de validez. Las condiciones encontradas en la práctica, nunca serán exactamente las obtenidas cuando se lleva a cabo el experimento. Deben procurarse que las conclusiones sobre los resultados del experimento se hagan sobre condiciones similares del experimento. Si las conclusiones se aplican, deberá haber confiabilidad de que las condiciones donde se apliquen sean similares. Cumpliendo esto el experimento

Palacios C. Severo

debe tener un rango amplio de validez. Entre más amplio sea el rango de condiciones investigadas en el experimento, mayor será la confiabilidad de estas conclusiones cuando no cumplan las condiciones de homogeneidad, en aquellos casos donde las condiciones sean algo distintas.

Se debe tener cuidado, para verificar que la organización del experimento no se torne muy compleja y tener en cuenta además que si un grupo de tratamientos no es investigado totalmente, no se podrán obtener conclusiones significativas.

El diseño debe ser lo más simple posible para alcanzar los objetivos del experimento. La selección del diseño depende de la naturaleza de las fuentes de variación en el material experimental. Se debe elegir el diseño más simple posible que permita controlar adecuadamente la variabilidad conocida. A medida que el diseño experimental se torna más complejo, hay una menor flexibilidad haciendo difícil la organización lo cual puede llevar a cometer errores cuando se realiza el experimento. Entre más simple el diseño, más fácil será llevar a cabo ajustes por las equivocaciones que siempre suelen aparecer.

Una consecuencia general de los experimentos comparativos es que puede conducir a decisiones administrativas, mientras es verdad que la hipótesis nula para igualdad de efectos de los tratamientos siempre será rechazada dados determinados recursos, se debe recordar que el manejo de la no significancía implica equivalencia. Algunas acciones deberán tomarse siempre sobre la base de los resultados obtenidos; bien sea, mantener todo tal cual o cambiar por un nuevo tratamiento.

Las decisiones diarias son un proceso de dos etapas:

1. Examen (análisis) de las probabilidades asociadas a los datos estimados con las conclusiones (acción estadística).

2. Basados en estos resultados, se toma la decisión para implementar una acción (decisión de gestión).

El trabajo del estadístico es el de presentar las probabilidades de la primera etapa lo más acertadamente posible para lograr minimizar el número de decisiones incorrectas a tomar en la segunda etapa.

Un buen diseño de experimentos puede ser obtenido al aplicar los principios básicos establecidos por Fisher (1935). Ellos son:

1. Replicaciones de algunos o todos los tratamientos para estimar la magnitud del error experimental.

2. Aleatorización de los tratamientos a las unidades experimentales para tener así una estimación válida del error experimental así como estimaciones insesgadas de los efectos de los tratamientos.

3. El uso del control local de fuentes de variación extrañas conocidas a través del uso de sub-grupos homogéneos de unidades experimentales.

En el diagrama de Fisher, según las condiciones del experimento, se escoge el diseño experimental, se formula un modelo lineal apropiado y se lleva a cabo el análisis estadístico basado en la escogencia del diseño y del modelo.

II. Aleatoriza ción(Produce estimaciones insesg ados de varia nza y va lida el error

experimental)

I. Replica ción(Permite estimar error experimenta l)

III. Control Loca l(Disminuye el error)

Diagrama de Fisher Principios de la experimentación

Para mayor claridad se lleva a cabo en las siguientes secciones una explicación más amplia de estos principios.

VII. REPLICACIÓN

Es el proceso de repetir en condiciones similares el experimento para cada tratamiento se denomina replicación. Cuándo el número de replicaciones es igual para todos los tratamientos el diseño se denomina balanceado, en caso contrario se dice que es desbalanceado. Un número adecuado de replicaciones permite al experimentador obtener una estimación del error experimental.

La replicación es la asignación del mismo tratamiento a más unidades experimentales, o sea que hace referencia al número de unidades experimentales de cada tratamiento, no al número de observaciones.

Palacios C. Severo

El propósito de la replica es proveer una estimación del error experimental. Se obtiene de comparar unidades experimentales tratadas igual pero que antes del experimento tenían la oportunidad de ser tratadas de manera diferente. Las múltiples mediciones tomadas en una unidad experimental no satisfacen esta definición, dado que esto no es replicación; las repeticiones reducen la variación asociada con mediciones y/o errores muéstrales, pero no proveen ninguna información relacionada con los errores experimentales.

Además de proveer una estimación de error experimental, las replicaciones aportan la precisión del experimento al reducir el error estándar asociado con la comparación de tratamientos. Esto se desprende del hecho que la varianza de la media disminuye inversamente proporcional a la raíz cuadrada del número de replicas. Esto provee una forma para controlar el tamaño de la varianza del error.

A pesar de que el incremento en el número de replicaciones da precisión a las estimaciones, éstas no se pueden incrementar indefinidamente. Un punto para su disminución se alcanza cuando el incremento en los costos de la experimentación no es compensado con una reducción en la varianza. Cuando el número de replicas se torna demasiado grande, y las diferencias entre tratamientos detectadas son demasiado pequeñas, la importancia práctica que resulta es una pérdida de recursos valiosos.

Las replicaciones también proveen formas para incrementar el rango de las condiciones estudiadas en el experimento. No hay requisitos para que las replicaciones sean adyacentes en tiempo o espacio, dado que cuando se usan conjuntamente con el control local se puede investigar un mejor rango de condiciones experimentadas.

VIII. ALEATORIZACIÓN

La aleatorización es fundamental para que el diseño de un experimento sea válido. Es el procedimiento que permite que cada unidad experimental tenga iguales condiciones para recibir cualquier tratamiento. Esto no significa que el experimentador podrá escribir como quiera la identificación de tratamientos (nombres o símbolos) en el orden que se le ocurra. La aleatorización es un proceso físico que asegura que cada tratamiento tenga igual probabilidad de ser asignado a cualquier unidad experimental. Este es el punto en el cual,

el procedimiento experimental con las leyes de azar son explícitamente introducidas. De acuerdo con Brownlee (1957) una de las principales contribuciones que el estadístico puede hacer es insistir en la aleatorización del experimento.

La aleatorización es necesaria ya que provee las bases para obtener un tests válido de significancía al destruir cualquier sistema de correlación que pueda existir entre las unidades experimentales. Un supuesto valido que resalta el análisis de varianza es que los errores experimentales son independientes. Es bien sabido que los errores asociados con las unidades experimentales adyacentes en tiempo y/o espacio están correlacionados. Una correlación positiva entre las unidades experimentales va a tener una mayor varianza del tratamiento que si las observaciones fueran independientes. Consecuentemente la probabilidad del error tipo I será mayor que el valor preestablecido. Con una correlación negativa, los efectos son opuestos a aquellos con una correlación positiva. Con la asignación de tratamientos al azar con las unidades experimentales, posiblemente sujetas a las restricciones, el efecto de la correlación se disminuye entre las unidades experimentales. La aleatorización no hace que los errores sean independientes pero asegura que, en promedio, las correlaciones sean cero. Como resultado, los datos pueden ser analizados si el supuesto de independencia de los errores es verdadero.

Una segunda función de la aleatorización es la de proveer medios para evitar sesgos en la estimación del error experimental y los efectos de tratamiento. La estimación del error experimental se obtiene comparando las unidades experimentales tratadas de manera similar. Para que esta estimación sea válida, es necesario garantizar que las unidades experimentales tratadas de manera similar no sean diferenciables de manera relevante de las unidades experimentales tratadas de manera distinta. La forma de asegurar que la estimación del error sea válida se obtiene realizando una asignación aleatoria de los tratamientos.

La aleatorización también provee estimaciones insesgadas de los efectos de tratamiento al controlar los efectos de fuentes de variación desconocidas. Esto provee la seguridad de haber asignado adecuadamente estas fuentes de variación, las cuales deben ceñirse a normas donde el experimentador no tiene ni el tiempo ni el conocimiento para investigar, pero que de otra forma, podrán

Palacios C. Severo

conducir a conclusiones erradas. Esta es la única forma de asegurar que la comparación entre tratamientos no sean sesgadas por un tratamiento que fue asignado de manera premeditada, para hacer mejores o peores algunas unidades experimentales. La aleatorización romperá cualquier patrón asociado con factores desconocidos de tal forma que ningún tratamiento será favorecido frente a los demás. La aleatorización nunca elimina la variación causada por factores extraños desconocidos, pero distribuye sus efectos en promedio, equitativamente sobre todos esos factores extraños.

Finalmente, la aleatorización es necesaria para abolir los sesgos personales, conscientes e inconscientes, de las personas que intervienen en el experimento, incluyendo al experimentador. La historia cuenta con un gran número de experimentos en Inglaterra sobre efectos de comida suplementaria para colegios de niños de distritos pobres que fueron inválidos porque la selección de los niños fue dejada en manos de los profesores. Parece ser que se les asignó el mejor suplemento a los niños más desnutridos.

Hay un problema que aparece al aplicar la aleatorización cuando el número de unidades experimentales es muy pequeño. En estos casos es posible que los arreglos producidos por la aleatorización aparezcan al experimentador como bien, deseables o inaceptables. Por ejemplo, la secuencia:

XXXYYYZZZ

Es apenas una forma de las 1670 secuencias posibles de tres tratamientos con tres replicas en el tiempo. Este patrón sin embargo, probablemente no será aceptado por la mayoría de experimentos. Tal relación sugiere, una falta de conocimiento por parte del experimentador. Youden (1964) sugiere tres formas para manejar esta dificultad, todas ellas, colocando restricciones a la aleatorización:

1) Incorporar al diseño de experimentos la condición que hace el arreglo inaceptable, esta sería la mejor forma para manejar el problema. Tal vez no sea práctico o deseable, sin embargo, para introducir estas futuras restricciones al diseño puede ocurrir que:

a) Pierde grados de libertad en la estimación del error experimental debido a la eliminación de la otra fuente de

variación que puede no estar completamente compensada.b) El experimento se vuelve más complicado, oc) Que se hayan usado hasta ahora distintos sistemas de agrupación.

2) Rechazar arreglos extremos cuando ellos ocurran y re-aleatorizar: el mayor problema aquí será el de determinar subjetivamente lo que es un arreglo extremo. Si esto se puede hacer, entonces esta será una solución más razonable.3) Seleccionar un diseño al azar de un grupo predeterminado de arreglos aceptables.

IX. CONTROL LOCAL

Al proceso de clasificación de las unidades experimentales en grupos homogéneos, se le denomina Control Local.

Ejemplo 3.31Un ejemplo de control local en el ejemplo 3.30 puede ser controlar el nivel de fertilidad del terreno. Para esto se determinan unidades homogéneas de terreno llamadas bloques según el grado de fertilidad, cada bloque se subdivide en parcelas de igual área preferiblemente y sobre estas se aleatorizan los tratamientos buscando que cada unidad experimental reciba un único tratamiento y que la totalidad de los tratamientos estén en el bloque (caso de bloques completos).

Una función primaria del diseño de experimentos es el de reducir el control exacto del ambiente experimental debido a que tal control es un hecho costoso y tedioso, y presume que todos los factores que influyen han sido identificados.

La función principal del control local es la de eliminar los efectos de fuentes conocidas de variación extrema.

El control se acompaña del bloqueo de las unidades experimentales. El bloqueo es un arreglo de unidades experimentales en grupos más homogéneos, basados en características comunes, de los factores de clasificación. Los tratamientos se asignan a las unidades experimentales, basadas en la estructura de bloques, así el uso de control local coloca algunas restricciones en la aleatorización de tratamiento a las unidades experimentales. Para alcanzar la máxima eficiencia con el bloqueo, es necesario el conocimiento relacionado con

Palacios C. Severo

varios factores extraños que afectan las unidades experimentales, información que solo el experimentador puede proveer.

El bloqueo a las unidades experimentales se debe hacer de tal manera que se asocien a fuentes asociadas de variación extrema con diferencias entre bloques, en este caso se debe cumplir que:

1) Una estimación más precisa del error experimental debe ser obtenida, puesto que la contribución de estos factores, extraños se eliminan, introduciendo además eficiencia al experimento debido a que se podrán detectar menores diferencias entre los tratamientos y2) Las comparaciones de tratamiento no serán sesgadas por diferencias en las unidades experimentales debido a los factores externos.

La aplicación de control local (bloqueo) no remueve el requisito de aleatorización, solo impone restricciones al tope de aleatorización que se llevará a cabo.Para todos los diseños, la asignación aleatoria de tratamientos a las unidades experimentales dentro de los límites impuestos por el control local es esencial para poder tener así una interpretación válida de los resultados.

La relación de los tres principios básicos de un buen diseño de experimentos es la clave de la estructura que provee una estimación del error experimental y a través de la aleatorización, se asegura la validez de las estimaciones y de las pruebas de significancía. La replicación también trae consigo una reducción de los errores de la estimación directamente por medio de la relación n/σ e indirectamente a través de la determinación de un sistema de control local.

X. CLASIFICACIÓN DE LOS DISEÑOS

El diseño de un experimento depende solamente de los supuestos relacionados con las propiedades de las unidades experimentales; esencialmente tales características, determinan las restricciones que deben ser colocadas al aleatorizar los tratamientos a las unidades experimentales, las cuales a su vez determinan el tipo de diseño experimental, los cuales pueden ser clasificados como: sistemáticos y al azar.

Los diseños sistemáticos poseen un patrón regular para la asignación de tratamientos a las unidades experimentales. Las razones dadas para usar un diseño sistemático frecuentemente son:

1)Simplicidad, siendo extremadamente sencillo de aplicar.2) Provee muestreo adecuado del material experimental.3) Lleva a colocaciones inteligentes u ordenamiento natural de los tratamientos.4) La aleatorización no es necesaria, dada que la heterogeneidad de las unidades experimentales por si solas aleatorizan los efectos de tratamientos.

Las desventajas de los diseños sistemáticos son:

1) El arreglo de los tratamientos, puede combinarse con un patrón en variaciones no controladas que producen errores sistemáticos en la estimación de los efectos del tratamiento.2) No hay una estimación válida de la varianza del error.

En los experimentos al azar, la aleatorización elimina esta desventaja, esta es la razón para que estos experimentos sean de tanta importancia. Estos experimentos pueden ser subdivididos, de acuerdo con las siguientes restricciones: ninguna (irrestricto), única y múltiple. De acuerdo con las restricciones impuestas los diseños pueden ser clasificadas como completos e incompletos, dependiendo si los tratamientos ocurren con la misma frecuencia o no, dentro de cada restricción que se le impone al experimento que se ha definido. Los diseños de bloques incompletos serán clasificados después como balanceados o parcialmente balanceados, dependiendo de la varianza asociada con las comparaciones pareadas.

Al seleccionar un diseño, se deberá elegir el más simple posible que satisfaga los requisitos del experimento elegido. Si ningún diseño conocido esta disponible para el análisis, este deberá ser construido. Un axioma básico es el de diseñar para el experimento y no experimentar para el diseño. Hay investigadores que piensan que la elección del diseño y/o tratamientos experimentales deberán ser limitados para aquellos que aparecen publicados en la literatura especializada, de esta forma se forzó innecesariamente al experimentador a modificar el experimento y ajustarlo al diseño conocido. Aún cuando un diseño estándar haya sido usado para

Palacios C. Severo

determinar si los objetivos del experimento han sido logrados, siempre se hace necesario la verificación y su análisis estadístico.

1. Sistemático. Los tratamientos son asignados a las unidades experimentales de acuerdo a algún patrón predeterminado. Tales diseños no proveen estimaciones válidas del error experimental.2. Aleatorizados. La asignación de los tratamientos a las unidades experimentales depende de algún patrón de aleatorización. Solo para estos diseños, las técnicas de análisis de varianza son validas.

a) Irrestrictos. La aleatorización no está restringida a ningún arreglo de las unidades experimentales.b) Restricción Única. La aleatorización se restringe a un único requisito determinado en el arreglo de las unidades experimentales. Estos son los diseños de bloques.c) Balanceado. Se obtiene la misma precisión para cada par de comparaciones entre tratamientos.d) Parcialmente Balanceado. La precisión no es constante para cada par de comparaciones, pero depende de los tratamientos involucrados.e) Restricciones múltiples. La aleatorización se restringe a dos o más requisitos localizados en los arreglos de las unidades experimentales. La misma subclase general existe para estos diseños como en el caso de los diseños de bloques.

XI. ESTRATEGIA DEL DISEÑO

En la selección de un diseño experimental se debe tener en cuenta las características propias de la disciplina en donde se realiza; a pesar que los principios estadísticos son los mismos, las estrategias frecuentemente son distintas.

La estrategia experimental depende del tiempo para realizar el experimento, el costo de la experimentación y la cantidad de variación en el material experimental, como así mismo el factor climático a la cual se someten los experimentos.

El hecho de que no haya una única estrategia de experimentación, puede ser ilustrada por la comparación entre los experimentos agrícolas y los industriales.

En general, los experimentos agrícolas:

1. Requieren un tiempo más largo, frecuentemente meses, y en algunos casos se extienden hasta años, cuando se relacionan con cultivos perennes2. Por ejemplo. Usualmente presentan una mayor variabilidad entre las unidades experimentales. Es casi imposible alterar o modificar estos experimentos una vez ha comenzado. Consecuentemente, el campo de la experimentación agrícola debe estar auto-contenido, y así frecuentemente involucran diseños más amplios, comprensivos y complejos, de tal manera se puede obtener mucha información de cada experimento.

Por el otro lado, la mayoría de experimentos industriales satisfacen que:

1. La capacidad para realizar experimentos pueden ser muy rápidos, el tiempo de intervalo puede ser solo uno o unos pocos días inclusive horas, y2. La variación natural entre las unidades experimentales es generalmente muy pequeña.

Más aún la mayoría de la experimentación se hace secuencialmente, dado que los resultados están disponibles para su análisis antes de terminar el experimento. Como resultado, hay una gran flexibilidad. Como cada observación o grupo de observaciones están disponibles, la situación puede ser revisada antes de comenzar un próximo grupo de ensayos. Con base en los resultados, una decisión como que hacer luego permite hacer ajustes respectivos en el diseño de experimentos.

Consecuentemente, se puede usar secuencias de experimentos más pequeños, y simples, esta es una ventaja.

Box (1957) notó una paradoja interesante respecto al diseño de programas experimentales; el único tiempo en el cual el programa de experimentación puede ser diseñado adecuadamente es después de haber sido culminado. Es común encontrar en la culminación de un programa que:

Palacios C. Severo

1. Una o más variables probablemente hayan sido omitidas del experimento.2. Una o más variables originalmente incluidas en el experimento aparezcan con un pequeño efecto, por lo tanto no son tan importantes como se pensó al principio.3. Un diseño experimental más complejo se necesita para solucionar adecuadamente los problemas.4. Algunas transformaciones a las variables podrán ser apropiadas.

La experimentación deberá involucrar indeterminaciones como el hecho que dos experimentadores, que estudian el mismo problema, tendrán la misma opinión relacionada con estos items. Si determinara una serie de normas sobre sistemas de experimentación rígidos que puedan abolir estas dificultades, tendrán como único resultado el sacrificio en el conocimiento del experimentador, su experiencia e imaginación.

XII. DISEÑO DE TRATAMIENTOS

Cada uno de los diseños que controlan el error mencionados en la tabla 3.9 se usa con el fin de comparar los tratamientos entre si. Sin embargo los tratamientos son seleccionados según alguna estructura, en particular una estructura factorial, la cual se refiere al diseño de los tratamientos. Estos se seleccionan de acuerdo a las metas ó intereses de la investigación, el material experimental y los factores disponibles. La escogencia de los tratamientos estará enmarcada dentro de un apropiado diseño que controle el error. Dentro de la estructura factorial de tratamientos se conocen dos clases. Las estructuras factoriales simétricas y las estructuras factoriales asimétricas. En la primera, se tienen k factores cada uno s niveles, donde s es un entero, en este caso se tienen sk tratamientos. En la segunda estructura, se tienen k1 factores con s1 niveles, k2 factores con s2 niveles, … km factores con sm niveles, el cual tiene en total

kk sssst 12

1 . . . === tratamientos.

Tabla 3.9 Efecto de diseño de control del errorFactores de control del

diseño aleatorizado Tipo de diseño Caracterización

0 Diseño completamente

aleatorizado

1Diseño en bloque aleatorizado

1.Diseño Bloque Aleatorizado.

2.Diseño Bloque Aleatorizado

generalizado

3.Diseño Bloque Incompleto

4.Diseño Bloque extendido

5.Diseño Bloque por franjas.

2 Diseño cuadrado latino

1. Diseño cuadrado latino.

2. Diseño cuadrado latino incompleto

3. Diseño Cross - Over

3Diseño cuadrado latino replicado.Cuadrado grecolatino

>3Cuadrado latino mutuamente ortogonales

Cuando se desea reducir el tamaño del experimento considerado por motivos muchas veces de tiempo y costos, se trabaja con un diseño de tratamientos factorial fraccionado.

XIII. DISEÑO DE MUESTREO

Lo más importante de un diseño de control del error con sub muestreo es la separación del error experimental y el error observacional (o de muestreo), o más precisamente, la separación de la varianza del error experimental y el observacional.

La noción de sub muestreo puede obviamente ser extendida a más de un nivel, por ejemplo, para cada unidad experimental se puede tener algunas unidades muéstrales y luego para cada unidad muestral se pueden tener algunas unidades observacionales.

XIV. ESTUDIO EXPERIMENTAL

Para que el experimento sea exitoso, se deben tener en cuenta lo siguiente:

Palacios C. Severo

1) Conocimiento claro del material experimental. Aunque parezca obvio en la práctica, no siempre el desarrollo de un problema requiere de experimentación ni es simple presentar un claro y apropiado estado del problema. Es necesario abordar todas las ideas sobre los objetivos del trabajo. Un claro estado del problema frecuentemente contribuye a un mejor entendimiento del fenómeno y a una solución del problema.2) Escogencia de factores y niveles. El experimentador debe seleccionar las variables independientes o factores a ser estudiados, estos pueden ser cuantitativos o cualitativos. En el caso cualitativo hay que tener en cuenta como se controlarán estos valores en los valores de referencia y como van a ser medidos. Es importante seleccionar los rangos de variación de los factores y el número de niveles a considerar, los cuales pueden ser predeterminados o escogidos aleatoriamente del conjunto de los posibles niveles.3) Selección de las variables respuesta según los objetivos. En la escogencia de la variable respuesta o variable dependiente, el experimentador ha de estar seguro que la respuesta a medir realmente provee información sobre el problema de interés. Es necesario suministrar la forma como se mide esta variable y de ser posible la probabilidad de ocurrencia de estas medidas.4) Selección del diseño experimental. Este paso es de primordial importancia en el proceso de investigación. Se debe indicar la diferencia a la respuesta verdadera (que tan lejos se admite la realidad de lo observado), que se desea detectar y la magnitud de los riesgos tolerados (grado de confiabilidad), en el orden a escoger un tamaño de muestra apropiado (replicaciones); es procedente señalar también el orden de recolección de los datos y el método de aleatorización a emplearse. Siempre es necesario mantener un equilibrio entre la exactitud y los costos. Se deben recomendar planes que sean eficientes estadísticamente y económicamente viables. En la conducción de un estudio experimental es de esencial importancia la escogencia del diseño, esta escogencia depende de cuatro componentes:El diseño de tratamientos. En esta etapa se determinan los tratamientos a ser medidos en el estudio, es decir se establecen cuales y cuantos tratamientos se deben aplicar teniendo en cuenta la naturaleza del experimento. El interés del investigador en el sentido de decidir cuántos factores deben incluirse, cuántos

niveles de factores se deben identificar en cada factor y cuál es el rango razonable de cada factor. Los aspectos del diseño de tratamientos están estrechamente ligados con el diseño para controlar el error.Diseño de control del error. Por diseño de control del error se entiende la distribución aleatoria de los tratamientos en un plan experimental usando la regla de asignación aleatoria de los tratamientos a las unidades experimentales. Como ejemplos de control de error se tienen los diseños completamente aleatorizados, bloques completos aleatorizados y cuadrados latinos. La escogencia del diseño depende de la variabilidad de las unidades experimentales, la estructura de estas unidades y la precisión de la estimación deseada por el investigador.Estructura del control del error. Por esta se entiende la asignación aleatoria de los tratamientos a las unidades experimentales.Muestreo y diseño de observaciones. Hace referencia a determinar el número de observaciones tomadas por tratamiento y unidad experimental, lo cual caracterizará los planes experimentales, con sub muestreo.Una vez definidas los componentes anteriores, la respuesta del vector R para el análisis seleccionado satisface la formulación del modelo estadístico apropiado está íntimamente relacionado con la estructura del diseño de tratamientos, el diseño del control del error y el muestreo de las observaciones.El diseño seleccionado se asocia a un modelo lineal de la forma

εβ += XY si el modelo es de efectos fijos, se descompone la variabilidad de la respuesta (variabilidad total) como una partición ortogonal de las diferentes fuentes de variabilidad, es decir,

itotal iSCSC

Donde:

YYSC total ´= y YPYSC Xii ´)( = siendo tii

tiXi XXXXiP −= )( , i=1, …, q el proyector ortogonal en el

espacio columna de iX ; y para iX el bloque

Palacios C. Severo

X asociado con el i-ésimo factor de clasificación

[ ]421 :...:: XXXX =5) Conducción del experimento. Es el proceso de muestreo de recolección de datos. Sé entenderá que en el proceso haya un ajuste al plan (control). En la mayoría de las veces, la realización de un experimento no es lo suficientemente fiel al proyecto de investigación, porque surgen situaciones no consideradas previamente, como en el caso de un cultivo atacado por plagas, el agotamiento producido sobre una unidad experimental que se esta evaluando, o la aparición de una característica no determinada. De todas formas, se debe tener en cuenta si estos imprevistos alteran los propósitos del ensayo; de otra forma hay que tenerlos en cuenta en el análisis de los resultados.6) Análisis de datos. Las variables que intervienen, o mejor, que se procura sean considerados en un ensayo, pueden relacionarse matemáticamente de alguna forma. El problema no está en la consecución de una expresión matemática sino en que tanto explica la realidad dicha expresión. Es preferible renunciar a un bello modelo que aceptar una realidad deformada por el. En esta etapa se busca una fórmula matemática que explique el comportamiento de una(s) variable(s) a través del comportamiento de otras. Existen técnicas estadísticas, como el análisis de regresión que suministran estas relaciones. Se debe buscar que el modelo se analice junto con el especialista que lo está investigando.Una vez se ha seleccionado el diseño experimental, se establece la matriz de diseño X, el vector de parámetros β y se asocia a un modelo εβ += XY el cual generalmente resulta ser de rango incompleto y estimado por el método denominado mínimos cuadrados a través de una matriz inversa generalizada de X. Para la estimación del modelo y análisis estadístico de los datos, se debe tener en cuenta:

1. Estimación del modelo. Estimar mediante los métodos de mínimos cuadrados o máxima verosimilitud los parámetros asociados al modelo, en este último método, se tiene en cuenta la distribución de la variable respuesta; por este motivo la mayoría de los desarrollos realizados en este texto se hacen asumiendo que la variable respuesta sigue una distribución normal multivariada. Cuando el modelo es de rango incompleto, se realizan cálculos muy

similares al caso de rango completo, con lo cual simplemente los estimadores son adaptados a este modelo.2. La teoría de estimabilidad. Conocer los principales criterios para caracterizar las funciones estimables.3. Pruebas de hipótesis. Conocer la estructura distribucional de los estadísticos de prueba para las hipótesis de interés.

Una parte del análisis es el chequeo adecuado del modelo propuesto, lo cual conlleva a un examen crítico de las bases del modelo estadístico y su relación con los supuestos. En esta etapa recientemente el computador ha jugado un papel importante. Existen diferentes procedimientos y paquetes estadísticos que facilitan el análisis de los datos. Un paquete estadístico es un conjunto de programas elaborados para el procesamiento de información, los cuales se manipulan por medio de una serie de instrucciones y comandos dirigidos a resolver problemas de la estadística. Entre los paquetes estadísticos de más amplia difusión en el área experimental podemos mencionar: el SPSS (Statistical Package for Social Science), SAS (Statistical Analysis System), Statgraphics. 7) Conclusiones y recomendaciones. Hecho el análisis de los datos, el experimentador puede extraer conclusiones (inferencia) sobre los resultados.Las inferencias estadísticas deben ser físicamente interpretadas y su significancía práctica evaluada.Las recomendaciones deben de hacerse con base en los resultados. En la presentación de estos se deben evitar el empleo de terminología estadística seca y en lo posible presentar los resultados de manera simple. La elaboración de gráficos y tablas evita la redacción de resultados y recomendaciones extensas y confusas.

Palacios C. Severo

Problemas

(105) Desarrolle un bloque completo para el ejemplo 3.31 para el control del nivel de fertilidad del terreno.

(106) Determine el bloque de fertilidad para cada bloque que se subdivide en parcelas.

(107) Que los tratamientos del problema 100 sean unidades experimentales y reciban un único tratamiento y que estén por bloques.

(108) Una empresa farmacéutica desea evaluar por bloques una nuevo producto para el control de la natalidad para ello recurre a un investigador conocedor del tratamiento de dichos productos. El análisis lo desarrolla en una comunidad cercana a la población y obtiene datos que se tienen que corroborar a nivel macro. Se desea determinar el mejor bloque con el producto.

(109) Una capsula para el tratamiento del AH1N1 esta siendo probada en una población para el cual se desarrolla un diseño por bloques, y cada bloque se subdivide en zonas de tratamiento. Se desea determinar el bloque en donde se desarrolla con efectividad el tratamiento de dicha capsula.

(110) Un plaguicida para el control de la mosca blanca se viene aplicando en la zona agrícola de la población en donde se comprobó que dicha mosca viene desarrollando una plaga sin control. Se desea desarrollar un diseño por bloques a fin de contrarrestar dicha plaga.

(111) Un producto químico se desea probar para el control de la mosca de la fruta, el investigador desea desarrollar un diseño por bloques en diversas zonas agrícolas, para el cual trabaja en varios puntos con dicha plaga. Se desea evaluar dicho diseño con bloques a fin de eliminar dicha plaga.

(112) Un investigador se encuentra con un problema doble, ya que la siembra de un producto viene infectado por una plaga, como así mismo las semillas están contaminadas con un producto químico que no permite el desarrollo sustancial de la planta. Para ello desarrolla un diseño por bloques a fin de descartar dichos males y obtener un buen producto al cosechar.

§4DISEÑO EXPERIMENTAL

APLICADO A CIENCIASNo existe la suerte. Sólo hay preparación adecuada o inadecuada para hacer frente a una estadística.

Robert Heinlein

I. INTRODUCCIÓN

Fenómenos naturales. Al fin de esta definición y revisada corresponden a la meta de la mayoría de los proyectos de investigación en las ciencias de la ingeniería.

Y como se logra todo esto. En la ciencia esto se hace a través de experimentos definidos. La definición de experimento científico es una prueba que se hace a fin de demostrar una verdad conocida o por conocer, examinar la validez de una hipótesis, o determinar la eficacia de algo previamente ensayado. Los físicos, químicos agrónomos, metalurgistas, mineros, geólogos, y muchos científicos comparten el objetivo de entender y predecir causa y efecto.

LIMITACIONES

Palacios C. Severo

Los científicos en ciencias de la ingeniería tienen más facilidad en construir y llevar a cabo sus experimentos que los investigadores en las ciencias sociales. Las sustancias químicas y los tubos de ensayo son más fáciles de controlar que los consumidores y las campañas de publicidad. Algunas de las diferencias entre ambas ciencias que crea obstáculo para un experimento perfecto son:

Dispositivos imperfectos de medición: Los científicos pueden medir y pesar sus resultados. En cambio las ciencias sociales a menudo tienen que obtener sus datos preguntando a sus sujetos (cualitativos).Influencia de la medición en los resultados: Cuando se pesa un tubo de ensayo esto no afecta ni altera el tubo de ensayo. Pero cuando se pregunta a una persona si alguna vez ha oído a un artista popular esto si afecta a la persona, pues habiendo escuchado anteladamente no lo asociaría.

Limitaciones de corto tiempo: Los científicos a menudo se demoran años, generaciones y hasta siglos en hacer descubrimientos concluyentes. En cambio casi todos los problemas de la sociedad requieren soluciones en días, semanas, a lo sumo en meses. Por esto, rara vez existe el tiempo o el dinero para realizar un experimento en forma tranquila y detallada.

Complejidad y control de las variables: El resultado esperado de todos los esfuerzos es el resultado de muchos factores diferentes que incluyen el producto, el precio y venta. Cada uno de estos factores a su vez, esta afectado por muchas otras. Comprenden o siquiera identificar, todas las posibles causas es virtualmente imposible, y más aún el poder controlar con precisión en un experimento continuo.

Por esto y otras razones la experimentación científica de las ciencias de la ingeniería proporciona un estándar para los experimentos y siempre que sea posible se debe tratar de traer los atributos de esos experimentos para la aplicación

III. PREDICCIÓN

Los proyectos de investigación pueden considerarse en una jerarquía según el grado en que proporcionan hallazgos predictivos, la jerarquía tiene tres etapas:

Investigación descriptiva: Simplemente plantea lo que existe o describe algo que ha ocurrido en el pasado. No intenta inferir causa y efecto.

Investigación evolutiva: Añade juicio de valor a los datos descriptivos a fin de crear una dimensión de comparado con. Determina si algo es mejor. Añade un elemento analítico implícito de causa y efecto.

Investigación predictiva: Da significado absoluto a los resultados de las investigaciones. Pone causa y efecto en el tiempo futuro. Si usted hace esto, entonces sucederá tal y tal caso.La investigación siempre aspira a alcanzar este nivel predictivo.

Los experimentos en la investigación constituyen un forma de mover los proyectos a lo largo de las jerarquías y hacerla evaluativo y, a veces hasta predictivo.

IV. DISEÑOS EXPERIMENTALES

El uso del diseño experimental es esencial en el tratamiento de unidades experimentales (cuantitativo) en investigación científica.

Si deseamos comparar n poblaciones se efectúa los diseños experimentales. Dichos diseños son conjuntos de reglas (estructurado) que sirven para asociar unidades experimentales.

Las unidades experimentales son datos a los cuales se aplica una causa y efecto.

Para el análisis de las unidades experimentales procedemos a describir cada uno de los diseños.

a) DISEÑO ALEATORIZADO

Todo experimento se determina por cierto complejo de condiciones, los cuales bien se crean artificialmente o bien se realizan independientemente de la voluntad del experimentador, y por los resultados del experimento, es decir, por unos sucesos determinados que se observan como resultado de haberse ejecutado dicho experimento de condiciones. Un experimento se considera dado, si están determinadas sus condiciones e indicado los sucesos.

Palacios C. Severo

Los experimentos se pueden dividir a grandes rasgos en dos clases.

En una de ellas las condiciones del experimentador determinan el modo unívoco la aparición o no de los sucesos que se emplean. Los resultados de tales experimentos pueden pronosticarse de antemano a base de las leyes de las ciencias naturales. Los experimentos de esta índole se denominan deterministas.

En otra clase de experimentos, con iguales condiciones, es posible la aparición de los sucesos que entre si se excluyen. El estudio teórico de tales experimentos constituye precisamente el objeto de la teoría probabilística, esta última lleva el nombre de experimento aleatorio.Ventajas

b) Se pueden trabajar con un pequeño número de muestras de la población, sin que esto disminuya la exactitud de los datos.c) Se elimina la influencia del factor tiempo (cinética) sobre los resultados del experimento, las variantes cambian de lugar en los diferentes períodos.d) Es económico, ya que se trabaja con pocas muestras de la población.

b) DISEÑO UNIFACTORIAL CON n NIVELES

En dichos diseños se analizan ciertos experimentos que se usan para comprobar dos condiciones. A menudo se denominan experimentos de comprobación simple, los datos tienen pequeñas variaciones.

En la experimentación donde participan dos clases distintas de equipos, probeta, muestras, etc. con dos métodos distintos de niveles. Muchos experimentos de estos tipos implican más de dos niveles del factor. En el presente explicaremos con detalle los diseños aleatorizados.

Ejemplo 4.32Se desea maximizar la fibra de llama que se emplea en una manufactura de alfombras. Se sabe por experiencia que la resistencia es influida por el porcentaje de algodón presente, además se sospecha que elevar el contenido de algodón incrementará la resistencia, el contenido de algodón debe variar aproximadamente entre 10 y 40 por

ciento para que la alfombra resultante tenga otras características de calidad que se desean.

Se desea probar muestras a cinco niveles de porcentaje de algodón 15, 20, 25, 30, 35 por ciento. Así mismo, decide ensayar cinco muestras a cada nivel de contenido de algodón.

Este es un experimento unifactorial con a=5 niveles del factor y n=5 repeticiones. Las 25 corridas deben hacerse al azar.

Se elige un número aleatorio entre 1 y 25 ver tabla 4.10. Supóngase que este número es 8. Entonces la observación número, 9 (20% de algodón) se corre primero. El proceso se repite hasta que se ha asignado una posición en la secuencia de prueba a cada una de las 25 observaciones.

Tabla 4.10 Influencia del % de algodón a la fibra de llama% algodón Corrida experimental Total Media

1520253035

16111621

121722

38131823

49141924

510152025

La secuencia de pruebas aleatorizadas es necesaria para evitar que los resultados sean contaminados por los efectos de variables inconvenientes desconocidas, que puedan salir del control durante el experimento. Supongamos que se corren las 25 pruebas en el orden no aleatorizado original (esto es, las 5 muestras con 15 por ciento de algodón se prueban primero, luego las 5 muestras con 20 por ciento de algodón y así sucesivamente).

Tabla 4.11 Maximizar la fibra de llama por la Influencia del % de algodón% algodón Corrida experimental Total Media

1520253035

71214197

718182510

1512182211

1118191915

918192311

49778810854

9,815,417,621,610,8

Total 376 15,04

Si la maquina que dan los resultados presenta un efecto de calentamiento tal que ha mayor tiempo de funcionamiento menor lectura se tendrá (influencia perturbadora), entonces dicho efecto contaminará los datos de respuesta e invalidará el experimento. Si se efectúa en orden aleatorio.

Palacios C. Severo

Es bueno representar gráficamente los datos experimentales, en la figura se muestran los diagramas de dispersión a cada nivel de porcentaje de algodón.

15 19 23 27 31 35%

Diagrama de dispersión

Interpretando la gráfica indica que la resistencia aumenta con el aumento del algodón, hasta un valor aproximado de este último de 30 por ciento. Más halla del 30 por ciento ocurre un notable decremento en la resistencia. No hay una fuerte evidencia que sugiera que la variabilidad en la resistencia al rededor del promedio dependa del porcentaje de algodón.

En base a este sencillo análisis gráfico, sospechamos que:

a) El porcentaje de algodón influye en la respuesta, yb) Un porcentaje aproximado de 30 por ciento de algodón daría por resultado la máxima resistencia.

Análisis de varianza

Si se desea comparar a-tratamientos o niveles de un factor único. La respuesta que se observa en cada uno de los tratamientos es una variable aleatoria. Los datos se muestran en la tabla 4.10

Es útil describir las observaciones mediante el modelo estadístico2

ijiijY εµ +Τ+= nji ,...,4,3,2,1, =

Donde:

Yij es el ij-ésima observación,µ es un parámetro común a todos los tratamientos denominados

media global,Ti es un parámetro único para el i-ésimo, y

2 Polinomino ortogonal

εij es el componente aleatorio del error.

Nuestro objetivo será probar una hipótesis apropiada con respecto a los efectos del tratamiento, y hacer una estimación de ello. Para probar la hipótesis, se supone que los errores del modelo son variables aleatorias independientes con distribución normal, con media cero y varianza δ2. Se supone que esta última es constante para todos los niveles del factor.

Este modelo se denomina, análisis de varianza de clasificación en un sentido porque sólo se investiga un factor. Además se requiere que el experimento se realice en orden aleatorio, de manera que el medio en que se usan las unidades experimentales (tratamiento) sea lo más uniformemente posible. Por lo tanto, este diseño experimental es un diseño completamente aleatorizado.Para ilustrar este análisis de varianza, recordemos que deseamos determinar si al variar el contenido de algodón es una fibra de llama influye en la resistencia.

La suma de cuadrados requeridos para el análisis de varianza se calcula como sigue:

( ) NYYSCiIJtotal

/22 ∑−∑=

( ) NYnYSC iIJotratamient // 22 ∑−∑=

otratamienttotalerrorSCSCSC −=

SCtotal suma de cuadrados del totalSCtratamiento suma de cuadrados del tratamientoSCerror suma de cuadrados del errorΣYij sumatoria de los componentes del tratamientoΣYi sumatoria total de los tratamientosn número de datos por columnaN número total de datos del tratamiento

( ) ( ) 96,63625/3761115...77 22222 =−++++=total

( ) ( ) 76,47525/3765/54108887749 222222 =−++++=otratamient

Palacios C. Severo

20,16176,47596,636 =−=error

En la tabla 4.12 se muestran los resultados del procedimiento.

Tabla 4.12 Análisis de varianzaFuente SC G

LCM Fo Ft(99%)

% algodónError

475,76161,20

118,948,06

> 4,43

Total 636,96 24 R² = 74,6923%

Hay que notar que la media de cuadrados entre tratamientos (118,94) es mucho mayor que la media de cuadrados dentro del tratamiento (8,06). Esto indica que es probable que las medias de tratamiento sean iguales. Más formalmente, es posible calcularlas razón Fo=14,76 y comparando con Ft(99%)=4,43, debe rechazarse Ho y concluir que la media de tratamientos difieren; en otras palabras el porcentaje de algodón en la fibra de llama afecta significativamente su resistencia media.c) DISEÑO DE PARCELAS DIVIDIDAS

Los diseños en parcelas divididas y subdivididas se emplean frecuentemente en experimentos factoriales en las que las condiciones del material experimental, o las operaciones experimentales contempladas dificultan el manejo de toda la combinación de factores.

El diseño básico de una parcela dividida involucra la asignación de tratamientos de un factor a parcelas principales o parcelas grandes, las cuales se disponen en diseños experimentales clásicos.

Los experimentos de parcelas divididas se utilizan cuando se quiere dar mayor precisión o importancia a un factor en comparación con otro. Este diseñó se divide en parcelas denominado grande y chicas correspondiendo a estas últimas la mayor precisión. En algunas ocasiones este es el diseño óptimo a elegir ya sea porque un factor requiere de áreas grandes para su evaluación o por razones económicas: láminas de riego y variedad de arroz, sistema de cultivo y fertilización.

Cabe mencionar que la diferencia entre un experimento factorial y uno de parcela dividida está en el proceso de aleatorización de los tratamientos. Así mientras que en un diseño factorial se hacen todas las combinaciones de tratamiento y se distribuyen aleatoriamente a las unidades experimentales, en el experimento de parcelas divididas

primero se distribuyen aleatoriamente los tratamientos de las parcelas grandes y luego los tratamientos de las parcelas chicas dentro de las parcelas grandes.

Ejemplo 4.33Se desea estudiar el efecto de la frecuencia de corte (parcela grande) y tres alturas de corte (parcela chica) en una producción de materia seca del pasto.

El primer paso es localizar el área donde se realizará el experimento. Si el terreno es homogéneo entonces es factible utilizar un diseño completamente al azar, si el terreno muestra un gradiente de variación la solución pudiera ser un diseño de bloque al azar.

Tabla 4.13 Experimento de parcelas divididas

FrecuenciaCorte (días)

AlturaCorte (cm)

Replicas

I II III IV

20 510155

3,693,723,66

5,983,202,85

5,373,902,60

6,304,513,83

23,3415,3312,94

Total 13,07 12,03 11,87 14,64 51,6140 5

6,483,8611,15

7,924,543,54

4,744,423,91

6,305,063,66

25,4417,8822,26

Total 21,49 16,00 13,07 15,03 65,5860 5

4,905,343,40

5,734,285,47

12,006,164,78

8,566,343,75

31,1922,1217,40

Total 13,64 15,48 22,94 18,65 70,71

Tabla de doble entrada para totales de tratamiento

Altura de corteFrecuencia corte 5 10 15 Total

204060

23,3425,4431,19

15,3317,8822,12

12,9422,2617,40

51,5665,6870,71

Total 52,60 55,33 79,97 187,90

Factor de corrección

( )73,980

41,35306

²90,187 ===FC

Suma de cuadrados debido a las replicas

Palacios C. Severo

( ) ( ) ( ) ( )FCSC replica −+++=

²31,48²88,47²51,43²20,48

79,173,98052,98273,9809

71,8842 =−=−=replicaSC

Suma de cuadrados debido a las parcelas grandes (frecuencia de corte)

( ) ( ) ( )FCSC pg −++=

²71,70²58,65²61,51

29,1673,98012

90,499974,430059,2663 =−+++=replicaSC

Suma de cuadrados debida a las parcelas chicas (altura de corte)

( ) ( ) ( )FCSC pch −++=

²60,52²33,55²97,79

88,3773,98012

76,276640,306120,6395 =−++=pchSC

Suma de cuadrados debida a las interacciones de los tratamientos (frecuencia de corte y altura de corte)

( ) ( ) ( )pchpg SCSCFCSC −−−+++=

²40,17...²33,15²34,23int

71,888,3729,1673,9804

45,4174int =−−−=SC

( ) ( ) ( ) ( )FCSC ppgx −++++=

²65,18²94,22...²03,12²07,13Re

52,4773,98025,102873,9803

74,3084Re =−=−=ppgxSC

44,2929,1679,152,4752,47 =−−=−−= pgreperrorpg SCSCSC

( ) ( ) ( ) ( ) FCSC total −++++= ²75,3²78,4...²98,5²69,5

01,14973,98074,1129 =−=totalSC

intSCSCSCSCSC pchpgxreptotalerrorpch −−−=

9,5471,888,3752,4701,149 =−−−=errorpchSC

LCM Fo

ReplicaFrecuencia corteError pgAltura corteInteracción (f x a)Error pch

1,7916,2929,4437,888,71

3262418

0,608,154,9018,942,193,05

6,210,72

Total 149,01 35

Los efectos de bloque (replica) y frecuencia de corte se prueban utilizando la SCepg; mientras que los efectos de altura de corte (parcela chica) y de la interacción de frecuencia de corte de altura de corte se prueban utilizando la SCepch.

65,190,4

. ===pgerror

cortfre

72,005,3

int ===pcherrorCM

Problemas

(113) Un industrial textil utiliza un gran número de telares. Se desea que los telares sean homogéneos con el objeto de producir telas de resistencia uniforme. El industrial supone que, aparte de la variación usual en la resistencia de la tela en muestras del mismo telar, puede existir una variación significativa de la resistencia entre los distintos telares. Para investigar esto, selecciona cuatro telares al azar y realiza cuatro determinaciones de la resistencia. Este experimento es realizado en orden aleatorio.Realice un análisis de varianza y vea si existe diferencia significativa.

Palacios C. Severo

Telar Corrida experimental Total1234

98919695

97909596

99939799

96929598

390366383388

(114) Una fabrica de calzados cuenta con cinco tipos de cuero curtido. Cada cuero tiene una forma de proceso. Para investigar se escogen cinco cueros al azar, y se mide la cantidad de cuero producido en cinco tiempos diferentes. Obteniéndose los datos.

Cuero Corrida experimental Total12345

14,013,914,013,613,8

14,013,814,213,813,6

14,213,914,114,013,9

14,014,014,013,913,8

14,114,013,913,714,0

70,369,670,269,069,1

Estime la varianza del error experimental(115) Se pide a cuatro químicos qué determinen el contenido de

nitrógeno de un fertilizante cada uno realiza tres determinaciones y los resultados son los siguientes:

Químico Corrida experimental Total1234

44,4945,1544,7244,20

44,0445,1344,4844,10

44,3844,8845,1644,55

133,41135,16134,36132,85

Difieren significativamente los resultadosQue análisis químico debe ser seleccionado.

(116) Un ingeniero de producción esta interesado en maximizar una aleación. Sabe por experiencia que la aleación contiene 3 elementos metálicos. Desea determinar si variando el contenido de un elemento metálico se incrementa la resistencia a la corrosión. Por bibliografía sabe que el contenido de dicho elemento metálico debe variar entre 10 a 30 por ciento para que la aleación tenga buenas características.

% metal Corrida experimental Total12345

923191811

1518191119

2211151218

6876746692

Existe diferencia significativa entre las medias(117) Una panadería desea averiguar la tendencia de sus productos

para el siguiente año, bajo las siguientes encuestas, para la diversidad de sus productos en cinco diferentes distritos.

Producto Corrida experimental Total12

200700

150200

300180

100500

700300

0,890,79

300400

150800

100600

200150

250350

0,960,85

Describa las observaciones con un modelo matemáticoExiste diferencia significativa entre las mediasSi existe diferencia aplicar las pruebas de Duncan

(118) Se desea evaluar el rendimiento de los estudiantes de cinco colegios en cuatro materias A: matemáticas, B: física, C: química y D: lenguaje

Materia Colegio NotaABCD

20181525

30252035

25182732

29352735

27333235

50403543

(119) Se realizó un estudio de ingeniería de tránsito sobre los retrasos en las intersecciones con semáforos en las calles de una ciudad. Se usaron tres tipos de semáforo: a) programado, b) semiautomático y c) automático.Se usaron cinco intersecciones para cada tipo de semáforo. La medida de retraso utilizada fue el promedio de tiempo que cada vehículo permanece detenido en cada intersección (segundos/vehículo). Los datos son los siguientes:

Programado Semiautomático

Automático

3837313635

1821192623

1611191117

Escriba el modelo linealCalcule el análisis de varianza.Calcule las medias de mínimos cuadrados del retraso en el tránsito y sus errores estándar para cada tipo de semáforo.Calcule el intervalo de confianza del 95% estimado para las medias de los tipos de semáforo.Pruebe la hipótesis de que no hay diferencia entre las medias de retraso para los tipos de semáforo; a un nivel de significación de 0.05, con la prueba F.Escriba las ecuaciones normales para los datos.

(120) Se llevó a cabo un experimento para probar los efectos de un fertilizante nitrogenado en la producción de lechuga. Se aplicaron cinco dosis diferentes de nitrato de amonio a cuatro parcelas (réplicas) en un diseño totalmente aleatorizado. Los datos son el número de lechugas cosechadas de la parcela.

Tratamient Lechuga

Palacios C. Severo

50100150200

104134146147131

114130142160148

90144152160154

140174156163168

Escriba el modelo lineal estadístico para este estudio y explique sus componentes.Calcule el análisis de varianza.Calcule el intervalo de confianza del 95% estimado para las medias de los niveles de nitrógeno.Pruebe la hipótesis de que no hay diferencia entre las medias de los niveles de nitrógeno con una prueba F a un nivel de significancía de 0.05.Escriba las ecuaciones normales para los datos.Este experimento se llevó a cabo con un diseño totalmente aleatorizado de las parcelas en un arreglo rectangular. Muestre una aleatorización de los cinco tratamientos con nitrógeno de las 20 parcelas, usando una permutación aleatoria de 1 a 20.

(121) Un fisiólogo de animales estudió la función pituitaria de las gallinas, bajo el régimen estándar de muda de pluma forzada que usan los productores de huevo para mantenerlas en producción. Se usaron 25 gallinas en el estudio. Cinco se utilizaron para la medición, una previa al régimen de muda forzada y una al final de cada una de las cuatro etapas del régimen. Las cinco etapas del régimen fueron:

1. Premuda (control),2. Ayuno de 8 días,3. 60 gramos de salvado al día durante 10 días,4. 80 gramos de salvado al día por 10 días y5. Mezcla de malta durante 42 días.

El objetivo era dar seguimiento a las respuestas fisiológicas asociadas con la función pituitaria de las gallinas durante el régimen para explicar por qué vuelven a producir después de una muda forzada. Uno de los compuestos medidos fue la concentración de suero T3. Los datos de la tabla son las medidas de suero T3 en las cinco gallinas sacrificadas al final de cada etapa del régimen.

Tratamiento Suero T3PremudaAyuno60 g salvado80 g salvadoMezcal malta

94,198,8197,2102,983,1

90,5103,6207,3117,589,6

99,4115,3177,5119,987,8

73,6129,1226,1112,196,4

74,4117,6222,

8101,1

Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo.Calcule el análisis de varianza.Calcule un intervalo de confianza de 95% estimado para las medias de los tratamientos.Pruebe la hipótesis de que no hay diferencia entre las medias de los cinco tratamientos con la prueba F a un nivel de significancía de 0,05.Escriba las ecuaciones normales de los datos.Este experimento se llevó a cabo en un diseño totalmente aleatorizado, con una gallina en cada una de las 25 jaulas. Proporcione una asignación aleatoria de los cinco tratamientos a las 25 jaulas, con una permutación aleatoria de los números 1 a 25.

(122) Se recolectaron datos de estudiantes de pedagogía en cuanto a su uso de ciertas estrategias de enseñanza estudiadas antes de sus prácticas. Había 28 estudiantes que habían aprendido las estrategias (9 en 2002, 9 en 2003 y 10 en 2004). El 2001 había 6 profesores que no habían aprendido el uso de estas estrategias y se usaron como grupo de control.El investigador registró el número promedio de estrategias por semana que cada estudiante usaba durante sus prácticas. El investigador quería saber si el número de estrategias usadas variaba con el tiempo.

Número promedio de estrategias usadasControl 2001 2002 2003 2004

6,95,615,99,87,85

7,310,68,68,78,87,1

11,27,3

10,97,56,87,67,85,78,95,97,3

7,514,96,15,25,7

14,29,35,67,3

Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo.Calcule el análisis de varianza.Calcule un intervalo de confianza del 95% estimado para las medias de los tratamientos.Pruebe la hipótesis de que no hay diferencia entre las medias de los cuatro tratamientos, con la prueba F a un nivel de significancía de 0.05.

Palacios C. Severo

Escriba las ecuaciones normales de los datos.(123) En cierto estudio de calibración de espectroscopia de

absorción atómica, las medidas de respuesta fueron las unidades de absorción de un instrumento según la cantidad de cobre diluido en una solución ácida. Se usaron cinco niveles de cobre con cuatro réplicas del nivel cero y dos réplicas de los otros cuatro niveles.En la siguiente tabla se dan los datos de espectroscopia para cada nivel de cobre como microgramos de Cu/mililitro de solución.

Cobre mg/ml0,00 0,05 0,10 0,20 0,500,0450,0470,0510,054

0,0840,087

0,1150,116

0,1830,191

0,3950,399

Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo.Calcule el análisis de varianza.Calcule las medias de mínimos cuadrados y sus errores estándar para cada tratamiento.Calcule un intervalo de confianza del 95% estimado para las medias de los tratamientos.Pruebe la hipótesis de que no hay diferencia entre las medias de los cinco tratamientos, con la prueba F(95%).Escriba las ecuaciones normales de los datos.

(124) Considere el experimento del ejercicio 121. Suponga que se perdieron algunas gallinas durante el transcurso del mismo, lo que dio como resultado el siguiente conjunto de observaciones.

Tratamiento Suero T3PremudaAyuno60 g salvado80 g salvadoMezcal malta

94,198,8197,2102,983,1

90,5103,6207,3117,589,6

99,4115,3177,5119,987,8

73,6129,1

112,196,4

Escriba el modelo lineal estadístico para este estudio y explique las componentes del modelo.Calcule el análisis de varianza.Calcule las medias de mínimos cuadrados y sus errores estándar para cada tratamiento. ¿Cómo afectó la pérdida de gallinas a las estimaciones de las medias?Calcule un intervalo de confianza de 95% estimado para las medias de los tratamientos.

Pruebe la hipótesis de que no hay diferencia entre las medias de los cinco tratamientos; con la prueba F a un nivel de significancía de 0,05.Escriba las ecuaciones normales de los dato

(125) Utilice los datos del ejercicio 51 para determinar cuántas gallinas necesitaría el biólogo en cada tratamiento para rechazar la hipótesis nula a un nivel de significancía de 0.05, si la diferencia entre el tratamiento de control y cualquier tratamiento nuevo es de 30 unidades de T3.

(126) Use los datos del ejercicio 49 para determinar cuántas intersecciones necesita el ingeniero de tránsito con cada tipo de semáforo para rechazar la hipótesis nula a un nivel de significancía de 0.01, si los retrasos medios respectivos en los tres tipos de señal fueron 20, 18 y 16 segundos.

(127) Se quiere probar el efecto de cinco dietas en el aumento de peso en cerdos pero se tiene diferente peso inicial en las unidades experimentales. Aquí el factor peso inicial es medible y no puede utilizarse como un criterio de clase (nivel de un factor) por lo que es mejor utilizar un diseño completamente al azar con peso inicial de las unidades experimentales como covariables. De esta manera se ajusta respecto a peso inicial, se tiene más grados de libertad para el cuadrado medio del error y se maneja un diseño más sencillo. Si además del peso inicial, la edad se los animales fuese otro factor de importancia podría incluirse teniendo así un diseño completamente al azar con dos covariables.

(128) Suponga que un investigador en fisiología esta interesado en planear un experimento para medir el efecto del área necrótica sobre la fotosíntesis de 8 variedades de café susceptibles a la roya. Planea usar parcelas experimentales de 4 plantas en un lote ubicado en una pendiente del 70 %. Por experimentos anteriores se sabe que la roya es más agresiva en la zonas bajas que en este caso además son las más húmedas y por lo tanto más favorables para el desarrollo de la enfermedad. El investigador cuenta con 320 plantas y solo puede sembrar grupos de 32 plantas para distribuirlas a lo largo de la pendiente. Por otra parte cuenta solo con 8 equipos para la medir la fotosíntesis y decide medir entre 10:00 y 10:15 a.m. Se sabe que tarda en medir la fotosíntesis de cada hoja afectada 3 minutos. ¿Qué diseño experimental le recomendaría al investigador? De acuerdo con lo recomendado, indíquele como

Palacios C. Severo

hacer el análisis de los datos y las comparaciones de tratamientos.

(129) Un investigador plantea la hipótesis de que el gusano blanco de la papa se puede controlar biológicamente usando tres especies de nematodos. Para su aplicación, quiere ensayar tres sistemas diferentes: en la superficie, en la parte media y en el fondo de cada matera formando un círculo. La efectividad del sistema puede variar de acuerdo con el nematodo. Para evitar complejidad, el investigador esterilizara el suelo, aplicara soluciones nutritivas a todas las materas e infestara cada matera con igual número de larvas. La infestación con las larvas se hará 8 días después de la floración del cultivo de papa y la aplicación de los nematodos se hará 15 días antes de la infestación. Se consideró la matera con 2 kg de suelo y una planta, como unidad experimental. Por tratamiento va a tener 10 unidades experimentales en un invernadero.Qué diseño experimental recomendaría.Como asignaría los tratamientos a las unidades experimentales Que variable(s) mediríaEscriba una tabla de análisis mostrando solamente las fuentes de variación y los grados de libertad.Son los factores cualitativos o cuantitativosConsidere los factores aleatorios y escriba como calcular las componentes de varianza y las pruebas de F

(130) Para determinar la permanencia del controlador biológico beauveria bassiana sobre las hojas del cafeto después de un aguacero, se piensa hacer un experimento en el cual se usará un solo simulador de lluvia para despachar una misma cantidad de agua con diferentes tiempos de duración, para una intensidad dada. Los tiempos de duración son: 30, 60 y 90 minutos en horas de la tarde. Se asperjarán 3 dosis del hongo (108, 1010 Y 1012 esporas por mililitro) debidamente calibradas, donde se espera tener una distribución uniforme del número de gotas por centímetro cuadrado en las hojas. La unidad experimental estará constituida por 10 plántulas de 6 meses de edad. Se quiere medir el número de esporas promedio en 5 campos de la hoja. El simulador de lluvia logra regar 30 plantas a la vez. El investigador cuenta con 450 plantas para su experimento. ¿Que diseño experimental recomienda? ¿Qué le indicaría al investigador para hacer el análisis de los datos?

(131) Suponga que un ingeniero está interesado en la comparación de tres procesos químicos para la manufactura de cierto

compuesto. Se sospecha que la impureza de la materia prima usada en el proceso puede afectar el producto final, sin embargo se espera ajustar el proceso al final del análisis. Usando un diseño completamente aleatorizado con 15 unidades experimentales obtuvo la siguiente información:

Tratamiento Impurezas Producción1

4,12,91,54,12,26,82,73,86,45,66,62,23,53,54,6

12,510,39,612,611,311,58,67,211,68,96,84,85,67,56,2

Estime la línea de regresión para cada tratamientoLleve a cabo la prueba de hipótesis de que las tres líneas de regresión tienen la misma pendienteObtenga la estimación combinada de la pendiente.Obtenga las medias sin ajustar y ajustadas de los tratamientos y compárelos comentando los resultados respectivos.Obtenga la tabla de análisis de la varianza e interprete cada uno de los resultados de esta tabla.

(132) A continuación se analizan los datos de un experimento en caña de azúcar. En las parcelas grandes se ensayaron dos tratamientos.C: Con compuesto orgánicoS: Sin compuesto orgánicoEn las sub parcelas se ensayaron cuatro tratamientos.1 Testigo.2 Cal 1,5 Ton/ha.3 Cal 3,0 Ton/ha.4 Cal 4,5 Ton/ha.La respuesta de interés fue el rendimiento del campo en kilogramos por parcela chica de 100.8 m2, y se generó la variable R: para el rendimiento de caña en toneladas por hectárea.

V. DISEÑO TOTALMENTE ALEATORIZADO

Palacios C. Severo

Se usa cuando los datos tienen pequeña variación, y además cuando el número de tratamientos también es pequeño.

Si tenemos N-tratamientos, y queremos ubicar n-elementos para los N-tratamientos procedemos de la siguiente manera.

Se eligen aleatoriamente n-unidades experimentales para aplicarle un tratamiento digamos t, luego tenemos n-elementos de las Nn-n restantes para aplicarles el tratamiento t2 y así sucesivamente hasta agotar las Nn unidades experimentales.

En muchos problemas es necesario diseñar experimentos en los que pueda controlarse sistemáticamente la variabilidad producida por diversas fuentes extrañas.

Ejemplo 4.34Se desea determinar la alimentación de terneras con productos distintos para el engorde artificial. El experimentador ha decidido obtener cuatro observaciones para cada alimentación.

Solo existe un factor - alimentación artificial, y el diseño de un factor completamente aleatorizado consiste en asignar aleatoriamente cada uno de los 4x4=16 ensayos a una unidad experimental, o sea la alimentación de terneras, el engorde artificial correspondiente.

Por lo tanto, se requerirán 16 formas de alimentación para realizar este experimento, una para cada ensayo.

En principio existe un problema serio en el diseño. Como las terneras son distintas, las unidades experimentales contribuyen a la variabilidad observada en la lectura de alimentación.

Como resultado, el error experimental reflejará tanto el error aleatorio como la variabilidad entre los animales.

Tabla 4.15 Datos de alimentación de ternerasTernera Corrida experimental Total Media

9,39,49,29,7

9,49,79,49,6

9,69,89,510

109,99,7

38,338,837,839,5

9,5759,7009,4509,875

Se desea que el error experimental sea lo más pequeño posible; en otras palabras, se busca sustraer del error experimental la variabilidad producida por las terneras. Un diseño que logre esto requiere que el experimentador pruebe cada alimentación, una vez, en cada uno de las cuatro terneras diferentes.

El diseño que aparece en la tabla 4.15, se conoce como diseño aleatorizado. La respuesta observada es el incremento de peso diario en gramos.

El análisis estadístico se lleva a cabo en función de la prueba F, el valor de Fo se compara con el valor de Ft en función de los grados de libertad de los tratamientos y del error experimental.

Debemos calcular la varianza total y descomponerla para el tratamiento y el error.

( ) ( ) 18,116/4,1532,1010...4,93,9 22222 =−++++=total

( ) ( ) 395,016/4,1534/5,398,373,383,38 22222 =−+++=ootratamient

785,0395,018,1 =−=error

=−=−

=−==

nNError

noTratamient

NTotal

LCM Fo Ft(99%)

TernerasError

0,3950,785

0,1280,065

1,96 < 5,95

Total 1,18 15 R² = 66,5254%

El análisis de la prueba F indica que puede ser rechazado la hipótesis Ho por lo que puede afirmarse que existe diferencia entre las medias de los tratamientos comparados; sin embargo el investigador puede concluir entre cuales tratamientos es que existe diferencia.

Palacios C. Severo

Problemas

(133) Un técnico textil desea probar el efecto que tiene cuatro productos químicos sobre la resistencia de un tipo de tela. Como puede haber variabilidad entre un rollo de tela y otro, decide utilizar un diseño aleatorizado, seleccionando cinco rollos al azar y les aplica los cuatro productos químicos en orden aleatorio. A continuación, se proporcionan los resultados de la resistencia.Analice estos datos y haga las conclusiones apropiadas.

Químico Corrida experimental Total Media1234

73737573

68676871

74757875

71727375

67706869

(134) Se emplean cuatro laboratorios para realizar un análisis químico como parte de un estudio, para determinar si los laboratorios dan en promedio los resultados mínimos, se le envía a cada uno una muestra del mismo material. Los resultados analíticos son:

Análisis Corrida experimental Total Media1234

58,764,557,361,4

62,756,160,958,2

55,960,359,160,3

60,760,959,258,1

61,463,155,262,3

Existe diferencia significativa entre los laboratoriosRealice un análisis de varianza

(135) Tres diferentes soluciones para lavar están siendo comparadas con objeto de estudias su efectividad en el retraso de crecimiento de bacterias en envases de leche. El análisis se realiza en un laboratorio y sólo puede efectuarse tres pruebas en un sólo día, el experimentador recupera las observaciones durante cuatro días y los datos aparecen a continuación.

Químico Corrida experimental Total Media123

394422

(136) Se desea estudiar la adición sistemática para la obtención de peltre (aleación de estaño, plomo, cobre antimonio) de muy buena calidad, se comparan cinco estándares con el suministro

de estaño (Sn) y cobre (Cu): a) Sn=92, Cu=2; b) Sn=93, Cu=1; c) Sn =93, Cu=2; d) Sn=94, Cu=1, e) Sn=94, Cu=2

Aleación Corrida experimentalABCDE

1,181,451,361,451,96

1,201,231,231,782,12

1,031,761,411,561,78

0,921,621,251,741,83

1,271,341,511,672,07

1,241,601,441,461,76

(137) Se realizó una prueba de la vida útil, a temperatura acelerada, de un tipo de calentador tubular. Se probaron seis calentadores, cada uno a cuatro temperaturas distintas: 1520°F, 1620°F, 1660°F y 1708°F. Se registró el número de horas transcurridas hasta que se presentó falla en los 24 calentadores utilizados en el estudio.

temperatura

Horas hasta la falla

1520162016601708

19531190651511

21351286837651

24711550848651

472721251038652

613425571361688

631428451543729

Investigue las suposiciones necesarias para un análisis de varianza de los datos.Realice un análisis de varianza de los datos transformados, y haga una partición de la suma de los cuadrados de la temperatura en contrastes polinomiales ortogonales, para determinar la mejor relación entre la temperatura y su variable de respuesta. Como las temperaturas de prueba tenían espaciamientos desiguales, use los siguientes coeficientes de contraste:

Temperatura

1520 1620 1660 1708

LinealCuadráticaCúbica

-0,7730,382-0,078

-0,051-0,6370,584

0,238-0,328-0,765

0,5850,5830,259

(138) Un entomólogo contó el número de huevos que pone cada una de las 15 hembras de polillas en días sucesivos, en tres variedades de gusano de tabaco (USDA, campo y resistente). Los siguientes datos son el número de huevos puestos en el tercer día después del apareamiento de cada hembra en cada variedad.

Variedad Número de huevos por polillaUSDACampoResistente

4482110

906276

28415143

227787

6341826

48118127

137151294

USDA 29 522 319 242 261 566 734

Palacios C. Severo

CampoResistente

253348

153218

El entomólogo desea realizar un análisis de varianza del número de huevos.

(139) Un criador de plantas evaluó la capacidad de enraizar de nueve clones de pasto en un experimento de laboratorio. Cultivó dos réplicas de cada clon en una solución oxigenada en un diseño totalmente aleatorizado.

ClonReplica I Replica II

Enraizado No enraizado

123456789

15131361614898

495151424850565540

111164129181016

535358605255465448

El cultivador quiere analizar la proporción de cultivos enraizados o la proporción de nodos enraizados.

(140) Dada la siguiente muestra aleatoria de N = 15 observaciones, ordenadas de menor a mayor:

14,3 16 17,3 17,5 17,8 18,7 18,8 18,920 20,8 21,4 22,7 23,2 25,6 27,8

Determine los valores f y sus cuantiles normal estándar.Grafique las observaciones contra los cuantiles normal estándar.Interprete la gráfica respecto a la forma de la distribución a partir de la cual se muestrearon las observaciones.

(141) Dada la siguiente muestra aleatoria de N = 16 observaciones, ordenadas de menor a mayor:

2 3 4 5 10 28 34 3539 63 87 97 112 156 188 253

Determine los valores f y sus cuantiles normal estándar.Grafique las observaciones contra los cuantiles normal estándar.Interprete la gráfica respecto a la forma de la distribución a partir de la cual se muestrearon las observaciones.

VI. DISEÑO DE BLOQUES ALETORIZADOS

El concepto de bloques fue introducido en agricultura; al observarse que los campos experimentales en agricultura marcaban una heterogeneidad de fertilidad, lo que complicaba la asignación de los tratamientos de un punto a otro, de aquí que el bloque permitía la partición de la variabilidad inherente en el campo experimental después de la asignación de los tratamientos en las siguientes componentes:

1. Diferencias entre tratamientos-Variación entre tratamientos.2. Variación dentro de bloques.3. Variación entre bloques.

De esta forma nació el concepto de diseño en bloque completos aleatorizados. El término bloque es usado más ampliamente para referirse a un grupo de unidad experimental que tienen un conjunto de características que provocan un problema efectivo de respuesta, una vez que han sido aplicados los tratamientos.

El diseño de bloques aleatorizados constituye una de las variantes para el agrupamiento de las unidades experimentales que se utilizan cuando en la conformación de los grupos en un experimento de comparación por grupos, se detecta que existen diferencias en cuanto a una característica determinada entre los objetos. A partir de ello se estructura la formación de los grupos, en función de establecer bloques de tratamiento semejantes en cuanto a las características en

Palacios C. Severo

cuestión para que compongan cada bloque en forma aleatoria en cada uno de los grupos experimentales posteriores.

Esta distribución permite llevar a cabo un control más preciso de los efectos de esta característica variable a través del agrupamiento en bloques elevando con ello la precisión del experimento.

Ejemplo 4.35Se realizo un experimento con el objeto de comparar el efecto del suministro de diferentes niveles de concentrado a las aves de corral para lo cual se aplicaron las siguientes variantes:

A; Sin concentrado (dieta normal)B: 250 gramos de concentrado por cada kilo de ave vivaC: 300 gramos de concentrado por cada kilo de ave vivaD: 500 gramos de concentrado por cada kilo de ave viva

El experimento se monto utilizando 80 aves de corral, los que fueron agrupados en 5 bloques de acuerdo al peso inicial, que vario entre 1 a 2 Kg. teniendo en cuenta este agrupamiento se formaron unidades experimentales de cuatro aves por corral.

Lográndose obtener los resultados en el aumento de peso diario durante la prueba (alimento de concentrado), expresado en Kg/día de peso vivo.

ConcentradoBloque

Total MediaI II III IV V

0,81,01,21,4

1,01,11,31,4

0,91,01,11,8

0,81,11,31,6

1,01,31,11,8

4,55,568

0,91,11,21,6

Total 5,2 4,8 4,4 4,8 4,8 24

( ) ( ) 6,120/244,16,1...9,01 22222 =−++++=total

( ) ( ) 3,120/245/865,55,4 22222 =−+++=otratamient

( ) ( ) 08,020/245/8,48,44,48,42,5 222222 =−++++=bloqueSC

22,008,03,16,1 =−−=error

=+−−=−

=−=−

mnNError

mBloque

noTratamient

NTotal

Tabla 4.17 Análisis de varianzaFuente SC GL CM Fo Ft(99%)

ConcentradoBloqueError

1,300,080,22

0,430,020,018

5,955,41

Total 1,6 19 R² = 81,25%

Al comparar los resultados de los valores de F encontramos que los efectos de los tratamientos resultan significativos lo que indica que existe una influencia diferente entre los efectos de las diferentes dietas comparadas en cuanto al incremento de peso diario de las aves de corral durante las pruebas.

Referente al efecto del agrupamiento en bloque resulto no significativo por lo que las aves de corral se comportan en forma semejante independiente de su peso inicial del experimento.

A partir de los resultados podemos concluir desde un punto de vista biológico el efecto obtenido con la utilización de concentrados en la dieta para aves de corral, sin embargo debe de estudiarse con detenimiento los factores que provocan los resultados obtenidos al comparar las dietas.

Ejemplo 4.36Un agrónomo desea determinar el efecto de diferentes fuentes de nitrógeno en la producción de una materia seca sobre cebada forrajera. Hay cinco fuentes a ser comparadas: (NH4)2SO4, NH4NO3, CO(NH2)2, Ca(NO3)2 y NaNO3 y con un tratamiento control sin nitrógeno. Se deseo aplicar los resultados sobre un rango bastante amplio de condiciones, se hicieron ensayos sobre cuatro tipos de suelo.

Para el diseño experimental se eligió un diseño en bloques completamente aleatorizado con los tipos de suelo como factor de bloqueo, se localizaron seis parcelas en cada uno de los cuatro tipos de suelo, y se asigno aleatoriamente los tratamientos a las parcelas

Palacios C. Severo

dentro de cada tipo de suelo. La variable de interés es la producción de cebada bajo varias fuentes de nitrógeno.

Los datos obtenidos de realizar este experimento se presentan en la tabla 4.18.

Tabla 4.18 Producción (kg/parcela) de cebada bajo varias fuentes de nitrógenoTipo de suelo

Tratamiento I II III IV(NH4)2SO4

NH4NO3CO(NH2)2Ca(NO3)2

NaNO3Control

32,130,125,424,126,123,2

35,631,527,133,031,024,8

41,937,133,835,633,826,7

35,430,831,131,431,926,7

Las sumas de cuadrados se obtienen de la siguiente manera:

ijtotal n

2∑ −=

494518324

²2,74052,23323 =−=totalSC

( )∑ −=

ijotratamient

[ ] 256153324

²2,740²4,110²8,122²1,124²4,117²5,129²145

1 =−+++++=otratamientSC

( )∑ −=

ijbloque

[ ] 192748324

²2,740²3,187²9,208²183²161

1 =−+++=bloqueSC

bloqueotratamienttotalerror SCSCSCSC −−=

456166192748325615334945183 =−−=errorSC

SueloTratamientoError

19274832561533456166

64249451230630411

21,1316,8

5,424,56

Total 4945183

23 R² = 90,7755%

Ejemplo 4.37Un agricultor rocía hojas de manzana con diferentes concentraciones de un compuesto de nitrógeno, luego determina la cantidad de nitrógeno que permanecía en las hojas inmediatamente después de la aplicación y al final de ciertos tiempos preestablecidos.

La finalidad de este experimento fue determinar la rapidez a la que el nitrógeno es absorbido por las hojas, hubo dos reproducciones de cada tratamiento según se muestra en la tabla 4.20

Tabla 4.20 Cantidad de nitrógeno que permanece después de la aplicaciónConcentración de nitrógeno

Tiempo N1 N2 N3

2,292,540,460,190,000,26

6,805,943,031,000,751,16

8,759,522,492,041,401,81

Asumiendo un bloqueo por tiempos, al llevar a cabo el análisis de varianza y probar la hipótesis de interés H0: µN1 = µN2 = µN3, los resultados del ANOVA se muestran en la tabla 4.21

[ ] 91757618

²43,50²83,5²21,9²84,35

1 =−++=bloque

[ ] 35113618

²43,50²01,26²68,18²74,5

1 =−++=otratamientSC

[ ] 309755²21,3..²74,12²83,42

12884143 =+++−=errorSC

Palacios C. Severo

1715741412880233045617640162853167exp =+−−=ererrorSC

147126214128802884143 =−=totalSC

Con base en éstos resultados, se obtiene la tabla 4.21 y a partir de la ésta, se concluye que la permanencia de nitrógeno en las hojas se ve afectada por la cantidad de nitrógeno aplicada, pues Fo = 4,09 < Ft(95%)

= 6,9. Por otro lado, al parecer los tiempos (bloques) difieren de manera significativa, ya que el cuadrado medio es grande en relación con el error experimental.

Tabla 4.21 Análisis de varianzapermanencia de nitrógeno en las hojas

Fuente SC GL CM Fo Ft(95%)TiempoNitrógenoError expError

91757635113617157430975

458788175568428933441

10,694,09

6,946,94

Total 1471262 17 R² = 88,3383%

Ejemplo 4.38Un ingeniero químico piensa que el tiempo de reacción de un proceso químico en donde los reactantes actúan espontáneamente esta en función directa del tipo de catalizador empleado, se emplean cuatro tipos de catalizadores a fin de realizar el presente estudio.

Tabla 4.22 Tiempos de reacción del procesoLote de materia prima

Catalizador I II III IV Yoi

747575-

-676872

218214216222

Yoj 221 224 207 218 Yoo=870

Se están investigando cuatro catalizadores, en cuatro lotes de materia prima y se observa el tiempo de reacción. Los datos obtenidos se presentan en la tabla 4.22

Para este conjunto de datos se tiene r = 3; k = 3 y el número de veces que cada par de tratamientos aparece en el mismo bloque es:

( ) ( )2

1 ==−−=

Este diseño en bloques incompletos balanceado tiene una eficiencia relativa con respecto al DBCA de:

( )( ) 889,033

42 ===kT

Prefiriendo de esta forma bloques incompletos balanceados.

Para comprobar la hipótesis H0: τ1 = τ2 = τ3 = τ4, se construyen las diferentes sumas de cuadrados con base en la estructura de las siguientes matrices:

( )444443

2xx JIC −= 443

8xI=Ω 44

8xI=Ω−

Con base en estos resultados, se encuentra que:

810012

²87063156 =−=totalSC

( ) 550012

²870²218²224²207²221

1 =−+++=bloqueSC

( ) 227540016498124

1 =+++=ajustratSC

En la tabla 4.23 se resumen los resultados anteriores a través del análisis de varianza. Puesto que Fo = 11,66 > Ft(95%) = 5,41, se concluye que el catalizador empleado tiene un efecto significativo sobre el tiempo de reacción.

325550022758100 =−−=−−= bloquetrattotal SCSCSCSCerrorajus

Tabla 4.23 Análisis de varianza para los tiempos de reacción del procesoFuente SC GL CM Fo Ft(95%)

BloqueTratamiento(ajus

55002275

1833758

28,211,6

5,415,41

Palacios C. Severo

)Error

325 5 65

Total 8100 11 R² = 95,9876 %

Problemas

(142) Se describe un experimento en el cual se determinó el factor de forma para distintos embutidos a seis niveles de velocidad. El interés se concentro en las diferencias potenciales del equipo, y la velocidad se consideró una variable problemática.

Embutido

Velocidad

0,780,830,83

0,750,860,89

0,770,810,89

0,800,850,92

0,810,920,95

0,780,850,93

0,830,75

0,880,76

0,860,76

0,790,86

0,980,78

1,140,97

(143) Un fabricante produce nutrientes en cuatro reactores se sabe que cada reactor tiene sus propias características de procesamiento de modo que cada reactor se considera una variable problemática en cualquier corrida experimental en la fabricación que implica más de un reactor. El ingeniero de planta sospecha que la velocidad de agitación influye en la homogenización y dilución de los productos sólidos. Cada reactor puede operar a cuatro velocidades de agitación distinto.Se efectuó un diseño de bloques aleatorizados para una empresa exportadora, los datos son:

Agitación Reactor5

101520

814147

Existe alguna evidencia de que la velocidad de agitación influya en la disolución de los productos.Que recomienda usted al ingeniero de planta respecto a la elección de la velocidad de agitación y el reactor para este proceso.Existe alguna evidencia de que la velocidad de agitación influya en la disolución de los productos.Que recomendaría usted al ingeniero de planta respecto a la elección de la velocidad de agitación y el reactor del proceso.

(144) Se emplean cuatro laboratorios para efectuar un análisis químico. Como parte del estudio para determinar si los datos dan un promedio en los resultados, se le envía a cada uno una muestra del mismo material, los resultados son:

Análisis Laboratorio12345

58,761,460,959,158,2

62,764,563,159,260,3

55,956,157,355,258,1

60,760,360,961,462,3

Existe alguna diferencia significativa entre los laboratorios.(145) Se estudia el rendimiento de cuatro detergentes diferentes. Se

obtuvieron las siguientes lecturas de blanqueo para 12 cargas de lavado distribuidos en tres modelos de lavado.

Detergente

Lavado

454748

434650

315255

Palacios C. Severo

D 42 37 49

(146) Considere un experimento de 10 tratamientos y 5 replicaciones en el diseño experimental de bloques completos al azar. Muestre un plan de la aleatorización de los tratamientos en las réplicas (Bloques).

(147) Quince variedades de maíz fueron sembradas en una estación experimental, con el propósito de seleccionar los de mayor producción. El ensayo se realizó teniendo en cuenta una estructura de bloques. Se midió el rendimiento de maíz tonelada/unidad de superficie y los resultados del ensayo se resumen en la siguiente tabla:

Fuente SC GL CM Fo

BloqueVariedadError

238033,14 7,38

Total 7082935

DISEÑO CUADRADO LATINO

El diseño en bloques aleatorios es adecuado cuando una fuente de variabilidad extraña se elimina comparando un conjunto de medias muéstrales. Una Característica importante de este tipo de diseño es su balance, que se logra asignando el mismo número de observaciones a cada tratamiento de cada bloque. La misma clase de balance puede

lograrse en otros tipos de diseño más complicados, en los cuales es conveniente eliminar el efecto de varias fuentes extrañas de variabilidad.

El diseño cuadrado latino se usa para eliminar dos fuentes de variabilidad problemática, en otras palabras, permite analizar sistemáticamente por bloques en dos direcciones. En este diseño los renglones y columnas representan, en realidad, dos restricciones a la aleatorización. En general, un cuadrado latino PxP, es un cuadrado que contiene P renglones y P columnas, dada una de la P2 celdas contiene una de las P letras que corresponde a un tratamiento, y cada letra aparece una sola vez en cada renglón y columna, ejemplo.

Su utilidad esta determinado por la búsqueda de ejercer un control efectivo de posibles fuentes de error en el experimento, derivadas éstas fundamentalmente de las características individuales del material experimental; se puede ampliar las posibilidades de control a dos posibles fuentes, con lo que resulta comparativamente con los diseños anteriores.

Esta posibilidad de control de dos fuentes de error determinado por el agrupamiento de las unidades experimentales en un sistema de distribución bi direccional; de tal manera ejecutado, que permita una formación de los grupos que componen cada variante del experimento, con una distribución equitativa, teniendo en cuenta dos posibles fuentes de error.

Ejemplo 4.39Se realizó un experimento para investigar la influencia entre los tiempos medios para ensamblar 4 tipos de equipos aspersores distintos.Hay dos fuentes de variación moderada que afectan la respuesta, la variación entre los operarios y el efecto de la fatiga.

Palacios C. Severo

Si una persona ensambla una serie de dispositivos durante un cierto tiempo, se desea evaluar dichas influencias.

Por consiguiente cuatro operarios fueron seleccionados y cada uno ensambla los cuatro dispositivos de acuerdo al siguiente diseño.

FilasEnsamblado

TotalI II III IV

C=44B=41A=59D=58

A=41C=42D=41B=37

B=30D=49C=59A=53

D=40A=49B=34C=59

153181193207

Total 202 161 191 192 763

Tratamiento

A B C D

Total 202 142 204 188Media 50,5 35,5 51 47

Partiendo de la base de datos obtenemos:

( ) ( ) 133016/7635953...4144 22222 =−++++=totalSC

( ) ( ) 36516/7634/20719318115322222 =−+++=

filaSC

( ) ( ) 5,22616/7634/19219116120222222 =−+++=

columnaSC

( ) ( ) 62616/7634/188204142202 22222 =−+++=otratamientSC

5,1126265,2263651330 =−−−=errorSC

=+−=−

=−=−=−

nNError

noTratamient

nColumna

nFilas

NTotal

Como se aprecia en la tabla 4.24 del análisis de varianza la columna de fuente no resulto controlada significativamente ya que el valor de F es menor que el Ft(99).

LCM Fo Ft(99%)

TratamientoFilaColumnaError

626365

226,5112,5

208,66121,66

75,518,75

11,126,484,02

9,789,789,78

Total 1330 15 R² = 76,5037%

Ejemplo 4.40Se presenta un experimento, en donde se probaron cuatro métodos distintos, A, B, C y D, para preparar mezclas de concreto. Consistieron los métodos de dos relaciones de cemento y agua, y dos duraciones de mezclado. Los cuatro métodos fueron controlados por cuatro lotes y cuatro días. El concreto se coló en cilindros y se midió la resistencia a la compresión en kg=cm2, a los 7 días de almacenamiento en cámaras especiales con 20°C de temperatura y 50% de humedad relativa. Los resultados del diseño que se uso se presentan en la tabla 4.25

Tabla 4.25 Resistencia del concreto a la compresión en kg=cm2

DíasEnsamblado

TotalI II III IV

A=303B=280C=275D=304

B=299A=321D=315C=293

C=290D=313A=319B=295

D=290C=282B=300A=305

1182119612091197

Total 1162 1228 1217 1177 4784

2854016

²47841433270 =−=totalSC

[ ] 1750016

²4784²1222²1140²1174²1248

1 =−+++=métodoSC

[ ] 91516

²4784²1197²1209²1196²1182

1 =−+++=díasSC

[ ] 745516

²4784²1177²1217²1228²1162

1 =−+++=loteSC

2670=−−−= lotedíastrattotalerror DCSCSCSCSC

Palacios C. Severo

Con base en los anteriores resultados, se llega a la tabla 4.26 y a partir de la misma, con un nivel de significancía del 5% el valor F es Ft(95%) > 4,75 y puesto que Fo = 13,1,

Se concluye que el método afecta la resistencia a la compresión. Además, al parecer los días no difieren significativamente en dicha resistencia (cuadrado medio es pequeño en relación al del error), mientras los lotes si, ya que el cuadrado medio es grande en relación con el error.

Tabla 4.26 Análisis de varianza para la resistencia a la compresión en kg=cm2

Fuente SC GL

CM Fo Ft(95%)

DíaLoteMétodoError

9157455

175002670

30524855833445

0,685.5813,1

4,754,754,75

Total 28540 15 R² = 90,6447%

Problemas

(148) Se encuentra en estudio el efecto que tienen 5 productos distintos A, B, C, D y E sobre el tiempo de reacción de un proceso. Cada lote de material nuevo es lo suficientemente grande para permitir que sólo se realicen cinco pruebas. Más aún cada prueba tarda hora y media; por lo que solo se pueden realizar cinco ensayos al día.El investigador decide efectuar el experimento usando un diseño cuadrado latino con el fin de controlar sistemáticamente las variables: lote de material y día. Obteniéndose los siguientes datos.

FilasEnsamblado

I II III IV V12345

A=8C=11B=4D=6E=4

B=3E=8A=5

C=10D=8

D=7A=3C=1E=6B=8

C=1D=7E=10B=6A=3

E=7B=2D=9A=8C=2

(149) Un ingeniero agrónomo está investigando el efecto que tienen cuatro métodos de fumigado (A, B, C y D) sobre el tiempo de curado de una plaga. Se selecciono cuatro operarios para realizar este estudio.Por otra parte, el ingeniero sabe que cada método produce cierto tipo de intoxicación, por lo que, el tiempo que se tarde en el último fumigado debe ser menor que el primero, independiente del método.En otras palabras, se produce un patrón en el tiempo de fumigado. Para controlar esta posible fuente de variabilidad el ingeniero utiliza el diseño cuadrado latino:

FumigadoOperario

I II III IV1α1β1µ1ε

C=2B=8A=9

D=7C=1B=11A=12

A=14D=18C=10B=10

B=10A=7D=5C=10

(150) Se va efectuar un estudio de los movimiento para determinar el mejor diseño de trabajo para montar computadoras, cinco diseño se hallan en estudio. Se seleccionan cuatro estudiantes en

Palacios C. Severo

ensamblaje aleatoriamente entre un grupo de sesenta, se le enseña minuciosamente a trabajar con los cinco diseños.

EstudianteDiseño de trabajo

I II III IV V1234

A=10B=5C=6D=4

B=3C=10D=12E=8

C=9D=5E=5A=4

D=14E=10A=10B=11

E=11A=6B=6C=5

Cada estudiante sigue cada diseño durante dos días y se registra el número de computadoras montadas:

(151) Se efectúa un experimento de soldadura, empleando el siguiente arreglo:

EstudianteDiseño de trabajo

I II III123

A=14B=9,5C=11

B=16,5C=17A=12

C=11A=15B=13

(152) Se fabrica una cubierta de caucho para una avioneta y se experimenta un cuadrado latino, el experimento es descrito:

PruebaMaquina

I II III IV2314

A=251D=234C=236B=195

B=241C=273D=236A=270

D=227A=274B=218C=230

C=229B=226A=268D=225

(153) Una investigación describe los métodos de preparación de cierto insecticida. Se usa un diseño cuadrado latino para analizar.

MezclaIngredientes

I II III IV V VI VII1234567

A=98B=69C=37D=65E=56F=113G=64

B=17E=67F=83G=60D=44C=15A=62

C=89A=70G=83E=91B=70D=65F=65

D=64G=70B=74F=56C=68A=51E=86

E=63F=111D=70C=61A=88G=83B=45

F=132D=60A=75B=59G=111E=57

G=244C=218E=169A=150F=220B=233D=187

(154) Una agencia de control supone que existe diferencia en el contenido de nitrato en lotes de fertilizante que son suministrados por un proveedor. Existe en estos momentos gran cantidad de lotes en el almacén. Se han elegido aleatoriamente cinco de estos. Mediante un análisis químico sobre cada lote se obtienen:

AnálisisLote

I II III IV V12

A=24,3B=24,4

B=24,7C=24,3

C=24,3D=24,9

D=24,4E=24,4

E=24,3A=24,4

C=24,6D=24,9E=24,0

D=24,5E=24,4A=24,2

E=24,7A=24,5B=24,8

A=24,5B=24,4C=24,6

B=24,6C=24,4D=24,9

(155) En un fuelle de herrero se forjan 4 clases de aceros. A una misma temperatura, aunque se sospecha que cada uno de los tipos de acero tiene un punto de caldeo, se trabaja con cada uno de ellos al temple, lográndose los siguientes resultados

AceroCaldeo

I II III IV1234

A=48C=41B=49D=46

B=43D=48A=45C=41

D=47A=43C=41B=46

C=41B=47D=49A=46

(156) Se evalúan tres muestras de tierra fertilizada con abono: químico, natural y compost. Siendo los resultados siguientes.

AbonoFertilizante

I II III IVQuímicoNaturalCompost

A=4,9B=5,1C=4,7

C=4,0A=5,3D=4,8

B=4,3D=4,8A=5,1

D=4,2C=4,1B=4,5

Analice y obtenga sus conclusiones.(157) Se realiza un experimento para determinar si la temperatura

(°C), de horneado afecta en el vidriado de cierto tipo de azulejo. El experimento proporciono los siguientes datos:

TemperaturaVidriado

I II III IV1300140015001800

C=23A=24D=25B=28

A=21B=22C=25D=23

B=24D=27A=29C=29

D=26C=25B=28A=27

(158) Se han preparado tres diferentes tipos de soluciones para eliminar el óxido de joyas (oro y plata). El análisis de realiza en un laboratorio, usando un diseño aleatorizado por bloques.Los datos se recopilaron durante tres días.

SoluciónDías

I II III123

A=13C=22B=9,5

B=44A=12C=22

C=16B=13A=39

(159) Se utilizan cinco reactores distintos sobre una solución galvánica de dorado electrolítico. Para evaluar se utilizan varios lotes que sólo permiten realizar cinco ensayos por día. La investigación se realiza mediante un diseño cuadrado latino, con el fin de controlar sistemáticamente las variables de material y día.

Reactor Días

Palacios C. Severo

I II III IV VABCDE

A=8C=6

B=10D=2E=8

B=10E=1A=7C=7D=4

D=5A=3C=1E=8B=6

C=8D=7E=6B=2A=4

E=3B=8

D=10A=9C=11

(160) Se encuentra bajo estudio el efecto que tienen 5 reactivos distintos (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material nuevo es lo suficientemente grande para permitir que sólo se realicen 5 ensayos. Más aún, cada ensayo tarda, aproximadamente, 1 hora y media, por lo que sólo pueden realizarse 5 ensayos por día. La investigadora decide efectuar el experimento usando un diseño de cuadrado latino, con el fin de controlar las variables lote de material y día. Ella recolecta los siguientes datos:

DíaLote 1 2 3 4 5

A=8C=11B=4D=6E=4

B=7E=2A=9C=8D=2

D=1A=7

C=10E=6B=3

C=7D=3E=1B=6A=8

E=3B=8D=5A=10C=8

Analice la tabla de ANOVADiga que otro diseño experimental pudiera utilizarse.Diga que recomendaría respecto a la elección del reactivo químico, del día y lote para realizar el proceso químico en el menor tiempo posible.Realice un análisis de los residuos.

(161) Complete la siguiente tabla de análisis de varianza, concluya e interprete. Se midió el rendimiento de trigo de 4 variedades (tratamientos) en kg/parcela.

Fuente SC GL

FilasColumnasTratamientoError 2,72

1,445,0458,4

7Total 90,40

VIII. DISEÑO CUADRADO GRECO-LATINO

Consideremos un cuadrado latino NxN al que se le sobrepone un segundo cuadrado latino cuyos tratamientos se designan con letras griegas. Se dice que los cuadrados son ortogonales si al sobreponerse poseen la propiedad de que cada letra aparezca solamente una vez en cada letra latina. Este diseño se denomina cuadrado greca-latino.

CuadroColumna

I II III IV1234

AαBβCτDσ

BβCτDσAα

CτDσAαBβ

DσAαBβCτ

El análisis de varianza es muy similar al de un cuadrado latino.

El factor representado por la letra griega es ortogonal a los renglones, las columnas y los tratamientos de las letras latinas porque cada letra griega ocurre una sola vez en cada renglón, en cada columna y para cada letra latina. Por lo tanto, la suma de cuadrados debido al factor letra griega puede calcularse usando los totales de la letra griega. El error experimental se reduce en esta cantidad.

Ejemplo 4.41Un ingeniero sospecha que en el lugar de trabajo usado por cuatro operarios puede representar una fuerte adición de variabilidad. Es posible introducir al lugar de trabajo α, β, τ, σ a como un cuarto

Palacios C. Severo

factor. Se produce el cuadrado greca latino que se muestra a continuación.

MontajeOperario

YiI II III IV1234

Cβ=11Bα=8Aσ=9Dτ=9

Bτ=10Cσ=12Dα=11Aβ=8

Dσ=4Aτ=10Bβ=7

Cα=18

Aα=8Dβ=12Cτ=15Bσ=6

33424241

Total 37 41 39 41 158

( ) ( ) 75,17316/158157...109 22222 =−++++=total

( ) ( ) 25,1416/1584/41424233 22222 =−+++=filaSC

( ) ( ) 75,216/1584/41394137 22222 =−+++=columna

SCTratamiento A B C DTotal 35 31 56 36Media 8,75 7,75 14 9

( ) ( ) 25,9416/1584/36563135 22222 =−+++=ootratamient

los totales de las líneas de montaje son:

Letra Griega Total de montajeαβτσ

Y1 = 45Y2 = 38Y3 = 44Y4 = 31

( ) ( ) 25,3116/1584/31443845 22222 =−+++=montajeSC

25,3125,3125,9475,225,1475,173 =−−−−=error

=+−=−

=−=−

=−=−==

nNError

noTratamient

nMontaje

nColumna

nFilas

NTotal

TratamientoFilaColumnaMontajeError

94,2514,252,7531,2531,25

31,414,750,9110,4110,41

3,0170,4560,08

29,529,529,529,5

Total 173,75 15 R² = 82,0143%

En el análisis de varianza ninguna de las fuentes de variación controladas resultaron significativas al análisis ya que los valores calculados de F siempre son menores que los valores de Ft.

Problemas

(162) Se desea saber si hay diferencia entre cuatro combustibles usados en cuatro sembradoras. Diseñar un experimento grecolatino.

MontajeOperario

I II III IV1234

Aα=14Bβ=16Cτ=19Dσ=15

Bβ=16Cτ=16Dσ=18Aα=11

Cτ=21Dσ=11Aα=16Bβ=15

Dσ=14Aα=23Bβ=16Cτ=15

(163) Con el fin de mejorar la calidad de las gallinas, se han añadido dos productos químicos en su alimentación. Las distintas cantidades del primero se indican con A, B, C y D.Las del segundo por α, β, τ y σ. Se alimenta a las gallinas ordenados en grupos de acuerdo con sus pesos iniciales 1 1,5 1,8 y 2 kilogramos y cuatro especies diferentes. El incremento de

Palacios C. Severo

peso por unidad de tiempo viene dado en el cuadro. Realice un análisis de varianza del experimento, sacar conclusiones de acuerdo a su criterio.

EspeciesPeso

I II III IV1234

Aα=3Bβ=4Cτ=8Dσ=6

Bβ=6Cτ=6

Dσ=10Aα=3

Cτ=10Dσ=5Aα=5Bβ=7

Dσ=6Aα=6Bβ=8Cτ=3

IX. PRUEBA DE INTERVALOS MÚLTIPLES DE DUNCAN

Procedimiento de uso amplio para comprobar las parejas de medias. Para aplicar dicha prueba en muestras del mismo tamaño, se disponen en orden ascendente los a - promedios del tratamiento y se determina el error estándar para cada promedio.

Ejemplo 4.42Consideremos los datos de la tabla 4.28, siendo el CMerror = 8,06 para N=25 y n=5, el error tiene 20 GL, organizando los promedios Y de tratamientos en orden ascendente se tiene

Y1 = 9,8Y5 = 10,8Y2 = 15,4Y3 = 17,6Y4 = 21,6

Error estándar de cada promedio: 27,1/ == nCMS erroriY

iYSrr *95,2)20,2( 05,005,0 →=

iYSrr *10,3)20,3( 05,005,0 →=

iYSrr *18,3)20,4( 05,005,0 →=

iYSrr *25,3)20,5( 05,005,0 →=

Tabla 4.28 Datos para tratamientoTratamiento Y1 Y5 Y2 Y3

Y 9,8 10,8 15,4 17,6Y4 21,6 11,8 10,8 6,2 4Y3 17,6 7,8 6,8 2,2Y2 15,4 5,6 4,6Y5 10,8 1

Y3 y Y2 no existe diferencia significativaY5 y Y1 no existe diferencia significativa

X. DISEÑO DOBLE REVERSO

En los experimentos de nuestro campo, sin duda, el estudio de la influencia de diferentes factores sobre la producción de ciertos procesos; ocupa uno de los principales lugares por su importancia económica y social.

El costo alto de estos experimentos y su duración cuando se utiliza los métodos por grupos, ha exigido estudiar y ampliar nuevas técnicas que permitan reducir los mismos.

Tales circunstancias han llevado a investigar un método experimental en grupo-tratamiento, con el objeto de abaratar los costos y reducir el tiempo de ejecución de los mismos.

Estudios sobre la producción de leche, huevo, derivados de leche, empollado de huevos, mejoramiento genético, etc. Han permitido establecer una serie de particularidades propias de los mismos, las que unidas a las técnicas experimentales, han dado origen a diseños

Palacios C. Severo

que logran una medida importante al resolver los problemas planteados.

El diseño doble reverso cumple los principios fundamentales del método de comparación por. grupo-tratamiento, aprovechando las características y la influencia de los diferentes factores sobre si misma.

Ejemplo 4.43Un total de 24 gallinas fueron seleccionadas para un experimento con el objeto de estudiar la influencia entre ponedoras y ordinarias. Con este fin se utilizo el diseño doble reverso que tuvo sub tratamientos experimentales de 30 días con duración semanal. Los tratamientos se identifican como: (a) ponedoras y (b) ordinarias.

Tabla 4.29

GallinasSub experimentos d = I – 2II + III

I II II d1 d2 d2

123456789101112

b=6b=6a=9b=4

a=10a=7

a=12a=9b=4b=3b=6a=8

a=7a=9b=3a=8b=12b=7b=4b=6a=15a=18a=9b=4

b=3b=2a=9b=2a=7

a=10a=15a=11b=4b=8b=7

-73198

-22-25-5

9100144100499

48462525144

Total 47 -75 2114

Pasemos a continuación al análisis de los resultados de este experimento en relación a la producción de huevos por semanas.

Los datos en el caso se organizan de acuerdo al esquema que se siguió en el experimento.

Tratamiento Total MediaAB

10,2823,25

( ) ( ) 206512/75472114 2 =−−=total

( ) ( ) 33,124012/75476/7547 222 =−−+=ootratamient

67,82433,12402065 =−=error

TratamientoError

1240,33824,67

1240,3382,467

15,04 > 10,0

Total 2065,00 11 R² = 60,0644 %

En función de los resultados existe diferencia significativa en cuanto a la producción de huevos de las gallinas sometidas a tratamiento y esta en función de los datos obtenidos respectivamente.

Como puede apreciarse este diseño tiende a dar solución a las limitaciones en los métodos precedentes. Este método fue desarrollado ampliamente para la aplicación en estudios con más de 3 tratamientos y resulta de amplia utilidad en la práctica actual de trabajo.

Problemas

(164) Elabore el diseño doble reverso para 14, 15, 20 y 24 pruebas(165) Simule el proceso con tres fertilizantes (Compost, Turba y

Químicos) en la siembra de hortalizas.(166) Establezca la diferencia entre el diseño doble reverso y los

diseños aleatorizados.(167) Elabore el modelo del ejemplo 4.43(168) Aporte un criterio de evaluación útil del diseño doble reverso.(169) A los problemas de (156, 157, 158 y 159) elabore sus análisis de

varianza.

Palacios C. Severo

XI. ESTIMACIÓN DE PARÁMETROS DEL MODELO

Las herramientas principales para el diagnóstico de modelos unifactoriales esta basado en los residuos.

ijijij YY −=ε

Los residuos del i-ésimo tratamiento se determinan restando el promedio del tratamiento a cada observación dentro del tratamiento.

Usualmente la comprobación de linealidad del promedio consiste en graficar los residuos, tal como se muestra. Se recomienda que tal comprobación de diagnostico sea un paso de rutina en cada proyecto de diseño experimental.

Ejemplo 4.44Analizar los datos de la tabla 4.10

Tabla 4.31 Valores originales y residuos% 1 2 3 4 5 Yi

15 7 -2,5 7 -2,8 15 5,2 11 1,2 9 0,8 9,520 12 -3,4 17 1,6 12 -3,4 18 2,6 8 2,6 15,425 14 -3,6 18 0,4 18 0,4 19 1,4 19 1,4 17,630 19 -2,6 25 3,4 22 0,4 19 1,4 23 1,4 21,635 7 -3,8 10 -0,8 11 0,2 15 0,2 11 0,2 10,8

Orden K εij PK=(K-1/2)/2512345678910111213141516171819202122232425

-3,8-3,6-3,4-3,4-2,8-2,8-2,8-2,6-0,8-0,8+0,2+0,2+0,4+0,4+0,4+1,2+1,4+1,4+1,4+1,6+2,6+2,6+3,4+4,2+5,2

0,020,060,100,140,180,220,260,300,340,380,420,460,500,540,580,620,660,700,740,780,820,860,900,940,98

Los residuos se organizan en forma ascendente y se calculan sus puntos de probabilidad acumulada Pk.

La gráfica de probabilidad normal se deja al lector para que lo desarrolle, con los residuos graficados contra Pkx100 en la escala vertical derecha.

Palacios C. Severo

En la parte inferior los puntos del residuo.

XII. POLINOMIO ORTOGONAL

Cuando los niveles de los factores son equidistantes, puede simplificarse mucho el ajuste del modelo polinomial por el método de mínimos cuadrados. El procedimiento utiliza los coeficientes de los contrastes ortogonales. Además del ajuste de mínimos cuadrados del polinomio se obtiene el efecto lineal, cuadrático, cúbico, cuártico y así sucesivamente, así como la suma de cuadrados del factor. Esto permite probar la contribución de cada término al polinomio.

Ejemplo 4.45Los datos de la tabla 4.32 en este problema el factor independiente, porcentaje de algodón, tienen cinco niveles equidistantes. La suma de cuadrados de los efectos lineales, cuadráticos; cúbicos y cuárticos descompone la suma de cuadrados de tratamiento y pueden ser incorporados al análisis de varianza como se muestra. Cada efecto tiene un grado de libertad y puede ser probado comparando su suma de cuadrados en la media de cuadrados del error.

% algodón Total detratamiento

Coeficiente de loscontrastes ortogonales Ci

Lineal Cuadrático Cúbico Cuártico1520253035

49778810854

-2-1012

2-1012

-120-2-1

1-46-41

τ 1 1 5/6 35/2

∑ YCEfecto i41 -155 -57 -100

( )[ ]∑∑ 22 / ii CnYCSC33,62 343,21 64,98 33,95

El modelo polinomial cúbico ajustado a los datos es:

εαααα ++++= )()()(332211

XPXPXPYo

∑ === 04,1525/376/ NYSCoα

∑ ==∑= 82,0)10(5/41/ 2

1 ii CnYCSCα

∑ −=−=∑= 2143,2)14(5/155/ 2

2 ii CnYCSCα

∑ −=−=∑= 14,1)10(5/57/ 2

3 ii CnYCSCα

Como se tiene a=5 niveles de X e Y entre los niveles, d=5 el modelo del polinomio ortogonal es:

( )( ) ( )[ ]( ) ( )[ ]2 0/)7)5(3(5/2 55/2 5)6/5(1 4,1

1 2/155/2 52 1 4 3,25/)2 5(8 2,00 4,1 52

−−−−−−−−−−+=

resultando el modelo

32 00786,04814,001,9611,62 XXXY −+−=

% AlgodónLinealCuadráticoCúbicoCuárticoError

475,95(33,62)(343,4)(64,98)(33,95)161,20

118,9433,62

343,4064,9833,958,06

14,764,17

42,588,064,21

2,874,354,354,354,35

Total 637,15 28 R² = 74,6998%

Los efectos cuadrático y cúbico del porcentaje de algodón son significativos.

§5MÉTODOS DE ANÁLISIS

Palacios C. Severo

Las cosas complejas y estadísticamente improbables, son por naturaleza más difíciles de explicar que las cosas simples y estadísticamente probables.

Richard Dawkins

I. INTRODUCCIÓN

No imite al ebrio que utiliza un poste de luz como apoyo, en vez de usarlo como iluminación. No deje que el ANAVA (análisis de varianza) se convierta en muleta de un trabajo de campo mal hecho o como sustituto de pensar. Recuerde estas pautas:

Adapte la técnica al problema, no el problema a la técnica: evite enamorarse de un método y tratar de acomodarse siempre a cualquier estudio. No se convierta en tecnócrata.

Los resultados son solo tan buenos como los datos: Las técnicas estadísticas no arreglan los malos datos. Por eso sea siempre cuidadoso en la elaboración del diseño y en la toma del vector respuesta.

Piense ante, no después de haber hecho el experimento: no amontone todo lo que se le ocurra en el computador con la esperanza de que éste lo clasifique y lo haga intangible para usted. Primero desarrolle hipótesis; luego ensaye sus preguntas. Puede estar casi seguro de que siempre habrá algo que conseguir en un trabajo de investigación.

Considere la investigación: usted siempre aprende conforme avanza - sobre cosas que usted hubiera querido añadir y sobre otras que hubiera querido dejar por fuera. Una o dos etapas piloto mejorarán la calidad de un gran estudio final. El análisis estadístico es costoso; por eso, proceda en forma planificada.

Encuentre la forma de comunicar los resultados con claridad: La mayoría de los investigadores no están familiarizados con estas técnicas y por eso hay peligro de confundirlo con datos y con jergas. Busque maneras de comunicar las técnicas y sus resultados en una forma fácil de entender.

Mantenga el análisis estadístico como un medio, no como un fin: "Correr un análisis conglomerado" no ayuda mucho si no contribuye al objetivo general del estudio. Empiece con el problema, no con la técnica.

Las técnicas estadísticas de análisis prueban ser herramienta muy valiosa. Su papel más útil generalmente es complementar análisis y juicios directos reuniendo variables complejas en un solo análisis. Es arriesgado hacer depender todo el estudio, de una sola técnica. Un procedimiento mejor es experimentar con estas técnicas como parte del estudio hecho con otros fines; luego, proseguir con un estudio más grande después de que el valor y la aplicabilidad de la técnica se hayan aprobado.

II. MÉTODOS NO PARÁMETRICOS

En la práctica aparecen situaciones en las que los requisitos no están justificados, como es el caso de una población fuertemente asimétrica. A causa de ello, se han creado métodos que son independientes de las distribuciones de la población y de los parámetros asociados.

Las pruebas no paramétricas se pueden usar como observaciones de contraste más complicada. Son especialmente útiles cuando se trata con datos no numéricos, por ejemplo, cuando los consumidores colocan productos por orden de preferencia.

III. PRUEBA U DE MANN-WHITNEY

Consideremos dos productos distintos de los cuales obtenemos dos muestras, queremos decidir si hay o no diferencia entre las muestras, o sea, si proceden o no de una misma muestra poblacional. Es conveniente una prueba no paramétrica consistente en los siguientes pasos:

1. Combinar todos los valores muéstrales en una ordenación ascendente y asignar rangos a todos los valores. Si dos o más muestras son idénticas, se le asigna a cada uno un rango que es la media de los rangos que los ubica con tal coincidencia.2. Hallar la suma de los rangos para cada muestra, denominándolo Rn y los tamaños muéstrales Nn. Por conveniencia elegimos N1 al menor. Una diferencia significativa entre la suma del rango R1 y Rz, implica una diferencia entre las muestras.3. Para encontrar la diferencia entre las sumas de rangos, usamos:

Palacios C. Severo

NNU iii

ji ≠−++=2

La distribución muestral U es simétrica y tiene una media

y una varianza

)1(2 ++= jiji

NNNNσ

Si Ni y Nj son ambas al menos iguales a 8, resulta que la distribución de U es aproximadamente normal

σµ−=

Esta normalmente distribuido con media cero y varianza 1. Un valor correspondiente a otra muestra viene dada por.

NNU iii

ji ≠−++=2

Además

jiji NNUU =+

676,033 −=b

Donde:

N = Ni + Nj

Ejemplo 5.46Se desea determinar si hay diferencia entre los telares I y II, al nivel de significancía del 0,05.

Tabla 5.33 Datos de telares I y II

11,711,812,612,914,1

678910

14,715,215,916,116,9

1112131415

17,818,318,919,620,5

161718

22,724,225,3

Combinando los 18 valores de la muestra en ordenación ascendente, tal como se indica en la tabla 5.33, en la segunda fila se asignan los rangos.

10821== NN

Además

6510621== RR

( ) ( ) 101062/98108 =−+=U

402/10*8 ==U

67,12612/19*10*82 ==Uσ

la distribución es

[ ] 67,225,11/4010 −=−=z

Textil I Textil IIResistencia Rango Resistencia Rango

18,316,422,717,818,925,316,124,2

121016111318917

12,614,120,510,715,919,612,915,211,814,7

351518144726

Suma 106

Suma 65

como la hipótesis Ho que estamos estudiando es que no hay diferencia entre los telares, entonces

Palacios C. Severo

9 6,19 6,1 +≤≤− zs iHo

Rechazamos y concluimos que hay diferencia entre los telares al nivel del 0,05.

IV. PRUEBA H DE KRUSKAL-WALLIS

Con esta prueba podemos decidir si dos muestras provienen o no de la misma población. Una generalización para k muestras de Kruskal-Wallis con sus pruebas.

La prueba puede describirse como: sean k muestras de tamaño Nk, con suma total N, supongamos que los datos de todas las muestras se ordenan y que las sumas de rangos para las k muestras son Rk

respectivamente. Definido:

)1(3)1(

+−∑

Ejemplo 5.47Una fabrica de tejidos desea comprar una de cinco maquinas diferentes. En un experimento diseñado para saber si hay diferencia en la eficacia de tales maquinas, cinco operarios expertos trabajan en cada maquina un tiempo determinado.

Los resultados se escogen y ordenan en forma ascendente pero colocada por orden de presentación.

12,52,54

42485050

6,56,56,56,5

53535353

9101112

57606163

14141416

64646465

17,517,51921

68687072

2121232425

757782

6872604864

7253826165

7763645770

42535348757264506853

RangoABC

17,52110

216,525

241214

16,523

6,52,521

7048,593

1417,5

40,573

44,6=H

Para K-1=4 grados de libertad al nivel de significación 0,05 296,0X .

Puesto que 6,44 < 9,49 no podemos rechazar la hipótesis de igualdad entre las maquinas. Podemos aceptar la hipótesis de que no hay diferencia entre las maquinas.

V. MÉTODOS MULTIVARIABLES

Cuando varias variables se analizan juntas, el procedimiento se llama análisis multivariable.

El primer paso analítico en la mayoría de los proyectos de investigación es una tabulación cruzada directa de los resultados.

Las técnicas multivariables más utilizada en el análisis son:

Análisis de regresión múltipleInteracción automáticaAnálisis discriminanteAnálisis de factoresAnálisis de conglomerados

Escalas multidimensionalesAnálisis conjunta.

Las tres primeras técnicas miden la dependencia entre variables. Estos métodos tienen que ver con dos tipos de variables, y es importante entender la distribución entre ellos.

Variables dependientesEstas son las variables que usted esta tratando de predecir o explicar. Un ejemplo típico es el volumen de utilización de un producto o de utilización de un cierto tipo de equipo.

Variable independienteEstas son las variables que explican o predicen diferencias en las variables dependientes.

Palacios C. Severo

Las otras cuatro técnicas, están diseñados para medir la interdependencia entre las variables. En este método no hay variable dependiente o independiente.

Análisis de regresión múltiple

Este tipo de análisis enfoca una ecuación de predicción que relaciona una variable dependiente y un conjunto de variables independiente. Esta es una de las técnica multivariable más básicas. Es muy útil para predecir el intervalo de una variable dependiente.El procedimiento proporciona la ecuación correspondiente a la línea recta que mejor se ajusta a los datos. La ecuación de esta línea recta se puede usar como ecuación de predicción.

La ecuación se desarrolla mediante un procedimiento conocido como mínimos cuadrados y corresponde a una línea recta, no es apropiado para situaciones donde la relación entre las variables dependiente e independiente no es lineal.

Interacción automática

Al igual que la regresión múltiple, la interacción automática es un método para analizar la relación entre una variable dependiente y varias variables independientes. Pero mientras el análisis de regresión múltiple produce una ecuación predictiva que describe la relación, la interacción automática genera una serie de ecuaciones de dos vías, seleccionado en cada división la variable independiente que explica la mayor variación en la variable dependiente.

Análisis discriminante

El procedimiento determina las variables predictivas más estrechas que identifican a un subgrupo en la muestra, es decir, identifica las variables que son las discriminadoras entre los miembros de los subgrupos cuyo comportamiento se quiere predecir. La técnica puede usarse con variables de dos grupos.

Análisis de factores

Sirve para analizar las interrelaciones entre variables e intenta reducirlas a un conjunto más pequeño. En procesos sociales es común medir un gran número de datos, por esta razón se cree que en la mayoría de los casos todas estas variables son facetas de un número

menor de variables subyacentes. El propósito del análisis de factores es establecer la cantidad de variables que sustenten el fenómeno.

Análisis de conglomerados

Define los grupos naturales de objetos que son similares dentro de una población muestra. El análisis de conglomerado crea sub muestras cuyos miembros son similares entre ellos con los demás. Es decir identifica conglomerados de unidades homogéneas.Escalas multidimensionales

Es un análisis matemático de percepciones y preferencias que los miembros tienen en el espacio muestra.

Análisis conjunta

Es una técnica que separa de sus componentes los juicios globales de los informantes sobre alternativas complejas, tales como característica de un producto.

VI. CORRELACIÓN DE SPEARMAN

Se utiliza este método para medir la correlación de dos variables X e Y. En lugar de usar valores precisos de las variables, o cuando tal precisión no es alcanzable, a los datos se les puede asignar un rango de 1 a N ordenándolo por su tamaño, importancia, preferencia, etc. Dicha asignación viene dada por:

−∑−=NN

Ejemplo 5.48Se analiza agua contaminada de 10 estanques, además para ver la confiabilidad de dicho análisis se procede a realizar los cálculos analíticos para ver su dispersión.

Laboratorio 8 3 9 2 7 10 4 6 1 5Teórico 9 5 10 1 8 7 3 4 2 6

Diferencia de rangos:

D -1 -2 -1 1 -1 3 1 2 -1 -1D2 1 4 1 1 1 9 1 4 1 1

Palacios C. Severo

[ ] 8545,0)110(*10/)24*6(1 2 =−−=Sr

Indica que hay marcada relación entre los análisis de laboratorio y teórico.

Análisis de varianza

El análisis de varianza es una técnica que resulta útil para mejorar la precisión de un experimento. Supongamos que en un experimento la variable respuesta Y está relacionada linealmente con la variable independiente X. Además, el experimentador no puede controlar la variable X pero puede medirla al mismo tiempo que a Y. Con el análisis de varianza se busca adaptar el valor observado de la respuesta para tomar en cuenta el efecto de la variable concominante. Si no se lleva a cabo dicho ajuste, la variable concominante puede aumentar la media del cuadrado del error, con lo que hay mayor dificultad en la detección de diferencias reales en la respuesta debidos a los tratamientos. Por lo tanto, el análisis de covarianza es un método para tomar en cuenta el efecto de algunas variables que no pueden ser controladas.

Ejemplo 5.49Se usan tres maquinas distintas para producir fibras para una empresa textil. El ingeniero de proceso esta interesado en determinar si existe diferencia en los resultados de la fibra producida por las tres maquinas. Sin embargo, la resistencia de la fibra depende del grosor de la misma, siendo más resistente las fibras de mayor grosor. Se selecciona una muestra aleatoria de cinco fragmentos para cada maquina siendo. Y: resistencia de cada fibra y X: grosor.

Maquina I Maquina II Maquina IIIY X Y X Y X

3641394249

2025242532

4048394544

2228223028

3537423432

2123262115

207 126 216 130 180 106

( ) ( ) 40,436)5(3/6033234...4136 22222 =−++++=YYSC

( ) ( ) 73,261)5(3/3621521...2520 22222 =−++++=XXSC

( ) ( ) 60,282)5(3/603*36232*1534*21...41*2536*20 2222 =−++++=XYSC

( ) ( ) 40,140)5(3/6035/180216207 2222 =−++=ΤYY

( ) ( ) 13,66)5(3/3625/106103126 2222 =−++=ΤXX

( ) ( ) 00,96)5(3/603*3625/180*106216*130207*126 =−++=ΤXY

00,20640,14040,346 =−=Τ−=Ε YYYYYY SC

50,19513,6673,261 =−=Τ−=Ε XXXXXX SC

60,18600,9060,282 =−=Τ−=Ε XYXYXY SC

( ) ( ) 27,4173,261/6,28240,346/ 22´ =−=−=Ε XXXYYY SCSCSCSC

( ) ( ) 99,276,195/6,186206/ 22 =−=ΕΕ−Ε=Ε XXXYYYSC

28,1399,2727,41´ =−=− ΕΕ SCSC

( ) [ ][ ] ( )( )[ ]11//1/´ −−−−= ΕΕΕ naS CaS CS CFo

[ ] [ ] 61,211/99,27/2/28,13 ==oF

86,211,2,90 =F

954,06,195/6,186/ ==ΕΕ= XXXYβ

( )[ ] ( ) ( ) ( ) 08,7059,2/6,195/6,186// 22 ==ΕΕ= errorXXXYo CMF

65,911,2,90 =F

Palacios C. Severo

( ) ( ) 38,4013,242,25954,04,41111 =−−=−−= XXYAjustadaY β

( ) ( ) 42,4113,240,26954,02,43222 =−−=−−= XXYAjustadaY β

( ) ( ) 80,3813,242,21954,00,36333 =−−=−−= XXYAjustadaY β

Tabla 5.34 Análisis de varianza

Fuente GLSC

Y GL CMX XY Y

MaquinaErrorTotal

66,13195,6

0261,73

96,0186,6282,6

140,4206,0346,4

27,9941,27

Maquina

ajustada

13,28 2 6,64

Problemas

(170) Se dan los rangos de 10 estudiantes en mitad de semestre y a fin de semestre obtenido en los exámenes de estadística.Compute el coeficiente de correlación de Spearman e interprételo.

Estudiantes1 2 3 4 5 6 7 8 9 10

Mitad de semestre

5 4 8 2 6 1 3 7 10 9

Fin de semestre 4 1 10 5 6 9 7 8 2 3

(171) Una Empresa textilera desea comprar una de cinco maquinas diferentes. En un experimento diseñado para saber si hay diferencia en la eficacia de tales maquinas, cinco operarios trabajan en cada maquina un tiempo determinado.Los resultados se escogen y ordenan en forma ascendente pero colocada por orden de presentación

24283739

43455253

9101112

58626364

13141516

65666768

1717,51921

69717375

2324262832

7778798082

(172) Se analiza Aire contaminado de 10 Ingenios mineros, además para ver la confiabilidad de dicho análisis se procede a realizar los cálculos analíticos para ver su dispersión.

Laboratorio

12 8 9 7 9 18 6 9 3 5

Teórico 11 6 12 4 12 14 4 6 4 6

(173) Se analiza Aire contaminado con ácido cianhídrico de una empresa minera aurífera, además para ver la confiabilidad del análisis químico se procede a realizar los cálculos analíticos para ver su dispersión.

Laboratorio

0,011 0,08 0,09 0,07 0,09 0,018 0,06

Teórico 0,011 0,06 0,012 0,04 0,012 0,014 0,04

(174) Se usan tres maquinas distintas para producir Queso cremo para una empresa Lechera. La ingeniera a cargo de la investigación esta interesada en determinar si existe diferencia en los resultados del Queso cremoso producido por las doss maquinas. Se selecciona una muestra aleatoria de cinco fragmentos para cada maquina siendo. Y: sabor y X: dureza.

Maquina I Maquina IIY X Y X

0,310,400,320,490,48

0,290,270,220,200,39

0,490,450,300,420,41

0,200,290,270,350,29

2,00 1,37 2,07 1,40

(175) Se usan tres maquinas distintas para producir Yogur para una empresa Heladera. La ingeniera de proceso esta interesada en determinar si existe diferencia en los resultados del Yogur producida por las tres maquinas. Se selecciona una muestra aleatoria de cinco fragmentos para cada maquina siendo. Y: consistencia y X: sabor.

Maquina I Maquina II Maquina IIIY X Y X Y X3140324948

2927222039

4945304241

2029273529

3935494347

2826292419

200 137 207 140 213 126

(176) Se dan los rangos de 10 estudiantes en mitad de semestre y a fin de semestre obtenido en los exámenes de diseño experimental de una Universidad Estatal del Sur del Perú.

Palacios C. Severo

Compute el coeficiente de correlación de Spearman e interprételo.

Estudiantes1 2 3 4 5 6 7 8 9 10

Mitad de semestre

15 14 18 12 06

11 13 17 10 09

Fin de semestre 14 11 10 15 06

§6DISEÑOS EXPERIMENTALES

APLICADO A INGENIERÍALa estadística ha demostrado que la mortalidad de los militares aumenta perceptiblemente durante tiempos de guerra.

Alphonse Allais

I. INTRODUCCIÓN

En muchos procesos experimentales de carácter exploratorio, el investigador se enfrenta con el problema de determinar el efecto de un gran número de variables. En estas condiciones, es necesario establecer un procedimiento aceptable para elegir las condiciones de cada uno de los ensayos experimentales.

La estrategia estadística en el diseño de experimentos consiste en el procedimiento sistemático y controlado para desarrollar las combinaciones correctas de condiciones variables para que el análisis resulte confiable. En la industria se utilizan tres tipos de diseños fundamentales de experimentación estadísticamente diseñados, que son:

a) Diseños Factorialesb) Diseños Rotablesc)Operaciones Evolutivas

Se ha desarrollado un nuevo diseño de mucha utilidad para los procesos industriales al cual he denominado Diseño Severo.

Antes de estudiar con amplitud estos métodos conviene familiarizarse con la nomenclatura utilizada en este campo del análisis estadístico.

A las variables experimentales las llamamos factores, el valor numérico del factor se denomina nivel. La combinación de factores que se utilizan en ciertos ensayos experimentales se llama tratamiento. El resultado del ensayo se llama efecto.Si la cantidad de material que se procesa es limitada, de manera que resulta necesario utilizar varios lotes de material, cuyas características son similares pero no idénticas, cada lote se llama bloque. Si el mismo experimento se repite en las mismas condiciones se llama replica.

La aplicación de estas técnicas a una estrategia experimental puede ilustrarse considerando la optimización de las consideraciones operativa de un proceso.

Ejemplo 6.50Todo proceso científico, tecnológico y social esta vinculado bajo el siguiente esquema:

Palacios C. Severo

a) El insumo varia por su calidad, cantidad y la variedad.

b) El proceso varia si es continuo (dinámico) o Bach (estacionario).c) El control si es de calidad, de rendimiento o eficiencia (cualitativo o cuantitativo).

Donde al variar el insumo en el proceso el control es muy distinto para cada caso.

Proceso

Factores externos

R espuesta(Salidas)

Factorescontrolables

( Entradas)Diseño

Ejemplo 6.51Se lixivia un desecho minero conocido como cola (relave, desecho, desmonte) con alto contenido de plata, estaño, plomo y cobre. En medio ácido bajo dos procesos distintos:

a) Clorurado en donde los componentes lixiviados fueron complejos de plata.

b) Nitratado en donde se forma compuestos de nitrato de plata.Siendo el insumo el desecho de mineral a diferentes dosificaciones de cloruros y nitratos.

El procedo viene a ser la disolución al dosificarse el cloruro o nitrato en medio ácido, a fin de disolver la plata en forma de complejo clorurado de plata o nitrato de plata.

El vector de control viene a ser la recuperación del metal valioso (plata) de la cola (relave, desecho, desmonte).

La recuperación de la plata de los dos medios acuosos (insumo en donde esta la plata en forma ionica) se efectúa por medio de la

precipitación (cementanción) con chatarra de hierro obteniéndose los siguientes productos respectivamente.

++ +↓→+ 222 FeAgOFeAg

++ +↓→+ 222 FeAgFeAg

Dos productos distintos en donde el insumo es el mismo, produciendo un control distinto en la recuperación del metal valioso, en cada tipo de medio acuoso.

Problema

(177) En un centro educativo se ve el rendimiento académico de los estudiantes alimentados y desnutridos, Obteniéndose el gráfico asintótico ascendente y descendente respectivamente.¿Evalué el insumo en el proceso de aprendizaje?

(178) Se procesa un mineral aurífero con dos reactivos con el fin de evaluar el rendimiento de recuperación de oro de dicho material.¿Plante un diseño factorial para el presente proceso?

Palacios C. Severo

(179) Se realiza la comparación de dos procesos para la recuperación de oro, siendo el proceso convencional la cianuración y el proceso innovativo el Proceso SEVERO.Plantee un diseño experimental para los procesos mencionados.

(180) Se tiene una solución ácida de cloruro de plata y desea precipitarse electrolíticamente dicho metal, se pide al lector que factores influyen en dicho proceso y a que niveles trabajaría.

(181) Al problema 169 en vez del proceso electrolítico se desarrolla el proceso de cementación con chatarra de hierro, que factores y niveles utilizaría para desarrollar el proceso.

(182) Se tiene una solución ácida de cobre, del cual se quiere recuperar el cobre por vía electrolítica, se pide que se evalué dos factores: densidad de corriente y concentración de cobre.¿Proponga un tipo de diseño?

(183) Se quiere recuperar cobre de una solución ácida, para el cual se adiciona chatarra de hierro, el cobre producto de dicha precipitación es de calidad comercial, a partir de dicho cobre se desea producir sulfato de cobre de calidad comercial.¿Elabore un diseño que produzca una sola variación con los dos productos obtenidos?

II. DISEÑOS BIFACTORIALES

Por diseño Bifactorial se entiende aquel en el que se investigan todas las posibles combinaciones de los niveles de los factores, en cada ensayo completo o réplica del experimento.

Por ejemplo, si existen a-niveles del factor A y b-niveles del factor B, entonces cada réplica del experimento contiene todas las ab combinaciones de los tratamientos. A menudo, se dice que los factores están cruzados cuando éstos se arreglan en un diseño factorial.

El efecto de un factor se define como el cambio en la respuesta producida por un cambio en el nivel del factor. Este se conoce como efecto principal.

Ejemplo 6.52Consideremos los datos de la tabla 6.34. El efecto del factor A es la diferencia entre las respuestas promedio en el primero y segundo nivel de ese factor.

Tabla 6.34 Experimento factorial

a) Interactivo

Factor B

b) Sin interacción

Factor B

Numéricamente

[ ] [ ] 5,62/542/1012 =+−+=A

Interpretando este resultado nos indica que incrementando el factor A del nivel 1 al 2 produce un cambio en la respuesta promedio de 6,5 unidades.

Para el efecto B:

Palacios C. Severo

[ ] [ ] 5,02/1242/105 −=+−+=A

Interpretando este resultado indica un decremento del factor B del nivel 1 al 2 produciendo un cambio en la respuesta promedio de -0,5 unidades.

Como en este caso la diferencia en la respuesta entre los niveles de un factor no es la misma en todos los niveles de otros factores. Cuando esto ocurre existe una interacción entre los factores.

Gráficamente podemos visualizar este fenómeno,

Interactivo Sin Interacción

Ejemplo 6.53Un investigador diseña un calefactor eléctrico para mantener constante la temperatura de una Piscigranja debiendo este ser sometido a ciertas variaciones de temperatura. El único parámetro de diseño que él puede seleccionar en este punto es el material de la cubierta de calefacción, y tiene tres alternativas. Cuando el calefactor se manufactura y se envía a la Piscigranja, el investigador no tiene control sobre los extremos de temperatura a que será expuesto, sabe por experiencia que es probable que la temperatura influya en la duración efectiva del calefactor.El investigador decide probar los tres materiales de la cubierta a tres niveles de temperatura ( 2°C, 8°C y 12°C). Se prueban tres calefactores a cada combinación de material de la cubierta y temperatura y las 36 pruebas se ejecutan al azar.

En la tabla 6.35 se presenta el experimento y los datos resultantes de duración observada de los calefactores.

Tabla 6.35 Datos para el experimento del calefactor eléctricoMateria Temperatura Yi

l 2 8 12

7058 230

150126

188126 623

138168

110160 576 1429

2136106

122115 479

7045 198

155180 539 1216

4075 229

150139

174120 583

10460 342 1154

Total 938 1404 1457 3799

79,7764636/37996082...7020 22222 =−++++=totalSC

[ ] 72.1068336/37994*3/115412161429 2222 =−++=materialSC

[ ] 72,3911836/37994*3/14571404938 2222 =−++=aatemperaturSC

[ ] ( ) 78,961372,3911872.1068336/37994/342...230 222

int =−−−++=eracciónSC

75,1823078,961372,3911872,1068397,77646 =−−−=errorSC

En la tabla 6.36 se muestran los resultados del procedimiento.

Tabla 6.36 Análisis de varianzaFuente SC GL CM Fo Ft(99) Ft(95)Material 10683,72 2 5341,86 7,91 5,53 3,37Temperatura

39118,72 2 19558,36 28,97 5,53 3,37

Interacción 9613,78 4 2403,94 3,56 4,14 2,74Error 18230,75 27 675,21Total 77646,97 35

Se concluye que no existe interacción para un Ft(99)=4,14 entre el tipo de material y la temperatura. Además son significativas los efectos principales del tipo de material y la temperatura para Ft(99)=5,53. En cambio para Ft(95) existe interacción así como influencia de los efectos principales.

Palacios C. Severo

Temperatura

Tipo 1

Tipo 2

Tipo 3

Gráfica de tipo de material contra temperatura.

Como una interpretación auxiliar de los resultados en este experimento resulta útil la construcción de una gráfica de las respuestas promedio en cada combinación del tratamiento.

El hecho de que las rectas no son paralelas indica una interacción significativa tan solo para Ft(95). En general a menos temperatura, mayor duración, independiente del tipo del material.

Al variar la temperatura de baja a intermedia la duración aumenta con el material tipo 2 mientras que disminuye con el material tipo 1 y 3. Cuando la temperatura varia de intermedio a alta, la duración disminuye con los materiales tipo 3 y 2, mientras que con el tipo 1 permanece sin cambio, al parecer, el material tipo 2 da los mejores resultados.

III. COMPARACIÓN MÚLTIPLE

Si el análisis de varianza indica que hay diferencia en el nivel medio de los renglones y columnas, es de interés llevar a cabo comparación entre las medias individuales de renglón y columna para describir las diferencias significativas.

Y22 = 9,8 Y32 = 10,8 Y12 = 15,4

Error estándar de cada promedio

99,124/21,675/ === NCMS erroriY

Del apéndice obtenemos los valores críticos para 27 GL y 95% de significación

80,3799,12*91,2)27,2(05,0 ==r 75,3999,12*06,3)27,3(05,0 ==r

Tabla 6.37Tratamiento Y22 Y32

Yij 9,8 10,8Y12 21,6 11,8 10,8Y32 17,6 7,8

Y1 y Y3 no existe diferencia significativa

El modelo estimado para el presente caso es:

Material Y1Coeficientes de los contrastes ortogonales

Lineal Cuadrático123

142912161154

r 1 3Efecto ΣCiY 275 151

SC[(ΣCiY)2/n ΣCi2] 12604,16 1266,72

164,25)6(3/151*3/

83,45)2(3/275/

52,10536/3799/

==∑ ∑=

−==∑ ∑=

==∑=

CnYCSC

El modelo del polinomio ortogonal es:

21 164,2535,7911,225 XXY +−=

Tabla6.38 Análisis de varianzaFuente SC GL CM Fo Ft(65

)Material 10683,72 4 5341,86 7,91 > 3,36Lineal 12604,16 1 12604,16 18,6

6> 4,22

Cuadrático 1266,72 1 1266,72 1,83 4,22Error 18230,75 27 675,21Total 31

El efecto lineal es significativo.

22,59413intmod =++= eraccióntempmaterialelo scSCSCS

Palacios C. Severo

765,0/mod

2 == totalelo SCSCR

IV. DISEÑO ANIDADO

En ciertos experimentos multifactoriales, los niveles de un factor son similares pero no idénticos pero diferentes del otro factor. Tal arreglo se conoce como diseño anidado con los niveles del factor.

Ejemplo 6.54Un industrial compra materia prima por lotes a tres proveedores. La pureza de la materia prima varia considerablemente, lo cual causa problemas en el control del producto terminado. Se desea determinar si la variabilidad en la pureza puede atribuirse a diferencias entre los proveedores. Cuatro lotes de materia prima de cada proveedor se seleccionan al azar y se hacen tres determinaciones de la pureza sobre cada lote. Esto por supuesto, corresponde a un diseño anidado. Los datos después de codificarse aparecen en la tabla.

Tabla 6.39Lote Proveedor I Proveedor II Proveedor III

1 2 3 4 1 2 3 4 1 2 3 4949293

919089

919394

949793

949190

939795

929391

939695

959793

919395

949295

969594

Tlote 279

Tproveedor 1111 1120 1130

31,14836/3361313935 2 =−=totalSC

[ ] 06,1536/33618*4/113011201111 2222 =−++=proveedorSC

[ ] [ ] 92,698*4/1130112011113/285281...270279 2222222 =++−+++=loteSC

[ ] 33,633/285281...270279313935 2222 =++++−=errorSC

3436: === mnNGL

351: =−NTotal

21:Pr =−moveedor

9)1(: =−nmLote

24)12(: =−mnError

LCM Fo Ft(99)

Proveedor 15,06 2 7,53 0,97

< 2,26

Lote 69,92 9 7,77 2,94

> 2,26

Error 63,33 24 2,64Total 148,31 35

Palacios C. Severo

Problemas

(184) Un ingeniero de procesos sospecha que el acabado de una pieza no metálica (polietileno) depende de la alimentación y la temperatura. Selecciona tres niveles de alimentación y eligió aleatoriamente cuatro niveles de temperatura a continuación se realiza un experimento Bifactorial.

Alimentación m/min

Temperatura (°)160 180 200 240

0,508608076

746460

9910496

9810899

0,63599110111

1198892

1049995

928688

0,76299110107

9810488

114108110

10488102

Analice los datos.Elabore una gráfica de los residuos.Estime los componentes de varianza con la temperatura.

(185) Se estudian factores que influyen en la resistencia de ruptura de una fibra. Se eligen al azar tres maquinas y dos operarios y se realiza un experimento Bifactorial usando la fibra de un mismo lote de producción.

OperarioMaquina

1 110111

111109

114112

2 112115

114119

120117

(186) Un ingeniero electromecánico estudia la fuerza producida por un torno. Sospecha que los factores más importantes son las revoluciones del motor y la alimentación. Se selecciona aleatoriamente cuatro niveles de alimentación y se usan los niveles de velocidad de rotación baja y alta para representar las condiciones de operación extrema. Analice los datos.

VelocidadTorno

Rapidez alimentación0,15 0,30 0,45 0,60

9802,852,80

2,862,87

2,942,88

2,832,86

12002,452,44

2,702,78

2,752,86

2,602,72

(187) Se realizó un experimento para determinar si la temperatura influye en la cocción de un azulejo ordinario producto de arcillas contaminadas.

AzulejoTemperatura °C

800 850 900

198810261004

526538532

528547521

2106310801043

565510590

570565583

(188) Un fabricante esta estudiando la tasa de combustible para tres tipos de estufas. Se seleccionan aleatoriamente tres lotes de combustible y se recopilan cuatro observaciones de la razón de calefacción en cada lote. Analice los datos y obtenga conclusiones.

LoteProceso I Proceso II Proceso III

1 2 3 1 2 3 1 2 315252026

16192820

13151714

35191714

27252421

25182117

25141520

27352129

33385450

(189) Un Ingeniero está estudiando el calibrado y afino de un embolo producido por tres fresadoras. Cada fresadora tiene 2 ejes. Se seleccionan aleatoriamente cuatro componentes de cada eje. Analice los datos.

LoteProceso I Proceso II Proceso III

1 2 1 2 1 2910816

15131914

10111312

10121114

1515148

9111212

Palacios C. Severo

V. DISEÑOS FACTORIALES

El término experimento factorial o arreglo factorial hace referencia a la constitución de los tratamientos o combinaciones de tratamientos que se desean comparar. Este término no afecta lo que se conoce como diseño de tratamientos, pues este se refiere a la selección de factores que se desean estudiar los niveles de los factores a ensayar y combinación de éstos.

De esta forma se debe dejar en claro que el diseño de tratamientos es independiente del diseño experimental, el cual hace referencia a la manera en que los tratamientos se aleatorizan a las diferentes unidades experimentales y la forma como se controla la variabilidad natural de las mismas. Así el diseño experimental puede ser completamente aleatorizado, bloques completamente aleatorizados, cuadrados latinos, etc., y para cada uno de éstos diseños se puede tener un arreglo factorial.

En muchos experimentos el éxito o fracaso del ensayo depende más de la selección de los tratamientos que se desea comparar que de la elección del diseño. Sin embargo, la selección de ambos (del diseño y de los tratamientos) es importante por tanto ninguno de los dos debe descuidarse en la planeación del experimento. En un experimento factorial se investigan simultáneamente los efectos de cierto número de diferentes factores. La necesidad de estudiar conjuntamente varios factores obedece principalmente a dos razones:

a. Encontrar un modelo que describa el comportamiento general del fenómeno en estudio. Esto se restringe al rango de variación de los niveles de los factores.b. Optimizar la respuesta o variable independiente, es decir, encontrar la combinación de niveles de los factores que optimizan esa respuesta.

Los tratamientos en el análisis factorial consisten en todas las combinaciones se forman de los distintos niveles de los factores. Por ello, la característica esencial que hace necesario el estudio conjunto de factores es la posibilidad de que el efecto de un factor cambie en presencia de los niveles de otro factor, es decir, que los factores interactúen, lo cual conlleva al concepto de interacción entre ellos.

Si se estudia un factor en forma separada el resultado puede ser diferente al que daría con un estudio conjunto, y es mas difícil describir el comportamiento general o encontrar el óptimo.Ejemplo 6.55Se presenta un experimento de factores por separado que consiste en determinar las condiciones óptimas de almacenaje de los pescados en barcos pesqueros. Los factores estudiados fueron: temperatura, duración y método de empaque (proporción de hielo y pescado). La respuesta de interés es una medida de la calidad del pescado al descargue.

Al investigar únicamente la temperatura se debe tener varios niveles de temperatura y mantener constante la duración y el empaque a niveles arbitrarios. Una vez obtenida una temperatura óptima (manteniendo los niveles constantes de duración y empaque) se investiga otro factor, por ejemplo el empaque con la temperatura óptima y un nivel arbitrario de duración. Si el empaque óptimo encontrado no es el que se seleccionó en la primera etapa se deberá estudiar de nuevo la temperatura haciéndose necesario ajustes sucesivos.

Si el tiempo de obtención de la variable respuesta es corto y barato se puede seguir este procedimiento secuencial, en caso contrario es más conveniente el uso de experimentos factoriales.

Los diseños experimentales factoriales son ampliamente utilizados por agrónomos, químicos, metalúrgicos, físicos, economistas, sociólogos, industriales, ingenieros y científicos. Ya sea en el laboratorio, planta piloto o nivel industrial.

PruebaCombinació

nNotación 2

A B C1234

Palacios C. Severo

Los diseños factoriales son particularmente útiles en la primera fase del trabajo experimental, cuando es comprobado que hay muchos factores por investigar. Conlleva el menor número de corridas con las cuales pueden estudiarse n-factores en un diseño factorial completo. Debido a que sólo hay dos niveles para cada factor, debe suponerse que la respuesta (rendimiento, calidad, recuperación) es aproximadamente lineal en el intervalo de los niveles escogidos de los factores.Si cada variable es continua, existen dos niveles el superior e inferior.

Las notaciones arriba mencionadas son obtenidas para asignar los niveles superior e inferior de los factores. La combinación 1 indica que todas las variables están en su nivel inferior. Las variables que no aparecen en el resto de combinaciones están en su nivel inferior. La combinación a indica los valores superior e inferior por + y - respectivamente. Un diseño experimental 2n puede combinarse geométricamente y cada combinación experimental corresponde a un punto en el espacio cartesiano cuyas coordenadas son ±1.

VI. DISEÑO FACTORIAL 2n

Los diseños factoriales se usan ampliamente en experimentos que incluyen varios factores cuando es necesario estudiar el efecto conjunto de los factores sobre la respuesta. Hay varios casos especiales del diseño factorial que son importantes debido a su uso generalizado en el trabajo de investigación y porque constituyen las bases de otros diseños de gran valor práctico.

El más importante de estos casos especiales es el de n factores, cada uno con sólo dos niveles. Si todos los factores se estudian con dos niveles, se dice que es un experimento factorial 2n. Los niveles de estos factores pueden ser cuantitativos o bien cualitativos.

La selección de únicamente dos niveles puede conducir a inferencias erróneas.

Así cuando la respuesta se afecta en forma cuadrática, los niveles estudiados pueden indicar que no efecto el factor. Este es un riesgo que se corre al usar dos niveles por factor.

Diseño factorial 2n simpleEn el caso de n = 2, se tiene el factorial más sencillo 22.

VII. DISEÑO FACTORIAL 22

A este diseño se le llama diseño factorial 22. Los niveles de los factores pueden denominarse arbitrariamente mínimo y máximo.

Se tienen cuatro tratamientos que se denotan por cualquiera de los siguientes símbolos.

El primer diseño de esta serie, es aquel que tiene Sólo dos factores, A y B, Cada uno con dos niveles, con cuatro combinaciones en el plano.

Ejemplo 6.56Un investigador desea estudiar la influencia de la temperatura y el tiempo de acondicionamiento en un experimento. Su vector respuesta Y¡ es la recuperación del proceso.

Factores NivelesA = Temperatura (°C)B = tiempo (min)

El número de experiencias de 22 = 4 y el diseño será:

Tabla 6.41 Notación de un diseño 22

PruebaCombinació

nDiseño Niveles

YiX1 X2 A B123

208020

658070

Palacios C. Severo

4 ab + + 80 3 85

El análisis del diseño 22 nos permite obtener información sobre los efectos e interacciones de las variables.

Efecto A = [-1+a-b+ab]/2 = [-65+80-70+85]/2 = 15Efecto B = [-1-a+b+ab]/2 = [-65-80+70+85]/2 = 5Interacción AB = [+1-a-b+ab]/2 = [65-80-70+85]/2 = 0

El efecto principal se calcula simplemente de las diferencias de los promedios de las respuestas cuando el efecto A esta en su nivel superior, menos el promedio de las respuestas cuando A está en su nivel inferior.

No existe interacción con los factores en estudio.Ejemplo 6.57Se desea evaluar un proceso donde se estudian dos factores a tres niveles. Para evaluar el error se corren pruebas centrales.

A: 8 9 10B: 90 115 140

Tabla 6.42 Notación de un diseño 22 con pruebas centrales

PruebaCombinació

nDiseño Niveles

YiX1 X2 A B1234567

-+-+000

--++000

810810999

9090140140115115115

80828695899091

Para determinar la varianza media del error, evaluamos los puntos 5, 6 y 7 bajo la siguiente expresión:

( )( )11

−∑−

−∑=

919089 22222 =−++=S

Efecto A = (-80+82-86+95)/2 = 5,5Efecto B = (-80-82+86+95)/2 = 9,5

Interacción AB = (+80-82-86+95) = 3,5

Ejemplo 6.58En una investigación se desea evaluar el efecto del SO2, sobre una población cercana a una empresa minera que monitorea dicho contaminante para lo cual estudia a la salida de la chimenea, la altura de la chimenea, la velocidad del viento y la distancia promedio a la población respecto de la chimenea y la dirección del viento. Los niveles elegidos para evaluar cada uno de los factores son los siguientes.

FactoresNiveles

- 0 +Q: Tasa de emisividad (g/s)H: Altura de chimenea (m)V: Velocidad del viento (m/seg)X: Distancia (m)

120457.5650

606010

La concentración de SO2 viene expresada por la relación:

5,0exp10

Donde:

k1 = 36; k2 = 18,5: son constantes de proporcionalidad.

Ejemplo 6.59

Un estudioso desea conocer la influencia de la temperatura y el tiempo de acondicionamiento en un experimento. Particularmente está interesado en entender como al elevar la temperatura del acondicionador cambia las características del medio produciendo un conjunto de condiciones no favorables para el proceso.

FactoresNiveles

- +A: Tiempo (min)B: Temperatura (°C)

Se evalúan dos factores fijados a dos niveles, es decir se decide utilizar un diseño factorial completo, en donde N = 2n = 22 = 4 experimentos. Los valores de las variables a experimentar se codifican con valores +1 y –1. Con los recursos que se dispone se decide realizar el experimento por triplicado. Los resultados se visualizan en la siguiente tabla.

Palacios C. Severo

Tabla 6.43 Notación de un diseño 22 replicadoPrueb

aA B Recuperación

30603060

10103030

0,170,220,300,37

0,160,200,290,36

0,150,210,310,38

Tabla 6.44 Efecto e interaccionesEfectos Interacciones

A = 0,06B = 0,15

AB = 0,01Bloque = -0,015Bloque = 0,005

Basado en 1 grado de libertad

LCM Fo Ft(99)

ABABBloqueError

0,01080,06750,0003

0,000350,00045

0,01080,06750,0003

0,0001750,00007

144,00900,0

04,002,33

13,7413,7413,7413,74

Total 0,0794 11 R2 = 99,4332%

Ejemplo 6.60Se estudia un proceso electrolítico en donde interactúan dos factores: densidad de corriente y temperatura, en la tabla 6.46 se dan las respuestas y los niveles de trabajo.

Tabla 6.46 Notación de un diseño 22 con pruebas centrales

PruebaExperimento

YX1 X2

1234567

0,50,70,50,70,60,60,6

646466

353535

68,7267,8569,6069,4468,7368,7268,74

Varianza del error

[ ] [ ] 0001,06/16,2062/74,6872,6873,68 22222 =−++=S

el modelo lineal viene representado bajo un estudio de Yates.

2121 1775,06175,025,083,68 XXXXY ++−=

Ejemplo 6.61La remoción del cobre y la recuperación de cianuro de los efluentes de cianuración son, sin duda de gran interés desde el punto de vista ambiental y económico.

En este ejemplo se estudian dos objetivos, el primero es la evaluación preliminar de utilizar aminas para eliminar el cobre de las soluciones de cianuración por medio de la formación de un sólido que pueda separarse fácilmente por filtración. El segundo es hacer una evaluación con diferentes aminas seleccionando la mejor y realizar un diseño experimental 22 utilizando como variables el pH y la cantidad de reactivo adicionado para el compuesto que de mejores resultados en la evaluación preliminar.

Los experimentos preliminares consistieron en adicionar 0,025 g de cada uno de los compuestos a 100 ml de solución a pH 12 y 8. Después de filtrar las soluciones con papel de filtrado lento (tamaño de poro de 1,5 micrones) se analizó el cobre remanente por absorción atómica. Una vez seleccionado el mejor compuesto, se realizó un diseño de experimentos factorial 22 utilizando como variables el pH (9 y 12) y la concentración del compuesto (0,25 y 5 g/L). Todas las pruebas de este diseño experimental se realizaron por triplicado.

Amina FórmulaQuartamin 2050Quartamin 60DodecilaminaQuartamin D86P

R-N(CH3)3ClR-N(CH3)3Cl

CH3(CH2)11NH2

2R-N(CH3)3Cl

NivelesFactores - +

X1: pH soluciónX2: Amina (g/L)

PruebaExperimento

Remoción cobre (%)X1 X2

912912

0,250,25

9,510,05

60,2555,54

9,000,0961,6355,12

9,970,0561,2756,87

Palacios C. Severo

Efectos estimados para YEfectos Interacciones

X1: pH = -53,683X2: Amina = -7,318

AB = -2,1116Bloque = -0,305Bloque = 0,855

Errores estándar con 6 GL

El primer paso para interpretar los efectos principales es comprobar que la variación observada en la respuesta es debida a un efecto real de cada factor y no al error experimental. Para no entrar en detalles, se considera que los dos efectos no son significativos y que no parecen fruto de la imprecisión de la experimentación. No existe interacción entre los factores.

Análisis de varianzaFuente SC G

LCM Fo Ft(99)

X1: pHX2: AminaX1X2

BloqueError

8640,87160,67413,37741,126552,03945

8640,87

160,67413,37740,563270,3399

25421,18

472,7039,361,66

13,7413,7413,7413,74

Total 8818,09 11 R2 = 99,9769%

Valor óptimo = 61,05Facto

rBajo Alto Óptim

opHAmina

9,00,25

12,05,0

9,00,25

2121 2963,05712,11115,17327,215 XXXXY −+−=

De aquí puede verse que la amina y no así el pH afectan la eficiencia de eliminación de cobre. Un aumento en la cantidad de amina incrementará la remoción de cobre, de la misma manera que lo hará una disminución del pH.

El efecto más importante es el de la cantidad de amina, por lo que valdría la pena explorar cantidades mayores a las estudiadas en este trabajo.

9Amina

Gráfica de Efectos Principales para Y

pH12 0.25

Amina=0.25Amina=5

Gráfica de Interacción para Y

Amina=0.25

Amina=5

Grafico de efectos principales Interacción de efectos principales

En el gráfico de efectos principales vemos que el pH no tiene efecto significativo, la Amina tiene efecto significativo.

No existe interacción en el rango (niveles) trabajado, pero existe interacción a niveles inferiores de ambos factores.

Contornos de la Superficie de Respuesta Estimada

9 9.5 10 10.5 11 11.5 12

Y0.0-8.08.0-16.016.0-24.024.0-32.032.0-40.040.0-48.048.0-56.056.0-64.064.0-72.072.0-80.080.0-88.0

Superficie de Respuesta Estimada

9 9.5 10 10.5 11 11.5 12pH

Amina0

Y0.0-8.08.0-16.016.0-24.024.0-32.032.0-40.040.0-48.048.0-56.056.0-64.064.0-72.072.0-80.080.0-88.0

Gráfico lineal con punto óptimo Gráfico espacial con punto óptimo

En el gráfico lineal y espacial se puede visualizar la región óptima del proceso.

Problemas

(190) Se presume que el efecto del pH y la temperatura en el rendimiento de cierta reacción química no son independientes. Para determinar el grado de relación entre los factores estudiados (pH, T), se realizó un diseño experimental 22 donde se evalúan dos niveles de cada uno de estos factores y se mide el % de rendimiento de la reacción. Acá se muestran las condiciones del diseño, la matriz del mismo y los resultados experimentales de 2 determinaciones paralelas:

Rendimiento (%)

Palacios C. Severo

pH T (°C) Replica I Replica II--++

45732330

47712633

Haciendo uso del análisis de varianza, confirme el resultado.Escriba la ecuación de regresión teniendo en cuenta solamente los términos significativos.Analice los efectos principales de los factores estudiados y de la interacción entre estos sobre el rendimiento mediante los gráficos correspondientes.Determine las condiciones experimentales óptimas de T y pH que permiten obtener el mayor rendimiento.

(191) Se llevó a cabo una investigación para estudiar el efecto que tienen la concentración de un reactivo cR y la presencia de un catalizador K sobre el rendimiento de un proceso químico. El estudio se realizó mediante un diseño factorial 22 en las siguientes condiciones experimentales:

Rendimiento (%)cR mK Replica I Replica II Replica III-+-+

28361831

25321930

27322329

Analice de manera cualitativa la significación de los factores de interés (cR, mK) y la interacción cRmK sobre el rendimiento de la reacción estudiada y compruebe estadísticamente el resultado de su análisis.Escriba la ecuación de regresión obtenida. ¿Qué información le brindan los signos de los coeficientes de la ecuación? ¿De que tipo es la interacción cRmK?.Analice los gráficos de efectos principales de los factores estudiados y de la interacción entre estos sobre el rendimiento. Determine las condiciones experimentales óptimas de cR y mK

para obtener el mayor rendimiento. Reporte el valor del rendimiento y su intervalo de confianza en estas condiciones.

(192) En la determinación potenciométrica simultánea de NH3 y CO2 con HCl se desea estudiar la influencia de Co(II) y Ni(II) presente en la muestra sobre los resultados obtenidos. Con este objetivo se realizan dos diseños experimentales 22 para estudiar el efecto de Co(II) y Ni(II) sobre la determinación del NH3 y sobre la determinación de CO2. Las condiciones del diseño son las siguientes:

NH3 CO2

Ni(II)

Co(II)

NH3 Ni(II) Co(II)

75,936,766,8

76,136,5

56,956,756,556,8

57,256,456,756,7

Analice de manera cualitativa la significación de los factores de interés (concentración de Ni y de Co) y la interacción entre estos sobre el resultado de la determinación de cada uno de los compuestos químicos analizados. Compruebe estadísticamente el resultado cualitativo obtenido.Escriba la ecuación de regresión obtenida. ¿Qué indican los signos de los coeficientes de la ecuación? ¿Cómo es la interacción Ni(II) Co(II)?.Analice los gráficos de efectos principales de los factores estudiados y de la interacción entre estos. Determine cuales son las condiciones experimentales óptimas tal que no se afecte la determinación de NH3 y de CO2.

(193) Se desea estudiar el efecto sobre el rendimiento (expresado en %) de un proceso químico para obtener un compuesto inorgánico de tres factores de manera simultánea: concentración de un reactivo, pH de la mezcla reaccionante y temperatura de reacción. Con este objetivo se diseña un experimento factorial 23 bajo las siguientes condiciones experimentales:

C (mol/L) pH T (°C) Rendimiento (%)-+-+-+-+

--++--++

----++++

56,052,537,854,269,072,049,170,6

58,054,239,453,066,070,848,271,9

59,655,540,155,667,574,547,073,2

Afectan de manera significativa los factores estudiados el rendimiento del proceso bajo investigaciónActúan de manera independiente estos tres factores sobre el rendimiento de la reacciónCuáles son las condiciones experimentales óptimas

(194) Un método nuevo de determinación de manganeso (Mn) fue desarrollado para conocer el contenido de este elemento en un mineral. Para validar el método se tomaron 8 muestras

Palacios C. Severo

homogéneas del mineral y se determinó el porcentaje en masa de Mn por dos laboratorios diferentes. Los resultados obtenidos son:

A B Mn (%)-+-+

1,701,751,681,72

Suponiendo que el contenido real de Mn en la muestra es de 1.71 %, compare el mismo con cada una de las 2 medias experimentales (en caso de existir diferencias significativas entre estas).

(195) En muestras de licores amoniacales de níquel, obtenidos en la industria niquelífera mediante la digestión de los minerales, se determinó el contenido de este elemento por tres métodos analíticos diferentes: gravimetría, colorimetría y complejometría. Los resultados en % de níquel se encuentran abajo:

A B C Mn (%)Gravimetrí

aColorimetrí

aComplejometrí

a-+-+-+-+

--++--++

----++++

1,761,801,481,271,601,741,272,18

4,444,065,794,344,645,125,574,39

1,781,852,121,401,721,601,581,23

Cuáles de los métodos pueden emplearse para la determinación de Ni

(196) Consideremos un experimento donde el objetivo es estudiar la relación entre la frecuencia de oscilación de un reloj de cuarzo patrón y las condiciones de humedad y temperatura. En este caso el instrumento ya cuenta con un dispositivo para minimizar los cambios de temperatura, dado que los fabricantes conocen su impacto en la frecuencia de oscilación. Los factores seleccionados son temperatura (T) y humedad (H) y sus niveles de prueba se eligen de acuerdo a las condiciones del laboratorio; en este caso los niveles de temperatura son (22oC, 24oC) y para la humedad (20%, 50%).

La variable de respuesta es la frecuencia de oscilación (Y). El diseño experimental seleccionado es un factorial completo 22 con punto central que se muestran a continuación.

Prueba

Temperatura(°C)

Humedad(%)

Frecuencia (Hz)

123456

222422242323

202050503535

9,97069,9706997049,97029,97049,9692

En particular en el estudio presentado se muestra cómo evaluar experimentalmente la incertidumbre dada por el fabricante de un equipo para verificar su magnitud en las condiciones del propio laboratorio. Este tipo de estudios podrían llevar a mejoras tanto de los equipos como de las instalaciones del laboratorio, buscando tener un menor impacto de las fuentes de incertidumbre detectadas como las más importantes.

(197) En la definición de las variables de estudio de electrodeposición de oro se tuvo en cuenta las condiciones impuestas por el proceso previo de desorción de oro, sobre todo en aquellas que tienen que ver con el electrolito, como la concentración de oro, la concentración de cianuro de sodio e hidróxido de sodio, la conductividad, el pH y la temperatura. Con estas queda definida la referencia base para la selección y rango de las variables de estudio.Entre las variables mencionadas se seleccionaron el potencial aplicado, la concentración de hidróxido de sodio y la Densidad de corriente catódica como las de mayor interés para este estudio, y como variables de respuesta se consideraron la eficiencia de corriente, el consumo de potencia, la cinética de la deposición del oro y su recuperación.

FactoresNiveles

- +Potencial (Vols)NaOH (g/L)DC (A/cm³)

Prueba

Potencial(Vols)

NaOH(g/L)

DC(A/cm³)

Consumo energía

(Watt-h)Tiempo (min)

2,53,52,53,52,5

1010202010

0,0250,0250,0250,0250,075

3,439,384,3313,943,29

115,078,7

108,576,078,9

Palacios C. Severo

3,52,53,53,03,03,03,03,0

1020201515151515

0,0750,0750,0750,0500,0500,0500,0500,050

9,385,73

15,667,797,646,877,756,70

78,7173,9113,288,987,480,393,880,0

Se pretende minimizar el tiempo del proceso, de consumo de energía (mayor eficiencia de corriente) y menor cantidad de hidróxido de sodio a fin de optimizar las condiciones por medio de las ecuaciones logradas. Esto redunda en un beneficio económico y practico para la recuperación electroquímica de oro.

(198) El reciclado electroquímico de los compuestos de partida en disolución ácido se ha monitorizado por análisis de la DQO (demanda química de oxígeno), cromatografía de placa fina, análisis de CG-MS y por espectroscopia de UV-VIS.El tiempo de cada electrólisis se ha calculado para circular la cantidad teórica de electricidad necesaria para oxidar completamente el sustrato, a partir de las leyes de Faraday, y una concentración de sustrato a tratar de 0,015 M en un volumen de 150 cm3. El tiempo de reacción se ha prolongado para aquellos casos en que se observó un mejor comportamiento de la disminución de la DQO al aumentar la carga eléctrica.El plan experimental escogido para estudiar la influencia de las principales variables de reacción es un diseño factorial completo 23 con ocho barridos experimentales, donde las variables escogidas y sus niveles fueron la temperatura (25 y 40ºC), la concentración de electrolito (50 y 96%) y la densidad de corriente (500 y 1000 A/m2).

FactoresNiveles

- +X1: Temperatura (°C)X2: Concentración (%)X3: DC (A/m²)

Prueba

Temperatura(°C)

Concentración

(A/m²) DQO1234567

25402540254025

50509696505096

500500500500

100010001000

32487725

3075285227756525867

8 40 96 1000 4425

La tecnología propuesta se presenta como una técnica universal para degradar compuestos nitratados aromáticos en contra de la biodegradación, en la que las especies microbianas encargadas de degradar son específicas para cada contaminante concreto y mucho más versátil y cómoda de escalar y diseñar a nivel industrial que tecnologías basadas en sistemas fotocalíticos.Del estudio experimental de la degradación de los sustratos de partida se realizó en base al diseño de experimentos detallados en la tabla adjunta. La influencia de las variables tenidas en cuenta, temperatura, densidad de corriente y concentración de electrolito, así como las interacciones entre ellas, se han estudiado estadística y comparativamente.Se pide demostrar la influencia de dichos factores

(199) El propósito de este estudio fue evaluar la remoción de sólidos totales, presentes en la vinaza (destilado del alcohol), mediante procesos de electrocoagulación-electroflotación utilizando electrodos de aluminio y como variables de operación pH inicial, concentración de electrolito y densidad de corriente.Las variables evaluadas fueron densidad de corriente (DC), pH inicial y concentración de NaCl como soporte electrolítico, todas las variables en dos niveles.Los niveles usados para cada variable fueron: DC 20, 40 y 60 mA/cm2; pH 4, 7 y 9; [NaCl] 0, 2000 y 4000 ppm.

FactoresNiveles

- 0 +X1: DC (mA/cm²)X2: pHX3: [NaOH] (ppm)

Prueba

DC(mA/cm²) pH

[NaOH](ppm)

% Sólidos totalesClarificado Espuma

1234567891011

2060206020602060404040

44994499777

4000400040004000200020002000

0,06630,06590,02450,13010,21390,06480,06580,06470,21090,20910,2173

19,8120,9522,5922,0921,7315,0514,5615,2322,0016,8820,16

22,7323,4924,0023,7722,7717,2517,9218,6923,1216,8019,15

Que factor influye en el mayor desprendimiento de aluminio al desarrollar la electrocoagulación-electroflotación.

Palacios C. Severo

En que región del pH ocurre mejor el proceso.(200) La investigación se desarrolló con las aguas residuales de una

industria láctea de la región. Se tomaron muestras tanto del tanque de descargas, como del tanque de homogeneización; este último toma las aguas del tanque de descarga de las aguas residuales de la empresa y las mezcla. A éstas se le analizaron: pH, DQO, conductividad eléctrica, grasas y aceites. Los análisis se realizaron el mismo día del muestreo; de acuerdo con los resultados, se decidió que las muestras de agua para la investigación serían recolectadas sólo del tanque de homogenización, por ser éste el más representativo en las características fisicoquímicas del agua residual láctea. La experimentación se llevó a cabo en un sistema para electrólisis. Este sistema opera como reactor discontinuo a escala prototipo, con capacidad para tratar dos litros de aguas residuales. Consta de una celda electrolítica de dos litros en la que están sumergidos los electrodos; estos electrodos son placas rectangulares metálicas de hierro y aluminio, dispuestas en paralelo y conectadas a una fuente de voltaje de corriente continua que proporciona la corriente eléctrica requerida para la electrocoagulación.

FactoresNiveles

- 0 +X1: pHX2: DC (A/m²)X3: tiempo (min)

532,43

737,83

843,23

Prueba pHDC

(A/m²)tiempo(min)

DQO(%)

1234567891011

58585858777

32,4332,4343,2343,2332,4332,4343,2343,2337,8337,8337,83

555515151515101010

75,7362,3646,5593,9970,8351,4477,2993,9943,8845,7942,15

La electrocoagulación se vislumbra como un tratamiento eficiente para la remoción de contaminantes en las aguas residuales industriales, específicamente en el caso de la industria láctea como se muestra en esta investigación. Los tres factores bajo estudio (pH, densidad de corriente y tiempo) tienen efecto significativo sobre la remoción de DQO. El

diseño de tres factores es bastante ajustado a los datos. En particular, si se tienen niveles óptimos del estudio para pH, tiempo y densidad de corriente.

(201) La planificación de los experimentos se realizó aplicando el diseño experimental factorial 2n; se analizó la influencia de la temperatura, la relación líquido/sólido y tiempo en la depuración de especies metálicas de efluentes, manteniendo fija la velocidad de agitación. Las variables de respuesta consideradas fueron: porcentaje de extracción de especies metálicas (E) y selectividad (S). Esta última, se determinó como la relación entre la recuperación de un componente dado y el grado de dilución del mineral. La extracción de Ni, Co, Fe y Mn como residuo de la depuración de efluentes. Las condiciones experimentales y niveles de las variables se muestran en la tabla.

FactoresNiveles

- 0 +X1: Temperatura (°)X2: tiempo (h)X3: Líquido/Sólido (L:S)

Condiciones fijas del experimento: Velocidad de agitación 600 rpm; pH 4,06.Los modelos que regulan el proceso son:

9058,87²765,20625,01325,44475,62433,72 21321 =+−++= RXXXXXYNi

5456,96²165,23425,0255,258,30333,81 21321 =++++= RXXXXXYCo

0524,90²61125,151625,10613,1724125,522625,636,71 3221321 =−−−++= RXXXXXXXYFe

9567,95²2425,34925,06675,45,62356,70 21321 =++++= RXXXXXYMn

Elabore un diseño experimental que satisfaga la depuración del efluente

(202) Los residuos sólidos de la lixiviación o colas constituyen un gran problema para el ecosistema de la región industrial; su tratamiento, disposición y manejo son objeto de estudios con el fin de encontrar alternativas para minimizar los impactos negativos al medio ambiente. Una cuestión de interés lo constituye la recuperación de plata y el cobre contenidos en las colas residuales, las cuales son consideradas un mineral de baja ley. Con el objetivo de recuperar especies metálicas de las colas de los procesos de lixiviación, ya sean las resultantes del proceso ácido o del proceso amoniacal, se han realizado estudios de biolixiviación y lixiviación química con ácidos orgánicos

Palacios C. Severo

producidos por los microorganismos en sus procesos metabólicos.En la tabla aparece la matriz experimental correspondiente al plan 23, y un experimento en el nivel central. Con este diseño de experimento se obtuvo el comportamiento de las variables de respuesta Selectividad y Extracción de Ag y Cu. La selectividad se consideró como la relación entre la recuperación de un componente dado y el grado de disolución total del mineral. En todos los experimentos se mantuvieron fijos los parámetros siguientes: relación líquido:sólido: L/S=12/1 cm3 de solución/g de cola; velocidad de agitación: 630 rpm; tamaño de partículas (-0,149+0,074) mm. Se realizó el estudio del comportamiento cinético de la disolución del Ag y Cu. Las muestras de licor de lixiviación se colectaron a determinados intervalos de tiempo, se filtraron y analizaron por espectroscopia de absorción atómica.

FactoresNiveles

PruebaT

(h)L/S

(cm³/g)% Extracción

Ag Cu123456789

306030603060306045

115511553

111199995

62,9671,6069,0782,4064,2470,4563,7287,1278,63

77,3880,5377,9387,3977,5880,0977,3990,9180,10

(203) Se controlaron 3 variables que permitieron conocer las condiciones óptimas del reactor para obtener altos porcentajes de descontaminación y realizar el escalamiento del reactor a nivel industrial. Las variables escogidas para el estudio fueron:

FactoresNiveles

- 0 +X1: [H2O2] (ml/L)X2: Volumen a tratar (L)X3: [TiO2] (mg/L)

Prueba[H2O2](ml/L)

Volumen

[TiO2](mg/L) Radiación

(W/m²)pH Degradación

36,544,5

3,853,91

23,5246,19

34567891011

020202111

1212441212888

200200200200100100100

18,044,8326,0361,8352,8335,4140,1750,8334,17

5,775,413,725,738,435,124,244,24,12

7,3933,0343,3431,8714,86,6216,819,8

Para el estudio de estas variables se realizaron una serie de experimentos donde la variable de respuesta fue el porcentaje de degradación medido como el porcentaje de reducción en la DQO.Del análisis de los datos obtenga el ANAVA, estime la respuesta óptima, además de la superficie de respuesta, que permiten obtener un modelo estadístico que describe el comportamiento del sistema de fotodegradación respecto a las variables experimentales estudiadas y que permitan establecer el grado de confiabilidad de los datos obtenidos.

(204) Se seleccionaron modelos lineales del tipo 2n, en los que n representa el número de variables a estudiar. Para un diseño experimental con 3 variables (pH, dosis de coagulante y floculante), el número de experimentos a realizar es igual a 8.En la tabla se especifica los niveles de cada experimento para una pareja coagulante-floculante determinada. Como se observa en esta tabla los valores probados para el pH son 6 y 9, las dosis de coagulante fueron 20 y 100 mg/L y las del floculante de 0,1 y 1,0 mg/L.

PruebaFloculante

(mg/L)Coagulante

(mg/L)pH

Concentración residualColor DQO

12345678

1001002020

100100

66669999

47,04513

22,5188,5180,540,540,5

84,575,060,555,5

105,5138,582,542,5

Debido a la buena calidad del efluente obtenido bajo las condiciones óptimas determine el modelo de remoción de los parámetros y, con el fin de disminuir el volumen de lodos y los costos del proceso, utilice dicho modelos para realizar un análisis de sensibilidad de respuesta con respecto a la variación de dosis para poder reducir la cantidad de coagulante a aplicar, de tal manera de conservar niveles de remoción aceptables para los derivados.

Palacios C. Severo

VIII. DISEÑO FACTORIAL 23

Cuando se tienen tres factores, A, B y C, con dos niveles cada uno, entonces hay un total de 8 tratamientos en investigación. Al diseño se le llama diseño factorial 23, y en este caso la representación geométrica de las ocho combinaciones de tratamientos puede hacerse con un cubo como se muestra

Diseño factorial 23 simple

Al igual que en el diseño factorial 22, existen tres notaciones diferentes para los ocho tratamientos que son de uso general. La primera es la notación + y -, llamada con frecuencia notación geométrica. La segunda es el uso de las letras minúsculas para identificar las combinaciones de los tratamientos. La tercera notación utiliza 1 y 0 para denotar los niveles alto y bajo, respectivamente, de los factores, en lugar de + y -

En este diseño se estudian tres factores A, B y C cada uno a dos niveles con ocho combinaciones de tratamiento que se representan gráficamente en un cubo.

En este tipo de diseño se asume el error al valor de la mayor combinación, abad.

Ejemplo 6.62En un autoclave se desarrolla un experimento a nivel planta piloto con la finalidad de evaluar la influencia sobre la taza de filtración de un producto, se estudian tres variables.

A: Concentración, B: Temperatura y C: Presión.

Tabla 6.47 Datos para un diseño 23

Prueba

A B C Combinación

12345678

-+-+-+-+

--++--++

----++++

7165606590958696

Tabla 6.48 Efecto e interaccionesEfectos InteraccionesA = 3,5B = -3,5C = 26,5

AB = 4,0AC = 4,0BC = 2,0

Error estándar 1 GL

LCM Fo Ft(99)

ABCABACBCError

24,524,5

1404,532,032,08,04,5

1111111

24,524,5

1404,532,032,08,04,5

5,445,44312,1

17,117,111,78

<<><<<

12,2512,2512,2512,2512,2512,25

Total 1530,0 7 R2 = 99,7059%

Ejemplo 6.63Al ejemplo 6.62 se le adiciona un factor de mezcla en un experimento a nivel planta piloto para estudiar los efectos que influyen sobre la taza de filtración de un producto.

Tabla 6.50 Datos para un diseño 24

Prueba

A B C D Combinación

Palacios C. Severo

12345678910111213141516

-+-+-+-+-+-+-+-+

--++--++--++--++

----++++----++++

--------++++++++

acdbcd

71656065909586968588688083857570

Tabla 6.51 Efecto e interaccionesEfectos InteraccionesA = 3,25B = -7,75C = 12,25D = 0,75

AB = 2,25AC = -0,25BC = 1,25

AD = -0,25BD = -4,25CD = -14,25ABC = -2,75ABD = -1,75ACD = -4,25BCD = -0,75

ABCD = -1,25

Tabla 6.52 Matriz de variables independientesAB AC AD BC BD CD AB

+--++--++--++--+

+-+--+-++-+--+-+

+-+-+-+--+-+-+-+

++----++++----++

++--++----++--++

++++----++++----

-++-+--+-++-+--+

-++--++-+--++--+

--++++--++----++

-+-++-+-+-+--+-+

+--+-++--++-+--+

Los efectos importantes son B, C y CD.

Tabla 6.54 Análisis de varianza

Fuente SC GL

CM Fo Ft(99)

B 240,25 1 240,25

10,79 > 9,33

C 600,25 1 600,25

> 9,33

CD 812,25 1 812,25 36,51 > 9,33Error 267,00 12Total 1919,75 R2 = 86,09%

Ejemplo 6.64Se lixivia un mineral argentífero en una salmuera clorurada, de desea evaluar tres factores con el fin de establecer el efecto significativo de cada uno de dichos factores y el rango de cada uno de ellos,

A: NaCl (gr) 100 150B: H2SO4 (ml) 50 120C: FeCl3 (gr) 15 35

A B C Y100150100150100150100150125125125

50501201205050120120858585

1515151535353535252525

68,7167,3964,9362,1661,0565,8269,2170,3564,1364,8864,27

Tabla 6.55 Efecto e interacciones Efectos interaccione

sA = 0,45B = 0,92C = 0,81

AB =-1,27AC = 2,50BC = 5,42

LCM Fo Ft(99)

ABCABACBCError

0,4141,6921,3123,22512,5

58,5617,792

1111114

0,4141,6921,3123,22512,5

58,5611,948

0,210,870,671,666,4230,21

21,2021,2021,2021,2021,2021,20

Total 85,798 10 R2 = 90,9175%

Palacios C. Severo

BCACABCBAY 0077,0005,00007,0243,1089,0054,083,86 ++−−−−=

Valor óptimo = 70,1382Factor Bajo Alto Óptimo

1005015

15012035

120 35

A150 50

C15 100

100 150

BC50 120

Efectos e interacciones significativas de factores principales

C=25.0

100 110 120 130 140 150