Tema 2. Modelos de diseño de experimentos (varios factores)

Documentos relacionados
DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

ANÁLISIS DE DATOS NO NUMERICOS

Tema 12: Contrastes Paramétricos

ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ

Calculadora de Tamaño muestral GRANMO

1.1. Introducción y conceptos básicos

Diseño Estadístico de Experimentos

ESTIMACIÓN. puntual y por intervalo

Detergente Lavad.1 Lavad.2 Lavad.3 Media A B C D Media

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:

ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

Tema 7: Modelos de diseños de experimentos

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA

Divisibilidad y números primos

Validation. Validación Psicométrica. Validation. Central Test. Central Test. Centraltest CENTRAL. L art de l évaluation. El arte de la evaluación

Covarianza y coeficiente de correlación

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

Indicaciones específicas para los análisis estadísticos.

Datos del autor. Nombres y apellido: Germán Andrés Paz. Lugar de nacimiento: Rosario (Código Postal 2000), Santa Fe, Argentina

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS

Ecuaciones de primer grado con dos incógnitas

Otras medidas descriptivas usuales

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

EXPERIMENTACIÓN. Eduardo Jiménez Marqués

EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral

Tema 3. Comparaciones de dos poblaciones

Parámetros y estadísticos

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

Tema 2. Espacios Vectoriales Introducción

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO

Análisis de los datos

GUIA BASICA DE REGLETAS MATEMATICAS Aprender jugando con regletas matemáticas de Cuisenaire

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz

Lección 24: Lenguaje algebraico y sustituciones

1 Introducción al SPSS

Matrices equivalentes. El método de Gauss

TEMA 4: Introducción al Control Estadístico de Procesos

Inferencia Estadística

ESQUEMA GENERAL DISEÑOS DE MEDIDAS REPETIDAS

Capítulo 7: Distribuciones muestrales

CORRELACIÓN Y PREDICIÓN

TEMA 5 VALIDEZ DE LA INVESTIGACIÓN (II): Validez de conclusión estadística

Aproximación local. Plano tangente. Derivadas parciales.

Física de los Procesos Biológicos Curso 2005/6

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

Definición Se llama suceso aleatorio a cualquier subconjunto del espacio muestral.

Soluciones de los ejercicios de Selectividad sobre Probabilidad de Matemáticas Aplicadas a las Ciencias Sociales II

Análisis de la varianza (un factor): ANOVA

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11

6. DISEÑOS FACTORIALES 2 K NO REPLICADOS

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD.

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

Diseños en cuadrados latinos

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

ANALISIS MULTIVARIANTE

DETERMINACIÓN DEL VOLUMEN DE PEDIDO.

Base de datos en Excel

SPSS: ANOVA de un Factor

SOLUCION DE MODELOS DE PROGRAMACION LINEAL EN UNA HOJA DE CALCULO. PROBLEMAS DE TRANSPORTE Y ASIGNACION.

Colegio Alexander von Humboldt - Lima. Tema: La enseñanza de la matemática está en un proceso de cambio

de la empresa Al finalizar la unidad, el alumno:

Cómo el trabajo afecta sus beneficios

ESTRATEGIA DE DINAMARCA: INFORME SOBRE EL FUTURO DEL ENTORNO LABORAL

Pronósticos. Pronósticos y gráficos Diapositiva 1

Curso Excel Básico - Intermedio

PARTE 3 ECUACIONES DE EQUIVALENCIA FINANCIERA T E M A S

aplicado al Experiencia La gestión de un servicio y, por ende, la

Una serie temporal o cronológica es en una sucesión de valores que adopta una variable (Y):

RESUMEN EJECUTIVO EFECTOS DEL RUIDO EN LA SALUD

Tema 3. Medidas de tendencia central Introducción. Contenido

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos.

Benchmarking de Compensaciones DIRECTOR EJECUTIVO CONFIDENCIAL:

SEMINARIOS. (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

TEMA 4: Variables binarias

MUESTREO TIPOS DE MUESTREO

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

Técnicas de valor presente para calcular el valor en uso

Medias Móviles: Señales para invertir en la Bolsa

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1

Introducción al Diseño de Experimentos

ESTUDIO PRELIMINAR DE ALGUNOS FACTORES INFLUYENTES EN EL RENDIMIENTO ACADÉMICO DE ALUMNOS DEL GRUPO EXECUTIVE FISIOTERAPIA

Metodología de la Investigación. Dr. Cristian Rusu

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante

LA MEDIDA Y SUS ERRORES

Tema 1 con soluciones de los ejercicios. María Araceli Garín

Fundamentos de Biología Aplicada I Estadística Curso Práctica 6: Regresión Logística I

Precio del alquiler de pisos durante una serie de meses. Evolución del índice del precio del trigo con mediciones anuales.

PRUEBA DE HIPÓTESIS CON CHI CUADRADO EMPLEANDO EXCEL Y WINSTATS

Aplicaciones de Estadística Descriptiva

ANÁLISIS DE LA VARIANZA PARTE SEGUNDA

Transcripción:

Tema 2. Modelos de diseño de experimentos (varios factores) Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 1

Introducción Estudiaremos si un conjunto de factores (con dos o más niveles cada uno) influye sobre los valores medios de una variable respuesta Y. Intentaremos determinar qué factores influyen realmente sobre Y. Es importante el diseño del experimento para asegurar la homogeneidad dentro de cada población y reducir el error experimental. Ejemplo 2.1: En 1973 la compañía petroĺıfera Texaco informó al Subcomité de Contaminación Ambiental sobre la eficiencia del filtro Octel para reducir la emisión de gases contaminantes en los coches. Una de las posibles desventajas del filtro era que aumentaba el ruido producido por los automóviles. La compañía ofrecía datos del ruido (en decibelios) producido por coches provistos del filtro Octel frente al producido por coches desprovistos de él y deducía que no existía diferencia. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 2

Ejemplo 2.1 (cont.): Nivel de ruido (en decibelios) Sin filtro 810 820 820 840 840 845 785 790 785 835 835 835 845 855 850 760 760 770 Octel 820 820 820 820 820 825 775 775 775 825 825 825 815 825 825 770 760 765 Nivel de ruido (en decibelios) 860 840 820 800 780 760 Sin filtro Filtro Octel Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 3

Ejemplo 2.1 (cont.): Es un problema de ANOVA con I = 2 grupos. El contraste de igualdad de medias no muestra evidencia de que el filtro Octel sea más ruidoso. F.V. S.C. g.l. C.M. F Explicada 1056.3 1 1056.3 F = 1.24 < F 1,34,0.05 = 4.13 Residual 28818.1 34 847.6 Total 29874.3 35 El error experimental de estos datos es muy grande comparado con la posible diferencia entre el ruido medio emitido por ambos grupos, razón por la cual quizá no detectemos dicha diferencia. El error experimental puede deberse a la influencia de otros factores (gama de coche: alta, media o baja) sobre la respuesta. En algunos casos quizá podamos medir y controlar estos factores (y reducir el error) y en otros no seremos capaces de detectarlos (pero esperamos que influyan poco en la respuesta). Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 4

Cuando aceptamos H 0 : µ 1 = µ 2 =... = µ I, o bien es porque las medias son todas iguales, o bien porque no podemos detectar la diferencia entre las medias debido a que σ es demasiado grande. El diseño de experimentos intenta reducir el error experimental para que éste no oculte una diferencia significativa entre las respuestas medias. Uno de nuestros objetivos será realizar comparaciones entre grupos lo más homogéneos posible y tratar de detectar los factores que realmente influyen sobre la variable de interés. Estudiaremos tres casos: Dos factores (diseño por bloques) Dos factores con interacción Tres factores (cudrados latinos) Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 5

El diseño del experimento Llamaremos variable respuesta a la variable de interés Y (el nivel de ruido producido por el coche). Los factores o variables experimentales son aquellas variables que pueden afectar a los valores de la respuesta (el que un coche lleve o no el filtro, la gama de automóvil). Suponemos que la respuesta es continua y que los factores se prefijan para el experimento en unos niveles determinados (filtro/silenciador, gama alta/media/baja). Podemos controlar o prefijar el valor que toman algunos factores y luego observar el valor que toma Y. Pero en cualquier experimento habrá numerosos factores que no midamos ni controlemos y que contribuyen al error experimental. Hay tres posibles maneras de reducir este error: la aleatorización, la repetición y los diseños factoriales. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 6

Aleatorización Consiste en asignar todos los factores no controlados aleatoriamente a las observaciones. Esto previene sesgos en las observaciones y reduce la dependencia de éstas entre sí. Ejemplo 2.1 (cont.): Supongamos que en las pruebas se utilizaron dos marcas de coche exclusivamente, Ford y Seat, pero que el factor marca no nos interesa. Si los filtros Octel se instalan en los Ford y los silenciadores en los Seat y la marca Seat es más silenciosa que la Ford quizá lleguemos a la conclusión de que el filtro hace demasiado ruido cuando en realidad el efecto ha sido causado por la marca Ford. Una manera de resolver este problema es, al ir a tomar una nueva observación, escoger al azar la marca de ese coche de entre las dos disponibles. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 7

El principio de aleatorización también se utiliza para prevenir el efecto de aprendizaje o de fatiga. Supongamos que queremos comparar tres programas estadísticos, A, B y C, para su posible uso en la docencia de una asignatura. Se evaluará, entre otras cosas, si los programas son de fácil manejo y comprensión. Se pide a seis estudiantes que analicen algunos conjuntos de datos, cada uno de ellos con esos tres programas. Si todos resuelven cada problema utilizando los programas en el orden A, B, C, es probable que los programas B o C les parezcan mejor, porque la utilización del programa A previamente les ha servido para aprender. Para evitar este efecto se asignará aleatoriamente a cada estudiante un orden de utilización de los programas: estudiante 1 2 3 4 5 6 A B C B C A programas B C B A A C C A A C B B Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 8

La repetición del experimento Puesto que lo que deseamos es detectar las posibles diferencias entre medias de poblaciones y la varianza de una media muestral es σ 2 /n, disminuiremos el error experimental aumentando el tamaño muestral n, es decir, repitiendo más veces el experimento. Diseño factorial Supongamos que medimos el nivel de ruido emitido por un coche en función de si lleva o no un filtro, pero hay otro factor (la gama) que influye en la respuesta. Podemos eliminar la presencia de ese factor utilizando la misma gama de coche en todo el experimento. En esto consiste el diseño clásico de experimentos: eliminar el efecto de todos los factores que puedan afectar a la respuesta, excepto la presencia o no del filtro, manteniendo fijos sus valores a lo largo de todo el experimento. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 9

Otra opción es utilizar distintas gamas de coche tanto para la presencia de filtro como para su ausencia. Esto es razonable si queremos extender las conclusiones del experimento a cualquier tipo de coche (y no sólo a los de una determinada gama). En general, trataremos de introducir en el experimento todos los factores que puedan afectar a la respuesta y observaremos ésta para distintos niveles de los factores. En el diseño factorial con dos factores se cruzan todos los posibles niveles del factor que más nos interesa (la presencia o no de filtro) con todos los posibles niveles del otro factor (la gama del automóvil). Las observaciones obtenidas se presentan en una tabla de doble entrada. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 10

Ejemplo 2.1 (cont.) Texaco en realidad proporcionó más información en su informe del filtro Octel: Silenciador Filtro Octel Gama vehículo Baja Media Alta 810 840 785 820 840 790 820 845 785 835 845 760 835 855 760 835 850 770 820 820 820 825 825 825 820 820 825 815 825 825 775 775 775 770 760 765 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 11

A esa variable experimental, como la gama del coche, que a priori no nos interesa directamente, pero que incluimos en las observaciones para reducir el error experimental se la llama variable bloque (o factor secundario). El factor principal también se denomina tratamiento. El diseño experimental más sencillo, llamado modelo en bloques aleatorizados, cruza todos los posibles niveles del factor de interés con todos los niveles de la variable bloque y observa la variable respuesta al menos una vez para cada una de esas combinaciones. El resto de factores que puedan afectar al experimento (como el punto de instalación del filtro en el coche) se asignarán al azar (aleatorización) a cada combinación del bloque con el factor. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 12

Análisis de la varianza con dos factores (diseño en bloques aleatorizados) También se denomina modelo simple con dos factores. Se utiliza cuando queremos investigar el efecto de dos atributos independientes sobre una variable respuesta Y. Por ejemplo, deseamos averiguar si en el crecimiento de un helecho influyen la longitud de onda de la luz que recibe y la edad de la planta. Denotamos por I y J el número de niveles del primer y segundo factor respectivamente. Tenemos una única observación y ij por cada combinación (i, j) del primer factor con el segundo y disponemos los n = I J datos en una tabla de doble entrada. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 13

Factor 2 1 2 J Medias por filas 1 y 11 y 12... y 1J ȳ 1 Factor 1 2 y 21 y 22... y 2J ȳ 2.... I y I 1 y I 2... y IJ ȳ I Medias por columnas ȳ 1 ȳ 2 ȳ J ȳ Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 14

Ejemplo 2.2: Se realiza un estudio del efecto de la luz sobre el crecimiento de los helechos. Como la tasa de crecimiento depende de la edad de la planta se utilizan cuatro plantas jóvenes (plantas crecidas en la oscuridad durante cuatro días) y cuatro plantas más viejas (crecidas en las oscuridad durante doce días). Se investigan cuatro tratamientos de luz diferentes: se expone la planta a una única dosis de luz, se la pone de nuevo en la oscuridad y se mide el área (en µm 2 ) de sección transversal del extremo del helecho veinticuatro horas después de administrársele la luz. Se asigna un helecho elegido aleatoriamente a cada cruce de los dos factores. Longitud de onda de la luz Edad 420 nm 460 nm 600 nm 720 nm Joven 1017.6 929.0 939.8 1081.5 Adulto 854.7 689.9 841.5 797.4 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 15

El modelo en bloques aleatorizados Se supone que el valor medio de la respuesta Y es un cierto µ, que si el primer factor está en el nivel i entonces el valor medio de Y se incrementa en una cantidad α i y que si el segundo factor está en un nivel j entonces la media de la respuesta se incrementa en β j. Imponemos la hipótesis de que no existe interacción entre ambos factores, es decir, que el efecto del factor principal no depende del nivel j de la variable bloque (y viceversa). El modelo es Y ij = µ + α i + β j + U ij, i = 1,..., I, j = 1,..., J, siendo U ij variables aleatorias independientes N(0, σ 2 ) que representan el error experimental. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 16

En consecuencia, Y ij N(µ + α i + β j, σ 2 ) para i = 1,..., I, j = 1,..., J, y además son independientes entre sí. Como los α i y β j representan efectos incrementales supondremos además que I J α i = 0 y β j = 0. i=1 j=1 Por tanto, los parámetros desconocidos en el modelo son µ, α 1,..., α I 1, β 1,..., β J 1 y σ, un total de I + J. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 17

Estimación de los parámetros del modelo Estimamos µ, α i y β j mediante máxima verosimilitud: ˆµ = 1 n I i=1 j=1 J y ij = ȳ ˆα i = ȳ i ˆµ = ȳ i ȳ ˆβ j = ȳ j ˆµ = ȳ j ȳ Sólo I 1 de los efectos incrementales ˆα i son independientes I ˆα i = 0. i=1 Asimismo sólo J 1 de los ˆβ j son independientes ya que J ˆβ j = 0. j=1 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 18

Residuo e ij = Valor observado Valor previsto con el modelo = y ij ŷ ij Ejemplo 2.2 (cont.): = y ij (ˆµ + ˆα i + ˆβ j ) = y ij + ȳ ȳ i ȳ j Longitud de onda de la luz Edad 420 nm 460 nm 600 nm 720 nm ȳ i ˆα i Joven 1017.6 929.0 939.8 1081.5 Adulto 854.7 689.9 841.5 797.4 ȳ j ˆβ j Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 19

I + J ecuaciones de restricción para los residuos: I e ij = 0, j = 1,..., J, i=1 J e ij = 0, i = 1,..., I. j=1 De ellas una se puede deducir de las demás ya que I i=1 j=1 J e ij = 0. Luego el número de restricciones sobre los residuos es I + J 1 y el número de residuos independientes es (I 1)(J 1). Un estimador centrado de σ 2 es la varianza residual Ejemplo 2.2 (cont.): s 2 R = 1 (I 1)(J 1) I J i=1 j=1 e 2 ij. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 20

Propiedades de los estimadores de los parámetros ) ˆµ N (µ, σ2 n ) ˆα i N (α i, (I 1) σ2 n ) ˆβ j N (β j, (J 1) σ2 n (I 1)(J 1)s 2 R σ 2 χ 2 (I 1)(J 1) Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 21

Análisis de la varianza Para averiguar si el primer factor influye en el nivel medio de la respuesta contrastaremos Ejemplo 2.2 (cont.): H (1) 0 : α i = 0, para todo i = 1,..., I H (1) 1 : α i 0, para algún i = 1,..., I. 1100 Crecimiento del helecho 1000 900 800 700 600 Joven Viejo Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 22

También contrastaremos si el segundo factor influye H (2) 0 : β j = 0, para todo j = 1,..., J H (2) 1 : β j 0, para algún j = 1,..., J. Si alguno de los dos factores no fuera influyente quizá podríamos obviarlo y utilizar el modelo del Tema 1. Para realizar estos contrastes descomponemos la variabilidad total I J VT = (y ij ˆµ) 2 i=1 j=1 en términos asociados a los distintos factores. Observemos que Por tanto, y ij ˆµ = y ij ȳ = ˆα i + ˆβ j + e ij. VT = J I ˆα i 2 + I i=1 J ˆβ j 2 + j=1 I J i=1 j=1 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 23 e 2 ij.

VT = VE(α) + VE(β) + VNE, donde I VE(α) = J i=1 es la variabilidad debida al primer factor, ˆα 2 i VE(β) = I J j=1 ˆβ 2 j es la variabilidad debida al segundo factor y VNE = I J i=1 j=1 e 2 ij. es la variabilidad residual o no explicada. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 24

Ejemplo 2.2 (cont.): Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 25

Tabla ADEVA para el análisis de la varianza con dos factores: Fuentes de Suma de Grados de variación cuadrados libertad Varianzas Factor 1 VE(α) I 1 s 2 α = VE(α) I 1 Factor 2 VE(β) J 1 s 2 β = VE(β) J 1 Residual VNE (I 1)(J 1) s 2 R Total VT n 1 s 2 y = VT n 1 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 26

Ejemplo 2.2 (cont.): Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 27

Si el primer factor no influye sobre el nivel medio de la respuesta, es decir, si la hipótesis H (1) 0 : α i = 0 para todo i es cierta, entonces VE(α) σ 2 χ 2 I 1 y es independiente de la VNE. Entonces F (1) = s2 α s 2 R F (I 1),(I 1)(J 1) y rechazamos H (1) 0 al nivel de significación α si F (1) > F (I 1),(I 1)(J 1),α. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 28

Análogamente, si el segundo factor no influye y la hipótesis H (2) 0 : β j = 0 para todo j es cierta, entonces F (2) = s2 β s 2 R F (J 1),(I 1)(J 1) y rechazamos H (2) 0 al nivel de significación α si Ejemplo 2.2 (cont.): F (2) > F (J 1),(I 1)(J 1),α. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 29

Observación: Si alguno de los factores no influye, entonces este diseño en bloques aleatorizados es menos eficaz que el que vimos en el Tema 1 (diseño completamente aleatorizado). Entonces deberíamos obviar la clasificación dada por el factor no relevante y construir una tabla ADEVA con un solo factor. Ejemplo 2.2 (cont.): En cambio, si el segundo factor influye significativamente sobre el valor medio de la respuesta, entonces el estadístico F (1) del contraste en bloques aleatorizados es más sensible a las diferencias entre tratamientos que el estadístico F del contraste completamente aleatorizado. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 30

El coeficiente de determinación El coeficiente de determinación es la proporción de variabilidad total explicada por el modelo en bloques aleatorizados R 2 = VE VT VE(α) + VE(β) =. VT Observemos que R 2 = Rα 2 + Rβ 2, siendo R2 α = VE(α)/VT el coeficiente de determinación parcial del primer factor y Rβ 2 = VE(β)/VT el coeficiente de determinación parcial del segundo factor. Ejemplo 2.2 (cont.): Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 31

Análisis de las diferencias entre medias Si el análisis de la varianza revela la influencia de uno de los factores sobre la respuesta, debemos averiguar qué niveles de este factor son realmente distintos entre sí. Estimamos las diferencias entre los niveles i y k del primer factor mediante ˆα i ˆα k = ȳ i ȳ k. Además utilizaremos que ˆα i ˆα k (α i α k ) 2 sr / J t (I 1)(J 1) Análogamente estimamos las diferencias entre los niveles j y l del segundo factor mediante ˆβ j ˆβ l = ȳ j ȳ l. Se cumple que ˆβ j ˆβ l (β j β l ) 2 sr / I t (I 1)(J 1). Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 32

Ejemplo 2.2 (cont.): Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 33

Diagnosis del modelo Se hará mediante análisis gráfico de los residuos. Las hipótesis de normalidad, homocedasticidad e independencia se comprobarán igual que en el Tema 1. Ejemplo 2.2: Histograma de los residuos 2,0 Histograma de los residuos no estandarizados 1,5 1,0 0,5 0,0-50 -25 0 25 50 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 34

Ejemplo 2.2: Curtosis y asimetría de los residuos Estadísticos descriptivos N Estadístico Residuo 8 N válido (según lista) 8 Asimetría Estadístico Error típico,000,752 Curtosis Estadístico Error típico -1,706 1,481 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 35

Ejemplo 2.2: Diagrama de residuos frente a valores previstos Ejemplo 2.2: Crecimiento de helechos 48,90 44,00 21,50 Residuo 16,60-16,60-21,50-44,00-48,90 711,40 792,60 838,10 841,40 907,50 988,70 1034,20 Valor pronosticado o previsto 1037,50 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 36

Modelo sin interacción y K replicaciones Ejemplo 2.1 (cont.): En la página 11, por cada cruce del nivel i del factor principal (con/sin filtro) con el nivel j de la variable bloque (gama de vehículo), tenemos K = replicaciones. Queremos ver si alguno de los dos factores influye en el nivel medio de ruido provocado por el automóvil. El modelo de Análisis de la Varianza con dos factores, sin interacción y K replicaciones es Y ijk = µ + α i + β j + U ijk, donde i = 1,..., I, j = 1,..., J, k = 1,..., K,, U ijk N(0, σ 2 ) son independientes entre sí, I i=1 α i = 0 y J j=1 β j = 0. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 37

Estimación de los parámetros del modelo: donde ˆµ = ȳ = 1 IJK ˆα i = ȳ i ȳ ˆβ j = ȳ j ȳ ȳ i = 1 JK ȳ j = 1 IK J j=1 k=1 J j=1 k=1 I J K i=1 j=1 k=1 y ijk K y ijk, i = 1,..., I, K y ijk, j = 1,..., J. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 38

I Variabilidad debida al primer factor = VE(α) = JK i=1 J Variabilidad debida al segundo factor = VE(β) = IK I J K Variabilidad total = VT = (y ijk ȳ ) 2. i=1 j=1 k=1 Residuos del modelo con replicaciones: e ijk = y ijk ŷ ijk = y ijk (ˆµ + ˆα i + ˆβ j ) = y ijk + ȳ ȳ i ȳ j j=1 ˆα 2 i ˆβ 2 j Variabilidad residual = VNE = I J K eijk 2. i=1 j=1 k=1 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 39

Ejemplo 2.1 (cont.): VE(α) = Gama vehículo Residuos Baja Media Alta VE(β) = Silenciador VT = VNE = Filtro Octel Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 40

Tabla ANOVA F.V. S.C. g.l. C.M. Factor 1 VE(α) I 1 s 2 α = VE(α) I 1 Factor 2 VE(β) J 1 s 2 β = VE(β) J 1 Residual VNE IJK (I + J) + 1 s 2 R = VNE IJK (I + J) + 1 Total VT IJK 1 s 2 y = VT IJK 1 Rechazo H (1) 0 : α i = 0 para todo i = 1,..., I al nivel α si F (1) = s2 α s 2 R > F (I 1),IJK (I +J)+1,α. Rechazo H (2) 0 : β j = 0 para todo j = 1,..., J al nivel α si F (2) = s2 β s 2 R > F (J 1),IJK (I +J)+1,α. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 41

Ejemplo 2.1 (cont.): Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 42

0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 Ejemplo 2.1 (cont.): Histograma y gráfico probabiĺıstico normal de los residuos 15 10 5 0 5 10 15 Probability 0.99 0.98 0.95 0.90 0.75 0.50 0.25 Normal Probability Plot 0.10 0.05 0.02 0.01 20 10 0 10 Data Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 43

Ejemplo 2.1 (cont.): Diagrama de residuos frente a valores previstos 20 10 0 10 20 760 780 800 820 840 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 44

Modelo con dos factores e interacción El modelo de efectos aditivos Y ij = µ + α i + β j + U ij, i = 1,..., I, j = 1,..., J, establece que E(Y ij ) = µ + α i + β j. No existe interacción entre los dos factores. Por ejemplo, se cumple que para cualquier j = 1,..., J, E(Y 4j ) E(Y 1j ) = α 4 α 1. En el Ejercicio 2.2 esto significa que la diferencia entre el consumo medio de gasolina de un coche español y japonés es la misma independientemente de si estamos conduciendo en hora punta o en carretera llana. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 45

En el modelo sin interacción, al representar las respuestas medias para valores fijos de uno de los factores, las ĺıneas son paralelas. E(Y ij ) en modelo sin interacción µ+α 1 +β 1 µ+α 1 +β 2 µ+α 4 +β 1 µ+α 4 +β 2 µ+α 3 +β 1 µ+α 3 +β 2 µ+α 1 +β 3 µ+α 4 +β 3 µ+α 3 +β 3 j=1 j=2 j=3 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 46

Un modelo con interacción sería Y ij = µ + α i + β j + (αβ) ij + U ij, i = 1,..., I, j = 1,..., J donde U ij N(0, σ 2 ) son independientes y (αβ) ij son parámetros que describen la interacción entre los factores. En este modelo hay IJ + 1 parámetros desconocidos. Si sólo tenemos una observación y ij para cada (i, j), no podemos estimarlos todos. En este caso, aunque podríamos modelizar la interacción con una expresión más simple, utilizaremos siempre el modelo sin interacción. Cuando hay K 2 replicaciones por cada cruce de los dos factores sí podemos ajustar el modelo con interacción a nuestros datos. Ejemplo 2.1 (cont.): En la página 11, por cada cruce del nivel i del factor principal (con/sin filtro) con el nivel j de la variable bloque (gama de vehículo), tenemos K = replicaciones. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 47

El modelo ANOVA de dos factores con interacción es Y ijk = µ + α i + β j + (αβ) ij + U ijk, i = 1,..., I j = 1,..., J k = 1,..., K( 2) donde U ijk N(0, σ 2 ) son independientes y I α i = 0 ; i=1 J β j = 0 ; j=1 I (αβ) ij = 0, j = 1,..., J i=1 J (αβ) ij = 0, i = 1,..., I. j=1 (αβ) ij = E(Y ij ) µ α i β j = desviación de la respuesta esperada respecto de la predicción dada por el modelo sin interacción Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 48

Número de parámetros desconocidos = IJ + 1. Estimaciones de los parámetros: donde ȳ ij = 1 K ȳ i = 1 JK ȳ j = 1 IK ˆµ = ȳ = 1 IJK ˆα i = ȳ i ȳ ˆβ j = ȳ j ȳ I J K i=1 j=1 k=1 (αβ) ij = ȳ ij ȳ i ȳ j + ȳ K k=1 J y ijk j=1 k=1 J j=1 k=1 K y ijk, i = 1,..., I, K y ijk, j = 1,..., J. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 49 y ijk

Ejemplo 2.1 (cont.): Gama vehículo Baja Media Alta ȳ i ˆα i Sin filtro F. Octel 810 820 820 835 835 835 ȳ 11 = (αβ) 11 = 820 820 820 825 825 825 ȳ 21 = (αβ) 21 = 840 840 845 845 855 850 ȳ 12 = (αβ) 12 = 820 820 825 815 825 825 ȳ 22 = (αβ) 22 = 785 790 785 760 760 770 ȳ 13 = (αβ) 13 = 775 775 775 770 760 765 ȳ 23 = (αβ) 23 = ȳ j ȳ = ˆβ j Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 50

Residuos: e ijk = y ijk ŷ ijk = y ijk (ˆµ + ˆα i + ˆβ j + (αβ) ij ) = y ijk ȳ ij Tienen IJ(K 1) g.l., pues K k=1 e ijk = 0 para todo (i, j). Ejemplo 2.1 (cont.): Gama vehículo Residuos Baja Media Alta -15,83-5,83-5,83-5,83 10,00 15,00 Sin filtro -5,83-0,83 10,00 9,17-0,83-15,00 9,17 9,17 9,17 4,17-15,00-5,00 Filtro Octel -2,50-2,50-2,50 2,50 2,50 2,50-1,67-1,67 3,33-6,67 3,33 3,33 5,00 5,00 5,00 0,00-10,00-5,00 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 51

I J K Descomposición de la variabilidad total VT = (y ijk ȳ ) 2 i=1 j=1 k=1 VT = VE(α) + VE(β) + VE(αβ) + VNE, donde VE(α) = JK I ˆα i 2 i=1 VE(β) = IK J j=1 ˆβ 2 j VNE = I J K i=1 j=1 k=1 e 2 ijk VE(αβ) = K I J (αβ) 2 ij i=1 j=1 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 52

Tabla ANOVA para dos factores con K replicaciones y con interacción: FV SC gl CM Factor α VE(α) I 1 s 2 α = VE(α) I 1 Factor β VE(β) J 1 s 2 β = VE(β) J 1 Interacción VE(αβ) (I 1)(J 1) s 2 αβ = VE(αβ) (I 1)(J 1) Residual VNE IJ(K 1) s 2 R = VNE IJ(K 1) Total VT n 1 s 2 y = VT n 1 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 53

Posibles contrastes y sus regiones de rechazo: H (1) 0 : α i = 0, i = 1,..., I { } R (1) = F (1) = s2 α sr 2 > F I 1,IJ(K 1),α H (2) 0 : β j = 0, j = 1,..., J { H (3) R (2) = F (2) = s2 β s 2 R > F J 1,IJ(K 1),α } 0 : (αβ) ij = 0, i = 1,..., I, j = 1,..., J { } R (3) = F (3) = s2 αβ sr 2 > F (I 1)(J 1),IJ(K 1),α Aunque no rechacemos H (3) 0, no conviene unir VE(αβ) con VNE a menos que F (3) sea muy próximo a 1. La diagnosis del modelo se realiza mediante análisis de los residuos. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 54

Ejemplo 2.1 (cont.): Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 55

Ejemplo 2.3: Se investiga el efecto de diferentes tipos de música sobre enfermos de Alzheimer. Se eligen enfermos con un desarrollo bajo y medio de la enfermedad y se prueban tres tipos de música: interludios de piano, Mozart y música ligera. La variable respuesta es el nivel de agitación del enfermo. Música Desarrollo enfermedad Interludios Mozart Ligera Bajo 21 9 29 24 12 26 22 10 30 18 5 24 20 9 26 Medio 22 14 15 20 18 18 25 11 20 18 9 13 20 13 19 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 56

Ejemplo 2.3 (cont.): Música Desarrollo enfermedad Interludios Mozart Ligera ȳ i ˆα i Bajo 21 9 29 24 12 26 22 10 30 18 5 24 20 9 26 ȳ 11 = (αβ) 11 = Medio 22 14 15 20 18 18 25 11 20 18 9 13 20 13 19 ȳ 21 = (αβ) 21 = ȳ j ȳ = ˆβ j Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 57

Ejemplo 2.3 (cont.): Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 58

Ejemplo 2.3 (cont.): Residuos e ijk Música Des. enf. Int. Moz. Lig. Bajo 0 0 2 3 3-1 1 1 3-3 -4-3 -1 0-1 Medio 1 1-2 -1 5 1 4-2 3-3 -4-4 -1 0 2 Valores previstos ŷ ijk Música Des. enf. Int. Moz. Lig. Bajo 21 9 27 21 9 27 21 9 27 21 9 27 21 9 27 Medio 21 13 17 21 13 17 21 13 17 21 13 17 21 13 17 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 59

Ejemplo 2.3 (cont.): Residuos 6 4 2 0 2 4 6 5 10 15 20 25 30 Valores previstos Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 60

Ejemplo 2.3 (cont.): Histograma de los residuos 0.15 0.1 0.05 0 5 0 5 Curtosis de los residuos = 2.1683 Coeficiente de asimetría de los residuos = 0.0554 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 61

Una manera gráfica de estudiar si existe interacción es representar las medias muestrales ȳ ij para valores fijos de uno de los factores. Si las ĺıneas no son paralelas, concluimos que existe interacción. Ejemplo 2.3 (cont.): 30 25 D. bajo D. medio 20 15 10 5 Interludios Mozart Ligera Tipo de música Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 62

Ejemplo 2.1 (cont.): 840 820 800 780 Silenciador F. Octel Baja Media Alta Gama Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 63

Análisis de la varianza con tres factores Modelo general para tres factores sin replicación Para i = 1,..., I, j = 1,..., J, k = 1,..., K, Y ijk = µ + α i + β j + γ k + (αβ) ij + (αγ) ik + (βγ) jk + (αβγ) ijk + U ijk, donde U ijk N(0, σ 2 ) son independientes y I α i = 0, i=1 J β j = 0, j=1 K γ k = 0 k=1 I J I K (αβ) ij = (αβ) ij = (αγ) ik = (αβ) ik =... = 0 i=1 j=1 i=1 k=1 I J K (αβγ) ijk = (αβγ) ijk = (αβγ) ijk = 0. i=1 j=1 k=1 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 64

α i, β j, γ k = Efectos principales (αβ) ij, (βγ) jk, (αγ) ik = Interacciones de segundo orden (αβγ) ijk = Interacciones de tercer orden N o de observaciones = IJK < N o de parámetros a estimar = IJK + 1 En un diseño con tres factores a cuatro niveles cada uno y sin replicación se necesitan 4 3 = 64 observaciones. Existe un diseño más restrictivo pero más sencillo que sólo precisa 4 2 = 16 observaciones: el cuadrado latino. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 65

Cuadrado latino Este diseño se utiliza cuando hay tres factores; el número de niveles de los tres factores es el mismo, I ; no hay interacción entre los factores. El cuadrado latino tiene n = I 2 observaciones. Cada nivel de un factor se cruza sólo una vez con cada nivel de los otros dos factores. En la práctica se forma una cuadrícula con I filas e I columnas y se asignan I letras de tal manera que no haya letras repetidas en ninguna fila ni en ninguna columna. Por ejemplo, si I = 3, existen 12 diseños posibles. Uno es A C B C B A B A C y 11(1) y 12(3) y 13(2) y 21(3) y 22(2) y 23(1) y 31(2) y 32(1) y 33(3) Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 66

Ejemplo 2.4: Se desea evaluar si el tipo de riego (por goteo, aspersión o sin riego) puede contribuir a la protección de cultivos de fresas frente al frío extremo. En todos los casos se utiliza un mantillo plástico sobre la tierra de cultivo. Por otro lado, se supone que hay otros factores, como la humedad y el contenido en nitrógeno del suelo, que también pueden influir. Cuál de los siguientes diseños del experimento será más adecuado? Nivel de nitrógeno Alto Medio Bajo Nivel Alto No riego Goteo Aspersión de Medio No riego Aspersión No riego humedad Bajo Goteo Goteo Aspersión Nivel de nitrógeno Alto Medio Bajo Nivel Alto No riego Goteo Aspersión de Medio Goteo Aspersión No riego humedad Bajo Aspersión No riego Goteo Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 67

Con I = 4 tendríamos 576 posibles diseños. Uno de ellos es: A B D C C D A B B A C D D C B A Un ejemplo con I = 5: Deseamos contrastar la eficacia de 5 fertilizantes diferentes (A,B,C,D,E) sobre un cultivo específico. Queremos utilizar los 5 fertilizantes, esperar a que el cultivo madure y medir el resultado de la cosecha por unidad de superficie con cada fertilizante. Pero terrenos contiguos pueden variar en fertilidad debido a múltiples causas (diferencias de humedad, uso previo del terreno, etc.). Para reducir la variabilidad experimental dividimos el terreno en una retícula de 5 x 5 rectángulos y en cada uno utilizamos un fertilizante según el siguiente diseño de cuadrado latino: Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 68

Feature Column Arc 2. Agronomy experiments: Latin squares in real life. A B C D E B D A E C C E D B A D C E A B E A B C D A field planted with a crop using five different treatments according to a 5 x 5 latin square arrangement. Suppose we want to test the relative effectiveness of 5 different fertilizer mixtures on a crop of, say, oats. We apply the fertilizer, wait for the crop to mature, harvest it and measure the yield per unit area. But the five experiments cannot be car out on the same plot of land. Even contiguous plots may vary in fertility because of a moisture gradient, different previous of the land, or some other reason. Dividing a single plot into a 5 x 5 grid of subplots, and administering the fertilizers (labe randomly A, B, C, D, E) according to a latin square arrangement like the one used in the figure above: Estadística (CC. Ambientales). Profesora: Amparo Baíllo A B C D E B D A E C C E D B A Tema 2: Diseño D C E dea experimentos B (varios factores) E A B C D 69

Modelo: Y ij(k) = µ + α i + β j + γ k + U ij(k), i, j, k = 1,..., I, donde U ij(k) N(0, σ 2 ) son independientes y I α i = i=1 I I β j = γ k = 0. j=1 k=1 α i = efecto incremental de la fila β j = efecto incremental de la columna γ k = efecto incremental de la letra Parámetros desconocidos: µ, α 1,..., α I 1, β 1,..., β I 1, γ 1,..., γ I 1, σ 2 N o de parámetros a estimar = 3I 1 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 70

Estimación de los parámetros: ˆµ = ȳ = 1 n I I i=1 j=1 y ij() ˆα i = ȳ i ȳ ˆβj = ȳ j ȳ ˆγ k = ȳ k ȳ donde y ij() es la observación de la casilla (i, j) sea cual sea la letra asociada y I I I I ȳ i = 1 I j=1 y ij() ȳ j = 1 I i=1 y ij() ȳ k = 1 I i=1 j=1 y ij(k) Residuos: e ij(k) = y ij(k) ŷ ij(k) = y ij(k) (ˆµ + ˆα i + ˆβ j + ˆγ k ) = y ij(k) ȳ i ȳ j ȳ k + 2ȳ Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 71

Tabla ANOVA para el cuadrado latino: FV SC gl CM Efecto fila I VE(α) = I ˆα 2 i I 1 sα 2 = VE(α) I 1 i=1 Efecto columna I VE(β) = I ˆβ j 2 I 1 sβ 2 = VE(β) I 1 j=1 Efecto letra I VE(γ) = I ˆγ k 2 I 1 sγ 2 = VE(γ) I 1 k=1 Residual I I VNE = eij() 2 (I 1)(I 2) sr 2 = VNE (I 1)(I 2) i=1 j=1 Total I I VT = (y ij() ȳ ) 2 n 1 sy 2 = VT n 1 i=1 j=1 Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 72

Contrastes y sus regiones de rechazo al nivel de significación α: H (1) 0 : α i = 0, para todo i = 1,..., I { } R (1) = F (1) = s2 α sr 2 > F I 1,(I 1)(I 2),α H (2) 0 : β j = 0, para todo j = 1,..., I { } R (2) = F (2) = s2 β sr 2 > F I 1,(I 1)(I 2),α H (3) 0 : γ k = 0, para todo k = 1,..., I { } R (3) = F (3) = s2 γ sr 2 > F I 1,(I 1)(I 2),α Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 73

Ejemplo 2.4 (cont.): El estudio sobre la protección del cultivo de fresas frente al frío produjo finalmente los datos que se indican debajo. La efectividad de los métodos de irrigación se midió en función del peso de los frutos congelados. Cuál de los métodos protegió mejor el cultivo? Nivel de nitrógeno Alto Medio Bajo Nivel Alto 51 (G) 119 (A) 60 (NR) de Medio 98 (NR) 43 (G) 31 (A) humedad Bajo 99 (A) 87 (NR) 49 (G) Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 2: Diseño de experimentos (varios factores) 74