1 / 51 Méodos de Diseño y Análisis de Experimenos Paricia Isabel Romero Mares Deparameno de Probabilidad y Esadísica IIMAS UNAM febrero 2018
Diseño compleamene al azar 1 2 / 51
3 / 51 Ejemplo Suponga que enemos 4 dieas diferenes que queremos comparar. Las dieas esán eiqueadas A,B,C y D. Esamos ineresados en esudiar si las dieas afecan la asa de coagulación de sangre en conejos. La asa de coagulación es el iempo en segundos que arda una corada en dejar de sangrar. Tenemos 16 conejos para el experimeno, por lo que usaremos 4 en cada diea. Los conejos esán en una jaula grande hasa que se inicie el experimeno, momeno en que se ransferirán a oras jaulas. Cómo asignamos los conejos a los cuaro grupos raamieno?
4 / 51 Diseño compleamene al azar, un facor Ejemplo: Disminución del crecimieno de bacerias en carne almacenada. La vida en esane de carne almacenada es el iempo en que el core empacado se maniene bien, nuriivo y vendible. El empaque esándar con aire del medio ambiene iene una vida de 48 horas. Después se deeriora por conaminación bacerial, degradación del color y encogimieno. El empaque al vacío deiene el crecimieno bacerial, sin embargo, se pierde calidad. Esudios recienes sugieren que al conrolar cieros gases de la amósfera se alarga la vida en esane.
5 / 51 Diseño compleamene al azar, un facor Hipóesis de invesigación: Algunas formas de gases conrolados pueden mejorar la efecividad del empacamieno para carne. Diseño de raamienos: Un facor con 4 niveles (4 raamienos): 1. Aire ambienal con envolura plásica 2. Empacado al vacío 3. Mezcla de gases: 1% CO (monóxido de carbono) 40% O 2 (oxígeno) 59% N (nirógeno) 4. 100% CO 2 (bióxido de carbono) Diseño experimenal: Compleamene al azar.
6 / 51 Diseño compleamene al azar, un facor Tres biseces de res, aproximadamene del mismo amaño (75 grs.) se asignaron aleaoriamene a cada raamieno. Cada bisec se empaca separadamene con su condición asignada. Variable de respuesa: Se mide el número de bacerias psichnoropicas en la carne después de 9 días de almacenamieno a 4 C. Esas bacerias se encuenran en la superficie de la carne y aparecen cuando la carne se echó a perder. La medición fue el logarimo del número de bacerias por cm 2.
7 / 51 Diseño compleamene al azar, un facor Cómo aleaorizar? Programa en R: se.seed(1234) # por ejemplo f <- facor(rep( c(1,2,3,4), each=3)) # raamienos fac <- sample(f,12) ue <- 1:12 plan <- daa.frame(bisec = ue, ra=fac) plan Ver programa plan.r
Diseño compleamene al azar, un facor Modelo esadísico para el experimeno El modelo esadísico para esudios comparaivos supone que hay una población de referencia de u.e. En muchos casos la población es concepual. En el ejemplo, es posible imaginar una población de carne empacada. Cada unidad de la población iene un valor de la variable de respuesa, y, la cual iene media µ y varianza σ 2. Se supone una población de referencia para cada raamieno considerado en el esudio, y las variables en el experimeno se suponen seleccionadas aleaoriamene de dicha población de referencia, como resulado de la aleaorización. Noa. Para esudios observacionales, suponemos que las unidades observadas se seleccionaron aleaoriamene de cada una de las poblaciones. 8 / 51
9 / 51 Diseño compleamene al azar, un facor
10 / 51 Diseño compleamene al azar, un facor Modelo esadísico lineal para un diseño compleamene al azar y un solo facor. Modelo de medias: y ij = µ i + ε ij i = 1,2,...,; j = 1,2,...,r donde y ij es la observación de la j-ésima u.e. del i-ésimo raamieno, µ i es la media del i-ésimo raamieno, ε ij es el error experimenal de la unidad ij. Hay raamienos y r repeiciones en cada uno (balanceado). En el ejemplo de la carne empacada, enemos:
11 / 51 Diseño compleamene al azar, un facor bisec raa obser log y ij Modelo mieno vación (coneo/cm 2 ) 6 1 1 7.66 y 11 µ 1 + ε 11 7 1 2 6.98 y 12 µ 1 + ε 12 1 1 3 7.80 y 13 µ 1 + ε 13 12 2 1 5.26 y 21 µ 2 + ε 21 5 2 2 5.44 y 22 µ 2 + ε 22 3 2 3 5.80 y 23 µ 2 + ε 23 10 3 1 7.41 y 31 µ 3 + ε 31 9 3 2 7.33 y 32 µ 3 + ε 32 2 3 3 7.04 y 33 µ 3 + ε 33 8 4 1 3.51 y 41 µ 4 + ε 41 4 4 2 2.91 y 42 µ 4 + ε 42 11 4 3 3.66 y 43 µ 4 + ε 43
12 / 51 El modelo: Diseño compleamene al azar, un facor y ij = µ i + ε ij lo llamaremos modelo compleo ya que incluye una media separada para cada una de las poblaciones definidas por los raamienos. Si no hay diferencia enre las medias de las poblaciones, es decir, si µ 1 = µ 2 = µ 3 = µ 4 = µ se genera el modelo reducido y ij = µ + ε ij que esablece que las observaciones provienen de la misma población con media µ.
13 / 51 Diseño compleamene al azar, un facor El modelo reducido represena la hipóesis de no diferencia enre las medias H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ El modelo compleo represena la hipóesis alernaiva: H a : µ i µ k para alguna i k El invesigador debe deerminar cuál de los dos modelos describe mejor a los daos en el experimeno.
14 / 51 Diseño compleamene al azar, un facor y ij = µ + ε ij y ij = µ i + ε ij
15 / 51 Diseño compleamene al azar, un facor Preguna de invesigación: Hay más crecimieno bacerial con algunos méodos de empacado que con oros? Preguna esadísica: Cuál modelo describe mejor los resulados del experimeno? Se requiere un méodo para esimar los parámeros de los dos modelos y con base en algún crierio objeivo deerminar cuál modelo o hipóesis esadísica se ajusa mejor a los daos del experimeno.
16 / 51 Diseño compleamene el azar, un facor Los esimadores de mínimos cuadrados son aquellos que resulan de minimizar la suma de cuadrados de los errores experimenales. Si los errores experimenales son independienes con media cero y varianzas homogéneas, los esimadores de mínimos cuadrados son insesgados y ienen varianza mínima. Noa. El muesreo aleaorio en los esudios observacionales y la aleaorización en los experimenales aseguran la suposición de independencia.
17 / 51 Esimadores para el modelo compleo y ij = µ i + ε ij i = 1,..., j = 1,...,r ε ij = y ij µ i SSE c = r i=1 j=1 ε 2 ij = r i=1 j=1 (y ij µ i ) 2 La SSE c es una medida de qué an bien se ajusa el modelo a los daos. Queremos deerminar los esimadores ˆµ i ales que se minimice esa SSE c. Vamos a ener ecuaciones normales, una para cada raamieno, enconradas a parir de derivar la SSE c con respeco a cada µ i e igualarlas a cero.
18 / 51 Esimadores para el modelo compleo Para una i: µ i r j=1 (y ij µ i ) 2 = 2 igualando a cero 2 r j=1 r j=1 (y ij ˆµ i ) = 0 y ij r ˆµ i = 0 r j=1 ˆµ i = r j=1 y ij r (y ij µ i ) = ȳ i.
19 / 51 Esimadores para el modelo compleo Por lo ano, Enonces, ˆµ i = ȳ i. i = 1,..., SSE c = = = r i=1 j=1 r i=1 j=1 i=1 (y ij ˆµ i ) 2 (y ij ȳ i. ) 2 [ ] r (y ij ȳ i. ) 2 j=1
20 / 51 Esimadores para el modelo compleo La varianza muesral del i-ésimo raamieno es: S 2 i = r j=1 (y ij ȳ i. ) 2 r 1 es una esimador de σ 2 de los daos del i-ésimo grupo. S 2 = i=1 [ r j=1 (y ij ȳ i. ) 2] = SSE c (r 1) (r 1) es un esimador combinado (pooled) de σ 2 de odos los daos del experimeno. Es un buen esimador si podemos hacer la suposición de que σ 2 es homogénea en odos los grupos.
21 / 51 Esimadores para el modelo compleo Para los daos del ejemplo: raamieno comercial vacío mezcla CO2 7.66 5.26 7.41 3.51 6.98 5.44 7.33 2.91 7.80 5.80 7.04 3.66 ˆµ i = ȳ i. 7.48 5.50 7.26 3.36 r j=1 (y ij ȳ i. ) 2 0.3848 0.1512 0.0758 0.3150 SSE c = 0.3848 + 0.1512 + 0.0758 + 0.3150 = 0.9268 S 2 = SSE c (r 1) = 0.9268 = 0.11585 4(2)
22 / 51 Esimadores para el modelo reducido y ij = µ + ε ij i = 1,..., j = 1,...,r ε ij = y ij µ SSE r = µ r i=1 j=1 r i=1 j=1 ε 2 ij = r i=1 j=1 (y ij µ) 2 = 2 igualando a cero r i=1 j=1 ˆµ = (y ij µ) 2 r i=1 j=1 r y ij i=1 j=1 rµ = y.. ˆµ = y.. r = ȳ.. (y ij µ)
23 / 51 Esimadores para el modelo reducido Enonces, SSE r = r i=1 j=1 (y ij ˆµ) 2 = r i=1 j=1 (y ij ȳ.. ) 2 Para el ejemplo, ˆµ = ȳ.. = 70.80 12 = 5.90
24 / 51 Modelo reducido Modelo compleo y ij = µ + ε ij y ij = µ i + ε ij Observado Esimado Diferencia Esimado Diferencia Traamieno y ˆµ (y ij ˆµ) ˆµ i (y ij ˆµ i ) Comercial 7.66 5.90 1.76 7.48 0.18 6.98 5.90 1.08 7.48-0.50 7.80 5.90 1.90 7.48 0.32 Vacío 5.26 5.90-0.64 5.50-0.24 5.44 5.90-0.46 5.50-0.06 5.80 5.90-0.10 5.50 0.30 Mezcla 7.41 5.90 1.51 7.26 0.15 7.33 5.90 1.43 7.26 0.07 7.04 5.90 1.14 7.26-0.22 CO2 3.51 5.90-2.39 3.36 0.15 2.91 5.90-2.99 3.36-0.45 3.66 5.90-2.24 3.36 0.30 SSE r = 33.7996 SSE c = 0.9268
25 / 51 Diseño compleamene al azar, un facor Siguiendo con el ejemplo: Modelo compleo y ij = µ i + ε ij SSE c = i j (y ij ȳ i. ) 2 = 0.9268 Modelo reducido y ij = µ + ε ij SSE r = i j (y ij ȳ.. ) 2 = 33.7996 Diferencia: SSE r SSE c = i haciendo álgebra = i j j (y ij ȳ.. ) 2 (ȳ i. ȳ.. ) 2 = r i (y ij ȳ i. ) 2 j i (ȳ i. ȳ.. ) 2 En el ejemplo: SSE r SSE c = 32.8728
Diseño compleamene al azar, un facor SSE r SSE c = SS suma de cuadrados de raamienos. Represena la reducción en SSE al haber incluido raamienos en el modelo, ambién se le conoce como reducción en suma de cuadrados debida a raamienos. Llamaremos SS oal = SSE r ya que es la suma de cuadrados de las diferencias de cada observación y la media general ȳ.. Enonces, enemos la parición: i j SS oal = SS + SSE c (y ij ȳ.. ) 2 = i j (ȳ i. ȳ.. ) 2 + i (y ij ȳ i. ) 2 j desviación de la desviación de la desviación de la observación ij media del grupo observación ij con respeco a con respeco a con respeco a la media general la media general la media de su grupo 26 / 51
27 / 51 Diseño compleamene al azar, un facor i j (y ij ȳ.. ) 2 = i = i [(y ij ȳ i. ) + (ȳ i. ȳ.. )] 2 j j +2 i (y ij ȳ i. ) 2 + (y ij ȳ i. )(ȳ i. ȳ.. ) j i (ȳ i. ȳ.. ) 2 j i j (y ij ȳ i. )(ȳ i. ȳ.. ) = i (ȳ i. ȳ.. ) j (y ij ȳ i. ) = (ȳ i. ȳ.. )(y i. rȳ i. ) = 0 i
28 / 51 Diseño compleamene al azar, un facor Grados de liberad. Represenan el número de piezas de información independienes en las sumas de cuadrados. En general, es el número de observaciones menos el número de parámeros esimados de los daos. Sea n = r, el amaño de muesra oal. Así, SS oal = i r j (y ij ȳ.. ) 2 donde ȳ.. es el esimador de µ, iene n 1 g.l. SSE = i r j (y ij ȳ i. ) 2 se esimaron parámeros (µ 1, µ 2,..., µ ) por lo ano iene n g.l. SS = SS oal SSE = (n 1) (n ) = 1 g.l.
29 / 51 Tabla de Análisis de Varianza ANOVA F.V. g.l. SS CM Traamienos 1 SS CM = SS / 1 Error n SSE CME = SSE/n = ˆσ 2 Toal n 1 SS oal Se puede demosrar que: E (CME) = σ 2 E (CM ) = σ 2 + 1 1 i=1 r(µ i µ) 2 ; µ = µ i / i
30 / 51 Tabla de Análisis de Varianza Si suponemos ε ij NID(0,σ 2 ) i = 1,..., j = 1,...,r en el modelo compleo y ij = µ i + ε ij Enonces, y ij NID(µ i,σ 2 ). Se puede demosrar que: SS oal σ 2 = i j (y ij ȳ.. ) 2 σ 2 χn 1 2 SSE σ 2 = i j (y ij ȳ i. ) 2 σ 2 χn 2 Cuando H 0 : µ 1 = µ 2 =... = µ es ciera SS σ 2 = i r(ȳ i. ȳ.. ) 2 σ 2 χ 1 2
31 / 51 Tabla de Análisis de Varianza Por el Teorema de Cochran (Mongomery, 2001, pág. 69), SS y SSE son independienes, por lo ano cuando H 0 es ciera, F 0 = SS /σ 2 ( 1) SSE/σ 2 (n ) = CM CME F 1,n Además, E (CM ) = σ 2 + θ 2 = σ 2 cuando θ 2 = 0 que es cuando H 0 es ciera. Es decir, E (CM ) = E (CME) cuando H 0 es ciera E (CM ) > E (CME) cuando H 0 no es ciera Enonces, si CM > CME, o sea, valores grandes de F 0 llevan a rechazar la hipóesis nula H 0 : µ 1 = µ 2 =... = µ. Por lo ano, la región de rechazo es: F 0 > F α 1,n
Tabla de Análisis de Varianza ANOVA F.V. g.l. SS CM F E(CM) Traamienos 1 SS CM = SS CM 1 CME σ 2 + θ 2 Error n SSE CME = SSE n σ 2 Toal n 1 SS oal SS = SSE = SS oal = i=1 r i=1 j=1 i=1 j=1 r (ȳ i. ȳ.. ) 2 r (y ij ȳ i. ) 2 (y ij ȳ.. ) 2 32 / 51
33 / 51 Tabla de Análisis de Varianza En el ejemplo de empacado de carne: F.V. g.l. SS CM F Pr > F ra 3 32.8728 10.958 94.55 0.000 error 8 0.9268 0.1159 oal 11 33.7996 Por lo ano, se rechaza la hipóesis H 0 : µ 1 = µ 2 =... = µ 4, es decir, hay algún méodo de empaque que iene diferene comporamieno en promedio.
Inervalos de confianza ˆµ i = ȳ i. Sȳ 2 i. = S2 CME con S 2 = CME = ˆσ 2 Sȳi. = n i n i Como suponemos que y ij N ( µ i,σ 2) enonces ȳ i. N ( µ i,σ 2 /n i ) como esimamos la varianza: ȳ i. µ i Sȳi. n Por lo ano, un inervalo del (1 α)100% de confianza para µ i es ȳ i. ± 1 α/2 n (Sȳi. ) 34 / 51
35 / 51 Inervalos de Confianza En el ejemplo del empacado de carne eníamos: Comercial Al vacío CO,O2,N CO2 ˆµ i = ȳ i. 7.48 5.50 7.26 3.36 S 2 = CME = 0.116 con 8 g.l. Inervalos de confianza ra 1 (7.03, 7.93) ra 2 (5.05, 5.95) ra 3 (6.81, 7.71) ra 4 (2.91, 3.81) Una vez que rechazamos la hipóesis H 0 : µ 1 = µ 2 = µ 3 = µ 4 Qué sigue? Pero anes: ver programa biseces.r
Diseño compleamene al azar, un facor Se quieren comparar niveles de un facor, lo que implica raamienos y se dispone de n i u.e. para el raamieno i, i = 1,...,. Hay dos siuaciones: 1. Los raamienos son escogidos específicamene por el invesigador. En esa siuación deseamos probar hipóesis acerca de las medias de los raamienos y nuesras conclusiones se aplicarán solamene a los niveles del facor considerados en el análisis. Las conclusiones no se pueden exender a raamienos similares que no fueron explíciamene considerados. Ese es el modelo de efecos fijos. 2. Los raamienos son una muesra aleaoria de una población de raamienos. En esa siuación nos gusaría poder exender las conclusiones (las cuales esán basadas en la muesra de raamienos considerada) a odos los raamienos de la población. Ese es el modelo de efecos aleaorios. 36 / 51
37 / 51 Diseño compleamene al azar, un facor A las canidades n 1,n 2,...,n se les llama repeiciones de cada raamieno. Si n i = r i se dice que el diseño es balanceado. y ij es la respuesa de la u.e. j del raamieno i, i = 1,..., j = 1,...,n i.
38 / 51 Esrucura de los daos. Diseño compleamene al azar raamienos 1 2 3... y 11 y 21 y 31... y 1 y 12 y 22 y 32... y 2 y 13 y 23 y 33... y 3..................... y 1n1 y 2n2 y 3n3... y n y 1. y 2. y 3.... y. oales ȳ 1. ȳ 2. ȳ 3.... ȳ. medias
39 / 51 Diseño compleamene al azar n = y i. = i=1 n i y ij j=1 ȳ i. = n i j=1 y ij y.. = ȳ.. = y.. n n i amaño de muesra oal n i n i i=1 j=1 i = 1,...,; oal raamieno i y ij = i = 1,...,; media raamieno i i=1 media general y i. oal de las observaciones
40 / 51 Diseño compleamene al azar Se ienen muesras aleaorias independienes de amaños n 1,n 2,...,n respecivamene. y 11,y 12,...,y 1n1 es una muesra aleaoria de N(µ 1,σ 2 ) y 21,y 22,...,y 2n2 es una muesra aleaoria de N(µ 2,σ 2 ) y 1,y 2,...,y n es una muesra aleaoria de N(µ,σ 2 )
41 / 51 Diseño compleamene al azar Las observaciones en cada una de esas muesras se pueden represenar por el modelo lineal simple y ij = µ i + ε ij i = 1,...,; j = 1,...,n i con ε ij error experimenal en la observación j-ésima del raamieno i-ésimo. Esamos suponiendo independencia enre y denro de las muesras, es decir, ε ij son independienes y ε ij N(0,σ 2 ).
42 / 51 Diseño compleamene al azar Ora forma de verlo Como suponemos que las u.e. son homogéneas, es decir, el promedio de respuesa de odas las u.e. es el mismo (µ) anes de aplicar los raamienos, y si se observan en condiciones similares, las respuesas las podemos modelar como y ij = µ + ε ij
43 / 51 Modelo de efecos Enonces al aplicar el raamieno i-ésimo a un grupo (de amaño n i ) de u.e. se inroduce un efeco (τ i ) de ese raamieno en las variables por observar. El modelo se puede escribir como: Modelo de efecos donde y ij = µ + τ i + ε ij i = 1,...,; j = 1,...,n i µ es la media general, común a odas las u.e. τ i es el efeco del raamieno i-ésimo
Modelo de efecos 44 / 51
45 / 51 Modelo de efecos El modelo de efecos implica que se empieza el experimeno con u.e. con la misma capacidad de respuesa (µ) y con la misma varianza (σ 2 ). La aplicación de los raamienos iene el efeco de alerar las medias, que ahora son µ i = µ + τ i, pero supone que no se modifican las varianzas. En ese caso, la hipóesis a probar es: H 0 : τ 1 = τ 2 =... = τ = 0 H a : τ i 0 para al menos una i
46 / 51 Modelo de efecos Esimadores de mínimos cuadrados: y ij = µ + τ i + ε ij i = 1,..., j = 1,...,n i µ τ i i=1 j=1 SSE = n i n i i=1 j=1 n i i=1 j=1 ε 2 ij = n i i=1 j=1 (y ij µ τ i ) 2 = 2 (y ij µ τ i ) 2 = 2 (y ij µ τ i ) 2 n i i=1 j=1 n i j=1 (y ij µ τ i ) (y ij µ τ i ) i = 1,...,
Igualando a cero: Modelo de efecos n i i=1 j=1 n 1 j=1 n 2 j=1 n j=1 y ij = n ˆµ + i=1 n i ˆτ i y 1j = n 1 ˆµ + n 1 ˆτ 1 y 2j = n 2 ˆµ + n 2 ˆτ 2...... y j = n ˆµ + n ˆτ Las ecuaciones normales no son linealmene independienes, por lo ano no hay una solución única. Eso ocurre porque el modelo de efecos esá sobreparamerizado. 47 / 51
Modelo de efecos Se añade una ecuación linealmene independiene: a) i=1 n i ˆτ i = 0 ˆµ = ȳ.. ˆτ i = ȳ i. ȳ.. i = 1,..., b) ˆµ = 0 ˆµ = 0 ˆτ i = ȳ i. i = 1,..., c) ˆτ 1 = 0 ˆµ = ȳ 1. ˆτ i = ȳ i. ȳ 1. i = 2,..., 48 / 51
49 / 51 Modelo de efecos Hay un número infinio de posibles resricciones que se pueden usar para resolver las ecuaciones normales. Enonces Cuál usar? No impora ya que en cualquier caso µ + τ i = ȳ i. Aunque no podemos obener esimadores únicos de los parámeros del modelo de efecos, podemos obener esimadores únicos de funciones de esos parámeros. A esas funciones se les llama funciones lineales linealmene esimables.
Diseño compleamene al azar, Tabla de ANOVA F.V. g.l. SS CM F E(CM) Traamienos 1 SS CM = SS 1 Error n SSE CME = SSE n σ 2 CM CME σ 2 + i n i (τ i τ) 2 1 Toal n 1 SS oal SS = SSE = SS oal = i=1 n i i=1 j=1 n i (ȳ i. ȳ.. ) 2 = n i i=1 j=1 (y ij ȳ i. ) 2 = (y ij ȳ.. ) 2 = n = i=1 i=1 j=1 y 2 i. y2.. n i n n i n i i=1 j=1 n i i=1 y 2 ij i=1 y 2 ij y2.. n y 2 i. n i 50 / 51
51 / 51 Si rechazamos la hipóesis nula de igualdad de medias o nulidad de efecos, Qué sigue?