Diseño completamente al azar. Diseño de experimentos p. 1/111

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Diseño completamente al azar. Diseño de experimentos p. 1/111"

Transcripción

1 Diseño completamente al azar Diseño de experimentos p. 1/111

2 Ejemplo Suponga que tenemos 4 dietas diferentes que queremos comparar. Las dietas están etiquetadas A,B,C y D. Estamos interesados en estudiar si las dietas afectan la tasa de coagulación en conejos. La tasa de coagulación es el tiempo en segundos que tarda una cortada en dejar de sangrar. Tenemos 16 conejos para el experimento, por lo que usaremos 4 en cada dieta. Los conejos están en una jaula grande hasta que se inicie el experimento, momento en que se transferirán a otras jaulas. Cómo asignamos los conejos a los cuatro grupos tratamiento? Diseño de experimentos p. 2/111

3 Método 1 Supongamos que los conejos se atrapan "al azar". Atrapamos cuatro conejos y los asignamos a la dieta A. Atrapamos otros cuatro y los asignamos a la dieta B y así sucesivamente. Dado que los conejos fueron "atrapados al azar", esto producirá un diseño completamente al azar. Diseño de experimentos p. 3/111

4 Método 1 No es necesariamente cierto. Los primeros cuatro conejos atrapados pueden ser los más lentos y débiles, aquellos menos capaces de escapar. Esto puede sesgar los resultados. Si los resultados del experimento dan desventaja a la dieta A, no habrá forma de determinar si los resultados son a consecuencia de la dieta A o del hecho de haber asignado los conejos más débiles a esa dieta por nuestro "proceso de aleatorización". Diseño de experimentos p. 4/111

5 Método 2 Atrape a todos los conejos y etiquételos del 1 al 16. Seleccione cuatro números aleatorios (sin reemplazo) del 1 al 16 y ponga los conejos con esa etiqueta en una jaula que recibirá la dieta A. Entonces, seleccione otros cuatro números aleatorios y ponga los conejos correspondientes en otra jaula que recibirá la dieta B. Así sucesivamente hasta tener cuatro jaulas con cuatro conejos en cada una. Diseño de experimentos p. 5/111

6 Método 2 No hay repeticiones. El diseño es un diseño completamente al azar pero no tiene repeticiones. Hay 16 conejos, pero los conejos en cada jaula no son independientes. Si un conejo come mucho, los otros en la jaula tienen menos para comer. La unidad experimental es la menor unidad de material experimental a la cual se le aplica un tratamiento en forma independiente. En este caso, las jaulas son las unidades experimentales. Para un diseño completamente al azar con repeticiones, cada conejo debe estar en su propia jaula. Diseño de experimentos p. 6/111

7 Método 3 En una urna ponga las letras A,B,C y D en pedazos de papel separados. Atrape un conejo, saque un pedazo de papel al azar de la urna y asigne el conejo a la dieta que indique el papel. No reemplace el papel. Atrape el segundo conejo y seleccione al azar otro pedazo de papel de la urna de los tres que quedan. Asigne el conejo a la dieta correspondiente. Continue hasta que los primeros cuatro conejos sean asignados a una de las cuatro dietas. De esta manera, todos los conejos lentos tienen diferentes dietas. Coloque otra vez los cuatro pedazos de papel en la urna y repita el procedimiento hasta que los 16 conejos estén asignados a una dieta. Diseño de experimentos p. 7/111

8 Método 3 Este no es un diseño completamente al azar. Ya que se seleccionaron los conejos en bloques de 4, y cada uno asignado a una de las dietas, el diseño es el bloques al azar. El tratamiento es Dieta pero se ha bloqueado a través del grado de "atrapabilidad". Diseño de experimentos p. 8/111

9 Método 4 Atrape a todos los conejos y márquelos del 1 al 16. Ponga 16 piezas de papel en una urna, con las letras A, B, C y D repetidas cuatro veces cada una. Ponga otros 16 pedazos de papel numerados del 1 al 16 en otra urna. Tome un pedazo de papel de cada urna. El conejo con el número seleccionado es asignado a la dieta seleccionada. Para hacer más fácil de recordar cuál conejo tiene cuál dieta, las jaulas se acomodan como se muestra abajo: A A A A B B B B C C C C D D D D Diseño de experimentos p. 9/111

10 Método 4 El método 4 tiene algunas deficiencias. La asignación de los conejos a los tratamientos es un diseño completamente al azar. Sin embargo, el arreglo de las jaulas crea un sesgo en los resultados. Puede haber cambios climáticos y de luz que afecten de forma diferencial a los tratamientos, de tal manera que, cualquier diferencia observada no puede ser atribuida a la dieta, sino que podría ser resultado de la posición de la jaula. La posición de la jaula no es parte del tratamiento, pero debe ser considerada. En un diseño completamente al azar, todos los conejos tienen la misma probabilidad de recibir cualquier dieta y en cualquier posición de la jaula. Diseño de experimentos p. 10/111

11 Método 5 Marque las jaulas del 1 al Ponga 16 pedazos de papel en una urna, numerados del 1 al 16. En otra urna ponga 16 pedazos de papel, marcados con las letras A, B C y D. Atrape un conejo. Seleccione un número y una letra de cada urna. Ponga el conejo en la jaula indicada por el número escogido y asígnelo a la dieta indicada por la letra. Repita sin reemplazo hasta que todos los conejos hayan sido asignados a una dieta y una jaula. Diseño de experimentos p. 11/111

12 Método 5 Si, por ejemplo, el primer número seleccionado fué 7 y la primera letra B, entonces el primer conejo se pone en la jaula 7 y se alimenta con la dieta B B Diseño de experimentos p. 12/111

13 Método 5 Un ejemplo de asignación completa es el siguiente: 1 C 5 A 9 B 13 D 2 D 6 B 10 D 14 C 3 C 7 B 11 A 15 D 4 A 8 A 12 C 16 B Note que el diseño completamente al azar no toma en cuenta las diferencias en la altura de las jaulas. Es solamente una asignación completamente al azar. En este ejemplo vemos que la mayoría de los conejos con la dieta A están en jaulas de la parte de abajo y los de la dieta D están en la parte superior. Un diseño completamente al azar supone que estas posiciones no producen una diferencia sistemática en la respuesta (tiempo de coagulación). Si creemos que la posición afecta la respuesta, deberíamos usar un diseño de bloques al azar. Diseño de experimentos p. 13/111

14 Diseño completamente al azar, un factor Ejemplo: Disminución del crecimiento de bacterias en carne almacenada. La vida en estante de carne almacenada es el tiempo en que el corte empacado se mantiene bien, nutritivo y vendible. El empaque estándar con aire del medio ambiente tiene una vida de 48 horas. Después se deteriora por contaminación bacterial, degradación del color y encogimiento. El empaque al vacío detiene el crecimiento bacterial, sin embargo, se pierde calidad. Estudios recientes sugieren que al controlar ciertos gases de la atmósfera se alarga la vida en estante. Diseño de experimentos p. 14/111

15 Diseño completamente al azar, un factor Hipótesis de investigación: Algunas formas de gases controlados pueden mejorar la efectividad del empacamiento para carne. Diseño de tratamientos: Un factor con 4 niveles: 1. Aire ambiental con envoltura plástica 2. Empacado al vacío 3. Mezcla de gases: 1% CO (monóxido de carbono) 40% O 2 (oxígeno) 59% N (nitrógeno) % CO 2 (bióxido de carbono) Diseño experimental: Completamente al azar. Diseño de experimentos p. 15/111

16 Diseño completamente al azar, un factor Tres bisteces de res, aproximadamente del mismo tamaño (75 grs.) se asignaron aleatoriamente a cada tratamiento. Cada bistec se empaca separadamente con su condición asignada. Variable de respuesta: Se mide el número de bacterias psichnotropicas en la carne después de 9 días de almacenamiento a 4 C. Estas bacterias se encuentran en la superficie de la carne y aparecen cuando la carne se echó a perder. La medición fué el logaritmo del número de bacterias por cm 2. Diseño de experimentos p. 16/111

17 Diseño completamente al azar, un factor Cómo aleatorizar? Se obtiene una permutación aleatoria de los números 1 a 12. Para esto se toma una secuencia de números de 2 dígitos de una tabla de números aleatorios y se les asigna el rango que les corresponda. Por ejemplo: # aleatorio rango trat u.e trat Diseño de experimentos p. 17/111

18 Diseño completamente al azar, un factor Modelo estadístico para el experimento El modelo estadístico para estudios comparativos supone que hay una población de referencia de u.e. En muchos casos la población es conceptual. En el ejemplo, es posible imaginar una población de carne empacada. Cada unidad de la población tiene un valor de la variable de respuesta, y, la cual tiene media µ y varianza σ 2. Se supone una población de referencia para cada tratamiento considerado en el estudio, y las variables en el experimento se suponen seleccionadas aleatoriamente de dicha población de referencia, como resultado de la aleatorización. Nota. Para estudios observacionales, suponemos que las unidades observadas se seleccionaron aleatoriamente de cada una de las poblaciones. Diseño de experimentos p. 18/111

19 Diseño completamente al azar, un factor Diseño de experimentos p. 19/111

20 Diseño completamente al azar, un factor Modelo estadístico lineal para un diseño completamente al azar. y ij = µ i + ǫ ij Modelo de medias: i = 1, 2,...,t j = 1, 2,...,r donde y ij es la observación de la j-ésima u.e. del i-ésimo tratamiento, µ i es la media del i-ésimo tratamiento, ǫ ij es el error experimental de la unidad ij. Suponemos que hay t tratamientos y r repeticiones en cada uno. En el ejemplo de la carne empacada, tenemos: Diseño de experimentos p. 20/111

21 Diseño completamente al azar, un factor bistec trata obser log y ij Modelo miento vación (conteo/cm 2 ) y 11 µ 1 + ǫ y 12 µ 1 + ǫ y 13 µ 1 + ǫ y 21 µ 2 + ǫ y 22 µ 2 + ǫ y 23 µ 2 + ǫ y 31 µ 3 + ǫ y 32 µ 3 + ǫ y 33 µ 3 + ǫ y 41 µ 4 + ǫ y 42 µ 4 + ǫ y 43 µ 4 + ǫ 43 Diseño de experimentos p. 21/111

22 Diseño completamente al azar, un factor El modelo: y ij = µ i + ǫ ij lo llamaremos modelo completo ya que incluye una media separada para cada una de las poblaciones definidas por los tratamientos. Si no hay diferencia entre las medias de las poblaciones, es decir, µ 1 = µ 2 = µ 3 = µ 4 = µ se genera el modelo reducido y ij = µ + ǫ ij que establece que las observaciones provienen de la misma población con media µ. Diseño de experimentos p. 22/111

23 Diseño completamente al azar, un factor El modelo reducido representa la hipótesis de no diferencia entre las medias H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ El modelo completo representa la hipótesis alternativa: H a : µ i µ k i k El investigador debe determinar cuál de los dos modelos describe mejor a los datos en el experimento. Diseño de experimentos p. 23/111

24 Diseño completamente al azar, un factor y ij = µ + ǫ ij y ij = µ i + ǫ ij Diseño de experimentos p. 24/111

25 Diseño completamente al azar, un factor Pregunta de investigación: Hay más crecimiento bacterial con algunos métodos de empacado que con otros? Pregunta estadística: Cuál modelo describe mejor los resultados del experimento? Se requiere un método para estimar los parámetros de los dos modelos y con base en algun criterio objetivo determinar cuál modelo o hipótesis estadística se ajusta mejor a los datos del experimento. Diseño de experimentos p. 25/111

26 Diseño completamente el azar, un factor Los estimadores de mínimos cuadrados son aquellos que resultan de minimizar la suma de cuadrados de los errores experimentales. Si los errores experimentales son independientes con media cero y varianzas homogéneas, los estimadores de mínimos cuadrados son insesgados y tienen varianza mínima. Nota. El muestreo aleatorio en los estudios observacionales y la aleatorización en los experimentales aseguran la suposición de independencia. Diseño de experimentos p. 26/111

27 Estimadores para el modelo completo y ij = µ i + ǫ ij i = 1,...,t j = 1,...,r ǫ ij = y ij µ i SSE c = t r ǫ 2 ij = i=1 j=1 t i=1 r (y ij µ i ) 2 j=1 La SSE c es una medida de qué tan bien se ajusta el modelo a los datos. Queremos determinar los estimadores ˆµ i tales que se minimice esta SSE c. Vamos a tener t ecuaciones normales, una para cada tratamiento, encontradas a partir de derivar la SSE c con respecto a cada µ i e igualarlas a cero. Diseño de experimentos p. 27/111

28 Estimadores para el modelo completo Para una i: µ i r (y ij µ i ) 2 = 2 j=1 igualando a cero r 2 (y ij ˆµ i ) = 0 j=1 r y ij r ˆµ i = 0 j=1 r (y ij µ i ) j=1 ˆµ i = r j=1 y ij r = ȳ i. Diseño de experimentos p. 28/111

29 Estimadores para el modelo completo Por lo tanto, Entonces, ˆµ i = ȳ i i = 1,...,t SSE c = = = t r (y ij ˆµ i ) 2 i=1 t i=1 j=1 r (y ij ȳ i. ) 2 j=1 t i=1 j=1 r (y ij ȳ i. ) 2 Diseño de experimentos p. 29/111

30 Estimadores para el modelo completo La varianza muestral del i-ésimo tratamiento es: r j=1 (y ij ȳ i. ) 2 S 2 i = r 1 es una estimador de σ 2 de los datos del i-ésimo grupo. S 2 = t i=1 [ r j=1 (y ij ȳ i. ) 2] t(r 1) = SSE c t(r 1) es un estimador combinado (pooled) de σ 2 de todos los datos del experimento. Es un buen estimador si podemos hacer la suposición de que σ 2 es homogénea en todos los grupos. Diseño de experimentos p. 30/111

31 Estimadores para el modelo completo Para los datos del ejemplo: tratamiento comercial vacío mezcla CO ˆµ i = ȳ i r j=1 (y ij ȳ i. ) SSE c = = S 2 = SSE c t(r 1) = (2) = Diseño de experimentos p. 31/111

32 Estimadores para el modelo reducido y ij = µ + ǫ ij ǫ ij = y ij µ SSE r = t r ǫ 2 ij = i=1 j=1 t i=1 r (y ij µ) 2 j=1 µ t r t r (y ij µ) 2 = 2 (y ij µ) i=1 j=1 i=1 j=1 igualando a cero t r ˆµ = t r i=1 j=1 i=1 j=1 y ij rtµ = y.. ˆµ = y.. rt = ȳ.. Diseño de experimentos p. 32/111

33 Estimadores para el modelo reducido Entonces, SSE r = t r (y ij ˆµ) 2 = t r (y ij ȳ.. ) 2 i=1 j=1 i=1 j=1 Para el ejemplo, ˆµ = ȳ.. = = 5.90 Diseño de experimentos p. 33/111

34 Modelo reducido Modelo completo y ij = µ + ǫ ij y ij = µ i + ǫ ij Observado Estimado Diferencia Estimado Diferencia Tratamiento y ˆµ (y ij ˆµ) ˆµ i (y ij ˆµ i ) Comercial Vacío Mezcla CO SSE r = SSE c = Diseño de experimentos p. 34/111

35 Diseño completamente al azar, un factor Siguiendo con el ejemplo: Modelo completo y ij = µ i + ǫ ij SSE c = i j (y ij ȳ i. ) 2 = Modelo reducido y ij = µ + ǫ ij SSE r = i j (y ij ȳ.. ) 2 = Diferencia: SSE r SSE c = i haciendo álgebra = i (y ij ȳ.. ) 2 j i (y ij ȳ i. ) 2 (ȳ i. ȳ.. ) 2 = r (ȳ i. ȳ.. ) 2 j i j En el ejemplo: SSE r SSE c = Diseño de experimentos p. 35/111

36 Diseño completamente al azar, un factor SSE r SSE c = SS t suma de cuadrados de tratamientos. Representa la reducción en SSE al haber incluido tratamientos en el modelo, también se le conoce como reducción en suma de cuadrados debida a tratamientos. Llamaremos SS total = SSE r ya que es la suma de cuadrados de las diferencias de cada observación y la media general ȳ.. Entonces, tenemos la partición: SS total = SS t + SSE c (y ij ȳ.. ) 2 = (ȳ i. ȳ.. ) 2 + i j i j i (y ij ȳ i. ) 2 j desviación de la desviación de la desviación de la observación ij media del grupo observación ij con respecto a con respecto a con respecto a la media general la media general la media de su grupo Diseño de experimentos p. 36/111

37 Diseño completamente al azar, un factor (y ij ȳ.. ) 2 = [(y ij ȳ i. ) + (ȳ i. ȳ.. )] 2 i j i j = (y ij ȳ i. ) 2 + (ȳ i. ȳ.. ) 2 i j i j +2 (y ij ȳ i. )(ȳ i. ȳ.. ) i j (y ij ȳ i. )(ȳ i. ȳ.. ) = i j i (ȳ i. ȳ.. ) j (y ij ȳ i. ) = i (ȳ i. ȳ.. )(y i. rȳ i. ) = 0 Diseño de experimentos p. 37/111

38 Diseño completamente al azar, un factor Grados de libertad. Representan el número de piezas de información independientes en las sumas de cuadrados. En general, es el número de observaciones menos el número de parámetros estimados de los datos. Sea n = rt, el tamaño de muestra total. Así, SS total = t i r j (y ij ȳ.. ) 2 donde ȳ.. es el estimador de µ, tiene n 1 g.l. SSE = t i r j (y ij ȳ i. ) 2 se estimaron t parámetros (µ 1, µ 2,...,µ t ) por lo tanto tiene n t g.l. SS t = SS total SSE = (n 1) (n t) = t 1 g.l. Diseño de experimentos p. 38/111

39 Tabla de Análisis de Varianza ANOVA F.V. g.l. SS CM Tratamientos t 1 SS t CM t = SS t /t 1 Error n t SSE CME = SSE/n t = ˆσ 2 Total n 1 SS total Se puede demostrar que: E (CME) = σ 2 E (CM t ) = σ t 1 t r(µ i µ) 2 ; i=1 µ = i µ i /t Diseño de experimentos p. 39/111

40 Tabla de Análisis de Varianza Si suponemos ǫ ij NID(0, σ 2 ) i = 1,...,t j = 1,...,r en el modelo completo y ij = µ i + ǫ ij Entonces, y ij NID(µ i, σ 2 ). Se puede demostrar que: SS total σ 2 = SSE σ 2 = i j (y ij ȳ.. ) 2 i σ 2 j (y ij ȳ i. ) 2 σ 2 χ 2 n 1 χ 2 n t Cuando SS t σ 2 = H 0 : µ 1 = µ 2 =... = µ t es cierta i r(ȳ i. ȳ.. ) 2 χ 2 t 1 σ 2 Diseño de experimentos p. 40/111

41 Tabla de Análisis de Varianza Por el Teorema de Cochran (Montgomery, 2001, pág. 69), SS t y SSE son independientes, por lo tanto cuando H 0 es cierta, F 0 = SS t/σ 2 (t 1) SSE/σ 2 (n t) = CM t CME F t 1,n t Además, E (CM t ) = σ 2 + θ 2 t = σ 2 cuando θ 2 t = 0 que es cuando H 0 es cierta. Es decir, E (CM t ) = E (CME) cuando H 0 es cierta E (CM t ) > E (CME) cuando H 0 no es cierta Entonces, si CM t > CME, o sea, valores grandes de F 0 llevan a rechazar la hipótesis nula H 0 : µ 1 = µ 2 =... = µ t. Por lo tanto, la región de rechazo es: F 0 > F α t 1,n t Diseño de experimentos p. 41/111

42 Tabla de Análisis de Varianza ANOVA F.V. g.l. SS CM F E(CM) Tratamientos t 1 SS t CM t = SS t t 1 CM t CME Error n t SSE CME = SSE n t σ 2 σ 2 + θ 2 t Total n 1 SS total SS t = SSE = SS total = t r (ȳ i. ȳ.. ) 2 i=1 t i=1 t r (y ij ȳ i. ) 2 j=1 i=1 j=1 r (y ij ȳ.. ) 2 Diseño de experimentos p. 42/111

43 Tabla de Análisis de Varianza En el ejemplo de empacado de carne: F.V. g.l. SS CM F Pr > F trat error total Por lo tanto, se rechaza la hipótesis H 0 : µ 1 = µ 2 =... = µ 4, es decir, hay algún método de empaque que tiene diferente comportamiento en promedio. Diseño de experimentos p. 43/111

44 Diseño completamente al azar, un factor Se quieren comparar t niveles de un factor, lo que implica t tratamientos y se dispone de n i u.e. para el tratamiento i, i = 1,...,t. Hay dos situaciones: 1. Los t tratamientos son escogidos específicamente por el investigador. En esta situación deseamos probar hipótesis acerca de las medias de los tratamientos y nuestras conclusiones se aplicarán solamente a los niveles del factor considerados en el análisis. Las conclusiones no se pueden extender a tratamientos similares que no fueron explícitamente considerados. Este es el modelo de efectos fijos. 2. Los t tratamientos son una muestra aleatoria de una población de tratamientos. En esta situación nos gustaría poder extender las conclusiones (las cuales están basadas en la muestra de tratamientos considerada) a todos los tratamientos de la población. Este es el modelo de efectos aleatorios. Diseño de experimentos p. 44/111

45 Diseño completamente al azar, un factor A las cantidades n 1, n 2,...,n t se les llama repeticiones de cada tratamiento. Si n i = r i se dice que el diseño es balanceado. y ij es la respuesta de la u.e. j del tratamiento i, i = 1,...,t j = 1,...,n i. Diseño de experimentos p. 45/111

46 Diseño completamente al azar Estructura de los datos. tratamientos t y 11 y 21 y y t1 y 12 y 22 y y t2 y 13 y 23 y y t y 1n1 y 2n2 y 3n3... y tnt y 1. y 2. y y t. totales ȳ 1. ȳ 2. ȳ ȳ t. medias Diseño de experimentos p. 46/111

47 Diseño completamente al azar n = y i. = ȳ i. = y.. = t i=1 n i j=1 n i y ij i = 1,...,t total tratamiento i ni j=1 y ij t i=1 ȳ.. = y.. n n i n i j=1 y ij = i = 1,...,t media tratamiento i t y i. total de las observaciones i=1 media general Diseño de experimentos p. 47/111

48 Diseño completamente al azar Se tienen t muestras aleatorias independientes de tamaños n 1, n 2,...,n t respectivamente. y 11, y 12,...,y 1n1 es una muestra aleatoria de N(µ 1, σ 2 ) y 21, y 22,...,y 2n2 es una muestra aleatoria de N(µ 2, σ 2 ) y t1, y t2,...,y tnt es una muestra aleatoria de N(µ t, σ 2 ) Diseño de experimentos p. 48/111

49 Diseño completamente al azar Las observaciones en cada una de estas muestras se pueden representar por el modelo lineal simple y ij = µ i + ǫ ij i = 1,...,t j = 1,...,n i con ǫ ij error experimental en la observación j-ésima del tratamiento i-ésimo. Estamos suponiendo independencia entre y dentro de las muestras, es decir, ǫ ij son independientes y ǫ ij N(0, σ 2 ). Diseño de experimentos p. 49/111

50 Diseño completamente al azar Otra forma de verlo Como suponemos que las u.e. son homogéneas, es decir, el promedio de respuesta de todas las u.e. es el mismo (µ) antes de aplicar los tratamientos, y si se observan en condiciones similares, las respuestas las podemos modelar como y ij = µ + ǫ ij Diseño de experimentos p. 50/111

51 Modelo de efectos Entonces al aplicar el tratamiento i-ésimo a un grupo (de tamaño n i ) de u.e. se introduce un efecto (τ i ) de ese tratamiento en las variables por observar. El modelo se puede escribir como: Modelo de efectos donde y ij = µ + τ i + ǫ ij i = 1,...,t j = 1,...,n i µ es la media general, común a todas las u.e. τ i es el efecto del tratamiento i-ésimo Diseño de experimentos p. 51/111

52 Modelo de efectos Diseño de experimentos p. 52/111

53 Modelo de efectos El modelo de efectos implica que se empieza el experimento con u.e. con la misma capacidad de respuesta (µ) y con la misma varianza (σ 2 ). La aplicación de los tratamientos tiene el efecto de alterar las medias, que ahora son µ i = µ + τ i, pero supone que no se modifican las varianzas. En este caso, la hipótesis a probar es: H 0 : τ 1 = τ 2 =... = τ t = 0 H a : τ i 0 para al menos una i Diseño de experimentos p. 53/111

54 Modelo de efectos Estimadores de mínimos cuadrados: y ij = µ + τ i + ǫ ij i = 1,...,t j = 1,...,n i µ τ i SSE = t i=1 n i j=1 ǫ 2 ij = t n i (y ij µ τ i ) 2 i=1 t n i (y ij µ τ i ) 2 = 2 i=1 j=1 t n i (y ij µ τ i ) 2 = 2 i=1 j=1 j=1 t i=1 n i j=1 n i j=1 (y ij µ τ i ) (y ij µ τ i ) i = 1,...,t Diseño de experimentos p. 54/111

55 Modelo de efectos Igualando a cero: t i=1 n i j=1 n 1 j=1 n 2 j=1 n t j=1 y ij = nˆµ + t n iˆτ i i=1 y 1j = n 1ˆµ + n 1ˆτ 1 y 2j = n 2ˆµ + n 2ˆτ y tj = n tˆµ + n tˆτ t Las ecuaciones normales no son linealmente independientes, por lo tanto no hay una solución única. Esto ocurre porque el modelo de efectos está sobreparametrizado. Diseño de experimentos p. 55/111

56 Modelo de efectos Se añade una ecuación linealmente independiente: a) t i=1 ˆτ i = 0 ˆµ = ȳ.. ˆτ i = ȳ i. ȳ.. i = 1,...,t b) ˆµ = 0 ˆµ = 0 ˆτ i = ȳ i. i = 1,...,t c) ˆτ 1 = 0 ˆµ = ȳ 1. ˆτ i = ȳ i. ȳ 1. i = 2,...,t Diseño de experimentos p. 56/111

57 Modelo de efectos Hay un número infinito de posibles restricciones que se pueden usar para resolver las ecuaciones normales. Entonces Cuál usar? No importa ya que en cualquier caso µ + τ i = ȳ i. Aunque no podemos obtener estimadores únicos de los parámetros del modelo de efectos, podemos obtener estimadores únicos de funciones de estos parámetros. A estas funciones se les llama funciones lineales linealmente estimables. Diseño de experimentos p. 57/111

58 Diseño completamente al azar, Tabla de ANOVA F.V. g.l. SS CM F E(CM) Tratamientos t 1 SS t CM t = SS t t 1 CM t CME σ 2 + Error n t SSE CME = SSE n t σ 2 i n i(τ i τ) 2 t 1 Total n 1 SS total SS t = SSE = t n i (ȳ i. ȳ.. ) 2 = i=1 t i=1 n i j=1 (y ij ȳ i. ) 2 = t i=1 t i=1 yi. 2 y2.. n i n n i j=1 y 2 ij t i=1 y 2 i. n i SS total = t i=1 n i j=1 (y ij ȳ.. ) 2 = t i=1 n i j=1 y 2 ij y2.. n n = t n i i=1 Diseño de experimentos p. 58/111

59 Intervalos de confianza ˆµ i = ȳ i. S 2 ȳ i. = S2 n i con S 2 = CME = ˆσ 2 Sȳi. = Como suponemos que entonces como estimamos la varianza: y ij N ( µ i, σ 2) ȳ i. N ( µ i, σ 2 /n i ) CME n i ȳ i. µ i Sȳi. t n t Por lo tanto, un intervalo del (1 α)100% de confianza para µ i es ȳ i. ± t 1 α/2 n t (Sȳi. ) Diseño de experimentos p. 59/111

60 Contrastes En el ejemplo del empacado de carne teníamos: Comercial Al vacío CO,O2,N CO2 ˆµ i = ȳ i S 2 = CME = con 8 g.l. Una vez que rechazamos la hipótesis H 0 : µ 1 = µ 2 = µ 3 = µ 4 Qué sigue? Diseño de experimentos p. 60/111

61 Contrastes Se podrían contestar preguntas como: Es más efectiva la creación de una atmósfera artificial que el aire ambiente con plástico para reducir el crecimiento de bacterias? Son más efectivos los gases que el vacío? Es más efectivo el tratamiento de CO2 puro que la mezcla CO,O2 y N? Un contraste es una función lineal de los parámetros µ i definido como C = t k i µ i = k 1 µ 1 + k 2 µ k t µ t i=1 donde t i=1 k i = 0. Diseño de experimentos p. 61/111

62 Contrastes Los contrastes para las preguntas anteriores son: comercial vs. atmósfera artificial C 1 = µ (µ 2 + µ 3 + µ 4 ) vacío vs. gases C 2 = µ (µ 3 + µ 4 ) mezcla de gases vs. CO2 puro C 3 = µ 3 µ 4 Diseño de experimentos p. 62/111

63 Contrastes El estimador del contraste C = t k i µ i es Ĉ = t k iˆµ i = t k i ȳ i. i=1 i=1 i=1 Si suponemos que entonces y ij N ( µ i, σ 2) ȳ i. N ( µ i, σ 2 /n i ) Por lo tanto, Ĉ = t k i ȳ i. N i=1 ( t t k i µ i, σ 2 i=1 i=1 k 2 i n i ) Diseño de experimentos p. 63/111

64 Contrastes Ya que: E ( t ) k i ȳ i. = t k i E (ȳ i. ) = t k i µ i i=1 i=1 i=1 V ( t ) k i ȳ i. }{{} = i=1 m.indep t ki 2 V (ȳ i. ) = i=1 t i=1 k 2 i σ 2 n i = σ 2 t i=1 k 2 i n i ˆV (Ĉ) = ˆσ 2 t i=1 k 2 i n i = CME t i=1 k 2 i n i Diseño de experimentos p. 64/111

65 Contrastes Entonces, t i=1 k iȳ i. t i=1 k iµ i CME t i=1 k2 i /n i t g.l.error De aquí un intervalo del 100(1 α)% de confianza para el contraste C es: t Ĉ ± t 1 α/2 CME ki 2/n i g.l.error i=1 Diseño de experimentos p. 65/111

66 Contrastes Además, Ĉ C σ 2 t i=1 k2 i /n i N (0, 1) Si H 0 : t i=1 k iµ i = 0, es decir, H 0 : C = 0 es cierta, entonces, Sea Ĉ 2 σ 2 t i=1 k2 i /n i SS c = χ 2 1 Ĉ 2 t i=1 k2 i /n i entonces SS c /σ 2 t SSE/σ 2 (n t) = Ĉ2 / i=1 k2 i /n i CME F 1,n t Por lo tanto, para probar H 0 : C = 0 se rechaza si F c > F α 1,n t Diseño de experimentos p. 66/111

67 Contrastes El número de contrastes que se pueden hacer es muy grande, sin embargo, esta técnica tiene su mayor utilidad cuando se aplica a comparaciones planeadas antes de realizar el experimento. Una clase de contrastes, conocida como Contrastes ortogonales (como son los del ejemplo anterior) tienen propiedades especiales con respecto a la partición de sumas de cuadrados y grados de libertad y con respecto a su relación entre ellos. La ortogonalidad implica que un contraste no aporta información acerca de otro. Dos contrastes, con coeficientes {k i }, {l i } son ortogonales si t i=1 k i l i n i = 0 Diseño de experimentos p. 67/111

68 Contrastes Para t tratamientos existe un conjunto de t 1 contrastes ortogonales, los cuales hacen una partición de la suma de cuadrados de tratamientos en t 1 componentes independientes, cada uno con 1 g.l. Por lo tanto las pruebas realizadas con contrastes ortogonales son independientes. En el ejemplo anterior, los contrastes son ortogonales. k 1 k 2 k 3 k 4 C 1 1-1/3-1/3-1/3 C /2-1/2 C Diseño de experimentos p. 68/111

69 ANOVA La tabla de ANOVA incorporando las pruebas de hipótesis de los 3 contrastes es: F.V. g.l. SS CM F Pr > F trat C C C error total Se rechaza H 0 : µ 1 = µ 2 = µ 3 = µ 4 Se rechaza H 01 : µ 1 = 1 3 (µ 2 + µ 3 + µ 4 ) No se rechaza H 02 : µ 2 = 1 2 (µ 3 + µ 4 ) Se rechaza H 03 : µ 3 = µ 4 SS C1 = Ĉ r 4 i=1 k2 i = (2.11) ( 1/3) 2 3 = = Diseño de experimentos p. 69/111

70 Otro ejemplo Los siguientes datos son los tiempos de coagulación de sangre para 24 animales que fueron aleatoriamente asignados a una de cuatro dietas (A,B,C,D) Dieta A Dieta B Dieta C Dieta D Diseño de experimentos p. 70/111

71 Otro ejemplo Pruebe la hipótesis de igualdad de medias H 0 : µ 1 = µ 2 = µ 3 = µ 4. Pruebe el siguiente contraste: (pendiente) El promedio de la dieta A y B es igual al promedio de la C y D El análisis en R: Los datos están en el archivo coag.txt El programa está en anova_coag.txt Diseño de experimentos p. 71/111

72 Comparaciones múltiples En muchas situaciones prácticas, se desea comparar pares de medias. Podemos determinar cuáles medias difieren probando las diferencias entre todos los pares de medias de tratamientos. Es decir, estamos interesados en contrastes de la forma Γ = µ i µ j i j Lo primero que se nos viene a la mente es hacer una prueba t para cada par de medias, es decir, probar H 0 : µ i = µ j H a : µ i µ j i j Diseño de experimentos p. 72/111

73 Comparaciones múltiples Si suponemos varianzas iguales, se tiene la estadística de prueba t c = ȳi. ȳ j. s p 1 n i + 1 n j y se rechaza H 0 al nivel de significancia α si t c t α/2 n i +n j 2 ó t c t 1 α/2 n i +n j 2 Esto es equivalente a decir que se rechaza H 0 si t c = ȳ i. ȳ j. s p 1 n i + 1 n j > t 1 α/2 n i +n j 2 o equivalente a ȳ i. ȳ j. > t 1 α/2 n i +n j 2 s p 1 n i + 1 n j Diseño de experimentos p. 73/111

74 Comparaciones múltiples Esta prueba conocida como Diferencia Mínima Significativa (DMS ó LSD) en el contexto de ANOVA, lo que hace es comparar el valor absoluto de la diferencia de cada par de medias con DMS: Si ȳ i. ȳ j. > DMS = t 1 α/2 glerror se rechaza H 0 : µ i = µ j. CME ( 1 n i + 1 n j CME es el cuadrado medio del error que es una estimación ponderada de la varianza basada en t estimaciones de la varianza. El utilizar este procedimiento no es conveniente por que el nivel de significancia global, es decir, para el conjunto de todas las pruebas, resulta muy superior al nivel de significancia (α) planeado. ) Diseño de experimentos p. 74/111

75 Comparaciones múltiples Por ejemplo, si se tienen 4 medias de tratamientos, entonces se tienen ( ) 4 = 4! 2 2!2! = 6 pares a comparar, es decir, 6 pruebas de hipótesis a realizar, con lo que se pueden cometer 0, 1, 2, 3, 4, 5, ó 6 errores Tipo I, si todas las medias son iguales. Se define otra forma de error tipo I basado en los riesgos acumulados asociados a la familia de pruebas bajo consideración. Este es el error tipo I del experimento α E que es el riesgo de cometer el error tipo I al menos una vez. La probabilidad de error tipo I del experimento puede evaluarse para una familia de pruebas independientes. Diseño de experimentos p. 75/111

76 Comparaciones múltiples Sin embargo, todas las pruebas a pares usando la DMS no son independientes, puesto que el CME es el mismo en cada una de las estadísticas de prueba y el numerador contiene las mismas medias en varias de las estadísticas de prueba. Aún así, se puede evaluar el límite superior de la probabilidad de error tipo I del experimento, suponiendo n pruebas independientes. Suponga que la H 0 es cierta para cada una de las n = ( ) t 2 pruebas y que son independientes. Sea α c = P(error tipo I) en una sola prueba (comparación) con (1 α c ) = P(decisión correcta). Diseño de experimentos p. 76/111

77 Comparaciones múltiples La probabilidad de cometer x errores tipo I está dada por la distribución binomial como: P(X = x) = ( ) n α x x c(1 α c ) n x P(X = x) = n! (n x)!x! αx c(1 α c ) n x x = 0, 1, 2,...,n La probabilidad de no cometer ningún error tipo I es P(X = 0) = (1 α c ) n Diseño de experimentos p. 77/111

78 Comparaciones múltiples La probabilidad de cometer al menos 1 error tipo I es P(X 1) = 1 P(X = 0) = 1 (1 α c ) n es decir, la máxima probabilidad de cometer al menos un error tipo I entre las n comparaciones es: α E = 1 (1 α c ) n de aquí α c = 1 (1 α E ) 1/n Diseño de experimentos p. 78/111

79 Comparaciones múltiples # de pruebas α E cuando α c cuando indep. n α c = 0.05 α E = Por el razonamiento anterior es que han surgido una serie de pruebas de diferentes autores para hacer comparaciones múltiples tratando de mantener la P(error tipo I del experimento) = α Diseño de experimentos p. 79/111

80 Bonferroni α E nα c n comparaciones, la igualdad se dá cuando las pruebas son independientes. Entonces, α c = α E /n Si queremos α E = 0.05 entonces, α c = 0.05/n y se hacen las pruebas t para los pares de medias con un nivel de significancia α c en cada una de ellas. Diseño de experimentos p. 80/111

81 Tukey Conocida como la prueba de la Diferencia Mínima Significativa Honesta (DMSH) CME DMSH = qt,glerror α r DMSH = qt,glerror α CME 2 si n i = r i ( ) n i n j Si ȳ i. ȳ j. > DMSH se rechaza H 0 : µ i = µ j. q α ν 1,ν 2 se obtiene de las "tablas de rangos estudentizados". Diseño de experimentos p. 81/111

82 Tukey Para el ejemplo del empaque de carne: Comercial Al vacío CO,O2,N CO2 ȳ i S 2 = CME = con 8g.l. t = 4, r = 3 DMSH = q , = (4.53)(0.197) = ȳ 1. ȳ 2. = 1.98 ȳ 1. ȳ 3. = 0.22 ȳ 1. ȳ 4. = 4.12 ȳ 2. ȳ 3. = 1.76 ȳ 2. ȳ 4. = 2.14 ȳ 3. ȳ 4. = 3.90 Diseño de experimentos p. 82/111

83 Student-Newman-Keuls (SNK) Se calcula un conjunto de valores críticos k p = q α p,fsȳi. p = 2, 3,...,t donde qp,f α es el percentil 1 α de la distribución del rango estudentizado para el número p de medias involucradas en la comparación y f g.l. del error, y Sȳi. = Para el ejemplo de la carne empacada: CME r p q p, k p Diseño de experimentos p. 83/111

84 Student-Newman-Keuls (SNK) Comercial Al vacío CO,O2,N CO2 ȳ i Medias ordenadas: ȳ 4. = 3.36 ȳ 2. = 5.50 ȳ 3. = 7.26 ȳ 1. = 7.48 ȳ 4. ȳ 1. = 4.12 > k4 ȳ 4. ȳ 3. = 3.90 > k3 ȳ 4. ȳ 2. = 2.14 > k2 ȳ 2. ȳ 1. = 1.98 > k3 ȳ 2. ȳ 3. = 1.76 > k2 ȳ 3. ȳ 1. = 0.22 < k 2 (N.S.) Diseño de experimentos p. 84/111

85 Duncan Es similar a la de SNK. Los promedios de los t tratamientos se ordenan en forma ascendente y el error estándar de cada promedio se determina con CME Sȳi. = si n i = r i r Para muestras de diferente tamaño, se reemplaza la r por la media armónica (n h ) de los {n i } n h = t t i=1 ( ) 1 n i Diseño de experimentos p. 85/111

86 Duncan De las tablas de Duncan de rangos significativos se obtienen los valores de rp,f α para p = 2, 3,...,t. p es el número de medias involucradas en la comparación, α es el nivel de significancia y f los grados de libertad del error. Se calculan R p = r α p,fsȳi. p = 2, 3,...,t Para el ejemplo de la carne empacada: p r p, R p Diseño de experimentos p. 86/111

87 Duncan Comercial Al vacío CO,O2,N CO2 ȳ i Medias ordenadas: ȳ 4. = 3.36 ȳ 2. = 5.50 ȳ 3. = 7.26 ȳ 1. = 7.48 ȳ 4. ȳ 1. = 4.12 > R4 ȳ 4. ȳ 3. = 3.90 > R3 ȳ 4. ȳ 2. = 2.14 > R2 ȳ 2. ȳ 1. = 1.98 > R3 ȳ 2. ȳ 3. = 1.76 > R2 ȳ 3. ȳ 1. = 0.22 < R 2 (N.S.) Diseño de experimentos p. 87/111

88 Dunnett Para comparar las medias de los tratamientos con la media del tratamiento control. Suponga que el tratamiento t es el control, queremos probar las hipótesis H 0 : µ i = µ t H a : µ i µ t i = 1, 2,...,t 1 H 0 : µ i = µ t se rechaza si CME ȳ i. ȳ t. > D = d α (t 1, glerror) r con d α (k, ν) es el percentil 1 α de las tablas de Dunnett. Para el ejemplo de la carne empacada, el tratamiento 1 es el control. Comercial Al vacío CO,O2,N CO2 ȳ i Diseño de experimentos p. 88/111

89 Dunnett d 0.05,3,8 = 2.42 ( ) CME D = 2.42 = r ȳ 2. ȳ 1. = 1.98 > D ȳ 3. ȳ 1. = 0.22 < D(N.S.) ȳ 4. ȳ 1. = 4.12 > D Diseño de experimentos p. 89/111

90 Scheffé Scheffé (1953) propuso un método para probar todos los posibles contrastes. Considere cualquier contraste C = t k i µ i i=1 t estimado con Ĉ = k i ȳ i. i=1 con error estándar S C = [ t CME i=1 k 2 i n i ] La hipótesis nula pra el contraste H 0 : C = 0 se rechaza si C > S(α E ) donde S(α E ) = S C (t 1)F α E t 1,g.l.error Diseño de experimentos p. 90/111

91 Análisis de residuales Tenemos el modelo Suposiciones: errores normales independientes varianza constante y ij = µ i + ǫ ij ó y ij = µ + τ i + ǫ ij ǫ ij NID ( 0, σ 2) La prueba F del análisis de varianza es robusta a falta de normalidad. Diseño de experimentos p. 91/111

92 Análisis de residuales Si los errores experimentales están correlacionados, el error estándar estará mal estimado. La independencia se justifica aleatorizando las u.e. a los tratamientos en experimentos y seleccionando muestras aleatorias en estudios observacionales. Si no hay homogeneidad de varianzas el estimador de σ 2 es malo, aunque se ha visto en estudios que si el diseño es balanceado no efecta mucho. También si los tamaños de muestra mayores corresponden a las poblaciones con mayor varianza. Diseño de experimentos p. 92/111

93 Análisis de residuales, Normalidad Residuales e ij = y ij ŷ ij ŷ ij = µ + τ i = ˆµ i = ȳ i. e ij = y ij ȳ i. Prueba no parámetrica ( Kolmogorov-Smirnov ) Histograma (muestras grandes) gráfica en papel normal análisis de residuales estandarizados para detectar outliers. Si ǫ ij N(0, σ 2 ) entonces ǫ ij 0 σ N(0, 1). Sean d ij = e ij CME, esperamos que: 68% de los residuales estandarizados estén entre -1 y 1 95 % estén entre -2 y 2 Virtualmente todos estén entre -3 y 3. Diseño de experimentos p. 93/111

94 Análisis de residuales, Homogeneidad de varianzas Prueba de Bartlett H 0 : σ 2 1 = σ 2 2 =... = σ 2 t H a : no H 0 Estadística de Prueba: [ U = 1 (n t)ln(ˆσ 2 ) C i (n i 1)ln(ˆσ 2 i ) ] donde ˆσ 2 = i C = 1 + (n i 1)ˆσ 2 i n t 1 3(t 1) ˆσ i 2 = (y ij ȳ i. ) 2 n j i 1 ( ) 1 n i 1 1 n t H 0 se rechaza si U > χ 2 α,t 1 (prueba sensible a falta de normalidad) i Diseño de experimentos p. 94/111

95 Análisis de residuales, Homogeneidad de varianzas Prueba de Levene Se calcula d ij = y ij ỹ i. i = 1,...,t j = 1,...,n i donde ỹ i. es la mediana de las observaciones en el tratamiento i. Se evalúa si el promedio de estas observaciones d ij es igual para todos los tratamientos, es decir, se hace un ANOVA para probar igualdad de medias de d ij. Diseño de experimentos p. 95/111

96 Prueba de Welch La prueba F usual es robusta ante heteroscedasticidad (varianzas diferentes) si los tamaños de muestra son muy parecidos o, si los tamaños de muestra más grandes corresponden a las poblaciones con varianzas más grandes. Sin embargo, se han construído algunas procedimientos de prueba de igualdad de medias (H 0 : µ 1 = µ 2 =... = µ t ) como por ejemplo el desarrollado por Welch, conocido como la prueba de Welch, utilizada cuando no hay homoscedasticidad. Sean W i = n i /ˆσ 2 i ȳ = i W iȳ i. / i W i y Λ = i (1 W i /W. ) 2 n i 1 donde W. = i W i. Diseño de experimentos p. 96/111

97 Prueba de Welch Entonces F c = i W i (ȳ i. ȳ ) 2 t (t 2)Λ/(t 2 1) tiene aproximadamente una distribución F con ν 1 = t 1 y ν 2 = (t 2 1)/3Λ grados de libertad. H 0 : µ 1 = µ 2 =... = µ t se rechaza al nivel de significancia α si F c > F α ν 1,ν 2. Diseño de experimentos p. 97/111

98 Transformaciones Se utilizan las transformaciones para cambiar la escala de las observaciones para que se cumplan las suposiciones del modelo lineal y dar inferencias válidas del análisis de varianza. Cuando las transformaciones son necesarias, se hace el análisis y se hacen las inferencias en la escala transformada pero se presentan tablas de medias en la escala de medición original. 1. Distribución Poisson. Mediciones que son conteos (número de plantas en cierta área, insectos en plantas, accidentes por unidad de tiempo) tienen distribución Poisson. La transformación x = y + a, a R es la adecuada. Diseño de experimentos p. 98/111

99 Transformaciones 2. Distribución binomial. Observaciones del número de éxitos en n ensayos independientes tiene distribución binomial (proporción de semillas germinadas, proporción de plantas con flores en un transecto). ˆπ = y/n La transformación x = sin 1 ˆπ es la adecuada. Las transformaciones del tipo potencia alteran la simetría o asimetría de las distribuciones de las observaciones. Si suponemos que la desviación estándar de y es proporcional a alguna potencia de la media, es decir, σ y µ β Una transformación de las observaciones, del estilo: x = y p Diseño de experimentos p. 99/111

100 Transformaciones Da una relación σ x µ p+β 1 Si p = 1 β entonces la desviación estándar de la variable transformada x será constante, ya que p + β 1 = 0 y σ x µ 0. La transformación de Box-Cox x = (y p 1)/p p 1 x = log e y p = 1 El estimador de p se encuentra maximizando L(p) = 1 2 log e [CME(p)] donde CME(p) es el cuadrado medio del error del análisis de varianza usando la transformación x = (y p 1)/p para el valor dado p. Diseño de experimentos p. 100/111

101 Transformaciones Se determina CME(p) para un conjunto de valores de p, se grafica CME(p) vs. p y se toma el valor de p que corresponde al valor mínimo de CME(p). JMP calcula la transformación de Box-Cox, da una gráfica de p vs. CME y da la opción de guardar los datos transformados en el archivo. La dificultad de utilizar esta transformación es la interpretación. Diseño de experimentos p. 101/111

102 Ejemplo Los siguientes datos son el número de errores en un examen de sujetos bajo la influencia de dos drogas. El grupo 1 es un grupo control (sin droga), a los sujetos del grupo 2 se les dió la droga 1, a los del grupo 3 la droga 2 y a los del grupo 4 las dos drogas. Grupo 1 Grupo 2 Grupo 3 Grupo 4 (sin droga) (droga 1) (droga 2) (dos drogas) Diseño de experimentos p. 102/111

103 Ejemplo Correr el ejemplo con R y JMP. 1. Probar homogeneidad de varianzas. (Bartlett y Levene) 2. Hacer prueba de Welch 3. Probar con algunas transformaciones, checando normalidad y homogeneidad de varianzas ej2_1_messy.jmp ej2_1_messy.txt Diseño de experimentos p. 103/111

104 Relación entre Regresión y ANOVA Cualquier modelo de ANOVA se puede escribir como un modelo de regresión lineal. Suponga el ejemplo de la carne empacada tratamiento comercial vacío mezcla CO Un diseño completamente al azar con un solo factor (método de empacado) con 4 niveles (4 tratamientos) y 3 repeticiones en cada tratamiento (diseño balanceado). Diseño de experimentos p. 104/111

105 Relación entre Regresión y ANOVA Modelo ANOVA completamente al azar un solo factor balanceado: y ij = µ i + ǫ ij = µ + τ i + ǫ ij { i = 1, 2, 3, 4 j = 1, 2, 3 El modelo de regresión equivalente es: y ij = β 0 + β 1 x 1j + β 2 x 2j + β 3 x 3j + ǫ ij { i = 1, 2, 3, 4 j = 1, 2, 3 Diseño de experimentos p. 105/111

106 Relación entre Regresión y ANOVA Donde las variables x 1j, x 2j, x 3j están definidas como: x 1j = x 2j = x 3j = { { { 1 si la observación j es del tratamiento 1 0 en otro caso 1 si la observación j es del tratamiento 2 0 en otro caso 1 si la observación j es del tratamiento 3 0 en otro caso Diseño de experimentos p. 106/111

107 Relación entre Regresión y ANOVA La relación entre los parámetros del modelo ANOVA y el modelo de regresión es: Si la observación viene del tratamiento 1, entonces x 1j = 1, x 2j = 0, x 3j = 0 y el modelo de regresión es y 1j = β 0 + β 1 (1) + β 2 (0) + β 3 (0) + ǫ 1j = β 0 + β 1 + ǫ 1j y el modelo ANOVA es: y 1j = µ 1 + ǫ 1j = µ + τ 1 + ǫ 1j Por lo tanto: β 0 + β 1 = µ 1 = µ + τ 1 Diseño de experimentos p. 107/111

108 Relación entre Regresión y ANOVA Similarmente, para las observaciones del tratamiento 2 y 2j = β 0 + β 1 (0) + β 2 (1) + β 3 (0) + ǫ 2j = β 0 + β 2 + ǫ 2j y la relación entre los parámetros es: β o + β 2 = µ 2 = µ + τ 2 Lo mismo para las observaciones del tratamiento 3 y 3j = β 0 + β 1 (0) + β 2 (0) + β 3 (1) + ǫ 3j = β 0 + β 3 + ǫ 3j y la relación entre los parámetros es: β o + β 3 = µ 3 = µ + τ 3 Diseño de experimentos p. 108/111

109 Relación entre Regresión y ANOVA Finalmente, considere las observaciones del tratamiento 4, para las cuales el modelo de regresión es: y 4j = β 0 + β 1 (0) + β 2 (0) + β 3 (0) + ǫ 4j = β 0 + ǫ 4j entonces β 0 = µ 4 = µ + τ 4 Por lo tanto, β 0 = µ 4 β 1 = µ 1 µ 4 β 2 = µ 2 µ 4 β 3 = µ 3 µ 4 Diseño de experimentos p. 109/111

110 Relación entre Regresión y ANOVA Entonces, para probar la hipótesis H 0 : µ 1 = µ 2 = µ 3 = µ 4 tendríamos que probar H 0 : β 1 = β 2 = β 3 = 0, lo cual se puede hacer con cualquier paquete de cómputo estadístico. Para el ejemplo de la carne empacada: tratamiento y x 1 x 2 x Diseño de experimentos p. 110/111

111 Relación entre Regresión y ANOVA Si pedimos una regresión y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ǫ y pedimos una tabla de análisis de varianza del modelo y ij = µ + τ i + ǫ ij las dos tablas ANOVA son idénticas. Diseño de experimentos p. 111/111

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD.

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD. Experimentos con un solo factor: El análisis de varianza Jhon Jairo Padilla Aguilar, PhD. Experimentación en sistemas aleatorios: Factores Controlables Entradas proceso Salidas Factores No controlables

Más detalles

TEMA 5 VALIDEZ DE LA INVESTIGACIÓN (II): Validez de conclusión estadística

TEMA 5 VALIDEZ DE LA INVESTIGACIÓN (II): Validez de conclusión estadística TEMA 5 VALIDEZ DE LA INVESTIGACIÓN (II): Validez de conclusión estadística 1 TAMAÑO DEL EFECTO 2 TAMAÑO DEL EFECTO vel tamaño del efecto es el nombre dado a una familia de índices que miden la magnitud

Más detalles

ANÁLISIS DE DATOS NO NUMERICOS

ANÁLISIS DE DATOS NO NUMERICOS ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas

Más detalles

Detergente Lavad.1 Lavad.2 Lavad.3 Media A 45 43 51 46.3 B 47 44 52 47.6 C 50 49 57 52 D 42 37 49 42.6. Media 46 43.2 52.2 47.16

Detergente Lavad.1 Lavad.2 Lavad.3 Media A 45 43 51 46.3 B 47 44 52 47.6 C 50 49 57 52 D 42 37 49 42.6. Media 46 43.2 52.2 47.16 3. DISEÑO EN BLOQUES ALEATORIZADOS En muchos experimentos además de que interesa investigar la influencia de un factor controlado sobre la variable de respuesta, como en la sección anterior, existe una

Más detalles

Capítulo 7: Distribuciones muestrales

Capítulo 7: Distribuciones muestrales Capítulo 7: Distribuciones muestrales Recordemos: Parámetro es una medida de resumen numérica que se calcularía usando todas las unidades de la población. Es un número fijo. Generalmente no lo conocemos.

Más detalles

Tema IV. EL ANOVA de un factor

Tema IV. EL ANOVA de un factor 4.1. La estrategia del Análisis de varianza: - Los test t múltiples (múltiples tratamientos); corrección a posteriori - La mejora del ANOVA: necesidad de análisis a posteriori C Test t A versus B A versus

Más detalles

Matrices equivalentes. El método de Gauss

Matrices equivalentes. El método de Gauss Matrices equivalentes. El método de Gauss Dada una matriz A cualquiera decimos que B es equivalente a A si podemos transformar A en B mediante una combinación de las siguientes operaciones: Multiplicar

Más detalles

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales Estadística 38 Tema 3: Variables aleatorias y vectores aleatorios bidimensionales El concepto de variable aleatoria surge de la necesidad de hacer más manejables matemáticamente los resultados de los experimentos

Más detalles

Indicaciones específicas para los análisis estadísticos.

Indicaciones específicas para los análisis estadísticos. Tutorial básico de PSPP: Vídeo 1: Describe la interfaz del programa, explicando en qué consiste la vista de datos y la vista de variables. Vídeo 2: Muestra cómo crear una base de datos, comenzando por

Más detalles

Covarianza y coeficiente de correlación

Covarianza y coeficiente de correlación Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también

Más detalles

Diseño Estadístico de Experimentos

Diseño Estadístico de Experimentos Capítulo 3 Diseño Estadístico de Experimentos Una prueba o serie de pruebas en las cuales se introducen cambios deliberados en las variables de entrada que forman el proceso, de manera que sea posible

Más detalles

Tema 12: Contrastes Paramétricos

Tema 12: Contrastes Paramétricos Tema 1 Tema 1: Contrastes Paramétricos Presentación y Objetivos. Se comienza este tema introduciendo la terminología y conceptos característicos de los contrastes de hipótesis, típicamente a través de

Más detalles

Calculadora de Tamaño muestral GRANMO

Calculadora de Tamaño muestral GRANMO Calculadora de Tamaño muestral GRANMO Versión 7.12 Abril 2012 http://www.imim.es/ofertadeserveis/software-public/granmo/ Entre las distintas ofertas que existen para el cálculo del tamaño muestral, ofrecemos

Más detalles

Tema 2. Espacios Vectoriales. 2.1. Introducción

Tema 2. Espacios Vectoriales. 2.1. Introducción Tema 2 Espacios Vectoriales 2.1. Introducción Estamos habituados en diferentes cursos a trabajar con el concepto de vector. Concretamente sabemos que un vector es un segmento orientado caracterizado por

Más detalles

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009 Índice general 6. Regresión Múltiple 3 6.1. Descomposición de la variabilidad y contrastes de hipótesis................. 4 6.2. Coeficiente de determinación.................................. 5 6.3. Hipótesis

Más detalles

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases. BASES Y DIMENSIÓN Definición: Base. Se llama base de un espacio (o subespacio) vectorial a un sistema generador de dicho espacio o subespacio, que sea a la vez linealmente independiente. β Propiedades

Más detalles

Inferencia Estadística

Inferencia Estadística EYP14 Estadística para Construcción Civil 1 Inferencia Estadística El campo de la inferencia estadística está formado por los métodos utilizados para tomar decisiones o para obtener conclusiones sobre

Más detalles

Media vs mediana vs moda Cual medida de tendencia central es mas adecuada? MEDIA conveniencias:

Media vs mediana vs moda Cual medida de tendencia central es mas adecuada? MEDIA conveniencias: Iniciar con las interpretaciones de las medidas MEDIA VS MEDIANA VS MODA CUAL ES LA MEDIDA ADECUADA TAREA MEDIA PONDERADA Actividad de Medidas de Localización Problema 1. El problema de las tasas de delito.

Más detalles

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

Metodología. del ajuste estacional. Tablero de Indicadores Económicos Metodología del ajuste estacional Tablero de Indicadores Económicos Metodología del ajuste estacional Componentes de una serie de tiempo Las series de tiempo están constituidas por varios componentes que,

Más detalles

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias Carlos Velasco 1 1 Departamento de Economía Universidad Carlos III de Madrid Econometría I Máster en Economía

Más detalles

Estimación. Intervalos de Confianza para la Media y para las Proporciones

Estimación. Intervalos de Confianza para la Media y para las Proporciones Estimación. Intervalos de Confianza para la Media y para las Proporciones Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua Estimación El objetivo

Más detalles

Curso Comparabilidad de resultados

Curso Comparabilidad de resultados Curso Comparabilidad de resultados Director: Gabriel A. Migliarino. Docente: Evangelina Hernández. Agenda Introducción. n. Protocolos iniciales de comparación de métodos. m * EP9-A2. CLSI. * Comparación

Más detalles

6. DISEÑOS FACTORIALES 2 K NO REPLICADOS

6. DISEÑOS FACTORIALES 2 K NO REPLICADOS 6. DISEÑOS FACTORIALES 2 K NO REPLICADOS 6.1 INTRODUCCION El aumentar el numero de factores en un diseño 2 k crece rápidamente el numero de tratamientos y por tanto el numero de corridas experimentales.

Más detalles

CORRELACIÓN Y PREDICIÓN

CORRELACIÓN Y PREDICIÓN CORRELACIÓN Y PREDICIÓN 1. Introducción 2. Curvas de regresión 3. Concepto de correlación 4. Regresión lineal 5. Regresión múltiple INTRODUCCIÓN: Muy a menudo se encuentra en la práctica que existe una

Más detalles

Análisis de medidas conjuntas (conjoint analysis)

Análisis de medidas conjuntas (conjoint analysis) Análisis de medidas conuntas (conoint analysis). Introducción Como ya hemos dicho anteriormente, esta técnica de análisis nos sirve para analizar la importancia que dan los consumidores a cada uno de los

Más detalles

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de CAPITULO 4 JUSTIFICACION DEL ESTUDIO En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de estudios previos y los alcances que justifican el presente estudio. 4.1. Justificación.

Más detalles

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n Un diseño experimental que se utiliza muy a menudo es el de un grupo control y uno de tratamiento. En el caso de que los datos sean cuantitativos y sigan una distribución normal, la hipótesis de interés

Más detalles

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 1 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA Páginas 74-75 Lanzamiento de varios dados Comprobación de que: Desviación típica de n dados = (Desv. típica para un dado) / 1,71 n = 1,1 1,71 n = 3 0,98

Más detalles

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos.

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos. PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) PRUEBAS NO PARAMÉTRICAS F(X) es la función de distribución que hipotetizamos. Fs(X) es la probabilidad o proporción teórica de

Más detalles

Explicación de la tarea 3 Felipe Guerra

Explicación de la tarea 3 Felipe Guerra Explicación de la tarea 3 Felipe Guerra 1. Una ruleta legal tiene los números del 1 al 15. Este problema corresponde a una variable aleatoria discreta. La lectura de la semana menciona lo siguiente: La

Más detalles

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma: Ignacio Martín Tamayo 25 Tema: ANÁLISIS DE VARIANZA CON SPSS 8.0 ÍNDICE --------------------------------------------------------- 1. Modelos de ANOVA 2. ANOVA unifactorial entregrupos 3. ANOVA multifactorial

Más detalles

4 Pruebas y análisis del software

4 Pruebas y análisis del software 4 Pruebas y análisis del software En este capítulo se presentan una serie de simulaciones donde se analiza el desempeño de ambos sistemas programados en cuanto a exactitud con otros softwares que se encuentran

Más detalles

Técnicas de valor presente para calcular el valor en uso

Técnicas de valor presente para calcular el valor en uso Normas Internacionales de Información Financiera NIC - NIIF Guía NIC - NIIF NIC 36 Fundación NIC-NIIF Técnicas de valor presente para calcular el valor en uso Este documento proporciona una guía para utilizar

Más detalles

ACCIONES Y OTROS TÍTULOS DE INVERSIÓN

ACCIONES Y OTROS TÍTULOS DE INVERSIÓN ACCIONES Y OTROS TÍTULOS DE INVERSIÓN TASAS EFECTIVAS DE RENDIMIENTO ANUAL Y MENSUAL: Es aquélla que se emplea en la compraventa de algunos valores en el Mercado Bursátil o Bolsa de Valores. Estas tasas

Más detalles

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL. REPASO COCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓ ORMAL. Éste es un breve repaso de conceptos básicos de estadística que se han visto en cursos anteriores y que son imprescindibles antes de acometer

Más detalles

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral Enero 2005 1.- INTRODUCCIÓN En múltiples ocasiones el analista o investigador se enfrenta al problema de determinar

Más detalles

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones. TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones. La herramienta que nos indica si el proceso está o no controlado o Estado de Control son

Más detalles

TEMA 4: Introducción al Control Estadístico de Procesos

TEMA 4: Introducción al Control Estadístico de Procesos TEMA 4: Introducción al Control Estadístico de Procesos 1 Introducción 2 Base estadística del diagrama de control 3 Muestreo y agrupación de datos 4 Análisis de patrones en diagramas de control 1. Introducción

Más detalles

Pruebas de. Hipótesis

Pruebas de. Hipótesis Pruebas de ipótesis Pruebas de ipótesis Otra manera de hacer inferencia es haciendo una afirmación acerca del valor que el parámetro de la población bajo estudio puede tomar. Esta afirmación puede estar

Más detalles

TEMA 7: Análisis de la Capacidad del Proceso

TEMA 7: Análisis de la Capacidad del Proceso TEMA 7: Análisis de la Capacidad del Proceso 1 Introducción Índices de capacidad 3 Herramientas estadísticas para el análisis de la capacidad 4 Límites de tolerancia naturales 1 Introducción La capacidad

Más detalles

1.4 Cálculo de Probabilidades con Métodos de Conteo. Considerere un espacio muestral finito,

1.4 Cálculo de Probabilidades con Métodos de Conteo. Considerere un espacio muestral finito, 1 1.4 Cálculo de Probabilidades con Métodos de Conteo Considerere un espacio muestral finito, y defina, Luego, Ω = {ω 1,..., ω n }, P ({ω i }) = p i, i = 1,..., n P (A) = ω i A p i, A Ω Ω se dice equiprobable

Más detalles

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

Análisis y cuantificación del Riesgo

Análisis y cuantificación del Riesgo Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el

Más detalles

TEMA 4: Variables binarias

TEMA 4: Variables binarias TEMA 4: Variables binarias Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 4: Variables binarias Curso 2011-12 1 / 51 Variables

Más detalles

Grado en Finanzas y Contabilidad

Grado en Finanzas y Contabilidad Econometría Grado en Finanzas y Contabilidad Apuntes basados en el libro Introduction to Econometrics: A modern Approach de Wooldridge 5.2 Estimadores de Variables Instrumentales La endogeneidad aparece

Más detalles

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor Capítulo 14 Análisis de varianza de un factor: El procedimiento ANOVA de un factor El análisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una variable cuantitativa. Se trata,

Más detalles

Comente: Los bancos siempre deberían dar crédito a los proyectos rentables. Falso, hay que evaluar la capacidad de pago.

Comente: Los bancos siempre deberían dar crédito a los proyectos rentables. Falso, hay que evaluar la capacidad de pago. Explique Brevemente en que consiste el leasing y nombre los diferentes tipos existentes. Es un mecanismo de financiamiento de Activos el cual permite el uso del activo por un periodo determinado a cambio

Más detalles

Tema 3. Espacios vectoriales

Tema 3. Espacios vectoriales Tema 3. Espacios vectoriales Estructura del tema. Definición y propiedades. Ejemplos. Dependencia e independencia lineal. Conceptos de base y dimensión. Coordenadas Subespacios vectoriales. 0.1. Definición

Más detalles

Lección 24: Lenguaje algebraico y sustituciones

Lección 24: Lenguaje algebraico y sustituciones LECCIÓN Lección : Lenguaje algebraico y sustituciones En lecciones anteriores usted ya trabajó con ecuaciones. Las ecuaciones expresan una igualdad entre ciertas relaciones numéricas en las que se desconoce

Más detalles

Muestreo estadístico. Relación 2 Curso 2007-2008

Muestreo estadístico. Relación 2 Curso 2007-2008 Muestreo estadístico. Relación 2 Curso 2007-2008 1. Para tomar la decisión de mantener un determinado libro como texto oficial de una asignatura, se pretende tomar una muestra aleatoria simple entre los

Más detalles

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS ANÁLISIS DE DATOS Hoy día vamos a hablar de algunas medidas de resumen de datos: cómo resumir cuando tenemos una serie de datos numéricos, generalmente en variables intervalares. Cuando nosotros tenemos

Más detalles

Métodos y Diseños utilizados en Psicología

Métodos y Diseños utilizados en Psicología Métodos y Diseños utilizados en Psicología El presente documento pretende realizar una introducción al método científico utilizado en Psicología para recoger información acerca de situaciones o aspectos

Más detalles

Curso de Estadística no-paramétrica

Curso de Estadística no-paramétrica Curso de Estadística no-paramétrica Sesión 1: Introducción Inferencia no Paramétrica David Conesa Grup d Estadística espacial i Temporal Departament d Estadística en Epidemiologia i Medi Ambient i Investigació

Más detalles

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 1 de agosto de 2003 1. Introducción Cualquier modelo de una situación es una simplificación de la situación real. Por lo tanto,

Más detalles

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante Capítulo 15 Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante Los modelos factoriales de análisis de varianza (factorial = más de un factor) sirven para evaluar el efecto

Más detalles

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68. Departamento de Economía Aplicada: UDI de Estadística. Universidad Autónoma de Madrid Notas sobre el manejo de Excel para el análisis descriptivo y exploratorio de datos. (Descriptiva) 1 1 Introducción

Más detalles

ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ

ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ Presentado a: MARIA ESTELA SEVERICHE CORPORACION UNIVERSITARIA

Más detalles

Tema 7: Modelos de diseños de experimentos

Tema 7: Modelos de diseños de experimentos Tema 7: Modelos de diseños de experimentos Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 7: Modelos de diseños de experimentos Curso

Más detalles

SEMINARIOS. (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática

SEMINARIOS. (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática SEMINARIOS (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática Seminario de Estadística Descriptiva Unidimensional y Bidimensional 1. Se ha realizado un control de calidad en

Más detalles

Tema 3. Comparaciones de dos poblaciones

Tema 3. Comparaciones de dos poblaciones Tema 3. Comparaciones de dos poblaciones Contenidos Hipótesis para la diferencia entre las medias de dos poblaciones: muestras pareadas Hipótesis para la diferencia entre las medias de dos poblaciones:

Más detalles

ANÁLISIS DESCRIPTIVO CON SPSS

ANÁLISIS DESCRIPTIVO CON SPSS ESCUELA SUPERIOR DE INFORMÁTICA Prácticas de Estadística ANÁLISIS DESCRIPTIVO CON SPSS 1.- INTRODUCCIÓN Existen dos procedimientos básicos que permiten describir las propiedades de las distribuciones:

Más detalles

Tema 2 Estadística Descriptiva

Tema 2 Estadística Descriptiva Estadística Descriptiva 1 Tipo de Variables 2 Tipo de variables La base de datos anterior contiene la información de 2700 individuos con 8 variables. Los datos provienen de una encuesta nacional realizada

Más detalles

DETERMINACIÓN DEL VOLUMEN DE PEDIDO.

DETERMINACIÓN DEL VOLUMEN DE PEDIDO. Lote económico de compra o Lote Optimo DETERMINACIÓN DEL VOLUMEN DE PEDIDO. Concepto que vemos en casi todos libros de aprovisionamiento, habitualmente la decisión de la cantidad a reaprovisionar en las

Más detalles

Series de Tiempo. Una Introducción

Series de Tiempo. Una Introducción Series de Tiempo. Una Introducción Series de Tiempo Muchas veces, sobretodo para realizar pronósticos, resulta conveniente no suponer un modelo explícito para que explique la variables de interés, sino

Más detalles

Aplicaciones lineales continuas

Aplicaciones lineales continuas Lección 13 Aplicaciones lineales continuas Como preparación para el cálculo diferencial, estudiamos la continuidad de las aplicaciones lineales entre espacios normados. En primer lugar probamos que todas

Más detalles

RELACIONES DE RECURRENCIA

RELACIONES DE RECURRENCIA Unidad 3 RELACIONES DE RECURRENCIA 60 Capítulo 5 RECURSIÓN Objetivo general Conocer en forma introductoria los conceptos propios de la recurrencia en relación con matemática discreta. Objetivos específicos

Más detalles

8. Estimación puntual

8. Estimación puntual 8. Estimación puntual Estadística Ingeniería Informática Curso 2009-2010 Estadística (Aurora Torrente) 8. Estimación puntual Curso 2009-2010 1 / 30 Contenidos 1 Introducción 2 Construcción de estimadores

Más detalles

Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones

Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones Introducción Las Compañías aseguradoras determinan sus precios basadas en modelos y en información histórica

Más detalles

NIC 38 Activos Intangibles

NIC 38 Activos Intangibles 2012 Resumen técnico NIC 38 Activos Intangibles emitida el 1 de enero de 2012. Incluye las NIIF con fecha de vigencia posterior al 1 de enero de 2012 pero no las NIIF que serán sustituidas. Este extracto

Más detalles

MUESTREO TIPOS DE MUESTREO

MUESTREO TIPOS DE MUESTREO MUESTREO En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de

Más detalles

Qué es la Estadística Ambiental?

Qué es la Estadística Ambiental? Qué es la Estadística Ambiental? La Estadística Ambiental es simplemente la aplicación de la Estadística a problemas relacionados con el ambiente. Ejemplos de las actividades que requieren del uso de estas

Más detalles

Espacios generados, dependencia lineal y bases

Espacios generados, dependencia lineal y bases Espacios generados dependencia lineal y bases Departamento de Matemáticas CCIR/ITESM 14 de enero de 2011 Índice 14.1. Introducción............................................... 1 14.2. Espacio Generado............................................

Más detalles

ESTIMACION DE INTERVALOS DE CONFIANZA

ESTIMACION DE INTERVALOS DE CONFIANZA pag 3. Prohibida su reproducción ESTIMACION DE INTERVALOS DE CONFIANZA Una muestra permite realizar estimaciones puntuales de los parámetros de la población. Utilizando las propiedades de las distribuciones

Más detalles

IES Fco Ayala de Granada Junio de 2012 (General Modelo 4) Soluciones Germán-Jesús Rubio Luna

IES Fco Ayala de Granada Junio de 2012 (General Modelo 4) Soluciones Germán-Jesús Rubio Luna IES Fco Ayala de Granada Junio de 01 (General Modelo 4) Soluciones Germán-Jesús Rubio Luna SELECTIVIDAD ANDALUCÍA MATEMÁTICAS CCSS JUNIO 01 MODELO 4 (COMÚN) OPCIÓN A EJERCICIO 1 (A) Sea el recinto determinado

Más detalles

Clase 2: Estadística

Clase 2: Estadística Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea

Más detalles

PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2

PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2 PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2 1. Se eligen tres autos al azar y cada uno es clasificado N si tiene motor naftero o D si tiene motor diesel (por ejemplo, un resultado posible sería NND). a)

Más detalles

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión Descargado desde www.medwave.cl el 13 Junio 2011 por iriabeth villanueva Medwave. Año XI, No. 3, Marzo 2011. ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión Autor:

Más detalles

SPSS: ANOVA de un Factor

SPSS: ANOVA de un Factor SPSS: ANOVA de un Factor El análisis de varianza (ANOVA) de un factor nos sirve para comparar varios grupos en una variable cuantitativa. Esta prueba es una generalización del contraste de igualdad de

Más detalles

Transformaciones canónicas

Transformaciones canónicas apítulo 29 Transformaciones canónicas 29.1 Introducción onsideremos una transformación arbitraria de las coordenadas en el espacio de las fases de dimensión 2(3N k) (con el tiempo como un parámetro) Q

Más detalles

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz Control Estadístico del Proceso Ing. Claudia Salguero Ing. Alvaro Díaz Control Estadístico del Proceso Es un conjunto de herramientas estadísticas que permiten recopilar, estudiar y analizar la información

Más detalles

10. DISEÑOS EXPERIMENTALES

10. DISEÑOS EXPERIMENTALES 10. DISEÑOS EXPERIMENTALES Dr. Edgar Acuña http://math.uprm.edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ Diseños Experimentales de Clasificación Simple En un diseño experimental

Más detalles

CAPITULO 2 DISEÑO DE GRAFICAS ESTADISTICO-ECONOMICAS DE CONTROL DE CALIDAD.

CAPITULO 2 DISEÑO DE GRAFICAS ESTADISTICO-ECONOMICAS DE CONTROL DE CALIDAD. CAPITULO 2 DISEÑO DE GRAFICAS ESTADISTICO-ECONOMICAS DE CONTROL DE CALIDAD. En este capítulo se presenta la definición de diseño estadístico, económico y económico-estadístico para gráficas de control,

Más detalles

1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B(1, p), donde

1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B(1, p), donde Soluciones de la relación del Tema 6. 1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B1, p), donde p = P X = 1) = P la persona presente síntomas)

Más detalles

1. MEDIDAS DE TENDENCIA CENTRAL

1. MEDIDAS DE TENDENCIA CENTRAL 1. MEDIDAS DE TENDENCIA CENTRAL Lo importante en una tendencia central es calcular un valor central que actúe como resumen numérico para representar al conjunto de datos. Estos valores son las medidas

Más detalles

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido Tema 3 Medidas de tendencia central Contenido 31 Introducción 1 32 Media aritmética 2 33 Media ponderada 3 34 Media geométrica 4 35 Mediana 5 351 Cálculo de la mediana para datos agrupados 5 36 Moda 6

Más detalles

Generación de Números Pseudo-Aleatorios

Generación de Números Pseudo-Aleatorios Números Aleatorios Son un ingrediente básico en la simulación de sistemas Los paquetes de simulación generan números aleatorios para simular eventos de tiempo u otras variables aleatorias Una secuencia

Más detalles

ANÁLISIS ESTADÍSTICO Calculadora Gráfica TI 83 Plus José Carlos Vega Vilca, Ph.D.

ANÁLISIS ESTADÍSTICO Calculadora Gráfica TI 83 Plus José Carlos Vega Vilca, Ph.D. UNIVERSIDAD DE PUERTO RICO FACULTAD DE ADMINISTRACION DE EMPRESAS INSTITUTO DE ESTADISTICA ANÁLISIS ESTADÍSTICO Calculadora Gráfica TI 83 Plus, Ph.D. Presentación Este curso ofrece al estudiante, la posibilidad

Más detalles

Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0])

Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0]) Regresión logística Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0]) Se trata de calcular la probabilidad en la que una

Más detalles

LA MEDIDA Y SUS ERRORES

LA MEDIDA Y SUS ERRORES LA MEDIDA Y SUS ERRORES Magnitud, unidad y medida. Magnitud es todo aquello que se puede medir y que se puede representar por un número. Para obtener el número que representa a la magnitud debemos escoger

Más detalles

REGRESION simple. Correlación Lineal:

REGRESION simple. Correlación Lineal: REGRESION simple Correlación Lineal: Dadas dos variable numéricas continuas X e Y, decimos que están correlacionadas si entre ambas variables hay cierta relación, de modo que puede predecirse (aproximadamente)

Más detalles

Ampliación de Estructuras de Datos

Ampliación de Estructuras de Datos Ampliación de Estructuras de Datos Amalia Duch Barcelona, marzo de 2007 Índice 1. Diccionarios implementados con árboles binarios de búsqueda 1 2. TAD Cola de Prioridad 4 3. Heapsort 8 1. Diccionarios

Más detalles

MACROECONOMÍA. Tema 6 El comercio internacional. - MACROECONOMÍA -

MACROECONOMÍA. Tema 6 El comercio internacional. - MACROECONOMÍA - MACROECONOMÍA Tema 6 El comercio internacional. Introducción. En este tema vamos tratar de responder a las siguientes cuestiones: por qué los países comercian entre sí? quién gana y quién pierde con el

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL CAPÍTULO 14 MEDIDAS DE TENDENCIA CENTRAL A veces, de los datos recolectados ya organizados en alguna de las formas vistas en capítulos anteriores, se desea encontrar una especie de punto central en función

Más detalles

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas. El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los

Más detalles

Ejercicio de estadística para 3º de la ESO

Ejercicio de estadística para 3º de la ESO Ejercicio de estadística para 3º de la ESO Unibelia La estadística es una disciplina técnica que se apoya en las matemáticas y que tiene como objetivo la interpretación de la realidad de una población

Más detalles

Circuito RC, Respuesta a la frecuencia.

Circuito RC, Respuesta a la frecuencia. Circuito RC, Respuesta a la frecuencia. A.M. Velasco (133384) J.P. Soler (133380) O.A. Botina (13368) Departamento de física, facultad de ciencias, Universidad Nacional de Colombia Resumen. Se armó un

Más detalles

4 Análisis de los principales factores AsociAdos A los resultados en ciencias

4 Análisis de los principales factores AsociAdos A los resultados en ciencias cuada en relación con las posibles futuras profesiones de los estudiantes vinculadas a las ciencias. En segundo lugar, los alumnos opinan que las dificultades en el aprendizaje del nuevo conocimiento científico

Más detalles