ANÁLISIS DE LA VARIANZA PARTE SEGUNDA

Save this PDF as:
 WORD  PNG  TXT  JPG

Tamaño: px
Comenzar la demostración a partir de la página:

Download "ANÁLISIS DE LA VARIANZA PARTE SEGUNDA"

Transcripción

1 ANÁLISIS DE LA VARIANZA PARTE SEGUNDA Septiembre de 2012

2 Índice general 1. INTRODUCCIÓN FUNDAMENTOS DEL DISEÑO EN BLOQUES ALEATORIZADOS 1 3. EJEMPLO DE DISEÑO EN BLOQUES ALEATORIZADOS: EX- PANSIÓN DEL CARBÓN DURANTE LA COQUIZACIÓN FUNDAMENTOS DEL DISEÑO FACTORIAL EJEMPLO DE DISEÑO FACTORIAL: ESTUDIO COMPARA- TIVO DE ENVASES DE CONSERVAS EXTENSIÓN A TRES O MÁS FACTORES DISEÑO FACTORIAL A DOS NIVELES EL MODELO ANOVA Y EL ANÁLISIS DE REGRESIÓN

3 1. INTRODUCCIÓN En la Parte Primera del Análisis de la Varianza nos centrábamos en el modelo ANOVA Simple que consideraba un único factor como causa de variabilidad. Este modelo estaba ligado al Diseño completamente aleatorizado. Otros factores, posibles fuentes de variabilidad, no estaban incluidos expresamente en el modelo y sus efectos quedaban englobados en la variabilidad residual. En esta Parte Segunda consideraremos más de un factor como causas de variabilidad desarrollando modelos ANOVA ligados a Diseños en Bloques Aleatorizados y a Diseños Factoriales. 2. FUNDAMENTOS DEL DISEÑO EN BLOQUES ALEATORIZADOS En el diseño en bloques aleatorizados, además del factor de tipo categórico A con p niveles (tratamientos) cuyos efectos queremos cuantificar y comparar, existe otro factor B con q niveles que denominaremos variable bloque. El experimentador no está interesado, en principio, en cuantificar los efectos de la variable bloque pero sabe que ésta ejerce influencia sobre la variable de respuesta y desea eliminarla del análisis reduciendo de esta forma la variabilidad residual o error experimental. Cada uno de los p tratamientos se aplica una vez dentro de cada nivel de la variable bloque con lo que el número total de observaciones será N = p q. Las N observaciones quedan agrupadas en q bloques de forma que, dentro

4 2 Análisis de la varianza de cada bloque, las observaciones son entre si más homogéneas. El diseño en bloques aleatorizados es uno de los diseños utilizados con mayor frecuencia. Se hace evidente que aquellas variables cuya consideración suponga una mayor homogeneidad en las observaciones por afectar a las unidades experimentales o a las condiciones de realización del experimento son potenciales candidatas a su selección como variables bloque. Por ejemplo: lotes de materia prima, tiempo y en la experimentación con animales edad, sexo, estado de salud, etc. Dentro de cada nivel o bloque, podremos comparar mejor los efectos de los diferentes tratamientos que si no hubieramos efectuado la agrupación en bloques. La variabilidad existente en las N observaciones de la respuesta, quedará descompuesta en tres fuentes de variación: Dos de dichas fuentes serán asignables a los tratamientos y a la variable bloque mientras que la tercera será la variabilidad residual o error experimental. Es importante tener en cuenta que los p tratamientos deben ser aplicados aleatoriamente dentro de cada bloque por lo que habrá q aleatorizaciones. Si hubieramos introducido en el modelo una segunda variable bloque con r niveles, los p tratamientos habrían de haber sido aplicados, también, de forma aleatoría en cada nivel de la segunda variable bloque. En el caso de que el diseño considere el factor A y dos variables bloque coincidiendo el número de niveles del factor y los de las variables bloque nos encontramos ante el tipo de diseño denominado Cuadrado latino. En estos diseños los tratamientos se designan con letras latinas: a, b, c... En un cuadrado latino con p niveles el número de observaciones será p 2, los datos se disponen en p filas y p columnas mientras que los tratamientos (a, b, c...) se asignan de forma aleatoria en el cuadrado con las restricciones de que en cada fila y en cada columna se den los p tratamientos y no se repita ninguno. Por ejemplo, para p=5 un diseño en cuadrado latino sería:

5 Análisis de la varianza, parte segunda 3 Diseño en cuadrado latino (p=5) Niveles Bloque 2 Niveles I II III IV V Bloque 1 I b e a c d II d a e b c III e b c d a IV a c d e b V c d b a e Con un factor y tres variables bloques, del mismo número de niveles, tendremos el cuadrado greco-latino. El modelo de Análisis de la Varianza asociado a un Diseño en Bloques Aleatorizados para un factor (A) y una variable bloque (B) es: y ij = µ + τ i + β j + ε ij y ij : Son los valores obtenidos para la variable de respuesta. El subíndice i indica los diferentes niveles del factor A : 1, 2...p. El subíndice j señala los niveles de la variable bloque B :1,2,...q. µ : Valor medio de la variable de respuesta. τ i : Es el efecto correspondiente al nivel i del factor A. Si el nivel i tiene un valor medio µ i, se define el efecto τ i como la diferencia µ i µ. β j : Es el efecto del nivel j de la variable bloque B. Si el nivel j tiene un valor medio µ j, el efecto β j será la diferencia µ j µ. ε ij : Término residual que suponemos conforme a una distribución Normal de media cero y desviación típica σ que representamos por N(0, σ). En este diseño, nuestro interés está centrado en hacer el error experimental lo más pequeño posible eliminando del error experimental la influencia de la variable bloque. La variable bloque, en principio, no interacciona. Si nos consta que existe interacción el modelo no sería aplicable y habría que utilizar el modelo factorial que desarrollaremos en el punto 4.

6 4 Análisis de la varianza Los efectos τ i y β j están sujetos a las restricciones: i=p i=1 τ i = 0; j=q j=1 β j = 0 Para facilitar el desarrollo, las N=pq observaciones de y ij las dispondremos en q niveles o bloques. Bloque Tratamientos 1 2 q 1 y 11 y 12 y 1q 2. y 21. y 22. y 2q. p y p1 y p2 y pq Si sumamos los valores por filas, por columnas o la totalidad tendremos las expresiones: y is = j=q j=1 y ij; y i = y is q = j=q j=1 y ij q y is representa la suma de las observaciones de la fila i. El subíndice s indica suma. y i representa el valor medio de las observaciones de la fila i. y sj = i=p i=1 y ij; y j = y sj p = i=p i=1 p y sj representa la suma de las observaciones de la columna j. y j representa el valor medio de las observaciones de la columna j.

7 Análisis de la varianza, parte segunda 5 y ss = i=p j=q i=1 j=1 y ij; y = y ss pq = i=p j=q i=1 j=1 y ij pq y ss representa la suma del conjunto de las observaciones. Las estimaciones de los parámetros del modelo serán las siguientes: ˆµ = y; ˆτ i = y i y; ˆβ j = y j y Se omite la demostración de que estos estimadores son, precisamente, los estimadores minimocuadráticos del modelo. Por otra parte, la variabilidad total en las observaciones vendrá dada por: SC T = i=p j=q i=1 j=1 (y ij y) 2 Las variabilidades del factor A y de la variable bloque B serán: SC A = q i=p i=1 (y i y) 2 ; SC B = p j=q j=1 (y j y) 2 j=q La variabilidad residual SC RESIDUAL = i=p i=1 j=1 (y ij P redicción) 2 Puesto que la prediccion del modelo viene dada por: P redicción = ˆµ + ˆτ i + ˆβ j = y + (y i y) + (y j y) = (y i + y j y) y ij P redicción = y ij y i y j + y; SC RESIDUAL = i=p j=q i=1 j=1 (y ij y i y j + y) 2 Si agrupamos convenientemente el segundo miembro de SC T tendremos: SC T = i=p j=q i=1 j=1 (y ij y) 2 = i=p j=q i=1 j=1 [(y i y) + (y j y) + (y ij y i y j + y)] 2

8 6 Análisis de la varianza Elevando al cuadrado las expresiones del corchete resulta: SC T = i=p j=q i=1 j=1 (y i y) 2 + i=p j=q i=1 j=1 (y j y) 2 + i=p j=q i=1 j=1 (y ij y i y j + y) 2 +2 i=p j=q i=1 j=1 (y i y)(y j y) + 2 i=p j=q i=1 j=1 (y i y)(y ij y i y j + y) +2 i=p j=q i=1 j=1 (y j y)(y ij y i y j + y) Se demuestra, como sucedía en el desarrollo de la SC T del ANOVA simple (pag 5 de Análisis de la Varianza, Parte primera), que los dobles productos se anulan quedando tan sólo los términos elevados al cuadrado que son: SC A, SC B y SC RESIDUAL i=p j=q i=p j=q SC T = (y i y) 2 + (y j y) 2 + (y ij y i y j + y) 2 i=p j=p i=1 j=1 i=1 j=1 i=1 j=1 i=p SC T = q (y i y) 2 +p (y j y) 2 + (y ij y i y j + y) 2 i=1 } {{ } SCA j=q j=1 } {{ } SCB i=p i=1 j=q j=1 } {{ } SC RESIDUAL De esta forma, queda comprobada la igualdad SC T = SC A + SC B + SC RESIDUAL

9 Análisis de la varianza, parte segunda 7 También se cumple dicha igualdad en cuanto a los g.d.l: ν T OT AL = ν A +ν B +ν RESIDUAL (pq-1) (p-1) (q-1) (p-1)(q-1) ν T OT AL : Los g.d.l. en la SC T OT AL = N 1 = pq 1 ν A : Los g.d.l. en la SC A = p 1 ν B : Los g.d.l. en la SC B = q 1 ν RESIDUAL : Los g.d.l. en la SC RESIDUAL = (p 1)(q 1) Nótese que la SC RESIDUAL puede expresarse según la ecuación: SC RESIDUAL = SC T OT AL SC A SC B Por tanto, los g.d.l. del residual se calcularán restando de los g.d.l. de la SC T OT AL los g.d.l. de SC A y SC B : (pq 1) (p 1) (q 1) = pq 1 p + 1 q + 1 = pq p q + 1 = p(q 1) (q 1) = (p 1)(q 1) Las medias cuadráticas (MC) se calculan a partir de las sumas de cuadrados (SC) dividiéndolas por sus correspondientes g.d.l. (ν). Como hacíamos en el Análisis de la Varianza para un factor (pag 6 de la Parte Primera), aplicamos el concepto estadístico de Esperanza Matemática (E) para obtener los valores esperados de MC A, MC B y MC RESIDUAL que son variables aleatorias. Tras un desarrollo que omitimos, se obtiene: E(MC A ) = σ 2 + q i=p i=1 τ 2 i p 1 E(MC B ) = σ 2 + p j=q j=1 β2 j q 1 E(MC RESIDUAL ) = σ 2

10 8 Análisis de la varianza Hipótesis nulas (H 0 ) En nuestro modelo: y ij = µ + τ i + β j + ɛ ij la hipótesis nula de interés es la de suponer nulos todos los efectos del factor A: H 0 : τ 1 = τ 2 = = τ p = 0; τ i = 0 Bajo esta hipótesis, E(MC A ) queda reducida a σ 2 por anularse q i=p i=1 τ 2 i p 1. Dado que E(MC RESIDUAL ) = σ 2, ambas medias cuadráticas siguen distribuciones χ 2 (ji cuadrado) y su cociente seguirá una distribución F de Fisher-Snedecor con (p-1) y (p-1)(q-1) g.d.l. Si el ratio F es mayor que el valor crítico correspondiente al nivel de significación α, rechazaremos la hipótesis nula H 0 : τ i = 0. Entonces, alguno de los efectos τ i 0 y E(MC A ) = σ 2 + q i=p i=1 τ i 2 será significativamente p 1 mayor que σ 2. La hipótesis nula H 0 : β j = 0 tiene menor interés. Obsérvese que, si H 0 : β j = 0 se cumple, no hubiera tenido sentido introducir la variable bloque en el modelo. Los valores del ratio F se incluyen en la correspondiente tabla de Análisis de la Varianza que quedará: Fuente de Variación Suma de cuadrados g.d.l. Medias Cuadráticas Ratio F Factor A SC A (p-1) MC A = SC A MC A p 1 Factor B(Bloque) SC B (q-1) MC B = SC B q 1 Residual SC RESIDUAL (p-1)(q-1) MC RESIDUAL = SC RESIDUAL pq 1 MC RESIDUAL Total SC T OT AL pq-1

11 Análisis de la varianza, parte segunda 9 3. EJEMPLO DE DISEÑO EN BLOQUES ALEA- TORIZADOS: EXPANSIÓN DEL CARBÓN DURANTE LA COQUIZACIÓN El estudio * tiene como objeto la comparación del comportamiento de cuatro clases de carbones altos en volátiles respecto de su influencia sobre la expansión que pueden experimentar algunas mezclas de carbones durante el proceso de coquización. Se consideran peligrosas para la seguridad de la instalación aquellas mezclas que tengan expansión. Para predecir la expansión, se realiza un ensayo de laboratorio que simula las condiciones reales del proceso. Se ha optado por realizar la comparación mediante un Diseño Experimental en bloques aleatorizados en el que el factor A es la clase de carbón con cuatro niveles: 1,2,3,4. La variable B (variable de bloque) tiene tres niveles: 1,2,3 que son tres tipos de mezclas en las que se incluyen los cuatro carbones en estudio en distintos porcentajes en cada una de las tres mezclas. En la coquización siempre se usan mezclas de modo que las carencias de un determinado componente sean cubiertas por las propiedades de otros. En cada una de las tres mezclas, los restantes carbones no objeto de estudio, se dosifican en la misma proporción. Discusión de Resultados El modelo ANOVA es: Expansión = µ + τ i + β j + ɛ Siendo µ la media general; τ i los efectos del factor A y β j los efectos de la variable bloque B. El término residual ɛ sigue una distribución Normal (0, σ). El factor A (clase de carbón) tiene 4 niveles. El bloque B (tipo de mezcla) tiene 3 niveles. * NOTA: Los datos resultantes del experimento han sido modificados y adaptados para su utilización en el presente ejemplo.

12 10 Análisis de la varianza Los tratamientos (niveles) del factor A se aplican en cada uno de los 3 niveles de la variable bloque en el orden aleatorio indicado en la pag 16. Se realizan, en consecuencia, tres aleatorizaciones. Estimación de parámetros La estimación de los parámetros (efectos) del modelo, según lo expuesto en la pag 5 y los resultados de la pag 17. ˆµ = y = 18; ˆτ i = y i y; ˆβ j = y j y ˆτ 1 = 22, = 4, 6667 ˆβ 1 = = 12 ˆτ 2 = 20, = 2, 3333 ˆβ 2 = = 13 ˆτ 3 = 11, = 6, 6667 ˆβ3 = = 1 ˆτ 4 = 17, = 0, 3333 σ = 8, = 2, Nótese como los efectos ˆτ i y ˆβ j están sujetos a las restricciones ˆτ i = 0 y ˆβj = 0 Predicción de valores Los valores predichos por el modelo son los recogidos en la pag 19. Por ejemplo, la predicción para el nivel 1 del factor A perteneciente al bloque 1 sera: ŷ 11 = ˆµ + ˆτ 1 + ˆβ 1 ŷ 11 = 18 4, = 34, 6667; el correspondiente residual es: ,6667 = -1,3333

13 Análisis de la varianza, parte segunda 11 Sumas de cuadrados y grados de libertad En la tabla de Análisis de la Varianza de la pag 17 se recogen las sumas de cuadrados, grados de libertad, medias cuadráticas y ratios F. Mediante cálculo podemos también obtener, facilmente, los valores de la tabla: SC A = i=4 i=1 (τ i) 2 = 3[( 4, 6667) 2 + ( 2, 3333) 2 + (6, 6667) 2 + (0, 3333) 2 ] = 215, 333 SC B = j=3 j=1 (β j) 2 = 4[( 12) 2 + (13) 2 + ( 1) 2 ] = 1256, 0 SC T = (y ij y) 2 = (Expansión + 18) 2 = 1522, 0 Si sumamos la columna de residuales de la pag 19 elevados al cuadrado obtendremos. SC RESIDUAL = 50, 6667 Como comprobación vemos que SC T = SC A + SC B + SC RESIDUAL ; 1522, 0 = 215, , , 6667 La tabla de Análisis de la Varianza de la pag 17 nos indica lo siguiente respecto de los grados de libertad (g.d.l.): g.d.l. de la SC A = p 1 = 4 1 = 3. Hay 3 efectos independiantes por existir entre ellos la restricción τ i = 0 ya que -4,6667-2, , ,3333 = 0 g.d.l. de la SC B = q 1 = 3 1 = 2. Hay sólo dos efectos independientes ya que existe la restricción β j = 0 : = 0 g.d.l. en SC T OT AL = pq 1 = 11. De las 12 desviaciones respecto de la media, 11 de ellas son independientes por existir la restricción (yij y) = 0 g.d.l. en SC RESIDUAL = (p 1)(q 1) = (4 1)(3 1) = 6. De los 12 residuales, hay solamente 6 independientes. Se cumple por tanto: g.d.l. de SC T OT AL } {{ } 11 = g.d.l. de SC } {{ A + g.d.l. de SC } } {{ B } g.d.l. de SC RESIDUAL } {{ } 6

14 12 Análisis de la varianza Medias cuadráticas y ratios F Las medias cuadráticas y ratios F de la tabla de Análisis de la Varianza de la pag 17 se calculan según lo siguiente: MC A = SC A g.d.l. = 215, MC B = SC B g.d.l. = 1256, 0 2 = 71, 7778 = 628, 0 MC RESIDUAL = SC RESIDUAL = g.d.l. MC A 71, 7778 F A = = MC RESIDUAL 8, MC B F B = = 628, 0 MC RESIDUAL 8, , = 8, = 8, 50 (g.d.l. numerador=3; g.d.l. denominador=6) = 74, 37 (g.d.l. numerador=2; g.d.l. denominador=6) A la hipótesis nula (H 0 ) de que todos los efectos del factor A son nulos, le corresponde una probabilidad p=0,014 inferior al nivel de significación del 5 %(p=0,05). De ello se deduce que las diferencias entre los niveles del factor (clase de carbón) son significativas respecto de la Expansión. En la tabla inferior de la pag 17 podemos observar como el carbón 3 es significativamente diferente de los restantes. Los contrastes indicados con (*) señalan la presencia de contrastes significativos. Los efectos de la variable bloque también son significativos aunque no estamos directamente interesados en ellos y en sus contrastes. Obsérvese que F=74,37 es muy elevado y su probabilidad p=0,0001 muy baja. Si no hubiéramos considerado la variable bloque, la tabla de Análisis de la Varianza para un solo factor hubiera sido la de la pag 18. La variabilidad de la variable bloque hubiera quedado englobada en el error residual y los efectos del factor A con una F=0,44 y P=0,731 no hubieran aparecido como significativos.

15 Análisis de la varianza, parte segunda 13 Intervalos de confianza y Contrastes. Los intervalos de confianza bilateral para un parámetro θ son: ˆθ ± (error estándar del parámetro).t α 2,ν donde ˆθ es la estima del parámetro, t α 2,ν es el valor de la distribución t de Student para un nivel de significación α y ν g.d.l. del residual. En nuestro caso, para α = 0, 05 y ν = 6; t 0,025, 6 =2,44692 Intervalos para las medias µ i Error estándar = ˆσ 3 = 2, = 1, Intervalo de µ 1 = 22, 6667±1, , = 22, 6667±4, Intervalo de µ 2 = 20, 3333±1, , = 20, 3333±4, Intervalo de µ 3 = 11, 3333±1, , = 11, 3333±4, Intervalo de µ 4 = 17, 6667±1, , = 17, 6667±4, Intervalo de µ 1 : 26, 772 < µ 1 < 18, 5614 Intervalo de µ 2 : 24, 4386 < µ 2 < 16, 228 Intervalo de µ 3 : 15, 4386 < µ 3 < 7, Intervalo de µ 4 : 21, 772 < µ 4 < 13, 5614 Estos valores coinciden con los de la segunda tabla de la pag 17.

16 14 Análisis de la varianza Intervalos de los contrastes (µ i µ j ) (ˆµ i ˆµ j ) ± (Error estándar) t α 2,ν 2 MCRESIDUAL 2 8, error estándar = nº datos en cada nivel = 3 = 2, t α 2,ν = t 0,025, 6 = 2, (ˆµ i ˆµ j ) ± 2, , = (ˆµ i ˆµ j ) ± 5, Contraste µ 1 µ 2 : 2, ± 5, Contraste µ 1 µ 3 : 11, 3333 ± 5, * Contraste µ 1 µ 4 : 5, 0 ± 5, Contraste µ 2 µ 3 : 9, 0 ± 5, * Contraste µ 2 µ 4 : 2, ± 5, Contraste µ 3 µ 4 : 6, ± 5, * Los contrastes cuyos intervalos no contienen el valor cero indican diferencias significativas y se señalan con (*). Todos estos contrastes coinciden con los de la tabla inferior de la pag 17. Gráfico para efectos principales En el gráfico de la pag 18 podemos observar los intervalos de confianza al 95 % de la Expansión de las cuatro clases de carbones. Se hace patente que el carbón 3 tiene un comportamiento diferente de los restantes con una expansión relativamente mayor.

17 Análisis de la varianza, parte segunda 15 Conclusiones La clasificación en cuanto a resultados por orden descendente de calidad en cuanto a Expansión (E) es: Carbón 1 (E=-22,67) Carbón 2 (E=-20,33) Carbón 4 (E=-17,67) Carbón 3 (E=-11,33) Los carbones 1,2 y 4 pueden clasificarse en un grupo homogéneo mientras que el carbón 3 tiene una expansión significativamente más elevada que los restantes.

18 16 Análisis de la varianza

19 Análisis de la varianza, parte segunda 17

20 18 Análisis de la varianza

21 Análisis de la varianza, parte segunda 19

22 20 Análisis de la varianza 4. FUNDAMENTOS DEL DISEÑO FACTORIAL El caso más sencillo de Diseño Factorial es el que corresponde a dos factores A y B que tienen, respectivamente, p y q niveles fijos cada uno. En el Diseño Factorial, los tratamientos los constituyen todas las combinaciones posibles de los p niveles del factor A con los q niveles del factor B, en total p.q tratamientos. Si para estimar el error experimental repetimos cada tratamiento r veces, tendremos un total de N=p.q.r experimentos elementales a realizar de forma completamente aleatorizada, tanto en el orden de aplicar los tratamientos como en la asignación de cada uno de ellos a las unidades experimentales. La particularidad más notable del Diseño Factorial es la presencia del término de interacción. El modelo de Análisis de la Varianza asociado a un Diseño Factorial con dos factores es: y ijk = µ + τ i + β j + (τβ) ij + ɛ ijk y ijk : Son los valores obtenidos para la variable de respuesta. El subíndice i indica los diferentes niveles del factor A:1,2,...p. El subíndice j señala los niveles del factor B:1,2,...q. Finalmente, el subíndice k se refiere al orden de la repetición: 1,2,...r de cada tratamiento (combinaciones i,j) µ : Valor medio de la variable de respuesta. τ i : Es el efecto del nivel i del factor A. Si el nivel i tiene un valor medio µ i, se define el efecto τ i como la diferencia µ i µ. β j Es el efecto del nivel j del factor B. Si el nivel j tiene un valor medio µ j, el efecto β j será la diferencia µ j µ. τβ ij : Es el efecto correspondiente a la interacción de los niveles i del factor A con los niveles j del factor B. La existencia de interacción supone una falta de aditividad para explicar el efecto combinado de las variables A y B a partir de los efectos individuales de cada una de ellas. ɛ ijk : Término residual que se supone conforme con una distribución Normal de media cero y desviación típica σ que representaremos por N(0, σ).

23 Análisis de la varianza, parte segunda 21 Si comparamos este modelo ANOVA con el modelo ANOVA simple desarrollado en la parte primera (artículo de Feb. 2012) destaca la presencia del término de interacción: (τβ) ij que se añade a los efectos principales τ i, β j originados, respectivamente, por los factores A y B. Como en el caso, del modelo ANOVA simple, veremos que se cumple también la igualdad básica del Análisis de la Varianza. Mediante ella, la variabilidad total (SC T ) se descompone en los siguiente términos: SC T = SC A + SC B + SC AB + SC RESIDUAL SC T : Suma de los cuadrados de las desviaciones de los valores de la variable de respuesta respecto de la media general. SC A : Suma de los cuadrados de las desviaciones de los valores medios de los niveles i del factor A respecto de la media general. SC B : Suma de los cuadrados de las desviaciones de los valores medios de los niveles j del factor B respecto de la media general. SC AB : Suma de los cuadrados de los efectos de interacción. SC RESIDUAL : Suma de los cuadrados de las desviaciones residuales. Favorece la exposición disponer las N=pqr observaciones en p filas y q columnas correspondientes, respectivamente, al número de niveles del factor A y al número de niveles del factor B. En cada celda (i,j) se recogen los valores de las r replicaciones: Factor B ( q niveles) Factor A ( p niveles) 1 2 q 1 y 111 y 11r y 121 y 12r y 1q1 y 1qr 2 y 211 y 21r y 221 y 22r y 2q1 y 2qr p y p11 y p1r y p21 y p2r y pq1 y pqr

24 22 Análisis de la varianza Si sumamos los valores de una celda genérica (i,j), los valores de una fila, los de una columna o los de la totalidad de las celdas tendremos las siguientes expresiones: k=r y ijs = y ijk ; y ijk = k=1 k=r k=1 y ijk r y ijs : Representa la suma de las observaciones de la celda (i,j). El subíndice s indica suma. y ij : Indica el valor medio en dicha celda (i,j). j=q k=r y iss = y ijk ; y i = j=1 k=1 j=q k=r j=1 k=1 y ijk qr y iss : Representa la suma de todas las observaciones de la fila i. y i : Señala el valor medio de las observaciones de la fila i. i=p k=r y sjs = y ijk ; y j = i=1 k=1 i=p k=r i=1 k=1 y ijk pr y sjs : Representa la suma de totas las observaciones de la columna j. y j : Indica el valor medio de las observaciones de la columna j. y sss = i=p j=q k=r i=1 j=1 k=1 y ijk; y = i=p j=q k=r i=1 j=1 k=1 y ijk pqr Donde y sss es la suma de las observaciones de todas las celdas mientras que y es la media del conjunto de todas las observaciones.

25 Análisis de la varianza, parte segunda 23 En definitiva, las estimas de los parámetros del modelo serán las siguientes: ˆµ = y ˆτ i = y i y ˆβ j = y j y ( ˆ τβ) ij = y ij ˆµ ˆτ i ˆβ j = y ij y (y i y) (y j y) ( ˆ τβ) ij = y ij y i y j + y Por otra parte, los efectos principales y la interacción están sujetos a las siguientes restricciones: τi = 0; β j = 0; (τβ) ij = 0 La variabilidad total en las observaciones vendrá dada por: SC T = i=p j=q k=ν i=1 j=1 k=1 (y ijk y) 2 Agrupando convenientemente el segundo miembro de la ecuación y teniendo en cuenta que (y ij y i y j + y) es la estimación del efecto de la interacción tendremos: SC T = i=p i=p i=1 j=q j=1 j=q i=1 j=1 k=r k=1 (y ijk y) 2 = k=r k=1 [(y i y) + (y j y) + (y ij y i y j + y) + (y ijk y ij )] 2 SC T = i=p i=p i=1 + i=p i=1 j=q i=1 j=1 j=q k=r j=1 j=q j=1 k=r k=1 (y i y) 2 + i=p j=q k=r i=1 j=1 k=1 (y j y) 2 + k=1 (y ij y i y j + y) 2 k=r k=1 (y ijk y ij ) 2 Hacemos notar que, como sucedía en el desarrollo de la SC T del ANOVA simple (pag 5 de Análisis de la Varianza, Parte Primera), se anulan los dobles productos resultantes del desarrollo del cuadrado del corchete quedando tan sólo los términos elevados al cuadrado que son: SC A, SC B, SC AB y SC RESIDUAL.

26 24 Análisis de la varianza i=p j=q k=r i=1 j=1 k=1 (y i y) 2 = qr i=p i=1 (y i y) 2 que representa la suma de los cuadrados de las desviaciones de los p niveles del factor A respecto de la media general: SC A j=q k=r De la misma forma, i=p i=1 j=1 k=1 (y j y) 2 = pr j=q j=1 (y j y) 2 representará la suma de los cuadrados de las desviaciones de los q niveles del factor B: SC B En cuanto a i=p j=q k=r i=1 j=1 k=1 (y ij y i y j + y) 2 = r i=p j=q i=1 j=1 (y ij y i y j + y) 2 representa la suma de los cuadrados de los efectos de interacción: SC AB j=q i=1 j=1 k=r k=1 (y ijk y ij ) 2 es la suma de cua- Finalmente, el término i=p drados residual: SC RESIDUAL con lo que queda comprobado que se cumple la igualdad: SC T = SC A + SC B + SC AB + SC RESIDUAL También se cumple la igualdad en cuanto a los grados de libertad (g.d.l.): g.d.l. en A: (p-1) g.d.l. en B: (q-1) g.d.l. en AB: (p-1)(q-1) g.d.l. en Residuales: pq (r-1) La Suma de todos ellos es (pqr-1) que coincide con los g.d.l. de SC T : ν T OT AL = ν A +ν B +ν AB +ν RESIDUAL (pqr-1) (p-1) (q-1) (p-1)(q-1) pq(r-1) Las medias cuadráticas (MC) de las distintas fuentes de variación se calculan a partir de las sumas de cuadrados (SC) correspondientes dividiéndolas por sus respectivos grados de libertad (ν) : MC = SC. Según el procedimiento habitual, ya utilizado para el Anova Simple y para el Diseño en ν bloques aleatorizados, todas estas expresiones se recogen en una tabla de Análisis de las Varianza.

27 Análisis de la varianza, parte segunda 25 Medias Fuente de Variación Suma de cuadrados (g.d.l.) Cuadráticas Factor A Factor B Interacción AB Residual SC A = qr i=p i=1 (y i y) 2 (p-1) MC A = SC A p 1 SC B = pr j=p j=1 (y j y) 2 (q-1) MC B = SC B SC AB = r i=p j=q i=1 SC RESIDUAL = i=p i=1 q 1 SC AB (p 1)(q 1) j=1 (y ij y i y j + y) 2 (p-1)(q-1) MC AB = j=q k=r j=1 k=1 (y ijk y ij ) 2 pq(r-1) MC RESIDUAL = SC RESIDUAL pq(r 1) Total SC T OT AL = i=p i=1 j=q k=r j=1 k=1 (y ijk y) 2 pqr-1 Las medias cuadráticas MC A, MC B, MC AB y MC RESIDUAL son variables aleatorias. Si aplicamos a todas ellas el concepto estadístico de Esperanza Matemática (E) obtendremos los valores esperados de dichas variables que serán: E(MC A ) = E[ qr i=p i=1 (y i y) 2 ] p 1 E(MC B ) = E[ pr j=q j=1 (y j y) 2 ] q 1 E(MC AB ) = E[ r (y ij y i y j + y) 2 ] (p 1)(q 1) E(MC RESIDUAL ) = E[ i=p i=1 j=q j=1 k=r k=1 (y ijk y ij ) 2 ] pq(r 1) Sustituyendo y ijk por la ecuación del modelo y ijk = µ+τ i +β j +(τβ) ij +ɛ ijk y teniendo en cuenta que E(ɛ 2 ijk ) = σ2 y que E(ɛ ijk ) = 0 resultan, tras un cálculo que omitimos, las siguientes expresiones: E(MC A ) = σ 2 + qr i=p i=1 τ 2 i p 1 E(MC B ) = σ 2 + pr j=q j=1 β2 j q 1

28 26 Análisis de la varianza E(MC AB ) = σ 2 + r (τβ) 2 ij (p 1)(q 1) EMC RESIDUAL = σ 2 Hipótesis nulas (H 0 ) Para nuestro modelo y ijk = µ + τ i + β j + (τβ) ij + ɛ ijk, enunciaremos las siguientes hipotesis nulas (H 0 ): a) Todos los efectos del factor A son nulos: H 0 : τ 1 = τ 2 = τ p = 0; τ i = 0 Bajo esta hipótesis, E(MC A ) queda reducida a σ 2 por anularse qr i=p i=1 τ i 2 p 1 Dado que E(MC RESIDUAL ) = σ 2, ambas medias cuadráticas siguen distribuciones χ 2 (ji-cuadrado) y su cociente se ajustará a una distribución F de Fisher-Snedecor. El cociente de MC A y MC RESIDUAL seguirá, como en el Anova simple, una distribución F de Fisher-Snedecor con (p-1) y pq(r-1) g.d.l. En el caso de que el ratio F sea mayor que el valor crítico correspondiente al nivel de significación de la prueba (α), rechazaremos la hipótesis nula H 0 : τ i = 0. Entonces, alguno de los efectos τ i 0 y la E(MC A ) = σ 2 + qr i=p i=1 τ i 2 sería significativamente mayor que σ 2 p 1 b) Todos los efectos del factor B son nulos: H 0 : β 1 = β 2 = β q = 0; β j = 0 De la misma forma que para A, rechazaremos esta hipótesis cuando el ratio F sea mayor que el valor crítico correspondiente al nivel de significación. α, con (q-1) y pq(r-1) g.d.l..

29 Análisis de la varianza, parte segunda 27 c) Todos los efectos de la interacción AB son nulos: H 0 : (τβ) ij = 0 para cualquier combinación i,j Rechazaremos la hipótesis cuando el ratio F sea mayor que el valor crítico correspondiente al nivel de significación α con (p-1)(q-1) y pq(r-1) g.d.l. Los valores de los ratios F se incluyen, también, en la tabla de Análisis de la Varianza que quedará finalmente: Fuente de Variación Suma de Cuadrados (g.d.l.) Medias cuadráticas Ratios F Factor A SC A p-1 MC A = SCA p 1 Factor B SC B q-1 MC B = SCB q 1 SC AB Interacción AB SC AB (p-1)(q-1) MC AB = (p 1)(q 1) Residual SC RESIDUAL pq(r-1) MC RESIDUAL = SCRESIDUAL pq(r 1) F = F = F = MC A MC RESIDUAL MC B MC RESIDUAL MC AB MC RESIDUAL Total SC T OT AL pqr-1 5. EJEMPLO DE DISEÑO FACTORIAL: ESTUDIO COMPARATIVO DE ENVASES DE CONSERVAS En el ejemplo, * aplicaremos los fundamentos teóricos expuestos a un caso industrial destacando algunos aspectos prácticos de interés. Se quiere comparar el comportamiento de diversos tipos de envases destinados a conservar un determinado producto. El material base está recubierto de dos clases diferentes de recubrimiento metálico. Adicionalmente, se aplica una capa de barniz y se desea estudiar el comportamiento de 6 barnices diferentes. Se decide planificar un Diseño Factorial con dos factores A y B. El factor A tiene dos niveles: p=2 que son las dos clases de recubrimiento metálico * NOTA: Los datos resultantes del experimento han sido modificados y adaptados para su utilización en el presente ejemplo.

30 28 Análisis de la varianza y el factor B tiene q=6 niveles que son los seis tipos de barniz. El citado diseño factorial 2x6 se replica (r=2) en un total de 24 envases, pqr=2x6x2 = 24. Los envases se depositaron durante un año y se procedió a su apertura para analizar el contenido en Fe (metal base) que ha pasado a la conserva. El experimento tiene como objetivo selecionar el recubrimiento y el barniz más convenientes y de cuantificar las diferencias de resultados en sus distintas combinaciones. La variable de respuesta: Fe viene expresada en partes por millón (ppm) y, logicamente, se trata de minimizar su contenido en la conserva. El orden de realización de las aperturas de los envases y la ejecución de los análisis se ha efectuado de forma completamente aleatoria según lo indicado en la pag 37. Los cálculos han sido efectuados con el programa estadístico STATGRAPHICS. La discusión de resultados, conclusiones y cálculos se recogen en las páginas 29 a 42 y la base de datos en las páginas 37,41 y 42. Discusión de Resultados El modelo ANOVA al que se ajustan los resultados es: F e = µ + τ i + β j + (τβ) ij + ɛ Los parámetros del modelo son: µ que es la media general, τ i son los efectos del factor A, β j son los efectos del factor B, (τβ) ij son los efectos de la interacción y ɛ es el término residual que sigue una distribución Normal (0, σ). El factor A (metal de recubrimiento) tiene dos niveles: 1 y 2 El factor B (tipo de barniz) tiene seís niveles: 1,2, Los 24 experimentos elementales se han realizado en el orden aleatorio indicado en la pag 37.

31 Análisis de la varianza, parte segunda 29 Estimación de parámetros Las estimaciones de los parámetros del modelo, según las estimas de la pag 23, son los siguientes: ˆµ = y = 3, ˆτ i = y i y ˆβj = y j y (τβ) ˆ ij = y ij y i y j + y ˆτ 1 = 1, 275 ˆβ1 = 3, (τβ) ˆ 11 = 2, 125 ˆτ 2 = 1, 275 ˆβ2 = 1, (τβ) ˆ 12 = 1, 2 ˆβ 3 = 0, (τβ) ˆ 13 = 0, 9 ˆβ 4 = 1, (τβ) ˆ 14 = 0, 85 ˆβ 5 = 1, (τβ) ˆ 15 = 0, 975 ˆβ 6 = 1, (τβ) ˆ 16 = 0, 6 (τβ) ˆ 21 = 2, 125 (τβ) ˆ 22 = 1, 2 (τβ) ˆ 23 = 0, 9 (τβ) ˆ 24 = 0, 85 (τβ) ˆ 25 = 0, 975 (τβ) ˆ 26 = 0, 6 ˆσ = MC RESIDUAL = 1, = 1, 0859 La estima ˆσ nos permite calcular intervalos de confianza para los diferentes parámetros y para sus contrastes. Obsérvese como los efectos ˆτ i, ˆβj ; ˆτi = 0; ˆβj = 0; (τβ) ˆ ij = 0. ˆ (τβ) ij ; están sujetos a restricciones: Predicción de valores Los valores predichos por el modelo son equivalentes a los valores medios en cada celda(i,j) que según la pag 38 son: y 11 = 10, 65 y 21 = 3, 85 y 12 = 7, 85 y 22 = 2, 9 y 13 = 3, 35 y 23 = 2, 6 y 14 = 2, 95 y 24 = 2, 1 y 15 = 3, 1 y 25 = 2, 5 y 16 = 3, 25 y 26 = 1, 9

32 30 Análisis de la varianza Por ejemplo, la predicción y 14 = 2, 95, media de las observaciones 3,0 y 2,9, es equivalente al valor predicho por el modelo: y 14 = ˆµ + ˆτ 1 + ˆβ 4 + ˆ (τβ) 14 y 14 = 3, , 275 1, , 85 = 2, 95 Sumas de cuadrados y grados de libertad En la tabla de Análisis de la Varianza (pag 38) se recogen las Sumas de cuadrados, grados de libertad, medias cuadráticas y ratios F. Estos valores coinciden con los que se pueden obtener por cálculo: SC A = (ˆτ i ) 2 = 24 (1, 275) 2 = 39, 015 SC B = ˆβ2 j = 4 [3, , ( 0, 94167) 2 +( 1, 39167) 2 + ( 1, 11667) 2 + ( 1, 34167) 2 ] SC B = 4 19, = 76, 4333 SC AB = (τβ) ˆ ij = 4 [2, , ( 0, 9) 2 + ( 0, 85) 2 + ( 0, 975) 2 + ( 0, 6) 2 ] SC AB = 4 8, = 35, 195 SC T OT AL = (y ijk y) 2 = (F e 3, 91667) 2 = 164, 793 Finalmente, si sumamos la columna de residuales de la pag 41 elevada al cuadrado obtenemos: SC RESIDUAL = 14, 15 Como comprobación, tenemos: SC T OT AL = SC A + SC B + SC AB + SC RESIDUAL 164,793 = 39,015+76, ,195+14,15 En cuanto a los grados de libertad (g.d.l.), la tabla de Análisis de la Varianza de la pag 25 nos indica lo siguiente: g.d.l. de la SC A : p 1 = 2 1 = 1 Solamente hay un efecto independiente ya que existe la restricción τi = 0; 1, 275 1, 275 = 0

33 Análisis de la varianza, parte segunda 31 g.d.l. de la SC B : q 1 = 6 1 = 5. Hay cinco efectos independientes ya que β j = 0; 3, , , , , , = 0 g.d.l. de la interación AB:(p-1)(q-1)=(6-1)(2-1)=5 De los doce efectos de interacción, tan sólo cinco son independientes por estar sujetos a 7 restricciones del tipo (τβ) ˆ ij = 0 con lo que los g.d.l. resultan 12-7=5 g.d.l. en SC T OT AL : pqr 1 = = 23. De las 24 desviaciones hay 23 independientes ya que existe la restricción (y ijk y) = 0 g.d.l. de la SC RESIDUAL = pq(r 1) = = 12. Se cumple por tanto: g.d.l. de SC } {{ T OT AL = g.d.l. de SC } A +g.d.l. desc } {{ } B +g.d.l. desc } {{ } AB +g.d.l. del Residual; } {{ } } {{ } Obsérvese que sin replicación no habría habido g.d.l. para calcular el error residual y proseguir el análisis. Medias cuadráticas y ratios F Las medias cuadráticas y los ratios F de la tabla de Análisis de la Varianza (pag 38) coinciden con: MC A = SC A 39, 015 = = 39, 015 g.d.l. 1 MC B = SC B 76, 4333 = = 15, 2867 g.d.l. 5 MC AB = SC AB g.d.l. = 35, = 7, 039 MC RESIDUAL = SC RESIDUAL g.d.l. = 14, = 1, F A = F B = F AB = MC A MC RESIDUAL = 39, 015 = 33, 09 (g.d.l. numerador =1; g.d.l. denominador=12) 1, MC B 15, 2867 = = 12, 96 (g.d.l. numerador = 5; g.d.l. denominador=12) MC RESIDUAL 1, MC AB MC RESIDUAL = 7, 039 = 5, 97 (g.d.l. numerador = 5; g.d.l. denominador=12) 1, 17917

34 32 Análisis de la varianza A los tres ratios F, bajo la hipótesis nula (H 0 ) de que todos los efectos son nulos, les corresponden, respectivamente, unas probabilidades P A : 0, 001; P B = 0, 0002; P AB = 0, 0053 muy inferiores al nivel de significación del 5 %(p=0,05). De ello se deduce que los dos efectos principales y la interacción son significativos. En la pag 39 se presentan las tablas y contrastes entre los diferentes niveles de los factores A y B. Los contrastes marcados con (*) indican diferencias estadísticamente significativas. Intervalos de confianza Desviación típica del modelo: ˆσ = 1, 0859 Error estándar de la media total: Error estándar de las medias µ i = ˆσ 24 = 0, ˆσ 12 = 0, Error estándar de las medias µ j = ˆσ 4 = 0, Error estándar de las predicciones µ ij = ˆσ 2 = 0, Todos estos errores estándar coinciden con los indicados en la tabla de la parte inferior de la pag 38 Los intervalos de confianza bilateral de un parámetro θ con un nivel de confianza (1 α), siendo α el nivel de significación, se determinan según la expresión: ˆθ ± (Error estándar del parámetro) t α 2,ν Donde: ˆθ : Es la estimación del parámetro.

35 Análisis de la varianza, parte segunda 33 t α 2,ν : Es el valor de la distribución t de Student para ν g.d.l. y nivel de significación α. El valor ν corresponde a los g.d.l. del residual del modelo ajustado que en nuestro caso es pq(r 1) = = 12 a) Intervalos para µ i (factor A): ˆµ i ± 0, t 0,025, 12 t 0,025, 12 = 2, Intervalo µ 1 : 5, ± 0, , 17882; 4, < µ 1 < 5, Intervalo µ 2 : 2, ± 0, , 17882; 1, < µ 2 < 3, b) Intervalo para µ j (factor B): ˆµ j ± 0, , = ˆµ j ± 1, Intervalo µ 1 : 7, 250 ± 1, 18298; 6, < µ 1 < 8, Intervalo µ 2 : 5, 375 ± 1, 18298; 4, < µ 2 < 6, Intervalo µ 3 : 2, 975 ± 1, 18298; 1, < µ 3 < 4, Intervalo µ 4 : 2, 525 ± 1, 18298; 1, < µ 4 < 3, Intervalo µ 5 : 2, 800 ± 1, 18298; 1, < µ 5 < 3, Intervalo µ 6 : 2, 575 ± 1, 18298; 1, < µ 6 < 3, c) Intervalo para la predicción µ ij : µ ˆ ij ± 0, , = ˆµ ij ± 1, Intervalo µ 11 = Intervalo µ 12 = Intervalo µ 13 = Intervalo µ 14 = Intervalo µ 15 = Intervalo µ 16 = µ ˆ 11 ± 1, = 10, 65 ± 1, ; 8, < µ 11 < 12, 3223 µ ˆ 12 ± 1, = 7, 85 ± 1, ; 6, < µ 12 < 9, µ ˆ 13 ± 1, = 3, 35 ± 1, ; 1, < µ 13 < 5, µ ˆ 14 ± 1, = 2, 95 ± 1, ; 1, < µ 14 < 4, µ ˆ 15 ± 1, = 3, 10 ± 1, ; 1, < µ 15 < 4, µ ˆ 16 ± 1, = 3, 25 ± 1, ; 1, < µ 16 < 4, De la misma forma se obtienen las restantes 6 predicciones. Todos estos intervalos coinciden con los indicados al final de la pag 38

36 34 Análisis de la varianza d) Intervalos para los contrastes µ i µ j : (ˆµ i ˆµ j ) ± Error estándar. t α 2,ν 2 MCRESIDUAL Error estándar = nº datos en cada nivel 2 1, Factor A: Error estándar= = 0, ; t 12 α 2,ν=2,17882 (ˆµ 1 ˆµ j ) ± 0, , 17882; (ˆµ i ˆµ j ) ± 0, Intervalo µ 1 µ 2 = (5, , 64167) ± 0, = 2, 55 ± 0, , < (µ 1 µ 2 ) < 3, ; Al no contener el intervalo el valor cero, la diferencia entre los dos niveles es significativa. 2 1, Factor B: Error estándar= = 0, ; t 4 α 2,ν=2,17882 (ˆµ i ˆµ j ) ± 0, , 17882; (ˆµ i ˆµ j ) ± 1, Intervalo µ 1 µ 2 = (7, 25 5, 375) ± 1, = 1, 875 ± 1, Intervalo µ 1 µ 3 = (7, 25 2, 975) ± 1, = 4, 275 ± 1, Intervalo µ 1 µ 4 = (7, 25 2, 525) ± 1, = 4, 725 ± 1, Intervalo µ 1 µ 5 = (7, 25 2, 800) ± 1, = 4, 450 ± 1, Intervalo µ 1 µ 6 = (7, 25 2, 575) ± 1, = 4, 675 ± 1, Intervalo µ 5 µ 6 = (2, 80 2, 575) ± 1, = 0, 225 ± 1, Los intervalos que no contienen el valor cero indican diferencias significativas entre niveles. De las misma forma, se pueden calcular los restantes contrastes según figuran al final de la pag 39. Las diferencias marcadas con (*) indican valores significativos.

37 Análisis de la varianza, parte segunda 35 Intervalos para contrastes de predicciones (µ ij µ kl ) (ˆµ ij ˆµ kl ) ± Error estándar t α 2,ν ; 2MCRESIDUAL 2 1, Error estándar = nº datos en cada casilla = 2 = 1, 0859 t α 2,ν = t 0,025, 12 = 2, Contraste µ 11 µ 12 : (10, 65 7, 85) ± 2, = 2, 30 ± 2, Contraste µ 11 µ 13 : (10, 65 3, 35) ± 2, = 7, 30 ± 2, * Contraste µ 11 µ 14 : (10, 65 2, 95) ± 2, = 7, 70 ± 2, * Contraste µ 11 µ 15 : (10, 65 3, 10) ± 2, = 7, 55 ± 2, * Contraste µ 11 µ 16 : (10, 65 3, 25) ± 2, = 7, 40 ± 2, * Contraste µ 11 µ 21 : (10, 65 3, 85) ± 2, = 6, 80 ± 2, * Contraste µ 11 µ 22 : (10, 65 2, 90) ± 2, = 7, 75 ± 2, * Contraste µ 11 µ 23 : (10, 65 2, 60) ± 2, = 8, 05 ± 2, * Contraste µ 11 µ 24 : (10, 65 2, 10) ± 2, = 8, 55 ± 2, * Contraste µ 11 µ 25 : (10, 65 2, 50) ± 2, = 8, 15 ± 2, * Contraste µ 11 µ 26 : (10, 65 1, 90) ± 2, = 8, 75 ± 2, * Contraste µ 25 µ 26 : (2, 50 1, 90) ± 2, = 0, 40 ± 2, Serán significativas aquellas diferencias para las que el cero no esté dentro del intervalo. Las diferencias significativas se señalan con asterisco (*).

38 36 Análisis de la varianza Gráficos para efectos principales e interacciones En la pag 40 se recogen gráficos en los que se pueden apreciar las magnitudes relativas de los niveles de los factores y las de la interacción. Se pone de manifiesto la diferencia significativa entre los niveles 1 y 2 del factor A así como la de los niveles 1 y 2 respecto de los restantes niveles del factor B. En cuanto a la interacción, destaca la elevada respuesta de las combinaciones A=1, B=1 y A=1, B=2. Conclusiones De las dos alternativas de recubrimiento metálico (factor A), es significativamente mejor el resultado del tipo 2 con un contenido en Fe de 2,64ppm frente a 5,19ppm del tipo 1. De las seís clases de barnices (factor B) los resultados obtenidos por los tipos 1 y 2, con unos contenidos en Fe de, respectivamente, 7,25 y 5,37 p.p.m son significativamente peores que los restantes tipos de barniz cuyos resultados son, a su vez, equiparables entre si. Son fuertemente desfavorables las combinaciones del nivel 1 del factor A con el nivel 1 del factor B al resultar un contenido en Fe de 10,65 ppm así como las del nivel 1 del factor A con el nivel 2 del factor B y un contenido en Fe de 7,85 ppm.

39 Análisis de la varianza, parte segunda 37

40 38 Análisis de la varianza

41 Análisis de la varianza, parte segunda 39

42 40 Análisis de la varianza

43 Análisis de la varianza, parte segunda 41

44 42 Análisis de la varianza

45 Análisis de la varianza, parte segunda EXTENSIÓN A TRES O MÁS FACTORES La construcción de un modelo de Análisis de la Varianza asociado a un diseño con tres o más factores se realiza de forma análoga al modelo con dos factores. Sin embargo, el número de efectos principales e interacciones a estimar aumentará, rapidamente, con el número de factores considerados. Por ejemplo, en un modelo de Análisis de la Varianza para cuatro factores con tres niveles cada uno, existirán seís términos (C 2 4 = 6) de interacción doble, cuatro términos (C 3 4 = 4) de interacción triple y un término de interacción de cuarto orden (C 4 4 = 1). El número de g.d.l. necesarios para calcular las sumas de cuadrados y las medias cuadráticas sería 80: g.d.l. para los factores principales: 4(3-1) = 8 g.d.l. para las interacciones de segundo orden: 6(3-1)(3-1) = 24 g.d.l. para las interacciones de tercer orden: 4(3-1)(3-1)(3-1) = 32 g.d.l. para las interacciones de cuarto orden: (3-1)(3-1)(3-1)(3-1) = 16 Total 80 g.d.l. Los g.d.l. disponibles, si el diseño no se replica, será también de 80 dado que las combinaciones posibles de los tres niveles de los cuatro factores resultan N = = 81 y los correspondientes g.d.l: N-1=80 g.d.l. En consecuencia, al igual que sucedía para el caso de dos factores, es preciso replicar al menos una vez el diseño con lo que tendremos (con una réplica) un total de N = 2 81 = 162 observaciones y N 1 = 161 g.d.l. De los 161 g.d.l. disponibles, 80 se utilizarán en el cálculo de las sumas de cuadrados y medias cuadráticas y los 81 restantes en la estimación del error experimental σ que nos permitirá calcular los ratios F y efectuar los oportunos contrastes de hipótesis. Ciertamente, parece excesivo destinar 81 g.d.l. para calcular el error experimental. Se hace patente que un diseño factorial completo con varios factores con 4/5 niveles cada uno puede alcanzar una dimensión muy considerable. No obstante, dado que en muchas ocasiones no suelen ser de interés algunas de las interaciones de orden superior al segundo, los g.d.l. correspondientes pueden utilizarse para estimar el error experimimental y obviar la replicación.

46 44 Análisis de la varianza Supongamos, por ejemplo, un diseño factorial completo sin replicación de tres factores a tres niveles cada uno. Los datos de la variable dependiente (var1) correspondientes a los 27 tratamientos se recogen en la pag 45 mientras que en la parte superior de la pag 46 se presenta la correspondiente tabla de Análisis de la Varianza. Observamos que los 26 g.d.l. disponibles se han utilizado para calcular las medias cuadráticas y no se puede estimar el error residual. Suponiendo que la interacción de tercer orden es despreciable optamos por eliminarla del modelo. La nueva tabla de Análisis de la Varianza recogida en la parte inferior de la pag 46 nos muestra que los 8 g.d.l. de la interacción ABC se han utilizado para estimar el error residual, ˆσ = 0, = 0, 802, calcular los ratios F y establecer que los factores principales A y B tienen efectos de influencia significativa (p<0,05).

47 Análisis de la varianza, parte segunda 45

48 46 Análisis de la varianza

49 Análisis de la varianza, parte segunda DISEÑO FACTORIAL A DOS NIVELES Los diseños factoriales a dos niveles se utilizan con frecuencia como diseños de cribado en un estudio previo sobre un número elevado de factores de potencial influencia sobre la variable de respuesta. Para un número k de factores tendremos 2 k tratamientos diferentes. Una vez observada la presencia de factores con influencia significativa, podemos estudiarla de una forma más exhaustiva aumentando, en un nuevo diseño, el número de niveles de dichos factores. En un diseño factorial completo preparado para un número elevado de factores, crece rapidamente el número de experimentos elementales necesarios. Por ejemplo, para diez factores a dos niveles tendríamos 2 10 = 1024 tratamientos diferentes. Por otra parte, suele suceder que sólo alguno de los factores e interacciones resultan significativos mientras que los efectos de otros se confunden con el ruido de fondo producido por el error experimental. De ahí surge el fundamento de los diseños fraccionales en los que, desde el principio, se diseña solamente una fracción del diseño factorial completo: 1 2, 1 4, 1 8 etc, con lo que dedicaremos, preferentemente, los g.d.l. disponibles a la estimación de efectos de factores principales e interacciones de orden inferior mientras que otros efectos quedarán englobados en el término residual. Los diseños factoriales a dos niveles, tanto completos como fraccionales, serán estudiados con detalle en un próximo artículo. 8. EL MODELO ANOVA Y EL ANÁLISIS DE RE- GRESIÓN En un próximo capítulo veremos que los modelos ANOVA, ANCOVA, MA- NOVA y el modelo de Regresión Múltiple pueden englobarse en los llamados Modelos Generales de Regresión Lineal que estudian una o más variables dependientes de tipo continuo en función de varias variables independientes continuas y/o categóricas. En estos modelos, las variables dependientes se expresan en una ecuación cuyo segundo miembro contiene las sumas ponderadas de las variables independientes y el error residual. Como introducción, vamos a desarrollar un método que permite el estudio del modelo ANOVA mediante el modelo de Regresión lineal Múltiple. El lector interesado puede encontrar en nuestra web el artículo de fecha sobre Regresión

50 48 Análisis de la varianza lineal Múltiple. Ilustraremos el método aplicándolo al ejemplo del Estudio Comparativo de Envases de Conserva estudiado en el punto nº4 mediante un modelo ANOVA para dos factores y su interacción. El método consiste en la sustitución de cada variable categórica por tantas variables indicadoras (también llamadas variables mudas ) como g.d.l, equivalentes al número de niveles menos uno, tenga el factor. En nuestro caso, los factores A y B con 2 y 6 niveles, serán sustituidos respectivamente, por 2-1=1 y 6-1=5 variables mudas según lo siguiente: Variable muda Variables mudas Factor A x 1 Factor B x 2 x 3 x 4 x 5 x 6 nivel 1 1 nivel nivel 2-1 nivel nivel nivel nivel nivel Entre otras posibles alternativas, hemos escogido la de asignar a las variables mudas los valores 1-1 y 0 según lo indicado en los cuadros. En definitiva, el factor A (a dos niveles) es sustituido por una variable muda (x 1 ) mientras que el factor B lo es por cinco variables mudas : x 2, x 3, x 4, x 5 y x 6. El término de interacción queda sustituido por otras cinco variables mudas : x 7, x 8, x 9, x 10 y x 11 resultantes de multiplicar los valores de x 1 por los de x 2, x 3, x 4, x 5 y x 6. Obsérvese como el número de variables mudas coincide con los g.d.l. del modelo ANOVA recogidos en la tabla de Análisis de la Varianza de la pag 38. En la pag 51 se recoje la base de datos con los niveles de los factores A y B junto con los valores de las 11 variables mudas correspondientes. En la pag 50 se presenta el modelo de regresión resultante. Nótese que la media cuadrática residual: σ 2 = 1, (pag 50) es idéntica a la del modelo ANOVA (pag 38) así como las correspondientes predicciones y residuos (pags 41 y 51). Además, las estimas del valor medio y de los efectos del modelo ANOVA calculados en la pag 29 coinciden con los coeficientes de la ecuación de regresión múltiple de la pag 50.

51 Análisis de la varianza, parte segunda 49

52 50 Análisis de la varianza

53 Análisis de la varianza, parte segunda 51

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma: Ignacio Martín Tamayo 25 Tema: ANÁLISIS DE VARIANZA CON SPSS 8.0 ÍNDICE --------------------------------------------------------- 1. Modelos de ANOVA 2. ANOVA unifactorial entregrupos 3. ANOVA multifactorial

Más detalles

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 2011 UNED DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 7] Diseños con más de dos grupos independientes. Análisis de varianza con dos factores completamente aleatorizados 1 Índice 7.1 Introducción...

Más detalles

REGRESIÓN LINEAL MÚLTIPLE

REGRESIÓN LINEAL MÚLTIPLE REGRESIÓN LINEAL MÚLTIPLE.- Planteamiento general....- Métodos para la selección de variables... 5 3.- Correlaciones parciales y semiparciales... 8 4.- Multicolinealidad en las variables explicativas...

Más detalles

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009 Índice general 6. Regresión Múltiple 3 6.1. Descomposición de la variabilidad y contrastes de hipótesis................. 4 6.2. Coeficiente de determinación.................................. 5 6.3. Hipótesis

Más detalles

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD.

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD. Experimentos con un solo factor: El análisis de varianza Jhon Jairo Padilla Aguilar, PhD. Experimentación en sistemas aleatorios: Factores Controlables Entradas proceso Salidas Factores No controlables

Más detalles

Diseños en cuadrados latinos

Diseños en cuadrados latinos Capítulo 7 Diseños en cuadrados latinos 7.1. Introducción En el modelo en bloques aleatorizados, que estudiamos en el capítulo anterior, considerábamos un factor principal y un factor de control o variable

Más detalles

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante Capítulo 15 Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante Los modelos factoriales de análisis de varianza (factorial = más de un factor) sirven para evaluar el efecto

Más detalles

EXPERIMENTACIÓN. Eduardo Jiménez Marqués

EXPERIMENTACIÓN. Eduardo Jiménez Marqués EXPERIMENTACIÓN Eduardo Jiménez Marqués 1 CONTENIDO: 1. Experimentación...3 1.1 Concepto...3 1. Definición...4 1.3 Dificultad...4 1.4 Ventaja...5 1.5 Planificación...5 1.6 Aplicaciones...5 1.7 Metodología...6

Más detalles

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral Enero 2005 1.- INTRODUCCIÓN En múltiples ocasiones el analista o investigador se enfrenta al problema de determinar

Más detalles

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3 Capítulo 3 1. Introducción El análisis de regresión lineal, en general, nos permite obtener una función lineal de una o más variables independientes o predictoras (X1, X2,... XK) a partir de la cual explicar

Más detalles

Análisis de la Varianza de un Factor

Análisis de la Varianza de un Factor Práctica de Estadística con Statgraphics Análisis de la Varianza de un Factor Fundamentos teóricos El Análisis de la Varianza con un Factor es una técnica estadística de contraste de hipótesis, cuyo propósito

Más detalles

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO Análisis estadístico 31 3. ANÁLII ETADÍTICO DE LA PRECIPITACIONE EN EL MAR CAPIO 3.1. ANÁLII Y MÉTODO ETADÍTICO UTILIZADO 3.1.1. Introducción Una vez analizado el balance de masas que afecta al mar Caspio

Más detalles

Una serie temporal o cronológica es en una sucesión de valores que adopta una variable (Y):

Una serie temporal o cronológica es en una sucesión de valores que adopta una variable (Y): INTRODUCCIÓN Nos vamos a ocupar ahora de estudiar un fenómeno desde la perspectiva temporal, observando su evolución a través del tiempo, lo que se denomina investigación diacrónica o longitudinal, en

Más detalles

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor Capítulo 14 Análisis de varianza de un factor: El procedimiento ANOVA de un factor El análisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una variable cuantitativa. Se trata,

Más detalles

T. 5 Inferencia estadística acerca de la relación entre variables

T. 5 Inferencia estadística acerca de la relación entre variables T. 5 Inferencia estadística acerca de la relación entre variables 1. El caso de dos variables categóricas 2. El caso de una variable categórica y una variable cuantitativa 3. El caso de dos variables cuantitativas

Más detalles

ANÁLISIS DE DATOS NO NUMERICOS

ANÁLISIS DE DATOS NO NUMERICOS ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas

Más detalles

Diseños en bloques aleatorizados

Diseños en bloques aleatorizados Capítulo 5 Diseños en bloques aleatorizados 5.1. ntroducción En las situaciones que hemos estudiado en el Capítulo 1 hemos supuesto que existe bastante homogéneidad entre las unidades experimentales, así,

Más detalles

ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ

ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ Presentado a: MARIA ESTELA SEVERICHE CORPORACION UNIVERSITARIA

Más detalles

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias ECONOMETRIA I. Departamento de Fundamentos del Análisis Económico Universidad de Alicante. Curso 2011/12 GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias Bibliografía apartados : Greene, 8.2 A.F.Gallastegui:

Más detalles

Tema 7: Modelos de diseños de experimentos

Tema 7: Modelos de diseños de experimentos Tema 7: Modelos de diseños de experimentos Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 7: Modelos de diseños de experimentos Curso

Más detalles

Métodos y Diseños utilizados en Psicología

Métodos y Diseños utilizados en Psicología Métodos y Diseños utilizados en Psicología El presente documento pretende realizar una introducción al método científico utilizado en Psicología para recoger información acerca de situaciones o aspectos

Más detalles

SPSS: ANOVA de un Factor

SPSS: ANOVA de un Factor SPSS: ANOVA de un Factor El análisis de varianza (ANOVA) de un factor nos sirve para comparar varios grupos en una variable cuantitativa. Esta prueba es una generalización del contraste de igualdad de

Más detalles

Factorización de polinomios

Factorización de polinomios Factorización de polinomios Polinomios Un polinomio p en la variable x es una expresión de la forma: px a 0 a 1 x a x a n1 x n1 a n x n donde a 0, a 1, a,, a n1, a n son unos números, llamados coeficientes

Más detalles

Grado en Finanzas y Contabilidad

Grado en Finanzas y Contabilidad Econometría Grado en Finanzas y Contabilidad Apuntes basados en el libro Introduction to Econometrics: A modern Approach de Wooldridge 5.2 Estimadores de Variables Instrumentales La endogeneidad aparece

Más detalles

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11 Tema 5 Análisis de regresión (segunda parte) Estadística II, 2010/11 Contenidos 5.1: Diagnóstico: Análisis de los residuos 5.2: La descomposición ANOVA (ANalysis Of VAriance) 5.3: Relaciones no lineales

Más detalles

TEMA 4: Variables binarias

TEMA 4: Variables binarias TEMA 4: Variables binarias Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 4: Variables binarias Curso 2011-12 1 / 51 Variables

Más detalles

ESQUEMA GENERAL DISEÑOS DE MEDIDAS REPETIDAS

ESQUEMA GENERAL DISEÑOS DE MEDIDAS REPETIDAS TEMA IV ESQUEMA GENERAL Definición Clasificación Diseño simple de medidas repetidas Diseño factorial de medidas repetidas Diseño de medidas parcialmente repetidas DISEÑOS DE MEDIDAS REPETIDAS Definición

Más detalles

Modelos de regresión: lineal simple y regresión logística

Modelos de regresión: lineal simple y regresión logística 14 Modelos de regresión: lineal simple y regresión logística Irene Moral Peláez 14.1. Introducción Cuando se quiere evaluar la relación entre una variable que suscita especial interés (variable dependiente

Más detalles

Factores no controlables

Factores no controlables Acepto la Ho y ιj μ α ι β j ε ιj Dr. Alfredo Matos Ch. Universidad Peruana Unión amatosch@upeu.edu.pe Factores Controles Entradas PROCESO FUNCION ACTIVIDAD Salidas Factores no controlables 2 1 Se entiende

Más detalles

Capítulo 18 Análisis de regresión lineal El procedimiento Regresión lineal

Capítulo 18 Análisis de regresión lineal El procedimiento Regresión lineal Capítulo 18 Análisis de regresión lineal El procedimiento Regresión lineal Introducción El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables. Se

Más detalles

1 Ejemplo de análisis descriptivo de un conjunto de datos

1 Ejemplo de análisis descriptivo de un conjunto de datos 1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos

Más detalles

Control interno de los métodos de análisis

Control interno de los métodos de análisis Aseguramiento de la Calidad Control interno de los métodos de análisis Universidad Nacional Sede Medellín Facultad de Ciencias Escuela de Geociencias Orlando Ruiz Villadiego, Químico MSc. Coordinador Laboratorio

Más detalles

www.fundibeq.org Además, se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión.

www.fundibeq.org Además, se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión. DISEÑO DE EXPERIMENTOS 1.- INTRODUCCIÓN Este documento trata de dar una visión muy simplificada de la utilidad y la utilización del Diseño de Experimentos. En él se explican los conceptos clave de esta

Más detalles

Repaso de matrices, determinantes y sistemas de ecuaciones lineales

Repaso de matrices, determinantes y sistemas de ecuaciones lineales Tema 1 Repaso de matrices, determinantes y sistemas de ecuaciones lineales Comenzamos este primer tema con un problema de motivación. Problema: El aire puro está compuesto esencialmente por un 78 por ciento

Más detalles

1 Introducción al SPSS

1 Introducción al SPSS Breve guión para las prácticas con SPSS 1 Introducción al SPSS El programa SPSS está organizado en dos bloques: el editor de datos y el visor de resultados. En la barra de menú (arriba de la pantalla)

Más detalles

EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones

EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones Ricard Boqué, Alicia Maroto Grupo de Quimiometría y Cualimetría. Universitat Rovira i Virgili. Pl. Imperial Tàrraco, 1. 43005Tarragona

Más detalles

NT8. El Valor en Riesgo (VaR)

NT8. El Valor en Riesgo (VaR) NT8. El Valor en Riesgo (VaR) Introducción VaR son las siglas de Valor en el Riesgo (Value at Risk) y fue desarrollado por la división RiskMetric de JP Morgan en 1994. es una manera de medir el riesgo

Más detalles

INTERPRETACION ECONOMICA DEL ANALISIS DE SENSIBILIDAD

INTERPRETACION ECONOMICA DEL ANALISIS DE SENSIBILIDAD ESCOLA UNIVERSITÀRIA D ESTUDIS EMPRESARIALS DEPARTAMENT D ECONOMIA I ORGANITZACIÓ D EMPRESES INTERPRETACION ECONOMICA DEL ANALISIS DE SENSIBILIDAD Dunia Durán Juvé Profesora Titular 1ª Edición de 1995:

Más detalles

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes.

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 2009 UNED [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 1 ÍNDICE 3.1 Introducción 3.2 Objetivos 3.3 Muestras independientes o relacionadas 3.4 Contraste de hipótesis sobre

Más detalles

UNED. DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 8] Análisis de Regresión Lineal Simple y Múltiple

UNED. DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 8] Análisis de Regresión Lineal Simple y Múltiple 011 UNED DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 8] Análisis de Regresión Lineal Simple y Múltiple 1 Índice 8.1 Introducción... 3 8. Objetivos... 4 8.3 Análisis de Regresión Simple... 4 8.3.1

Más detalles

TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1

TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1 TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1 rafael.dearce@uam.es El objeto de las tablas de contingencia es extraer información de cruce entre dos

Más detalles

Diseño Estadístico de Experimentos

Diseño Estadístico de Experimentos Capítulo 3 Diseño Estadístico de Experimentos Una prueba o serie de pruebas en las cuales se introducen cambios deliberados en las variables de entrada que forman el proceso, de manera que sea posible

Más detalles

Empresarial y Financiero

Empresarial y Financiero Curso de Excel Empresarial y Financiero SESIÓN : REGRESIÓN Rosa Rodríguez Relación con el Mercado Descargue de yahoo.com los Datos de precio ajustado de cierre de las acciones de General Electric (GE),

Más detalles

ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso

ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 3 - Septiembre - 2.6 Primera Parte - Test Las respuestas del TEST son las siguientes: Pregunta 2 3 4 5 6 Respuesta C A D C B A Pregunta 7 8 9 2 Respuesta

Más detalles

- se puede formular de la siguiente forma:

- se puede formular de la siguiente forma: Multicolinealidad 1 Planteamiento Una de las hipótesis del modelo de regresión lineal múltiple establece que no existe relación lineal exacta entre los regresores, o, en otras palabras, establece que no

Más detalles

6. DISEÑOS FACTORIALES 2 K NO REPLICADOS

6. DISEÑOS FACTORIALES 2 K NO REPLICADOS 6. DISEÑOS FACTORIALES 2 K NO REPLICADOS 6.1 INTRODUCCION El aumentar el numero de factores en un diseño 2 k crece rápidamente el numero de tratamientos y por tanto el numero de corridas experimentales.

Más detalles

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 26 - Junio - 2.8 Primera Parte - Test Nota : En la realización de este examen sólo esta permitido utilizar calculadoras que, a lo sumo, tengan funciones

Más detalles

Capítulo 7: Distribuciones muestrales

Capítulo 7: Distribuciones muestrales Capítulo 7: Distribuciones muestrales Recordemos: Parámetro es una medida de resumen numérica que se calcularía usando todas las unidades de la población. Es un número fijo. Generalmente no lo conocemos.

Más detalles

Clase 8: Distribuciones Muestrales

Clase 8: Distribuciones Muestrales Clase 8: Distribuciones Muestrales Distribución Muestral La inferencia estadística trata básicamente con generalizaciones y predicciones. Por ejemplo, podemos afirmar, con base a opiniones de varias personas

Más detalles

IX.- ANÁLISIS DE VARIANZA

IX.- ANÁLISIS DE VARIANZA IX- ANÁLISIS DE VARIANZA Las técnicas de Diseño Experimental basadas en la estadística son particularmente útiles en el mundo de la Ingeniería en lo que corresponde a la mejora del rendimiento de los procesos

Más detalles

Diseños en cuadrados greco-latinos

Diseños en cuadrados greco-latinos Capítulo 8 Diseños en cuadrados greco-latinos 8.1. Introducción El modelo en cuadrado greco-latino se puede considerar como una extensión del cuadrado latino en el que se incluye una tercera variable de

Más detalles

Matrices equivalentes. El método de Gauss

Matrices equivalentes. El método de Gauss Matrices equivalentes. El método de Gauss Dada una matriz A cualquiera decimos que B es equivalente a A si podemos transformar A en B mediante una combinación de las siguientes operaciones: Multiplicar

Más detalles

Tema 3: El modelo de regresión lineal múltiple

Tema 3: El modelo de regresión lineal múltiple Econometría 1 curso 2009-2010 Tema 3: El modelo de regresión lineal múltiple Genaro Sucarrat (Departamento de Economía, UC3M) http://www.eco.uc3m.es/sucarrat/ Recordamos: El modelo de regresión lineal

Más detalles

EXPERIMENTOS FACTORIALES En esta unidad se estudian los experimentos factoriales. Aquí hay varios tratamientos en cada una de varias categorías y

EXPERIMENTOS FACTORIALES En esta unidad se estudian los experimentos factoriales. Aquí hay varios tratamientos en cada una de varias categorías y EXPERIMENTOS FACTORIALES En esta unidad se estudian los experimentos factoriales. Aquí hay varios tratamientos en cada una de varias categorías y definen un marco de tratamientos. Esta elección de diseño

Más detalles

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Índice 1. Objetivos de la práctica 2 2. Estimación de un modelo de regresión logística con SPSS 2 2.1. Ajuste de un modelo de regresión logística.............................

Más detalles

Aula Banca Privada. La importancia de la diversificación

Aula Banca Privada. La importancia de la diversificación Aula Banca Privada La importancia de la diversificación La importancia de la diversificación La diversificación de carteras es el principio básico de la operativa en mercados financieros, según el cual

Más detalles

Aplicaciones de Estadística Descriptiva

Aplicaciones de Estadística Descriptiva Aplicaciones de Estadística Descriptiva Contenidos de la presentación Funciones estadísticas en Excel. Gráficos. El módulo de análisis de datos y las tablas dinámicas de Excel. Información Intentaremos

Más detalles

DELTA MASTER FORMACIÓN UNIVERSITARIA C/ Gral. Ampudia, 16 Teléf.: 91 533 38 42-91 535 19 32 28003 MADRID ECONOMETRIA PRIMER PARCIAL 17 DE ENERO DE 2008 1.- A) La transformación estacionaria es SOLUCIONES

Más detalles

Covarianza y coeficiente de correlación

Covarianza y coeficiente de correlación Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también

Más detalles

Statgraphics Centurión

Statgraphics Centurión Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 1 Statgraphics Centurión I.- Nociones básicas El paquete Statgraphics Centurión es un programa para el análisis estadístico que

Más detalles

Pablo Fernández. IESE. Valoración de opciones por simulación 1 VALORACIÓN DE OPCIONES POR SIMULACIÓN Pablo Fernández IESE

Pablo Fernández. IESE. Valoración de opciones por simulación 1 VALORACIÓN DE OPCIONES POR SIMULACIÓN Pablo Fernández IESE Pablo Fernández. IESE. Valoración de opciones por simulación 1 VALORACIÓN DE OPCIONES POR SIMULACIÓN Pablo Fernández IESE 1. Fórmulas utilizadas en la simulación de la evolución del precio de una acción

Más detalles

CURSO CERO. Departamento de Matemáticas. Profesor: Raúl Martín Martín Sesiones 18 y 19 de Septiembre

CURSO CERO. Departamento de Matemáticas. Profesor: Raúl Martín Martín Sesiones 18 y 19 de Septiembre CURSO CERO Departamento de Matemáticas Profesor: Raúl Martín Martín Sesiones 18 y 19 de Septiembre Capítulo 1 La demostración matemática Demostración por inducción El razonamiento por inducción es una

Más detalles

TEMA 9: Desarrollo de la metodología de Taguchi

TEMA 9: Desarrollo de la metodología de Taguchi TEMA 9: Desarrollo de la metodología de Taguchi 1 La filosofía de la calidad de Taguchi 2 Control de calidad Off Line y On Line Calidad Off Line Calidad On Line 3 Función de pérdida 4 Razones señal-ruido

Más detalles

EL DISEÑO FACTORIAL COMPLETO 2 k

EL DISEÑO FACTORIAL COMPLETO 2 k EL DISEÑO FACTORIAL COMPLETO 2 k Joan Ferré Grupo de Quimiometría y Cualimetría Departamento de Química Analítica y Química Orgánica Universidad Rovira i Virgili (Tarragona) INTRODUCCIÓN En el primer artículo

Más detalles

Regresión lineal múltiple

Regresión lineal múltiple . egresión lineal múltiple egresión lineal múltiple. Introducción. En el tema anterior estudiamos la correlación entre dos variables y las predicciones que pueden hacerse de una de ellas a partir del conocimiento

Más detalles

Introducción al análisis de la varianza (ANOVA)

Introducción al análisis de la varianza (ANOVA) Introducción al análisis de la varianza (ANOVA) Albert Sorribas Departament de Ciències Mèdiques Bàsiques Universitat de Lleida albert.sorribas@cmb.udl.cat última versión: 6 de febrero de 2014 Índice 1.

Más detalles

Introducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS

Introducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS Introducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CON EXCEL La Herramienta para análisis Regresión

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

CLAVE: LII PROFESOR: MTRO. ALEJANDRO SALAZAR GUERRERO

CLAVE: LII PROFESOR: MTRO. ALEJANDRO SALAZAR GUERRERO Estadística Superior CLAVE: LII PROFESOR: MTRO. ALEJANDRO SALAZAR GUERRERO 1 1. REGRESIÓN LINEAL SIMPLE Y MÚLTIPLE 1.1. Regresión lineal simple 1.2. Estimación y predicción por intervalo en regresión lineal

Más detalles

La demanda de plazas en la licenciatura de Medicina en España

La demanda de plazas en la licenciatura de Medicina en España La demanda de plazas en la licenciatura de Medicina en España Estudio econométrico por Comunidades Autónomas de la demanda de plazas en las facultades de Medicina españolas para el curso 2006/2007 Asignatura:

Más detalles

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Cuando se analizan datos, el interés del analista suele centrarse en dos grandes objetivos:

Más detalles

Tema 2. Espacios Vectoriales. 2.1. Introducción

Tema 2. Espacios Vectoriales. 2.1. Introducción Tema 2 Espacios Vectoriales 2.1. Introducción Estamos habituados en diferentes cursos a trabajar con el concepto de vector. Concretamente sabemos que un vector es un segmento orientado caracterizado por

Más detalles

Capítulo 16 Análisis de varianza con medidas repetidas: El procedimiento MLG: Medidas repetidas

Capítulo 16 Análisis de varianza con medidas repetidas: El procedimiento MLG: Medidas repetidas Capítulo 6 Análisis de varianza con medidas repetidas: El procedimiento MLG: Medidas repetidas Los modelos de análisis de varianza (ANOVA) con medidas repetidas (MR) sirven para estudiar el efecto de uno

Más detalles

Práctica de Diseños Factoriales a dos niveles

Práctica de Diseños Factoriales a dos niveles Práctica de Diseños Factoriales a dos niveles Fichero de datos: antenas.sfx El tratamiento de un diseño factorial a dos niveles con Statgraphics tiene dos fases: 1. Diseñar el experimento: seleccionar

Más detalles

Capítulo IV Diseños de cuadrados latinos y diseños afines

Capítulo IV Diseños de cuadrados latinos y diseños afines Capítulo IV Diseños de cuadrados latinos y diseños afines Estos diseños clásicos son una extensión lógica y natural del diseño en bloques completos al azar y poseen una serie de características muy similares,

Más detalles

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases. BASES Y DIMENSIÓN Definición: Base. Se llama base de un espacio (o subespacio) vectorial a un sistema generador de dicho espacio o subespacio, que sea a la vez linealmente independiente. β Propiedades

Más detalles

Elementos de Diseño de Experimentos

Elementos de Diseño de Experimentos Elementos de Diseño de Experimentos Elementos de Diseño de Experimentos Porfirio Gutiérrez González Lizbeth Díaz Caldera María de Jesús Guzmán Sánchez Autores: Porfirio Gutiérrez González Lizbeth Díaz

Más detalles

Estadística aplicada y modelización. 10 de septiembre de 2005

Estadística aplicada y modelización. 10 de septiembre de 2005 Estadística aplicada y modelización. 10 de septiembre de 005 SOLUCIÓN MODELO A 1. Una persona se está preparando para obtener el carnet de conducir, repitiendo un test de 0 preguntas. En la siguiente tabla

Más detalles

Problemas de Probabilidad resueltos.

Problemas de Probabilidad resueltos. Problemas de Probabilidad resueltos. Problema 1 El profesor Pérez olvida poner su despertador 3 de cada 10 dias. Además, ha comprobado que uno de cada 10 dias en los que pone el despertador acaba no levandandose

Más detalles

Tema III. Capítulo 2. Sistemas generadores. Sistemas libres. Bases.

Tema III. Capítulo 2. Sistemas generadores. Sistemas libres. Bases. Tema III Capítulo 2 Sistemas generadores Sistemas libres Bases Álgebra Lineal I Departamento de Métodos Matemáticos y de Representación UDC 2 Sistemas generadores Sistemas libres Bases 1 Combinación lineal

Más detalles

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA PROF. Esther González Sánchez Departamento de Informática y Sistemas Facultad de Informática Universidad de Las Palmas de Gran Canaria

Más detalles

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales Estadística 38 Tema 3: Variables aleatorias y vectores aleatorios bidimensionales El concepto de variable aleatoria surge de la necesidad de hacer más manejables matemáticamente los resultados de los experimentos

Más detalles

Diseños de Investigación 40 conceptos que debes conocer

Diseños de Investigación 40 conceptos que debes conocer Diseños de Investigación 40 conceptos que debes conocer 1. El método científico: Se puede realizar desde dos enfoques distintos, hipotético deductivo y analítico inductivo. Con frecuencia los dos ocurren

Más detalles

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS AGRICOLA, PECUARIAS Y DEL MEDIO AMBIENTE ECAPMA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS AGRICOLA, PECUARIAS Y DEL MEDIO AMBIENTE ECAPMA UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS AGRICOLA, PECUARIAS Y DEL MEDIO AMBIENTE ECAPMA ESPECIALIZACIÓN EN NUTRICIÓN ANIMAL SOSTENIBLE Nombre del Curso: DISEÑO EXPERIMENTAL AVANZADO

Más detalles

Anexo 1: Demostraciones

Anexo 1: Demostraciones 75 Matemáticas I : Álgebra Lineal Anexo 1: Demostraciones Espacios vectoriales Demostración de: Propiedades 89 de la página 41 Propiedades 89- Algunas propiedades que se deducen de las anteriores son:

Más detalles

Definición 1.1.1. Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

Definición 1.1.1. Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas. Tema 1 Matrices Estructura del tema. Conceptos básicos y ejemplos Operaciones básicas con matrices Método de Gauss Rango de una matriz Concepto de matriz regular y propiedades Determinante asociado a una

Más detalles

Análisis multivariable

Análisis multivariable Análisis multivariable Las diferentes técnicas de análisis multivariante cabe agruparlas en tres categorías: «Análisis de dependencia» tratan de explicar la variable considerada independiente a través

Más detalles

Capítulo 12. Análisis de variables categóricas: El procedimiento Tablas de contingencia. Tablas de contingencia

Capítulo 12. Análisis de variables categóricas: El procedimiento Tablas de contingencia. Tablas de contingencia Capítulo 12 Análisis de variables categóricas: El procedimiento Tablas de contingencia En las ciencias sociales, de la salud y del comportamiento es muy frecuente encontrarse con variables categóricas.

Más detalles

Curso de Estadística no-paramétrica

Curso de Estadística no-paramétrica Curso de Estadística no-paramétrica Sesión 1: Introducción Inferencia no Paramétrica David Conesa Grup d Estadística espacial i Temporal Departament d Estadística en Epidemiologia i Medi Ambient i Investigació

Más detalles

TRATAMIENTO DE BASES DE DATOS CON INFORMACIÓN FALTANTE SEGÚN ANÁLISIS DE LAS PÉRDIDAS CON SPSS

TRATAMIENTO DE BASES DE DATOS CON INFORMACIÓN FALTANTE SEGÚN ANÁLISIS DE LAS PÉRDIDAS CON SPSS Badler, Clara E. Alsina, Sara M. 1 Puigsubirá, Cristina B. 1 Vitelleschi, María S. 1 Instituto de Investigaciones Teóricas y Aplicadas de la Escuela de Estadística (IITAE) TRATAMIENTO DE BASES DE DATOS

Más detalles

Capítulo 18. Análisis de regresión lineal: El procedimiento Regresión lineal. Introducción

Capítulo 18. Análisis de regresión lineal: El procedimiento Regresión lineal. Introducción Capítulo 18 Análisis de regresión lineal: El procedimiento Regresión lineal Introducción El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables.

Más detalles

REGRESION simple. Correlación Lineal:

REGRESION simple. Correlación Lineal: REGRESION simple Correlación Lineal: Dadas dos variable numéricas continuas X e Y, decimos que están correlacionadas si entre ambas variables hay cierta relación, de modo que puede predecirse (aproximadamente)

Más detalles

Diseño completamente al azar. Diseño de experimentos p. 1/111

Diseño completamente al azar. Diseño de experimentos p. 1/111 Diseño completamente al azar Diseño de experimentos p. 1/111 Ejemplo Suponga que tenemos 4 dietas diferentes que queremos comparar. Las dietas están etiquetadas A,B,C y D. Estamos interesados en estudiar

Más detalles

Capítulo 4 MEDIDA DE MAGNITUDES. Autor: Santiago Ramírez de la Piscina Millán

Capítulo 4 MEDIDA DE MAGNITUDES. Autor: Santiago Ramírez de la Piscina Millán Capítulo 4 MEDIDA DE MAGNITUDES Autor: Santiago Ramírez de la Piscina Millán 4 MEDIDA DE MAGNITUDES 4.1 Introducción El hecho de hacer experimentos implica la determinación cuantitativa de las magnitudes

Más detalles

Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico.

Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico. Universitat de de Barcelona. Institut de de Ciències de de l Educació Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico. María José Rubio

Más detalles

Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida. Por: Prof. Elena del C. Coba

Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida. Por: Prof. Elena del C. Coba Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida Por: Prof. Elena del C. Coba Encuestas y estudios aplicados al VIH/sida Definir la fuente de los datos: Datos

Más detalles

Prácticas y problemas de diseño de experimentos.

Prácticas y problemas de diseño de experimentos. Capítulo 1 Prácticas y problemas de diseño de experimentos. 1.1. Problemas de diseño de experimentos con ordenador. Problema 3.1. Datos apareados. El Ministerio de Trabajo desea saber si un plan de seguridad

Más detalles

Comparación de proporciones

Comparación de proporciones 11 Comparación de proporciones Neus Canal Díaz 11.1. Introducción En la investigación biomédica se encuentran con frecuencia datos o variables de tipo cualitativo (nominal u ordinal), mediante las cuales

Más detalles

METODOLOGIA DE SUPERFICIES DE RESPUESTA. Esto se logra al determinar las condiciones óptimas de operación del sistema.

METODOLOGIA DE SUPERFICIES DE RESPUESTA. Esto se logra al determinar las condiciones óptimas de operación del sistema. 37 CAPITULO METODOLOGIA DE SUPERFICIES DE RESPUESTA En este capítulo hablaremos de qué es la Metodología de Superficies de Respuesta, su representación gráfica, el procedimiento a seguir hasta encontrar

Más detalles