ANÁLISIS DE LA VARIANZA PARTE SEGUNDA

Tamaño: px
Comenzar la demostración a partir de la página:

Download "ANÁLISIS DE LA VARIANZA PARTE SEGUNDA"

Transcripción

1 ANÁLISIS DE LA VARIANZA PARTE SEGUNDA Septiembre de 2012

2 Índice general 1. INTRODUCCIÓN FUNDAMENTOS DEL DISEÑO EN BLOQUES ALEATORIZADOS 1 3. EJEMPLO DE DISEÑO EN BLOQUES ALEATORIZADOS: EX- PANSIÓN DEL CARBÓN DURANTE LA COQUIZACIÓN FUNDAMENTOS DEL DISEÑO FACTORIAL EJEMPLO DE DISEÑO FACTORIAL: ESTUDIO COMPARA- TIVO DE ENVASES DE CONSERVAS EXTENSIÓN A TRES O MÁS FACTORES DISEÑO FACTORIAL A DOS NIVELES EL MODELO ANOVA Y EL ANÁLISIS DE REGRESIÓN

3 1. INTRODUCCIÓN En la Parte Primera del Análisis de la Varianza nos centrábamos en el modelo ANOVA Simple que consideraba un único factor como causa de variabilidad. Este modelo estaba ligado al Diseño completamente aleatorizado. Otros factores, posibles fuentes de variabilidad, no estaban incluidos expresamente en el modelo y sus efectos quedaban englobados en la variabilidad residual. En esta Parte Segunda consideraremos más de un factor como causas de variabilidad desarrollando modelos ANOVA ligados a Diseños en Bloques Aleatorizados y a Diseños Factoriales. 2. FUNDAMENTOS DEL DISEÑO EN BLOQUES ALEATORIZADOS En el diseño en bloques aleatorizados, además del factor de tipo categórico A con p niveles (tratamientos) cuyos efectos queremos cuantificar y comparar, existe otro factor B con q niveles que denominaremos variable bloque. El experimentador no está interesado, en principio, en cuantificar los efectos de la variable bloque pero sabe que ésta ejerce influencia sobre la variable de respuesta y desea eliminarla del análisis reduciendo de esta forma la variabilidad residual o error experimental. Cada uno de los p tratamientos se aplica una vez dentro de cada nivel de la variable bloque con lo que el número total de observaciones será N = p q. Las N observaciones quedan agrupadas en q bloques de forma que, dentro

4 2 Análisis de la varianza de cada bloque, las observaciones son entre si más homogéneas. El diseño en bloques aleatorizados es uno de los diseños utilizados con mayor frecuencia. Se hace evidente que aquellas variables cuya consideración suponga una mayor homogeneidad en las observaciones por afectar a las unidades experimentales o a las condiciones de realización del experimento son potenciales candidatas a su selección como variables bloque. Por ejemplo: lotes de materia prima, tiempo y en la experimentación con animales edad, sexo, estado de salud, etc. Dentro de cada nivel o bloque, podremos comparar mejor los efectos de los diferentes tratamientos que si no hubieramos efectuado la agrupación en bloques. La variabilidad existente en las N observaciones de la respuesta, quedará descompuesta en tres fuentes de variación: Dos de dichas fuentes serán asignables a los tratamientos y a la variable bloque mientras que la tercera será la variabilidad residual o error experimental. Es importante tener en cuenta que los p tratamientos deben ser aplicados aleatoriamente dentro de cada bloque por lo que habrá q aleatorizaciones. Si hubieramos introducido en el modelo una segunda variable bloque con r niveles, los p tratamientos habrían de haber sido aplicados, también, de forma aleatoría en cada nivel de la segunda variable bloque. En el caso de que el diseño considere el factor A y dos variables bloque coincidiendo el número de niveles del factor y los de las variables bloque nos encontramos ante el tipo de diseño denominado Cuadrado latino. En estos diseños los tratamientos se designan con letras latinas: a, b, c... En un cuadrado latino con p niveles el número de observaciones será p 2, los datos se disponen en p filas y p columnas mientras que los tratamientos (a, b, c...) se asignan de forma aleatoria en el cuadrado con las restricciones de que en cada fila y en cada columna se den los p tratamientos y no se repita ninguno. Por ejemplo, para p=5 un diseño en cuadrado latino sería:

5 Análisis de la varianza, parte segunda 3 Diseño en cuadrado latino (p=5) Niveles Bloque 2 Niveles I II III IV V Bloque 1 I b e a c d II d a e b c III e b c d a IV a c d e b V c d b a e Con un factor y tres variables bloques, del mismo número de niveles, tendremos el cuadrado greco-latino. El modelo de Análisis de la Varianza asociado a un Diseño en Bloques Aleatorizados para un factor (A) y una variable bloque (B) es: y ij = µ + τ i + β j + ε ij y ij : Son los valores obtenidos para la variable de respuesta. El subíndice i indica los diferentes niveles del factor A : 1, 2...p. El subíndice j señala los niveles de la variable bloque B :1,2,...q. µ : Valor medio de la variable de respuesta. τ i : Es el efecto correspondiente al nivel i del factor A. Si el nivel i tiene un valor medio µ i, se define el efecto τ i como la diferencia µ i µ. β j : Es el efecto del nivel j de la variable bloque B. Si el nivel j tiene un valor medio µ j, el efecto β j será la diferencia µ j µ. ε ij : Término residual que suponemos conforme a una distribución Normal de media cero y desviación típica σ que representamos por N(0, σ). En este diseño, nuestro interés está centrado en hacer el error experimental lo más pequeño posible eliminando del error experimental la influencia de la variable bloque. La variable bloque, en principio, no interacciona. Si nos consta que existe interacción el modelo no sería aplicable y habría que utilizar el modelo factorial que desarrollaremos en el punto 4.

6 4 Análisis de la varianza Los efectos τ i y β j están sujetos a las restricciones: i=p i=1 τ i = 0; j=q j=1 β j = 0 Para facilitar el desarrollo, las N=pq observaciones de y ij las dispondremos en q niveles o bloques. Bloque Tratamientos 1 2 q 1 y 11 y 12 y 1q 2. y 21. y 22. y 2q. p y p1 y p2 y pq Si sumamos los valores por filas, por columnas o la totalidad tendremos las expresiones: y is = j=q j=1 y ij; y i = y is q = j=q j=1 y ij q y is representa la suma de las observaciones de la fila i. El subíndice s indica suma. y i representa el valor medio de las observaciones de la fila i. y sj = i=p i=1 y ij; y j = y sj p = i=p i=1 p y sj representa la suma de las observaciones de la columna j. y j representa el valor medio de las observaciones de la columna j.

7 Análisis de la varianza, parte segunda 5 y ss = i=p j=q i=1 j=1 y ij; y = y ss pq = i=p j=q i=1 j=1 y ij pq y ss representa la suma del conjunto de las observaciones. Las estimaciones de los parámetros del modelo serán las siguientes: ˆµ = y; ˆτ i = y i y; ˆβ j = y j y Se omite la demostración de que estos estimadores son, precisamente, los estimadores minimocuadráticos del modelo. Por otra parte, la variabilidad total en las observaciones vendrá dada por: SC T = i=p j=q i=1 j=1 (y ij y) 2 Las variabilidades del factor A y de la variable bloque B serán: SC A = q i=p i=1 (y i y) 2 ; SC B = p j=q j=1 (y j y) 2 j=q La variabilidad residual SC RESIDUAL = i=p i=1 j=1 (y ij P redicción) 2 Puesto que la prediccion del modelo viene dada por: P redicción = ˆµ + ˆτ i + ˆβ j = y + (y i y) + (y j y) = (y i + y j y) y ij P redicción = y ij y i y j + y; SC RESIDUAL = i=p j=q i=1 j=1 (y ij y i y j + y) 2 Si agrupamos convenientemente el segundo miembro de SC T tendremos: SC T = i=p j=q i=1 j=1 (y ij y) 2 = i=p j=q i=1 j=1 [(y i y) + (y j y) + (y ij y i y j + y)] 2

8 6 Análisis de la varianza Elevando al cuadrado las expresiones del corchete resulta: SC T = i=p j=q i=1 j=1 (y i y) 2 + i=p j=q i=1 j=1 (y j y) 2 + i=p j=q i=1 j=1 (y ij y i y j + y) 2 +2 i=p j=q i=1 j=1 (y i y)(y j y) + 2 i=p j=q i=1 j=1 (y i y)(y ij y i y j + y) +2 i=p j=q i=1 j=1 (y j y)(y ij y i y j + y) Se demuestra, como sucedía en el desarrollo de la SC T del ANOVA simple (pag 5 de Análisis de la Varianza, Parte primera), que los dobles productos se anulan quedando tan sólo los términos elevados al cuadrado que son: SC A, SC B y SC RESIDUAL i=p j=q i=p j=q SC T = (y i y) 2 + (y j y) 2 + (y ij y i y j + y) 2 i=p j=p i=1 j=1 i=1 j=1 i=1 j=1 i=p SC T = q (y i y) 2 +p (y j y) 2 + (y ij y i y j + y) 2 i=1 } {{ } SCA j=q j=1 } {{ } SCB i=p i=1 j=q j=1 } {{ } SC RESIDUAL De esta forma, queda comprobada la igualdad SC T = SC A + SC B + SC RESIDUAL

9 Análisis de la varianza, parte segunda 7 También se cumple dicha igualdad en cuanto a los g.d.l: ν T OT AL = ν A +ν B +ν RESIDUAL (pq-1) (p-1) (q-1) (p-1)(q-1) ν T OT AL : Los g.d.l. en la SC T OT AL = N 1 = pq 1 ν A : Los g.d.l. en la SC A = p 1 ν B : Los g.d.l. en la SC B = q 1 ν RESIDUAL : Los g.d.l. en la SC RESIDUAL = (p 1)(q 1) Nótese que la SC RESIDUAL puede expresarse según la ecuación: SC RESIDUAL = SC T OT AL SC A SC B Por tanto, los g.d.l. del residual se calcularán restando de los g.d.l. de la SC T OT AL los g.d.l. de SC A y SC B : (pq 1) (p 1) (q 1) = pq 1 p + 1 q + 1 = pq p q + 1 = p(q 1) (q 1) = (p 1)(q 1) Las medias cuadráticas (MC) se calculan a partir de las sumas de cuadrados (SC) dividiéndolas por sus correspondientes g.d.l. (ν). Como hacíamos en el Análisis de la Varianza para un factor (pag 6 de la Parte Primera), aplicamos el concepto estadístico de Esperanza Matemática (E) para obtener los valores esperados de MC A, MC B y MC RESIDUAL que son variables aleatorias. Tras un desarrollo que omitimos, se obtiene: E(MC A ) = σ 2 + q i=p i=1 τ 2 i p 1 E(MC B ) = σ 2 + p j=q j=1 β2 j q 1 E(MC RESIDUAL ) = σ 2

10 8 Análisis de la varianza Hipótesis nulas (H 0 ) En nuestro modelo: y ij = µ + τ i + β j + ɛ ij la hipótesis nula de interés es la de suponer nulos todos los efectos del factor A: H 0 : τ 1 = τ 2 = = τ p = 0; τ i = 0 Bajo esta hipótesis, E(MC A ) queda reducida a σ 2 por anularse q i=p i=1 τ 2 i p 1. Dado que E(MC RESIDUAL ) = σ 2, ambas medias cuadráticas siguen distribuciones χ 2 (ji cuadrado) y su cociente seguirá una distribución F de Fisher-Snedecor con (p-1) y (p-1)(q-1) g.d.l. Si el ratio F es mayor que el valor crítico correspondiente al nivel de significación α, rechazaremos la hipótesis nula H 0 : τ i = 0. Entonces, alguno de los efectos τ i 0 y E(MC A ) = σ 2 + q i=p i=1 τ i 2 será significativamente p 1 mayor que σ 2. La hipótesis nula H 0 : β j = 0 tiene menor interés. Obsérvese que, si H 0 : β j = 0 se cumple, no hubiera tenido sentido introducir la variable bloque en el modelo. Los valores del ratio F se incluyen en la correspondiente tabla de Análisis de la Varianza que quedará: Fuente de Variación Suma de cuadrados g.d.l. Medias Cuadráticas Ratio F Factor A SC A (p-1) MC A = SC A MC A p 1 Factor B(Bloque) SC B (q-1) MC B = SC B q 1 Residual SC RESIDUAL (p-1)(q-1) MC RESIDUAL = SC RESIDUAL pq 1 MC RESIDUAL Total SC T OT AL pq-1

11 Análisis de la varianza, parte segunda 9 3. EJEMPLO DE DISEÑO EN BLOQUES ALEA- TORIZADOS: EXPANSIÓN DEL CARBÓN DURANTE LA COQUIZACIÓN El estudio * tiene como objeto la comparación del comportamiento de cuatro clases de carbones altos en volátiles respecto de su influencia sobre la expansión que pueden experimentar algunas mezclas de carbones durante el proceso de coquización. Se consideran peligrosas para la seguridad de la instalación aquellas mezclas que tengan expansión. Para predecir la expansión, se realiza un ensayo de laboratorio que simula las condiciones reales del proceso. Se ha optado por realizar la comparación mediante un Diseño Experimental en bloques aleatorizados en el que el factor A es la clase de carbón con cuatro niveles: 1,2,3,4. La variable B (variable de bloque) tiene tres niveles: 1,2,3 que son tres tipos de mezclas en las que se incluyen los cuatro carbones en estudio en distintos porcentajes en cada una de las tres mezclas. En la coquización siempre se usan mezclas de modo que las carencias de un determinado componente sean cubiertas por las propiedades de otros. En cada una de las tres mezclas, los restantes carbones no objeto de estudio, se dosifican en la misma proporción. Discusión de Resultados El modelo ANOVA es: Expansión = µ + τ i + β j + ɛ Siendo µ la media general; τ i los efectos del factor A y β j los efectos de la variable bloque B. El término residual ɛ sigue una distribución Normal (0, σ). El factor A (clase de carbón) tiene 4 niveles. El bloque B (tipo de mezcla) tiene 3 niveles. * NOTA: Los datos resultantes del experimento han sido modificados y adaptados para su utilización en el presente ejemplo.

12 10 Análisis de la varianza Los tratamientos (niveles) del factor A se aplican en cada uno de los 3 niveles de la variable bloque en el orden aleatorio indicado en la pag 16. Se realizan, en consecuencia, tres aleatorizaciones. Estimación de parámetros La estimación de los parámetros (efectos) del modelo, según lo expuesto en la pag 5 y los resultados de la pag 17. ˆµ = y = 18; ˆτ i = y i y; ˆβ j = y j y ˆτ 1 = 22, = 4, 6667 ˆβ 1 = = 12 ˆτ 2 = 20, = 2, 3333 ˆβ 2 = = 13 ˆτ 3 = 11, = 6, 6667 ˆβ3 = = 1 ˆτ 4 = 17, = 0, 3333 σ = 8, = 2, Nótese como los efectos ˆτ i y ˆβ j están sujetos a las restricciones ˆτ i = 0 y ˆβj = 0 Predicción de valores Los valores predichos por el modelo son los recogidos en la pag 19. Por ejemplo, la predicción para el nivel 1 del factor A perteneciente al bloque 1 sera: ŷ 11 = ˆµ + ˆτ 1 + ˆβ 1 ŷ 11 = 18 4, = 34, 6667; el correspondiente residual es: ,6667 = -1,3333

13 Análisis de la varianza, parte segunda 11 Sumas de cuadrados y grados de libertad En la tabla de Análisis de la Varianza de la pag 17 se recogen las sumas de cuadrados, grados de libertad, medias cuadráticas y ratios F. Mediante cálculo podemos también obtener, facilmente, los valores de la tabla: SC A = i=4 i=1 (τ i) 2 = 3[( 4, 6667) 2 + ( 2, 3333) 2 + (6, 6667) 2 + (0, 3333) 2 ] = 215, 333 SC B = j=3 j=1 (β j) 2 = 4[( 12) 2 + (13) 2 + ( 1) 2 ] = 1256, 0 SC T = (y ij y) 2 = (Expansión + 18) 2 = 1522, 0 Si sumamos la columna de residuales de la pag 19 elevados al cuadrado obtendremos. SC RESIDUAL = 50, 6667 Como comprobación vemos que SC T = SC A + SC B + SC RESIDUAL ; 1522, 0 = 215, , , 6667 La tabla de Análisis de la Varianza de la pag 17 nos indica lo siguiente respecto de los grados de libertad (g.d.l.): g.d.l. de la SC A = p 1 = 4 1 = 3. Hay 3 efectos independiantes por existir entre ellos la restricción τ i = 0 ya que -4,6667-2, , ,3333 = 0 g.d.l. de la SC B = q 1 = 3 1 = 2. Hay sólo dos efectos independientes ya que existe la restricción β j = 0 : = 0 g.d.l. en SC T OT AL = pq 1 = 11. De las 12 desviaciones respecto de la media, 11 de ellas son independientes por existir la restricción (yij y) = 0 g.d.l. en SC RESIDUAL = (p 1)(q 1) = (4 1)(3 1) = 6. De los 12 residuales, hay solamente 6 independientes. Se cumple por tanto: g.d.l. de SC T OT AL } {{ } 11 = g.d.l. de SC } {{ A + g.d.l. de SC } } {{ B } g.d.l. de SC RESIDUAL } {{ } 6

14 12 Análisis de la varianza Medias cuadráticas y ratios F Las medias cuadráticas y ratios F de la tabla de Análisis de la Varianza de la pag 17 se calculan según lo siguiente: MC A = SC A g.d.l. = 215, MC B = SC B g.d.l. = 1256, 0 2 = 71, 7778 = 628, 0 MC RESIDUAL = SC RESIDUAL = g.d.l. MC A 71, 7778 F A = = MC RESIDUAL 8, MC B F B = = 628, 0 MC RESIDUAL 8, , = 8, = 8, 50 (g.d.l. numerador=3; g.d.l. denominador=6) = 74, 37 (g.d.l. numerador=2; g.d.l. denominador=6) A la hipótesis nula (H 0 ) de que todos los efectos del factor A son nulos, le corresponde una probabilidad p=0,014 inferior al nivel de significación del 5 %(p=0,05). De ello se deduce que las diferencias entre los niveles del factor (clase de carbón) son significativas respecto de la Expansión. En la tabla inferior de la pag 17 podemos observar como el carbón 3 es significativamente diferente de los restantes. Los contrastes indicados con (*) señalan la presencia de contrastes significativos. Los efectos de la variable bloque también son significativos aunque no estamos directamente interesados en ellos y en sus contrastes. Obsérvese que F=74,37 es muy elevado y su probabilidad p=0,0001 muy baja. Si no hubiéramos considerado la variable bloque, la tabla de Análisis de la Varianza para un solo factor hubiera sido la de la pag 18. La variabilidad de la variable bloque hubiera quedado englobada en el error residual y los efectos del factor A con una F=0,44 y P=0,731 no hubieran aparecido como significativos.

15 Análisis de la varianza, parte segunda 13 Intervalos de confianza y Contrastes. Los intervalos de confianza bilateral para un parámetro θ son: ˆθ ± (error estándar del parámetro).t α 2,ν donde ˆθ es la estima del parámetro, t α 2,ν es el valor de la distribución t de Student para un nivel de significación α y ν g.d.l. del residual. En nuestro caso, para α = 0, 05 y ν = 6; t 0,025, 6 =2,44692 Intervalos para las medias µ i Error estándar = ˆσ 3 = 2, = 1, Intervalo de µ 1 = 22, 6667±1, , = 22, 6667±4, Intervalo de µ 2 = 20, 3333±1, , = 20, 3333±4, Intervalo de µ 3 = 11, 3333±1, , = 11, 3333±4, Intervalo de µ 4 = 17, 6667±1, , = 17, 6667±4, Intervalo de µ 1 : 26, 772 < µ 1 < 18, 5614 Intervalo de µ 2 : 24, 4386 < µ 2 < 16, 228 Intervalo de µ 3 : 15, 4386 < µ 3 < 7, Intervalo de µ 4 : 21, 772 < µ 4 < 13, 5614 Estos valores coinciden con los de la segunda tabla de la pag 17.

16 14 Análisis de la varianza Intervalos de los contrastes (µ i µ j ) (ˆµ i ˆµ j ) ± (Error estándar) t α 2,ν 2 MCRESIDUAL 2 8, error estándar = nº datos en cada nivel = 3 = 2, t α 2,ν = t 0,025, 6 = 2, (ˆµ i ˆµ j ) ± 2, , = (ˆµ i ˆµ j ) ± 5, Contraste µ 1 µ 2 : 2, ± 5, Contraste µ 1 µ 3 : 11, 3333 ± 5, * Contraste µ 1 µ 4 : 5, 0 ± 5, Contraste µ 2 µ 3 : 9, 0 ± 5, * Contraste µ 2 µ 4 : 2, ± 5, Contraste µ 3 µ 4 : 6, ± 5, * Los contrastes cuyos intervalos no contienen el valor cero indican diferencias significativas y se señalan con (*). Todos estos contrastes coinciden con los de la tabla inferior de la pag 17. Gráfico para efectos principales En el gráfico de la pag 18 podemos observar los intervalos de confianza al 95 % de la Expansión de las cuatro clases de carbones. Se hace patente que el carbón 3 tiene un comportamiento diferente de los restantes con una expansión relativamente mayor.

17 Análisis de la varianza, parte segunda 15 Conclusiones La clasificación en cuanto a resultados por orden descendente de calidad en cuanto a Expansión (E) es: Carbón 1 (E=-22,67) Carbón 2 (E=-20,33) Carbón 4 (E=-17,67) Carbón 3 (E=-11,33) Los carbones 1,2 y 4 pueden clasificarse en un grupo homogéneo mientras que el carbón 3 tiene una expansión significativamente más elevada que los restantes.

18 16 Análisis de la varianza

19 Análisis de la varianza, parte segunda 17

20 18 Análisis de la varianza

21 Análisis de la varianza, parte segunda 19

22 20 Análisis de la varianza 4. FUNDAMENTOS DEL DISEÑO FACTORIAL El caso más sencillo de Diseño Factorial es el que corresponde a dos factores A y B que tienen, respectivamente, p y q niveles fijos cada uno. En el Diseño Factorial, los tratamientos los constituyen todas las combinaciones posibles de los p niveles del factor A con los q niveles del factor B, en total p.q tratamientos. Si para estimar el error experimental repetimos cada tratamiento r veces, tendremos un total de N=p.q.r experimentos elementales a realizar de forma completamente aleatorizada, tanto en el orden de aplicar los tratamientos como en la asignación de cada uno de ellos a las unidades experimentales. La particularidad más notable del Diseño Factorial es la presencia del término de interacción. El modelo de Análisis de la Varianza asociado a un Diseño Factorial con dos factores es: y ijk = µ + τ i + β j + (τβ) ij + ɛ ijk y ijk : Son los valores obtenidos para la variable de respuesta. El subíndice i indica los diferentes niveles del factor A:1,2,...p. El subíndice j señala los niveles del factor B:1,2,...q. Finalmente, el subíndice k se refiere al orden de la repetición: 1,2,...r de cada tratamiento (combinaciones i,j) µ : Valor medio de la variable de respuesta. τ i : Es el efecto del nivel i del factor A. Si el nivel i tiene un valor medio µ i, se define el efecto τ i como la diferencia µ i µ. β j Es el efecto del nivel j del factor B. Si el nivel j tiene un valor medio µ j, el efecto β j será la diferencia µ j µ. τβ ij : Es el efecto correspondiente a la interacción de los niveles i del factor A con los niveles j del factor B. La existencia de interacción supone una falta de aditividad para explicar el efecto combinado de las variables A y B a partir de los efectos individuales de cada una de ellas. ɛ ijk : Término residual que se supone conforme con una distribución Normal de media cero y desviación típica σ que representaremos por N(0, σ).

23 Análisis de la varianza, parte segunda 21 Si comparamos este modelo ANOVA con el modelo ANOVA simple desarrollado en la parte primera (artículo de Feb. 2012) destaca la presencia del término de interacción: (τβ) ij que se añade a los efectos principales τ i, β j originados, respectivamente, por los factores A y B. Como en el caso, del modelo ANOVA simple, veremos que se cumple también la igualdad básica del Análisis de la Varianza. Mediante ella, la variabilidad total (SC T ) se descompone en los siguiente términos: SC T = SC A + SC B + SC AB + SC RESIDUAL SC T : Suma de los cuadrados de las desviaciones de los valores de la variable de respuesta respecto de la media general. SC A : Suma de los cuadrados de las desviaciones de los valores medios de los niveles i del factor A respecto de la media general. SC B : Suma de los cuadrados de las desviaciones de los valores medios de los niveles j del factor B respecto de la media general. SC AB : Suma de los cuadrados de los efectos de interacción. SC RESIDUAL : Suma de los cuadrados de las desviaciones residuales. Favorece la exposición disponer las N=pqr observaciones en p filas y q columnas correspondientes, respectivamente, al número de niveles del factor A y al número de niveles del factor B. En cada celda (i,j) se recogen los valores de las r replicaciones: Factor B ( q niveles) Factor A ( p niveles) 1 2 q 1 y 111 y 11r y 121 y 12r y 1q1 y 1qr 2 y 211 y 21r y 221 y 22r y 2q1 y 2qr p y p11 y p1r y p21 y p2r y pq1 y pqr

24 22 Análisis de la varianza Si sumamos los valores de una celda genérica (i,j), los valores de una fila, los de una columna o los de la totalidad de las celdas tendremos las siguientes expresiones: k=r y ijs = y ijk ; y ijk = k=1 k=r k=1 y ijk r y ijs : Representa la suma de las observaciones de la celda (i,j). El subíndice s indica suma. y ij : Indica el valor medio en dicha celda (i,j). j=q k=r y iss = y ijk ; y i = j=1 k=1 j=q k=r j=1 k=1 y ijk qr y iss : Representa la suma de todas las observaciones de la fila i. y i : Señala el valor medio de las observaciones de la fila i. i=p k=r y sjs = y ijk ; y j = i=1 k=1 i=p k=r i=1 k=1 y ijk pr y sjs : Representa la suma de totas las observaciones de la columna j. y j : Indica el valor medio de las observaciones de la columna j. y sss = i=p j=q k=r i=1 j=1 k=1 y ijk; y = i=p j=q k=r i=1 j=1 k=1 y ijk pqr Donde y sss es la suma de las observaciones de todas las celdas mientras que y es la media del conjunto de todas las observaciones.

25 Análisis de la varianza, parte segunda 23 En definitiva, las estimas de los parámetros del modelo serán las siguientes: ˆµ = y ˆτ i = y i y ˆβ j = y j y ( ˆ τβ) ij = y ij ˆµ ˆτ i ˆβ j = y ij y (y i y) (y j y) ( ˆ τβ) ij = y ij y i y j + y Por otra parte, los efectos principales y la interacción están sujetos a las siguientes restricciones: τi = 0; β j = 0; (τβ) ij = 0 La variabilidad total en las observaciones vendrá dada por: SC T = i=p j=q k=ν i=1 j=1 k=1 (y ijk y) 2 Agrupando convenientemente el segundo miembro de la ecuación y teniendo en cuenta que (y ij y i y j + y) es la estimación del efecto de la interacción tendremos: SC T = i=p i=p i=1 j=q j=1 j=q i=1 j=1 k=r k=1 (y ijk y) 2 = k=r k=1 [(y i y) + (y j y) + (y ij y i y j + y) + (y ijk y ij )] 2 SC T = i=p i=p i=1 + i=p i=1 j=q i=1 j=1 j=q k=r j=1 j=q j=1 k=r k=1 (y i y) 2 + i=p j=q k=r i=1 j=1 k=1 (y j y) 2 + k=1 (y ij y i y j + y) 2 k=r k=1 (y ijk y ij ) 2 Hacemos notar que, como sucedía en el desarrollo de la SC T del ANOVA simple (pag 5 de Análisis de la Varianza, Parte Primera), se anulan los dobles productos resultantes del desarrollo del cuadrado del corchete quedando tan sólo los términos elevados al cuadrado que son: SC A, SC B, SC AB y SC RESIDUAL.

26 24 Análisis de la varianza i=p j=q k=r i=1 j=1 k=1 (y i y) 2 = qr i=p i=1 (y i y) 2 que representa la suma de los cuadrados de las desviaciones de los p niveles del factor A respecto de la media general: SC A j=q k=r De la misma forma, i=p i=1 j=1 k=1 (y j y) 2 = pr j=q j=1 (y j y) 2 representará la suma de los cuadrados de las desviaciones de los q niveles del factor B: SC B En cuanto a i=p j=q k=r i=1 j=1 k=1 (y ij y i y j + y) 2 = r i=p j=q i=1 j=1 (y ij y i y j + y) 2 representa la suma de los cuadrados de los efectos de interacción: SC AB j=q i=1 j=1 k=r k=1 (y ijk y ij ) 2 es la suma de cua- Finalmente, el término i=p drados residual: SC RESIDUAL con lo que queda comprobado que se cumple la igualdad: SC T = SC A + SC B + SC AB + SC RESIDUAL También se cumple la igualdad en cuanto a los grados de libertad (g.d.l.): g.d.l. en A: (p-1) g.d.l. en B: (q-1) g.d.l. en AB: (p-1)(q-1) g.d.l. en Residuales: pq (r-1) La Suma de todos ellos es (pqr-1) que coincide con los g.d.l. de SC T : ν T OT AL = ν A +ν B +ν AB +ν RESIDUAL (pqr-1) (p-1) (q-1) (p-1)(q-1) pq(r-1) Las medias cuadráticas (MC) de las distintas fuentes de variación se calculan a partir de las sumas de cuadrados (SC) correspondientes dividiéndolas por sus respectivos grados de libertad (ν) : MC = SC. Según el procedimiento habitual, ya utilizado para el Anova Simple y para el Diseño en ν bloques aleatorizados, todas estas expresiones se recogen en una tabla de Análisis de las Varianza.

27 Análisis de la varianza, parte segunda 25 Medias Fuente de Variación Suma de cuadrados (g.d.l.) Cuadráticas Factor A Factor B Interacción AB Residual SC A = qr i=p i=1 (y i y) 2 (p-1) MC A = SC A p 1 SC B = pr j=p j=1 (y j y) 2 (q-1) MC B = SC B SC AB = r i=p j=q i=1 SC RESIDUAL = i=p i=1 q 1 SC AB (p 1)(q 1) j=1 (y ij y i y j + y) 2 (p-1)(q-1) MC AB = j=q k=r j=1 k=1 (y ijk y ij ) 2 pq(r-1) MC RESIDUAL = SC RESIDUAL pq(r 1) Total SC T OT AL = i=p i=1 j=q k=r j=1 k=1 (y ijk y) 2 pqr-1 Las medias cuadráticas MC A, MC B, MC AB y MC RESIDUAL son variables aleatorias. Si aplicamos a todas ellas el concepto estadístico de Esperanza Matemática (E) obtendremos los valores esperados de dichas variables que serán: E(MC A ) = E[ qr i=p i=1 (y i y) 2 ] p 1 E(MC B ) = E[ pr j=q j=1 (y j y) 2 ] q 1 E(MC AB ) = E[ r (y ij y i y j + y) 2 ] (p 1)(q 1) E(MC RESIDUAL ) = E[ i=p i=1 j=q j=1 k=r k=1 (y ijk y ij ) 2 ] pq(r 1) Sustituyendo y ijk por la ecuación del modelo y ijk = µ+τ i +β j +(τβ) ij +ɛ ijk y teniendo en cuenta que E(ɛ 2 ijk ) = σ2 y que E(ɛ ijk ) = 0 resultan, tras un cálculo que omitimos, las siguientes expresiones: E(MC A ) = σ 2 + qr i=p i=1 τ 2 i p 1 E(MC B ) = σ 2 + pr j=q j=1 β2 j q 1

28 26 Análisis de la varianza E(MC AB ) = σ 2 + r (τβ) 2 ij (p 1)(q 1) EMC RESIDUAL = σ 2 Hipótesis nulas (H 0 ) Para nuestro modelo y ijk = µ + τ i + β j + (τβ) ij + ɛ ijk, enunciaremos las siguientes hipotesis nulas (H 0 ): a) Todos los efectos del factor A son nulos: H 0 : τ 1 = τ 2 = τ p = 0; τ i = 0 Bajo esta hipótesis, E(MC A ) queda reducida a σ 2 por anularse qr i=p i=1 τ i 2 p 1 Dado que E(MC RESIDUAL ) = σ 2, ambas medias cuadráticas siguen distribuciones χ 2 (ji-cuadrado) y su cociente se ajustará a una distribución F de Fisher-Snedecor. El cociente de MC A y MC RESIDUAL seguirá, como en el Anova simple, una distribución F de Fisher-Snedecor con (p-1) y pq(r-1) g.d.l. En el caso de que el ratio F sea mayor que el valor crítico correspondiente al nivel de significación de la prueba (α), rechazaremos la hipótesis nula H 0 : τ i = 0. Entonces, alguno de los efectos τ i 0 y la E(MC A ) = σ 2 + qr i=p i=1 τ i 2 sería significativamente mayor que σ 2 p 1 b) Todos los efectos del factor B son nulos: H 0 : β 1 = β 2 = β q = 0; β j = 0 De la misma forma que para A, rechazaremos esta hipótesis cuando el ratio F sea mayor que el valor crítico correspondiente al nivel de significación. α, con (q-1) y pq(r-1) g.d.l..

29 Análisis de la varianza, parte segunda 27 c) Todos los efectos de la interacción AB son nulos: H 0 : (τβ) ij = 0 para cualquier combinación i,j Rechazaremos la hipótesis cuando el ratio F sea mayor que el valor crítico correspondiente al nivel de significación α con (p-1)(q-1) y pq(r-1) g.d.l. Los valores de los ratios F se incluyen, también, en la tabla de Análisis de la Varianza que quedará finalmente: Fuente de Variación Suma de Cuadrados (g.d.l.) Medias cuadráticas Ratios F Factor A SC A p-1 MC A = SCA p 1 Factor B SC B q-1 MC B = SCB q 1 SC AB Interacción AB SC AB (p-1)(q-1) MC AB = (p 1)(q 1) Residual SC RESIDUAL pq(r-1) MC RESIDUAL = SCRESIDUAL pq(r 1) F = F = F = MC A MC RESIDUAL MC B MC RESIDUAL MC AB MC RESIDUAL Total SC T OT AL pqr-1 5. EJEMPLO DE DISEÑO FACTORIAL: ESTUDIO COMPARATIVO DE ENVASES DE CONSERVAS En el ejemplo, * aplicaremos los fundamentos teóricos expuestos a un caso industrial destacando algunos aspectos prácticos de interés. Se quiere comparar el comportamiento de diversos tipos de envases destinados a conservar un determinado producto. El material base está recubierto de dos clases diferentes de recubrimiento metálico. Adicionalmente, se aplica una capa de barniz y se desea estudiar el comportamiento de 6 barnices diferentes. Se decide planificar un Diseño Factorial con dos factores A y B. El factor A tiene dos niveles: p=2 que son las dos clases de recubrimiento metálico * NOTA: Los datos resultantes del experimento han sido modificados y adaptados para su utilización en el presente ejemplo.

30 28 Análisis de la varianza y el factor B tiene q=6 niveles que son los seis tipos de barniz. El citado diseño factorial 2x6 se replica (r=2) en un total de 24 envases, pqr=2x6x2 = 24. Los envases se depositaron durante un año y se procedió a su apertura para analizar el contenido en Fe (metal base) que ha pasado a la conserva. El experimento tiene como objetivo selecionar el recubrimiento y el barniz más convenientes y de cuantificar las diferencias de resultados en sus distintas combinaciones. La variable de respuesta: Fe viene expresada en partes por millón (ppm) y, logicamente, se trata de minimizar su contenido en la conserva. El orden de realización de las aperturas de los envases y la ejecución de los análisis se ha efectuado de forma completamente aleatoria según lo indicado en la pag 37. Los cálculos han sido efectuados con el programa estadístico STATGRAPHICS. La discusión de resultados, conclusiones y cálculos se recogen en las páginas 29 a 42 y la base de datos en las páginas 37,41 y 42. Discusión de Resultados El modelo ANOVA al que se ajustan los resultados es: F e = µ + τ i + β j + (τβ) ij + ɛ Los parámetros del modelo son: µ que es la media general, τ i son los efectos del factor A, β j son los efectos del factor B, (τβ) ij son los efectos de la interacción y ɛ es el término residual que sigue una distribución Normal (0, σ). El factor A (metal de recubrimiento) tiene dos niveles: 1 y 2 El factor B (tipo de barniz) tiene seís niveles: 1,2, Los 24 experimentos elementales se han realizado en el orden aleatorio indicado en la pag 37.

31 Análisis de la varianza, parte segunda 29 Estimación de parámetros Las estimaciones de los parámetros del modelo, según las estimas de la pag 23, son los siguientes: ˆµ = y = 3, ˆτ i = y i y ˆβj = y j y (τβ) ˆ ij = y ij y i y j + y ˆτ 1 = 1, 275 ˆβ1 = 3, (τβ) ˆ 11 = 2, 125 ˆτ 2 = 1, 275 ˆβ2 = 1, (τβ) ˆ 12 = 1, 2 ˆβ 3 = 0, (τβ) ˆ 13 = 0, 9 ˆβ 4 = 1, (τβ) ˆ 14 = 0, 85 ˆβ 5 = 1, (τβ) ˆ 15 = 0, 975 ˆβ 6 = 1, (τβ) ˆ 16 = 0, 6 (τβ) ˆ 21 = 2, 125 (τβ) ˆ 22 = 1, 2 (τβ) ˆ 23 = 0, 9 (τβ) ˆ 24 = 0, 85 (τβ) ˆ 25 = 0, 975 (τβ) ˆ 26 = 0, 6 ˆσ = MC RESIDUAL = 1, = 1, 0859 La estima ˆσ nos permite calcular intervalos de confianza para los diferentes parámetros y para sus contrastes. Obsérvese como los efectos ˆτ i, ˆβj ; ˆτi = 0; ˆβj = 0; (τβ) ˆ ij = 0. ˆ (τβ) ij ; están sujetos a restricciones: Predicción de valores Los valores predichos por el modelo son equivalentes a los valores medios en cada celda(i,j) que según la pag 38 son: y 11 = 10, 65 y 21 = 3, 85 y 12 = 7, 85 y 22 = 2, 9 y 13 = 3, 35 y 23 = 2, 6 y 14 = 2, 95 y 24 = 2, 1 y 15 = 3, 1 y 25 = 2, 5 y 16 = 3, 25 y 26 = 1, 9

32 30 Análisis de la varianza Por ejemplo, la predicción y 14 = 2, 95, media de las observaciones 3,0 y 2,9, es equivalente al valor predicho por el modelo: y 14 = ˆµ + ˆτ 1 + ˆβ 4 + ˆ (τβ) 14 y 14 = 3, , 275 1, , 85 = 2, 95 Sumas de cuadrados y grados de libertad En la tabla de Análisis de la Varianza (pag 38) se recogen las Sumas de cuadrados, grados de libertad, medias cuadráticas y ratios F. Estos valores coinciden con los que se pueden obtener por cálculo: SC A = (ˆτ i ) 2 = 24 (1, 275) 2 = 39, 015 SC B = ˆβ2 j = 4 [3, , ( 0, 94167) 2 +( 1, 39167) 2 + ( 1, 11667) 2 + ( 1, 34167) 2 ] SC B = 4 19, = 76, 4333 SC AB = (τβ) ˆ ij = 4 [2, , ( 0, 9) 2 + ( 0, 85) 2 + ( 0, 975) 2 + ( 0, 6) 2 ] SC AB = 4 8, = 35, 195 SC T OT AL = (y ijk y) 2 = (F e 3, 91667) 2 = 164, 793 Finalmente, si sumamos la columna de residuales de la pag 41 elevada al cuadrado obtenemos: SC RESIDUAL = 14, 15 Como comprobación, tenemos: SC T OT AL = SC A + SC B + SC AB + SC RESIDUAL 164,793 = 39,015+76, ,195+14,15 En cuanto a los grados de libertad (g.d.l.), la tabla de Análisis de la Varianza de la pag 25 nos indica lo siguiente: g.d.l. de la SC A : p 1 = 2 1 = 1 Solamente hay un efecto independiente ya que existe la restricción τi = 0; 1, 275 1, 275 = 0

33 Análisis de la varianza, parte segunda 31 g.d.l. de la SC B : q 1 = 6 1 = 5. Hay cinco efectos independientes ya que β j = 0; 3, , , , , , = 0 g.d.l. de la interación AB:(p-1)(q-1)=(6-1)(2-1)=5 De los doce efectos de interacción, tan sólo cinco son independientes por estar sujetos a 7 restricciones del tipo (τβ) ˆ ij = 0 con lo que los g.d.l. resultan 12-7=5 g.d.l. en SC T OT AL : pqr 1 = = 23. De las 24 desviaciones hay 23 independientes ya que existe la restricción (y ijk y) = 0 g.d.l. de la SC RESIDUAL = pq(r 1) = = 12. Se cumple por tanto: g.d.l. de SC } {{ T OT AL = g.d.l. de SC } A +g.d.l. desc } {{ } B +g.d.l. desc } {{ } AB +g.d.l. del Residual; } {{ } } {{ } Obsérvese que sin replicación no habría habido g.d.l. para calcular el error residual y proseguir el análisis. Medias cuadráticas y ratios F Las medias cuadráticas y los ratios F de la tabla de Análisis de la Varianza (pag 38) coinciden con: MC A = SC A 39, 015 = = 39, 015 g.d.l. 1 MC B = SC B 76, 4333 = = 15, 2867 g.d.l. 5 MC AB = SC AB g.d.l. = 35, = 7, 039 MC RESIDUAL = SC RESIDUAL g.d.l. = 14, = 1, F A = F B = F AB = MC A MC RESIDUAL = 39, 015 = 33, 09 (g.d.l. numerador =1; g.d.l. denominador=12) 1, MC B 15, 2867 = = 12, 96 (g.d.l. numerador = 5; g.d.l. denominador=12) MC RESIDUAL 1, MC AB MC RESIDUAL = 7, 039 = 5, 97 (g.d.l. numerador = 5; g.d.l. denominador=12) 1, 17917

34 32 Análisis de la varianza A los tres ratios F, bajo la hipótesis nula (H 0 ) de que todos los efectos son nulos, les corresponden, respectivamente, unas probabilidades P A : 0, 001; P B = 0, 0002; P AB = 0, 0053 muy inferiores al nivel de significación del 5 %(p=0,05). De ello se deduce que los dos efectos principales y la interacción son significativos. En la pag 39 se presentan las tablas y contrastes entre los diferentes niveles de los factores A y B. Los contrastes marcados con (*) indican diferencias estadísticamente significativas. Intervalos de confianza Desviación típica del modelo: ˆσ = 1, 0859 Error estándar de la media total: Error estándar de las medias µ i = ˆσ 24 = 0, ˆσ 12 = 0, Error estándar de las medias µ j = ˆσ 4 = 0, Error estándar de las predicciones µ ij = ˆσ 2 = 0, Todos estos errores estándar coinciden con los indicados en la tabla de la parte inferior de la pag 38 Los intervalos de confianza bilateral de un parámetro θ con un nivel de confianza (1 α), siendo α el nivel de significación, se determinan según la expresión: ˆθ ± (Error estándar del parámetro) t α 2,ν Donde: ˆθ : Es la estimación del parámetro.

35 Análisis de la varianza, parte segunda 33 t α 2,ν : Es el valor de la distribución t de Student para ν g.d.l. y nivel de significación α. El valor ν corresponde a los g.d.l. del residual del modelo ajustado que en nuestro caso es pq(r 1) = = 12 a) Intervalos para µ i (factor A): ˆµ i ± 0, t 0,025, 12 t 0,025, 12 = 2, Intervalo µ 1 : 5, ± 0, , 17882; 4, < µ 1 < 5, Intervalo µ 2 : 2, ± 0, , 17882; 1, < µ 2 < 3, b) Intervalo para µ j (factor B): ˆµ j ± 0, , = ˆµ j ± 1, Intervalo µ 1 : 7, 250 ± 1, 18298; 6, < µ 1 < 8, Intervalo µ 2 : 5, 375 ± 1, 18298; 4, < µ 2 < 6, Intervalo µ 3 : 2, 975 ± 1, 18298; 1, < µ 3 < 4, Intervalo µ 4 : 2, 525 ± 1, 18298; 1, < µ 4 < 3, Intervalo µ 5 : 2, 800 ± 1, 18298; 1, < µ 5 < 3, Intervalo µ 6 : 2, 575 ± 1, 18298; 1, < µ 6 < 3, c) Intervalo para la predicción µ ij : µ ˆ ij ± 0, , = ˆµ ij ± 1, Intervalo µ 11 = Intervalo µ 12 = Intervalo µ 13 = Intervalo µ 14 = Intervalo µ 15 = Intervalo µ 16 = µ ˆ 11 ± 1, = 10, 65 ± 1, ; 8, < µ 11 < 12, 3223 µ ˆ 12 ± 1, = 7, 85 ± 1, ; 6, < µ 12 < 9, µ ˆ 13 ± 1, = 3, 35 ± 1, ; 1, < µ 13 < 5, µ ˆ 14 ± 1, = 2, 95 ± 1, ; 1, < µ 14 < 4, µ ˆ 15 ± 1, = 3, 10 ± 1, ; 1, < µ 15 < 4, µ ˆ 16 ± 1, = 3, 25 ± 1, ; 1, < µ 16 < 4, De la misma forma se obtienen las restantes 6 predicciones. Todos estos intervalos coinciden con los indicados al final de la pag 38

36 34 Análisis de la varianza d) Intervalos para los contrastes µ i µ j : (ˆµ i ˆµ j ) ± Error estándar. t α 2,ν 2 MCRESIDUAL Error estándar = nº datos en cada nivel 2 1, Factor A: Error estándar= = 0, ; t 12 α 2,ν=2,17882 (ˆµ 1 ˆµ j ) ± 0, , 17882; (ˆµ i ˆµ j ) ± 0, Intervalo µ 1 µ 2 = (5, , 64167) ± 0, = 2, 55 ± 0, , < (µ 1 µ 2 ) < 3, ; Al no contener el intervalo el valor cero, la diferencia entre los dos niveles es significativa. 2 1, Factor B: Error estándar= = 0, ; t 4 α 2,ν=2,17882 (ˆµ i ˆµ j ) ± 0, , 17882; (ˆµ i ˆµ j ) ± 1, Intervalo µ 1 µ 2 = (7, 25 5, 375) ± 1, = 1, 875 ± 1, Intervalo µ 1 µ 3 = (7, 25 2, 975) ± 1, = 4, 275 ± 1, Intervalo µ 1 µ 4 = (7, 25 2, 525) ± 1, = 4, 725 ± 1, Intervalo µ 1 µ 5 = (7, 25 2, 800) ± 1, = 4, 450 ± 1, Intervalo µ 1 µ 6 = (7, 25 2, 575) ± 1, = 4, 675 ± 1, Intervalo µ 5 µ 6 = (2, 80 2, 575) ± 1, = 0, 225 ± 1, Los intervalos que no contienen el valor cero indican diferencias significativas entre niveles. De las misma forma, se pueden calcular los restantes contrastes según figuran al final de la pag 39. Las diferencias marcadas con (*) indican valores significativos.

37 Análisis de la varianza, parte segunda 35 Intervalos para contrastes de predicciones (µ ij µ kl ) (ˆµ ij ˆµ kl ) ± Error estándar t α 2,ν ; 2MCRESIDUAL 2 1, Error estándar = nº datos en cada casilla = 2 = 1, 0859 t α 2,ν = t 0,025, 12 = 2, Contraste µ 11 µ 12 : (10, 65 7, 85) ± 2, = 2, 30 ± 2, Contraste µ 11 µ 13 : (10, 65 3, 35) ± 2, = 7, 30 ± 2, * Contraste µ 11 µ 14 : (10, 65 2, 95) ± 2, = 7, 70 ± 2, * Contraste µ 11 µ 15 : (10, 65 3, 10) ± 2, = 7, 55 ± 2, * Contraste µ 11 µ 16 : (10, 65 3, 25) ± 2, = 7, 40 ± 2, * Contraste µ 11 µ 21 : (10, 65 3, 85) ± 2, = 6, 80 ± 2, * Contraste µ 11 µ 22 : (10, 65 2, 90) ± 2, = 7, 75 ± 2, * Contraste µ 11 µ 23 : (10, 65 2, 60) ± 2, = 8, 05 ± 2, * Contraste µ 11 µ 24 : (10, 65 2, 10) ± 2, = 8, 55 ± 2, * Contraste µ 11 µ 25 : (10, 65 2, 50) ± 2, = 8, 15 ± 2, * Contraste µ 11 µ 26 : (10, 65 1, 90) ± 2, = 8, 75 ± 2, * Contraste µ 25 µ 26 : (2, 50 1, 90) ± 2, = 0, 40 ± 2, Serán significativas aquellas diferencias para las que el cero no esté dentro del intervalo. Las diferencias significativas se señalan con asterisco (*).

38 36 Análisis de la varianza Gráficos para efectos principales e interacciones En la pag 40 se recogen gráficos en los que se pueden apreciar las magnitudes relativas de los niveles de los factores y las de la interacción. Se pone de manifiesto la diferencia significativa entre los niveles 1 y 2 del factor A así como la de los niveles 1 y 2 respecto de los restantes niveles del factor B. En cuanto a la interacción, destaca la elevada respuesta de las combinaciones A=1, B=1 y A=1, B=2. Conclusiones De las dos alternativas de recubrimiento metálico (factor A), es significativamente mejor el resultado del tipo 2 con un contenido en Fe de 2,64ppm frente a 5,19ppm del tipo 1. De las seís clases de barnices (factor B) los resultados obtenidos por los tipos 1 y 2, con unos contenidos en Fe de, respectivamente, 7,25 y 5,37 p.p.m son significativamente peores que los restantes tipos de barniz cuyos resultados son, a su vez, equiparables entre si. Son fuertemente desfavorables las combinaciones del nivel 1 del factor A con el nivel 1 del factor B al resultar un contenido en Fe de 10,65 ppm así como las del nivel 1 del factor A con el nivel 2 del factor B y un contenido en Fe de 7,85 ppm.

39 Análisis de la varianza, parte segunda 37

40 38 Análisis de la varianza

41 Análisis de la varianza, parte segunda 39

42 40 Análisis de la varianza

43 Análisis de la varianza, parte segunda 41

44 42 Análisis de la varianza

45 Análisis de la varianza, parte segunda EXTENSIÓN A TRES O MÁS FACTORES La construcción de un modelo de Análisis de la Varianza asociado a un diseño con tres o más factores se realiza de forma análoga al modelo con dos factores. Sin embargo, el número de efectos principales e interacciones a estimar aumentará, rapidamente, con el número de factores considerados. Por ejemplo, en un modelo de Análisis de la Varianza para cuatro factores con tres niveles cada uno, existirán seís términos (C 2 4 = 6) de interacción doble, cuatro términos (C 3 4 = 4) de interacción triple y un término de interacción de cuarto orden (C 4 4 = 1). El número de g.d.l. necesarios para calcular las sumas de cuadrados y las medias cuadráticas sería 80: g.d.l. para los factores principales: 4(3-1) = 8 g.d.l. para las interacciones de segundo orden: 6(3-1)(3-1) = 24 g.d.l. para las interacciones de tercer orden: 4(3-1)(3-1)(3-1) = 32 g.d.l. para las interacciones de cuarto orden: (3-1)(3-1)(3-1)(3-1) = 16 Total 80 g.d.l. Los g.d.l. disponibles, si el diseño no se replica, será también de 80 dado que las combinaciones posibles de los tres niveles de los cuatro factores resultan N = = 81 y los correspondientes g.d.l: N-1=80 g.d.l. En consecuencia, al igual que sucedía para el caso de dos factores, es preciso replicar al menos una vez el diseño con lo que tendremos (con una réplica) un total de N = 2 81 = 162 observaciones y N 1 = 161 g.d.l. De los 161 g.d.l. disponibles, 80 se utilizarán en el cálculo de las sumas de cuadrados y medias cuadráticas y los 81 restantes en la estimación del error experimental σ que nos permitirá calcular los ratios F y efectuar los oportunos contrastes de hipótesis. Ciertamente, parece excesivo destinar 81 g.d.l. para calcular el error experimental. Se hace patente que un diseño factorial completo con varios factores con 4/5 niveles cada uno puede alcanzar una dimensión muy considerable. No obstante, dado que en muchas ocasiones no suelen ser de interés algunas de las interaciones de orden superior al segundo, los g.d.l. correspondientes pueden utilizarse para estimar el error experimimental y obviar la replicación.

46 44 Análisis de la varianza Supongamos, por ejemplo, un diseño factorial completo sin replicación de tres factores a tres niveles cada uno. Los datos de la variable dependiente (var1) correspondientes a los 27 tratamientos se recogen en la pag 45 mientras que en la parte superior de la pag 46 se presenta la correspondiente tabla de Análisis de la Varianza. Observamos que los 26 g.d.l. disponibles se han utilizado para calcular las medias cuadráticas y no se puede estimar el error residual. Suponiendo que la interacción de tercer orden es despreciable optamos por eliminarla del modelo. La nueva tabla de Análisis de la Varianza recogida en la parte inferior de la pag 46 nos muestra que los 8 g.d.l. de la interacción ABC se han utilizado para estimar el error residual, ˆσ = 0, = 0, 802, calcular los ratios F y establecer que los factores principales A y B tienen efectos de influencia significativa (p<0,05).

47 Análisis de la varianza, parte segunda 45

48 46 Análisis de la varianza

49 Análisis de la varianza, parte segunda DISEÑO FACTORIAL A DOS NIVELES Los diseños factoriales a dos niveles se utilizan con frecuencia como diseños de cribado en un estudio previo sobre un número elevado de factores de potencial influencia sobre la variable de respuesta. Para un número k de factores tendremos 2 k tratamientos diferentes. Una vez observada la presencia de factores con influencia significativa, podemos estudiarla de una forma más exhaustiva aumentando, en un nuevo diseño, el número de niveles de dichos factores. En un diseño factorial completo preparado para un número elevado de factores, crece rapidamente el número de experimentos elementales necesarios. Por ejemplo, para diez factores a dos niveles tendríamos 2 10 = 1024 tratamientos diferentes. Por otra parte, suele suceder que sólo alguno de los factores e interacciones resultan significativos mientras que los efectos de otros se confunden con el ruido de fondo producido por el error experimental. De ahí surge el fundamento de los diseños fraccionales en los que, desde el principio, se diseña solamente una fracción del diseño factorial completo: 1 2, 1 4, 1 8 etc, con lo que dedicaremos, preferentemente, los g.d.l. disponibles a la estimación de efectos de factores principales e interacciones de orden inferior mientras que otros efectos quedarán englobados en el término residual. Los diseños factoriales a dos niveles, tanto completos como fraccionales, serán estudiados con detalle en un próximo artículo. 8. EL MODELO ANOVA Y EL ANÁLISIS DE RE- GRESIÓN En un próximo capítulo veremos que los modelos ANOVA, ANCOVA, MA- NOVA y el modelo de Regresión Múltiple pueden englobarse en los llamados Modelos Generales de Regresión Lineal que estudian una o más variables dependientes de tipo continuo en función de varias variables independientes continuas y/o categóricas. En estos modelos, las variables dependientes se expresan en una ecuación cuyo segundo miembro contiene las sumas ponderadas de las variables independientes y el error residual. Como introducción, vamos a desarrollar un método que permite el estudio del modelo ANOVA mediante el modelo de Regresión lineal Múltiple. El lector interesado puede encontrar en nuestra web el artículo de fecha sobre Regresión

50 48 Análisis de la varianza lineal Múltiple. Ilustraremos el método aplicándolo al ejemplo del Estudio Comparativo de Envases de Conserva estudiado en el punto nº4 mediante un modelo ANOVA para dos factores y su interacción. El método consiste en la sustitución de cada variable categórica por tantas variables indicadoras (también llamadas variables mudas ) como g.d.l, equivalentes al número de niveles menos uno, tenga el factor. En nuestro caso, los factores A y B con 2 y 6 niveles, serán sustituidos respectivamente, por 2-1=1 y 6-1=5 variables mudas según lo siguiente: Variable muda Variables mudas Factor A x 1 Factor B x 2 x 3 x 4 x 5 x 6 nivel 1 1 nivel nivel 2-1 nivel nivel nivel nivel nivel Entre otras posibles alternativas, hemos escogido la de asignar a las variables mudas los valores 1-1 y 0 según lo indicado en los cuadros. En definitiva, el factor A (a dos niveles) es sustituido por una variable muda (x 1 ) mientras que el factor B lo es por cinco variables mudas : x 2, x 3, x 4, x 5 y x 6. El término de interacción queda sustituido por otras cinco variables mudas : x 7, x 8, x 9, x 10 y x 11 resultantes de multiplicar los valores de x 1 por los de x 2, x 3, x 4, x 5 y x 6. Obsérvese como el número de variables mudas coincide con los g.d.l. del modelo ANOVA recogidos en la tabla de Análisis de la Varianza de la pag 38. En la pag 51 se recoje la base de datos con los niveles de los factores A y B junto con los valores de las 11 variables mudas correspondientes. En la pag 50 se presenta el modelo de regresión resultante. Nótese que la media cuadrática residual: σ 2 = 1, (pag 50) es idéntica a la del modelo ANOVA (pag 38) así como las correspondientes predicciones y residuos (pags 41 y 51). Además, las estimas del valor medio y de los efectos del modelo ANOVA calculados en la pag 29 coinciden con los coeficientes de la ecuación de regresión múltiple de la pag 50.

51 Análisis de la varianza, parte segunda 49

52 50 Análisis de la varianza

53 Análisis de la varianza, parte segunda 51

ANÁLISIS DE DATOS NO NUMERICOS

ANÁLISIS DE DATOS NO NUMERICOS ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas

Más detalles

TEMA 4: Variables binarias

TEMA 4: Variables binarias TEMA 4: Variables binarias Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 4: Variables binarias Curso 2011-12 1 / 51 Variables

Más detalles

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases. BASES Y DIMENSIÓN Definición: Base. Se llama base de un espacio (o subespacio) vectorial a un sistema generador de dicho espacio o subespacio, que sea a la vez linealmente independiente. β Propiedades

Más detalles

Matrices equivalentes. El método de Gauss

Matrices equivalentes. El método de Gauss Matrices equivalentes. El método de Gauss Dada una matriz A cualquiera decimos que B es equivalente a A si podemos transformar A en B mediante una combinación de las siguientes operaciones: Multiplicar

Más detalles

Covarianza y coeficiente de correlación

Covarianza y coeficiente de correlación Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también

Más detalles

EXPERIMENTACIÓN. Eduardo Jiménez Marqués

EXPERIMENTACIÓN. Eduardo Jiménez Marqués EXPERIMENTACIÓN Eduardo Jiménez Marqués 1 CONTENIDO: 1. Experimentación...3 1.1 Concepto...3 1. Definición...4 1.3 Dificultad...4 1.4 Ventaja...5 1.5 Planificación...5 1.6 Aplicaciones...5 1.7 Metodología...6

Más detalles

Una serie temporal o cronológica es en una sucesión de valores que adopta una variable (Y):

Una serie temporal o cronológica es en una sucesión de valores que adopta una variable (Y): INTRODUCCIÓN Nos vamos a ocupar ahora de estudiar un fenómeno desde la perspectiva temporal, observando su evolución a través del tiempo, lo que se denomina investigación diacrónica o longitudinal, en

Más detalles

Aula Banca Privada. La importancia de la diversificación

Aula Banca Privada. La importancia de la diversificación Aula Banca Privada La importancia de la diversificación La importancia de la diversificación La diversificación de carteras es el principio básico de la operativa en mercados financieros, según el cual

Más detalles

SPSS: ANOVA de un Factor

SPSS: ANOVA de un Factor SPSS: ANOVA de un Factor El análisis de varianza (ANOVA) de un factor nos sirve para comparar varios grupos en una variable cuantitativa. Esta prueba es una generalización del contraste de igualdad de

Más detalles

Tema 2. Espacios Vectoriales. 2.1. Introducción

Tema 2. Espacios Vectoriales. 2.1. Introducción Tema 2 Espacios Vectoriales 2.1. Introducción Estamos habituados en diferentes cursos a trabajar con el concepto de vector. Concretamente sabemos que un vector es un segmento orientado caracterizado por

Más detalles

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 2011 UNED DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 7] Diseños con más de dos grupos independientes. Análisis de varianza con dos factores completamente aleatorizados 1 Índice 7.1 Introducción...

Más detalles

DETERMINACIÓN DEL VOLUMEN DE PEDIDO.

DETERMINACIÓN DEL VOLUMEN DE PEDIDO. Lote económico de compra o Lote Optimo DETERMINACIÓN DEL VOLUMEN DE PEDIDO. Concepto que vemos en casi todos libros de aprovisionamiento, habitualmente la decisión de la cantidad a reaprovisionar en las

Más detalles

EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones

EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones Ricard Boqué, Alicia Maroto Grupo de Quimiometría y Cualimetría. Universitat Rovira i Virgili. Pl. Imperial Tàrraco, 1. 43005Tarragona

Más detalles

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD.

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD. Experimentos con un solo factor: El análisis de varianza Jhon Jairo Padilla Aguilar, PhD. Experimentación en sistemas aleatorios: Factores Controlables Entradas proceso Salidas Factores No controlables

Más detalles

UNIDAD 1 LAS LEYES FINANCIERAS DE CAPITALIZACIÓN DESCUENTO

UNIDAD 1 LAS LEYES FINANCIERAS DE CAPITALIZACIÓN DESCUENTO - 1 - UNIDAD 1 LAS LEYES FINANCIERAS DE CAPITALIZACIÓN Y DESCUENTO Tema 1: Operaciones financieras: elementos Tema 2: Capitalización y descuento simple Tema 3: Capitalización y descuento compuesto Tema

Más detalles

Análisis de medidas conjuntas (conjoint analysis)

Análisis de medidas conjuntas (conjoint analysis) Análisis de medidas conuntas (conoint analysis). Introducción Como ya hemos dicho anteriormente, esta técnica de análisis nos sirve para analizar la importancia que dan los consumidores a cada uno de los

Más detalles

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO Análisis estadístico 31 3. ANÁLII ETADÍTICO DE LA PRECIPITACIONE EN EL MAR CAPIO 3.1. ANÁLII Y MÉTODO ETADÍTICO UTILIZADO 3.1.1. Introducción Una vez analizado el balance de masas que afecta al mar Caspio

Más detalles

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral Enero 2005 1.- INTRODUCCIÓN En múltiples ocasiones el analista o investigador se enfrenta al problema de determinar

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

6. DISEÑOS FACTORIALES 2 K NO REPLICADOS

6. DISEÑOS FACTORIALES 2 K NO REPLICADOS 6. DISEÑOS FACTORIALES 2 K NO REPLICADOS 6.1 INTRODUCCION El aumentar el numero de factores en un diseño 2 k crece rápidamente el numero de tratamientos y por tanto el numero de corridas experimentales.

Más detalles

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 1 de agosto de 2003 1. Introducción Cualquier modelo de una situación es una simplificación de la situación real. Por lo tanto,

Más detalles

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido Tema 3 Medidas de tendencia central Contenido 31 Introducción 1 32 Media aritmética 2 33 Media ponderada 3 34 Media geométrica 4 35 Mediana 5 351 Cálculo de la mediana para datos agrupados 5 36 Moda 6

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009 Índice general 6. Regresión Múltiple 3 6.1. Descomposición de la variabilidad y contrastes de hipótesis................. 4 6.2. Coeficiente de determinación.................................. 5 6.3. Hipótesis

Más detalles

Tema 12: Contrastes Paramétricos

Tema 12: Contrastes Paramétricos Tema 1 Tema 1: Contrastes Paramétricos Presentación y Objetivos. Se comienza este tema introduciendo la terminología y conceptos característicos de los contrastes de hipótesis, típicamente a través de

Más detalles

Anexo 1: Demostraciones

Anexo 1: Demostraciones 75 Matemáticas I : Álgebra Lineal Anexo 1: Demostraciones Espacios vectoriales Demostración de: Propiedades 89 de la página 41 Propiedades 89- Algunas propiedades que se deducen de las anteriores son:

Más detalles

Tema 3. Espacios vectoriales

Tema 3. Espacios vectoriales Tema 3. Espacios vectoriales Estructura del tema. Definición y propiedades. Ejemplos. Dependencia e independencia lineal. Conceptos de base y dimensión. Coordenadas Subespacios vectoriales. 0.1. Definición

Más detalles

Definición 1.1.1. Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

Definición 1.1.1. Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas. Tema 1 Matrices Estructura del tema. Conceptos básicos y ejemplos Operaciones básicas con matrices Método de Gauss Rango de una matriz Concepto de matriz regular y propiedades Determinante asociado a una

Más detalles

1 Ejemplo de análisis descriptivo de un conjunto de datos

1 Ejemplo de análisis descriptivo de un conjunto de datos 1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos

Más detalles

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

E 1 E 2 E 2 E 3 E 4 E 5 2E 4 Problemas resueltos de Espacios Vectoriales: 1- Para cada uno de los conjuntos de vectores que se dan a continuación estudia si son linealmente independientes, sistema generador o base: a) (2, 1, 1, 1),

Más detalles

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros. QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros. Qué significa esto? Decir que una empresa es eficiente es decir que no

Más detalles

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma: Ignacio Martín Tamayo 25 Tema: ANÁLISIS DE VARIANZA CON SPSS 8.0 ÍNDICE --------------------------------------------------------- 1. Modelos de ANOVA 2. ANOVA unifactorial entregrupos 3. ANOVA multifactorial

Más detalles

MERCADOS FINANCIEROS: LOS FONDOS DE INVERSIÓN II

MERCADOS FINANCIEROS: LOS FONDOS DE INVERSIÓN II MERCADOS FINANCIEROS: LOS FONDOS DE INVERSIÓN II 28 febrero de 2012 Javier Marchamalo Martínez Universidad Rey Juan Carlos SABER INTERPRETAR LOS RATIOS SIGNIFICATIVOS EN LA GESTIÓN POR BENCHMARK Ratio

Más detalles

Ejercicio de estadística para 3º de la ESO

Ejercicio de estadística para 3º de la ESO Ejercicio de estadística para 3º de la ESO Unibelia La estadística es una disciplina técnica que se apoya en las matemáticas y que tiene como objetivo la interpretación de la realidad de una población

Más detalles

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias ECONOMETRIA I. Departamento de Fundamentos del Análisis Económico Universidad de Alicante. Curso 2011/12 GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias Bibliografía apartados : Greene, 8.2 A.F.Gallastegui:

Más detalles

Detergente Lavad.1 Lavad.2 Lavad.3 Media A 45 43 51 46.3 B 47 44 52 47.6 C 50 49 57 52 D 42 37 49 42.6. Media 46 43.2 52.2 47.16

Detergente Lavad.1 Lavad.2 Lavad.3 Media A 45 43 51 46.3 B 47 44 52 47.6 C 50 49 57 52 D 42 37 49 42.6. Media 46 43.2 52.2 47.16 3. DISEÑO EN BLOQUES ALEATORIZADOS En muchos experimentos además de que interesa investigar la influencia de un factor controlado sobre la variable de respuesta, como en la sección anterior, existe una

Más detalles

Ecuaciones de primer grado con dos incógnitas

Ecuaciones de primer grado con dos incógnitas Ecuaciones de primer grado con dos incógnitas Si decimos: "las edades de mis padres suman 120 años", podemos expresar esta frase algebraicamente de la siguiente forma: Entonces, Denominamos x a la edad

Más detalles

Tema 7: Modelos de diseños de experimentos

Tema 7: Modelos de diseños de experimentos Tema 7: Modelos de diseños de experimentos Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 7: Modelos de diseños de experimentos Curso

Más detalles

Contenidos. INFORME ENCUESTA TELEFÓNICA. Curso 2009 10

Contenidos. INFORME ENCUESTA TELEFÓNICA. Curso 2009 10 ENCUESTA DE OPINIÓN DEL ALUMNADO SOBRE LA ACTUACIÓN DOCENTE DEL PROFESORADO UNIVERSIDAD DE SEVILLA Curso 2009-2010 ENCUESTA TELEFÓNICA Contenidos Introducción.... 4 El Cuestionario... 5 El muestreo...

Más detalles

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de CAPITULO 4 JUSTIFICACION DEL ESTUDIO En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de estudios previos y los alcances que justifican el presente estudio. 4.1. Justificación.

Más detalles

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS 6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS Esquema del capítulo Objetivos 6.1. 6.. 6.3. 6.4. ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS COEFICIENTES DE CONTINGENCIA LA

Más detalles

ACCIONES Y OTROS TÍTULOS DE INVERSIÓN

ACCIONES Y OTROS TÍTULOS DE INVERSIÓN ACCIONES Y OTROS TÍTULOS DE INVERSIÓN TASAS EFECTIVAS DE RENDIMIENTO ANUAL Y MENSUAL: Es aquélla que se emplea en la compraventa de algunos valores en el Mercado Bursátil o Bolsa de Valores. Estas tasas

Más detalles

Análisis de los datos

Análisis de los datos Universidad Complutense de Madrid CURSOS DE FORMACIÓN EN INFORMÁTICA Análisis de los datos Hojas de cálculo Tema 6 Análisis de los datos Una de las capacidades más interesantes de Excel es la actualización

Más detalles

Subespacios vectoriales en R n

Subespacios vectoriales en R n Subespacios vectoriales en R n Víctor Domínguez Octubre 2011 1. Introducción Con estas notas resumimos los conceptos fundamentales del tema 3 que, en pocas palabras, se puede resumir en técnicas de manejo

Más detalles

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

Metodología. del ajuste estacional. Tablero de Indicadores Económicos Metodología del ajuste estacional Tablero de Indicadores Económicos Metodología del ajuste estacional Componentes de una serie de tiempo Las series de tiempo están constituidas por varios componentes que,

Más detalles

Diseños en cuadrados latinos

Diseños en cuadrados latinos Capítulo 7 Diseños en cuadrados latinos 7.1. Introducción En el modelo en bloques aleatorizados, que estudiamos en el capítulo anterior, considerábamos un factor principal y un factor de control o variable

Más detalles

1 Espacios y subespacios vectoriales.

1 Espacios y subespacios vectoriales. UNIVERSIDAD POLITÉCNICA DE CARTAGENA Departamento de Matemática Aplicada y Estadística Espacios vectoriales y sistemas de ecuaciones 1 Espacios y subespacios vectoriales Definición 1 Sea V un conjunto

Más detalles

CASO PRÁCTICO DISTRIBUCIÓN DE COSTES

CASO PRÁCTICO DISTRIBUCIÓN DE COSTES CASO PRÁCTICO DISTRIBUCIÓN DE COSTES Nuestra empresa tiene centros de distribución en tres ciudades europeas: Zaragoza, Milán y Burdeos. Hemos solicitado a los responsables de cada uno de los centros que

Más detalles

Divisibilidad y números primos

Divisibilidad y números primos Divisibilidad y números primos Divisibilidad En muchos problemas es necesario saber si el reparto de varios elementos en diferentes grupos se puede hacer equitativamente, es decir, si el número de elementos

Más detalles

1.4.- D E S I G U A L D A D E S

1.4.- D E S I G U A L D A D E S 1.4.- D E S I G U A L D A D E S OBJETIVO: Que el alumno conozca y maneje las reglas empleadas en la resolución de desigualdades y las use para determinar el conjunto solución de una desigualdad dada y

Más detalles

Indicaciones específicas para los análisis estadísticos.

Indicaciones específicas para los análisis estadísticos. Tutorial básico de PSPP: Vídeo 1: Describe la interfaz del programa, explicando en qué consiste la vista de datos y la vista de variables. Vídeo 2: Muestra cómo crear una base de datos, comenzando por

Más detalles

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos.

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos. PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) PRUEBAS NO PARAMÉTRICAS F(X) es la función de distribución que hipotetizamos. Fs(X) es la probabilidad o proporción teórica de

Más detalles

Calculadora de Tamaño muestral GRANMO

Calculadora de Tamaño muestral GRANMO Calculadora de Tamaño muestral GRANMO Versión 7.12 Abril 2012 http://www.imim.es/ofertadeserveis/software-public/granmo/ Entre las distintas ofertas que existen para el cálculo del tamaño muestral, ofrecemos

Más detalles

Análisis y cuantificación del Riesgo

Análisis y cuantificación del Riesgo Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el

Más detalles

EJERCICIOS DE MATEMÁTICAS I HOJA 4. Ejercicio 1. Se consideran los vectores

EJERCICIOS DE MATEMÁTICAS I HOJA 4. Ejercicio 1. Se consideran los vectores EJERCICIOS DE MATEMÁTICAS I HOJA 4 Ejercicio 1. Se consideran los vectores u 1 = (1, 1, 0, 1), u 2 = (0, 2, 1, 0), u 3 = ( 1, 1, 1, 1), u 4 = (2, 2, 1, 0) de R 4. Expresa, si es posible, los vectores u

Más detalles

Apuntes de Matemática Discreta 9. Funciones

Apuntes de Matemática Discreta 9. Funciones Apuntes de Matemática Discreta 9. Funciones Francisco José González Gutiérrez Cádiz, Octubre de 004 Universidad de Cádiz Departamento de Matemáticas ii Lección 9 Funciones Contenido 9.1 Definiciones y

Más detalles

EXPRESIONES ALGEBRAICAS. POLINOMIOS

EXPRESIONES ALGEBRAICAS. POLINOMIOS EXPRESIONES ALGEBRAICAS. POLINOMIOS 1. EXPRESIONES ALGEBRAICAS. Estas expresiones del área son expresiones algebraicas, ya que además de números aparecen letras. Son también expresiones algebraicas: bac,

Más detalles

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL. REPASO COCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓ ORMAL. Éste es un breve repaso de conceptos básicos de estadística que se han visto en cursos anteriores y que son imprescindibles antes de acometer

Más detalles

Otras medidas descriptivas usuales

Otras medidas descriptivas usuales Tema 7 Otras medidas descriptivas usuales Contenido 7.1. Introducción............................. 1 7.2. Medidas robustas.......................... 2 7.2.1. Media recortada....................... 2 7.2.2.

Más detalles

SESION 4. 1. El comando Integrate 2. Aproximación de integrales definidas 3. Integración de funciones racionales

SESION 4. 1. El comando Integrate 2. Aproximación de integrales definidas 3. Integración de funciones racionales SESION. El comando Integrate. Aproimación de integrales definidas. Integración de funciones racionales . El comando Integrate El cálculo de integrales definidas e indefinidas en MATHEMATICA es sencillo

Más detalles

Sistemas de numeración

Sistemas de numeración Sistemas de numeración Un sistema de numeración es un conjunto de símbolos y reglas que permiten representar datos numéricos. Los sistemas de numeración actuales son sistemas posicionales, que se caracterizan

Más detalles

Unidad Didáctica. Códigos Binarios

Unidad Didáctica. Códigos Binarios Unidad Didáctica Códigos Binarios Programa de Formación Abierta y Flexible Obra colectiva de FONDO FORMACION Coordinación Diseño y maquetación Servicio de Producción Didáctica de FONDO FORMACION (Dirección

Más detalles

a < b y se lee "a es menor que b" (desigualdad estricta) a > b y se lee "a es mayor que b" (desigualdad estricta)

a < b y se lee a es menor que b (desigualdad estricta) a > b y se lee a es mayor que b (desigualdad estricta) Desigualdades Dadas dos rectas que se cortan, llamadas ejes (rectangulares si son perpendiculares, y oblicuos en caso contrario), un punto puede situarse conociendo las distancias del mismo a los ejes,

Más detalles

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión...

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión... Tema 8 Análisis de dos variables: dependencia estadística y regresión Contenido 8.1. Introducción............................. 1 8.2. Dependencia/independencia estadística.............. 2 8.3. Representación

Más detalles

Aplicaciones de Estadística Descriptiva

Aplicaciones de Estadística Descriptiva Aplicaciones de Estadística Descriptiva Contenidos de la presentación Funciones estadísticas en Excel. Gráficos. El módulo de análisis de datos y las tablas dinámicas de Excel. Información Intentaremos

Más detalles

Criterios de Selección de Inversiones: El Valor Actual Neto y sus derivados *.

Criterios de Selección de Inversiones: El Valor Actual Neto y sus derivados *. Criterios de Selección de Inversiones: El Valor Actual Neto y sus derivados *. Uno de los criterios más válidos para la selección de inversiones alternativas es la determinación del Valor Actual Neto (VAN)

Más detalles

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales Estadística 38 Tema 3: Variables aleatorias y vectores aleatorios bidimensionales El concepto de variable aleatoria surge de la necesidad de hacer más manejables matemáticamente los resultados de los experimentos

Más detalles

Diseños de Investigación 40 conceptos que debes conocer

Diseños de Investigación 40 conceptos que debes conocer Diseños de Investigación 40 conceptos que debes conocer 1. El método científico: Se puede realizar desde dos enfoques distintos, hipotético deductivo y analítico inductivo. Con frecuencia los dos ocurren

Más detalles

Transformación de binario a decimal. Transformación de decimal a binario. ELECTRÓNICA DIGITAL

Transformación de binario a decimal. Transformación de decimal a binario. ELECTRÓNICA DIGITAL ELECTRÓNICA DIGITAL La electrónica es la rama de la ciencia que se ocupa del estudio de los circuitos y de sus componentes, que permiten modificar la corriente eléctrica amplificándola, atenuándola, rectificándola

Más detalles

ESQUEMA GENERAL DISEÑOS DE MEDIDAS REPETIDAS

ESQUEMA GENERAL DISEÑOS DE MEDIDAS REPETIDAS TEMA IV ESQUEMA GENERAL Definición Clasificación Diseño simple de medidas repetidas Diseño factorial de medidas repetidas Diseño de medidas parcialmente repetidas DISEÑOS DE MEDIDAS REPETIDAS Definición

Más detalles

- MANUAL DE USUARIO -

- MANUAL DE USUARIO - - MANUAL DE USUARIO - Aplicación: Kz Precio Hora Instagi Instagi Teléfono: 943424465-943466874 Email: instagi@instagi.com GUIA PROGRAMA CALCULO PRECIO HORA 1. Introducción 2. Datos de la empresa 2.1.Gastos

Más detalles

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se

Más detalles

Los números racionales

Los números racionales Los números racionales Los números racionales Los números fraccionarios o fracciones permiten representar aquellas situaciones en las que se obtiene o se debe una parte de un objeto. Todas las fracciones

Más detalles

LÍMITES Y CONTINUIDAD DE FUNCIONES

LÍMITES Y CONTINUIDAD DE FUNCIONES Capítulo 9 LÍMITES Y CONTINUIDAD DE FUNCIONES 9.. Introducción El concepto de ite en Matemáticas tiene el sentido de lugar hacia el que se dirige una función en un determinado punto o en el infinito. Veamos

Más detalles

ÍNDICE DISEÑO DE CONTADORES SÍNCRONOS JESÚS PIZARRO PELÁEZ

ÍNDICE DISEÑO DE CONTADORES SÍNCRONOS JESÚS PIZARRO PELÁEZ ELECTRÓNICA DIGITAL DISEÑO DE CONTADORES SÍNCRONOS JESÚS PIZARRO PELÁEZ IES TRINIDAD ARROYO DPTO. DE ELECTRÓNICA ÍNDICE ÍNDICE... 1 1. LIMITACIONES DE LOS CONTADORES ASÍNCRONOS... 2 2. CONTADORES SÍNCRONOS...

Más detalles

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias Carlos Velasco 1 1 Departamento de Economía Universidad Carlos III de Madrid Econometría I Máster en Economía

Más detalles

REGRESIÓN LINEAL MÚLTIPLE

REGRESIÓN LINEAL MÚLTIPLE REGRESIÓN LINEAL MÚLTIPLE.- Planteamiento general....- Métodos para la selección de variables... 5 3.- Correlaciones parciales y semiparciales... 8 4.- Multicolinealidad en las variables explicativas...

Más detalles

1. SOLUCIONES A LOS EJERCICIOS PROPUESTOS

1. SOLUCIONES A LOS EJERCICIOS PROPUESTOS 1 1. SOLUCIONES A LOS EJERCICIOS PROPUESTOS 1.1. ESPACIOS VECTORIALES 1. Analizar cuáles de los siguientes subconjuntos de R 3 son subespacios vectoriales. a) A = {(2x, x, 7x)/x R} El conjunto A es una

Más detalles

Los polinomios. Un polinomio es una expresión algebraica con una única letra, llamada variable. Ejemplo: 9x 6 3x 4 + x 6 polinomio de variable x

Los polinomios. Un polinomio es una expresión algebraica con una única letra, llamada variable. Ejemplo: 9x 6 3x 4 + x 6 polinomio de variable x Los polinomios Los polinomios Un polinomio es una expresión algebraica con una única letra, llamada variable. Ejemplo: 9x 6 3x 4 + x 6 polinomio de variable x Elementos de un polinomio Los términos: cada

Más detalles

Segmentación de redes. CCNA 1: módulo 10.

Segmentación de redes. CCNA 1: módulo 10. CURSO A DISTANCIA CCNA: Técnico experto en redes e Internet. MATERIAL DIDÁCTICO COMPLEMENTARIO: Segmentación de redes. CCNA 1: módulo 10. RUBÉN MUÑOZ HERNÁNDEZ. 1.- INTRODUCCIÓN. Aunque los materiales

Más detalles

Manual Oficina Web de Clubes (FBM)

Manual Oficina Web de Clubes (FBM) Manual Oficina Web de Clubes (FBM) INTRODUCCIÓN: La Oficina Web de Clubes de Intrafeb es la oficina virtual desde la que un club podrá realizar las siguientes operaciones durante la temporada: 1. Ver información

Más detalles

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones Fracciones. Las fracciones y los números Racionales Las fracciones se utilizan cotidianamente en contextos relacionados con la medida, el reparto o como forma de relacionar dos cantidades. Tenemos entonces

Más detalles

SEMINARIOS. (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática

SEMINARIOS. (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática SEMINARIOS (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática Seminario de Estadística Descriptiva Unidimensional y Bidimensional 1. Se ha realizado un control de calidad en

Más detalles

Nombre...Apellidos... Grado en:...grupo:...

Nombre...Apellidos... Grado en:...grupo:... ESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA - Soluciones Estadística- Curso 01/1. 9 de Julio de 01 Nombre...Apellidos... Grado en:...grupo:... 1. Considera la variable aleatoria (v.a.) X cuyos posibles

Más detalles

Modelo de fuerza deportiva NOTA TÉCNICA

Modelo de fuerza deportiva NOTA TÉCNICA Modelo de fuerza deportiva NOTA TÉCNICA Contenido 1 Motivación 3 2 El modelo de fuerza deportiva 3 2.1 Supuestos del modelo 3 2.2 Críticas al modelo 4 2.3 Formulación 4 2.4 Estimación de los parámetros

Más detalles

CORRELACIÓN Y PREDICIÓN

CORRELACIÓN Y PREDICIÓN CORRELACIÓN Y PREDICIÓN 1. Introducción 2. Curvas de regresión 3. Concepto de correlación 4. Regresión lineal 5. Regresión múltiple INTRODUCCIÓN: Muy a menudo se encuentra en la práctica que existe una

Más detalles

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones. TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones. La herramienta que nos indica si el proceso está o no controlado o Estado de Control son

Más detalles

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos El programa Minitab: breve introducción a su funcionamiento Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos estadísticos en la actualidad, el libro se acompaña, en todo

Más detalles

Grado en Finanzas y Contabilidad

Grado en Finanzas y Contabilidad Econometría Grado en Finanzas y Contabilidad Apuntes basados en el libro Introduction to Econometrics: A modern Approach de Wooldridge 5.2 Estimadores de Variables Instrumentales La endogeneidad aparece

Más detalles

1. MEDIDAS DE TENDENCIA CENTRAL

1. MEDIDAS DE TENDENCIA CENTRAL 1. MEDIDAS DE TENDENCIA CENTRAL Lo importante en una tendencia central es calcular un valor central que actúe como resumen numérico para representar al conjunto de datos. Estos valores son las medidas

Más detalles

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Índice 1. Objetivos de la práctica 2 2. Estimación de un modelo de regresión logística con SPSS 2 2.1. Ajuste de un modelo de regresión logística.............................

Más detalles

ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ

ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ ANOVA O ANAVA PARA DISEÑOS TOTALMENTE ALEATORIZADOS Y ANOVA PARA DISENOS DE BLOQUES ALEATORIZADOS ALBA MARTINEZ ROMERO MARY SOL MEZA CHAVEZ Presentado a: MARIA ESTELA SEVERICHE CORPORACION UNIVERSITARIA

Más detalles

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1 . ESPACIOS VECTORIALES Consideremos el siguiente subconjunto de R 4 : S = {(x, x 2, x 3, x 4 )/x x 4 = 0 x 2 x 4 = x 3 a. Comprobar que S es subespacio vectorial de R 4. Para demostrar que S es un subespacio

Más detalles

Inferencia Estadística

Inferencia Estadística EYP14 Estadística para Construcción Civil 1 Inferencia Estadística El campo de la inferencia estadística está formado por los métodos utilizados para tomar decisiones o para obtener conclusiones sobre

Más detalles

Problemas de Probabilidad resueltos.

Problemas de Probabilidad resueltos. Problemas de Probabilidad resueltos. Problema 1 El profesor Pérez olvida poner su despertador 3 de cada 10 dias. Además, ha comprobado que uno de cada 10 dias en los que pone el despertador acaba no levandandose

Más detalles

Aplicaciones Lineales

Aplicaciones Lineales Aplicaciones Lineales Ejercicio Dada la matriz A = 0 2 0 a) Escribir explícitamente la aplicación lineal f : 2 cuya matriz asociada con respecto a las bases canónicas es A. En primer lugar definimos las

Más detalles

Introducción a la Estadística con Excel

Introducción a la Estadística con Excel Introducción a la Estadística con Excel En el siguiente guión vamos a introducir el software Excel 2007 y la manera de trabajar con Estadística Descriptiva. Cargar o importar datos En Excel 2007 podemos

Más detalles

NÚMEROS NATURALES Y NÚMEROS ENTEROS

NÚMEROS NATURALES Y NÚMEROS ENTEROS NÚMEROS NATURALES Y NÚMEROS ENTEROS Los números naturales surgen como respuesta a la necesidad de nuestros antepasados de contar los elementos de un conjunto (por ejemplo los animales de un rebaño) y de

Más detalles