Introducción al análisis de la varianza (ANOVA)

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Introducción al análisis de la varianza (ANOVA)"

Transcripción

1 Introducción al análisis de la varianza (ANOVA) Albert Sorribas Departament de Ciències Mèdiques Bàsiques Universitat de Lleida última versión: 6 de febrero de 2014 Índice 1. Introducción Objetivos del método Análisis en el caso de un factor Notación Sumas de cuadrados Estimación de la varianza Distribución de F bajo la hipótesis nula Tabla del ANOVA Evolución del peso en personas anoréxicas (ANOVA de un factor) Prueba de igualdad de varianzas Contrastes Diseños con dos factores Ejemplos e interpretación del ANOVA de dos factores Ejercicios Apéndice: Funciones auxiliares Generación de experimentos de uno y dos factores Gráficos de medias por grupos

2 1. Introducción Una de las situaciones más comunes en diseño de experimentos consiste en controlar distintos factores (condiciones experimentales) y medir una respuesta con el objetivo de determinar si los factores considerados son responsables de una variación en la respuesta media. Por ejemplo, podemos medir la producción total en distintas parcelas experimentales definidas por el tipo de abono, situación y variedad plantada. En otro ejemplo, podemos medir la concentración de un metabolito en pacientes sometidos a distintos tramientos para verificar qué tratamiento es más efectivo en conseguir variar dicha concentración en los pacientes. Este tipo de problemas son un caso particular de los modelos lineales, donde se consideran factores qualitativos en el modelo. Vamos a ver el ejemplo más sencillo. Supongamos que estamos evaluando dos nuevos tratamientos respecto a un tratamiento de referencia (control). Diseñamos el experimento repartiendo al azar entre los tratamientos a un conjunto de voluntarios. Una vez finalizado el tratamiento, se mide una variable respuesta y se evalúa si hay diferencias entre los distintos tratamientos. Si los tratamiento no se diferencian del tratamiento de referencia, entonces la j ésima observación del tratamiento T i puede ponerse como y ij = µ + ɛ i (1) donde ɛ i sigue una N(0, σ). Un ejemplo de esta situación la podemos ver en la fig.1. Puede apreciarse que en cada nivel del factor (los grupos experimentales) los resultados son distintos pero que la distribución es similar en todos ellos. El análisi de la varianza debe determinar si las diferencias son estadísticamente significativas o no Y Factor Figura 1: Ejemplo de un experimento donde el efecto del factor considerado no parece ser muy importante Si el tratamiento tiene un efecto, entonces el modelo puede formularse como: y ij = µ + α i + ɛ i (2) 2

3 donde α i seria el efecto (aditivo) del tratamiento T i. En este caso, la distribución de resultados en el grupo T i seguiria una normal N(µ + α i, σ). Por ejemplo, en la fig.2 se muestra un caso en el que se aprecia un efecto evidente del factor, siendo evidente que la distribución de los resultados es claramente distinta para cada grupo experimental Y Factor Figura 2: Ejemplo de un experimento donde el efecto del factor considerado es evidente El modelo puede incluir otros factores. Por ejemplo, si queremos considerar el género como un posible factor, podríamos poner: y ijk = µ + α i + β j + ɛ ij (3) Ahora β j seria el efecto del género (p.e. β 1 para hombres y β 2 para mujeres. y ijk indicaría la k ésima observación en el grupo T i para el género G j. El término ɛ ij seguiria una N(0, σ) igual para todos los grupos. En la fig.3 puede verse un ejemplo donde tendríamos un efecto del primer factor, mientras que el segundo factor no determinaría un cambio en la respuesta. 3

4 Y 12.5 F F1 Figura 3: Ejemplo de un experimento con dos factores. Se muestra la media y el IC para cada combinación de factores Finalmente, si consideramos que hombres y mujeres (factor F1) responden de manera distinta a los tratamientos (factor F2), podríamos considerar un término de interacción: y ijk = µ + α i + β j + γ ij + ɛ ij (4) donde γ ij indicaría el efecto de la interacción entre el tratamiento T i i el género G j. En este caso, el comportamiento de las observaciones en los hombres (grupo 1) bajo el primer tratamiento seguiria una N(µ + α 1 + β 1 + γ 11, σ). Un ejemplo de esta situación puede apreciarse en la fig.4. 4

5 25 Y 20 F F1 Figura 4: Ejemplo de un experimento con dos factores con interacción. Se muestra la media y el IC para cada combinación de factores 1.1. Objetivos del método En función de los datos disponibles, se trata de ajustar un modelo lineal que considere los factores de interes. El ajuste proporciona un valor de los efectos y posibles interacciones y permite verificar si son distintos de cero. En tal caso, podremos concluir que el efecto es significativo y que debe tenerse en cuenta para entender el comportamiento de las observaciones. Por otra parte, deberemos poder determinar que niveles del factor proporcionan un efecto más importante. En el ejemplo de los tratamientos, deberemos estimar que tratamiento tiene un efecto superior al tratamiento de referencia y si los tratamientos que estamos probando son distintos entres si. Además, deberemos verificar si los efectos son similares o no para hombres y mujeres. 2. Análisis en el caso de un factor Para introducir la lógica y la interpretación del ANOVA, nos centraremos en el caso del diseño de un factor con k niveles. Este es un caso muy común en diseño experimental donde disponemos de un grupo control y diversos tratamientos. En este caso el factor es el tratamiento y los niveles son cada tratamiento (incluyendo el control) Notación En la tabla 1 introducimos la notación básica en este caso. En este caso n 1 = n 2 = n 3, es decir el diseño está balanceado. Este no es un requisto necesario, pero si recomendable. Las medias de cada grupo i son: y i. = ni j=1 yij n i 5

6 Cuadro 1: Tractament y 11 y 21 y 31 y 12 y 22 y y 1n1 y 2n2 y 3n3 y 1. y 2. y 3. Y la media global es: i y.. = i ni j yij 2.2. Sumas de cuadrados Para poder discutir los conceptos básicos asociados al ANOVA vamos a considerar un ejemplo sencillo. Supongamos que tenemos los datos siguientes (fig.5): Figura 5: Ejemplo de un experimento donde el efecto del factor considerado no parece ser muy importante 6

7 Vamos a introducir varios conceptos importantes. En primer lugar, vamos a considerar la variabilidad total que correspondería a las observaciones en el caso de que el factor no tuviese un efecto sobre las medias. En este caso, podemos calcular loque se conoce como suma de cuadrados total de la siguiente forma: SCT = (y ij y.. ) 2 (5) i j La SCT puede descomponerse de la siguiente forma: SCT = ((y ij y i. ) + (y i. y.. )) 2 (6) i j Desarrollando el cuadrado: y por tanto: SCT = i SCT = i ((y ij y i. ) 2 + (y i. y.. ) 2 + 2(y ij y i. )(y i. y.. )) (7) j (y ij y i. ) 2 + j i (y i. y.. ) 2 + j i 2(y ij y i. )(y i. y.. ) (8) Si desarrollamos el último término vemos que es nulo, por lo que obtenemos: SCT = (y ij y i. ) 2 + (y i. y.. ) 2 (9) i j i j Finalmente: El término SCT = i (y ij y i. ) 2 + i j SCD = i j n i (y i. y.. ) 2 = SCD + SCE (10) (y ij y i. ) 2 (11) se conoce como suma de cuadrados dentro de los grupos (within groups) y representa la suma de las desviaciones cuadráticas de las observaciones respecto de las medias de su grupo. Por otra parte, el término SCE = n i (y i. y.. ) 2 (12) i se conoce como suma de cuadrados entre grupos (between groups) y representa la variabilidad de las medias de cada grupo con respecto a la media general. Intuitivamente, si las medias son iguales la SCE será baja y la variabilidad dentro del grupo (SCD) será similar a la total (SCT). Cuando las medias se alejen por efecto del factor, entonces la SCE será mayor Estimación de la varianza En el modelo lineal que estamos considerando, la variabilidad dentro de cada grupo se considera N(0, σ). Vamos a ver que tenemos dos maneras de estimar σ 2 cuando no existe efecto del factor. En este caso, podemos considerar que las observaciones de cada grupo son muestras de una misma variable N(µ, σ). Si disponemos de distintas muestras de una variable, podemos estimar su varianza como: j 7

8 Donde ˆσ 2 = s 2 = (n 1 1)s (n 2 1)s (n k 1)s 2 k k (n k 1) s 2 i = j (y ij y i. ) (n i 1) Por lo tanto, la ecuación 13 es equivalente a ˆσ 2 = s 2 i j = (y ij y i. ) 2 = SSD n k n k Veamos ahora el problema desde otra perspectiva. Para simplificar la demostración, consideraremos que el diseño está balanceado, es decir: n 1 = n 2 =... = n k = n. Se cumple que la varianza de la media sería: σy 2.. = σ2 n σ2 y = n σ y 2.. (16) Podemos obtener una estimación de σ y 2.. haciendo (13) (14) (15) ˆσ y 2.. = i (y i. y.. ) 2 k 1 Por lo tanto, dado que n 1 = n 2 =... = n k = n, podemos escribir: σ 2 = n i (y i. y.. ) 2 k 1 (17) (18) Finalmente σ 2 = i n i(y i. y.. ) 2 k 1 = SCE k 1 Tenemos, por lo tanto dos estimaciones de σ 2. Por una parte SCE SCD k 1, y por otra n k. Bajo la hipóteis nula de ausencia de efecto del factor, ambas estimaciones deberían coincidir. Por otra parte, la SCE aumentará, como hemos comentado anteriormente, cuando el efecto sea mayor. Por lo tanto el cociente F = SCE/(k 1) SCD/(n k) Debería se bajo cuando no existen efectos (SCE 0) y alto cuando las medias son distintas en los distintos niveles del factor (SCE > SCD) Distribución de F bajo la hipótesis nula Bajo la hipótesis nula de ausencia de efectos, el estadístico F calculado como: (19) (20) F = SCE/(k 1) SCD/(n k) (21) sigue una distribució F de Fisher con k 1 y n k grados de libertad. La demostración de este resultado queda fuera del ámbito de estas notas. Sin embargo, podemos comprobarlo empíricamente. Para ello, podemos generar una serie de datos aleatorios que se correspondan con una situación determinada. Por ejemplo, podemos suponer que ɛ sigue una N(0, 2) y que el diseño corresponde al caso de un factor con tres niveles (k = 3). Supongamos también que en cada grupo dispone 8

9 de 30 observaciones. Para cada caso, calculamos SCE y SCD y el valor de F. Caso en que el factor no tiene efecto sobre las medias, entonces el resultado de F (que será distinto en cada muestra) debe seguir una distribución F de Fisher con 2 y 57 grados de libertad. Cuando existen efectos, la distribución de F será distinta. El resultado de las simulaciones se muestra en la fig.6. Asímismo, se muestran los resultados para el caso k = 8 (fig.7). Figura 6: Se generan 3000 casos de un experimento de un factor y tres niveles. En cada caso, se indica el efecto de los distintos niveles. Se puede apreciar que cuando el efecto es nulo, el valor de F sigue la distribución teórica prevista. Cuando existen efectos significativos, el valor de F se aleja de la distribución esperada en ausencia de efectos. 9

10 Figura 7: Se generan 3000 casos de un experimento de un factor y ocho niveles. En cada caso, se indica el efecto de los distintos niveles. Se puede apreciar que cuando el efecto es nulo, el valor de F sigue la distribución teórica prevista. Cuando existen efectos significativos, el valor de F se aleja de la distribución esperada en ausencia de efectos Tabla del ANOVA Los cálculos para el análisis de la varianza se disponen un una tabla (tabla ANOVA). Para el caso de un factor con k niveles, esya tabla es: Cuadro 2: Tabla del análisis de la varianza de un factor Fuente Suma cuadrados Grados libertad Cuadrados medios F SC g.l. k Entre grupos i=1 n i(y i. y.. ) 2 k 1 SQEG/k-1 k ni Dentro grupos i=1 j=1 (y ij y i. ) 2 N k SQDG/N-k k ni Total i=1 j=1 (y ij y.. ) 2 N-1 SQEG/k 1 SQDG/N k En el caso de R, esta tabla aparecerá como: Analysis of Variance Table Response: Y Df Sum Sq Mean Sq F value Pr(>F) Factor Residuals

11 La SCD aparece como Residuals, mientras que la SCE tiene el nombre del factor (en este caso Factor). Df se refiere a los grados de libertad, y Sum sq. a la suma de cuadrados. En este caso, SCE=2.7 y SCD= En este ejemplo, k=3, por lo que la SCE tiene 2 grados de libertad. En cada grupo tenemos 5 observaciones, por lo que n=3*5=15 y la SCD tiene 15-3=12 grados de libertad. Ms Sq indica las sumas de cuadrados divididas por sus grados de libertad. Finalmente F = SCE/(k 1) SCD/(n k) = 2,7/2 112,9/12 = 1,35 = 0,14 (22) 9,41 En este caso, la distribución teórica es una F de Fisher con 2 y 12 grados de libertad. La probabilidad de obtener un valor superior a 0.14 puede calcularse como > round(1-pf(0.14,2,12),3) [1] que es el valor que aparece en la columna P r(> F ) de la tabla. Este resultado indica que aunque un resultado de 0.14 o superior se observaría en un 87 % de los casos y, por lo tanto, no es indicativo de una desviación muy grande respecto a lo que se espera bajo la hipótesis nula de ausencia de efectos. Veamos otro caso donde las diferencias son significativas: Analysis of Variance Table Response: Y Df Sum Sq Mean Sq F value Pr(>F) Factor * Residuals Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 En este ejemplo, p = 0,021. Por lo tanto, podemos concluir que la desviación de los resultados respecto a lo que se espera en ausencia de efectos no entra dentro de lo que parece razonable (sólo un 2.1 % de los casos tendrían una discrepancia igual o superior a la observada en los datos). En este caso, concluimos que existe un efecto significativo del factor Evolución del peso en personas anoréxicas (ANOVA de un factor) Como primer ejemplo, consideraremos los datos en anorexia disponibles en la libreria MASS. En este fichero se recogen los datos de la evolución del peso de distintas personas en función de tres tratamientos. Los detalles pueden obtenerse mediante el comando help(anorexia) en R. Veamos en primer lugar cual es la distribución del aumento de peso para cada tratamiento (fig.8): > library(ggplot2) > library(mass) > ggplot(anorexia,aes(x=treat,y=postwt-prewt)) + + geom_boxplot(aes(fill=treat)) 11

12 20 Postwt Prewt 10 0 Treat CBT Cont FT 10 CBT Cont FT Treat Figura 8: Variación del peso en función del tratamiento Es útil considerar los valores medios y su intervalo de confianza (fig.9) 1 : > ggplotmeans1f(anorexia,f1='treat',var='postwt-prewt') 1 Las funciones ggplotmeans1f y ggplotmeans2f no estan incluidas en la librería ggplot2. Se incluyen en un apéndice y deben ejecutarse antes de utilizarlas para obtener las gráficas de medias. 12

13 8 Postwt Prewt 4 Treat CBT Cont FT 0 4 CBT Cont FT Treat Figura 9: Variación de la media de peso y su IC en función del tratamiento Los IC dan una primera idea del posible efecto de los tratamientos. Se observa en la fig.9 que el tratamiento en familia (FT) produce un aumento medio mayor respecto al control y que el tratamiento cognitivo no parece conseguirlo. Para evaluar esta observación debemos ajustar un modelo lineal y realizar algunos cálculos: > res <- lm((postwt-prewt)~treat,data=anorexia) > anova(res) Analysis of Variance Table Response: (Postwt - Prewt) Df Sum Sq Mean Sq F value Pr(>F) Treat ** Residuals Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 En la instrucción lm indicamos que queremos ajustar un modelo de variación del peso en función del tratamiento. Los resultados del análisis de la varianza indican que la dispersión de las medias de los grupos es muy superior a la de las observaciones en los grupos, sugiriendo que hay un efecto del tratamiento. En la fila del tratamiento, observamos un valor significativo inferior a 0.05 para el efecto del tratamiento y concluimos que el aumento de peso dependen del tratamiento. Pero,? qué tratamiento es mejor?. Para responder a esta pregunta debemos estimar la diferencia de medias entre tratamientos. Esto lo podemos hacer mediante la instrucció: > TukeyHSD(aov(res)) 13

14 Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = res) $Treat diff lwr upr p adj Cont-CBT FT-CBT FT-Cont Podemos ver que el IC de la diferenecia de las medias entre FT y Control se sitúa entre 2.09 y 13.34, indicando que este tratamiento consigue aumentar el peso medio. No es así para el tratamiento CBT ya que el IC de la diferencia de medias respecto al Control incluye el valor 0. Gráficamente (fig.10): > plot(tukeyhsd(aov(res))) 95% family wise confidence level FT Cont FT CBT Cont CBT Differences in mean levels of Treat Figura 10: IC de las diferencias de medias entre los tratamientos 2.7. Prueba de igualdad de varianzas El análisis de la varianza requiere que las varianzas de los distintos grupos sean iguales. Podemos verificar la igualdad de varianzas en los tres tratamientos mediante del test de Levene. Es preciso cargar la libreria car: > library(car) > with(anorexia, + levenetest(postwt-prewt,treat) + ) 14

15 Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group Podemos observar que los datos permiten aceptar la hipótesis de igualdad de varianzas (p=0.6). Por lo tanto, la aplicación del análisis de la varianza es correcta Contrastes 3. Diseños con dos factores Una vez que hemos introducido las ideas fundamentales del análisis de la varianza, podemos explorar casos más completos. Vamos a considerar ahora el caso de dos factores. Para ello, consideraremos los datos ToothGrowth disponibles en R. En estos datos se recoge el crecimiento de los dientes de conejillos de indias en función de la dosis devitamina C que ingieren y del suplemento alimenticio mediante el que ingieren dicha vitamina. Podemos representar mediante boxplots la variación de la longitud en función de ambos factores (fig.11): > ggplot(toothgrowth,aes(x=factor(dose),y=len)) + + geom_boxplot(aes(fill=factor(supp))) 30 len 20 factor(supp) OJ VC factor(dose) Figura 11: Variación de la longitud de los dientes en función del suplemento vitamínico y la dosis Tambien es útil representar los medias con su intervalo de confianza (fig.12): > ggplotmeans2f(toothgrowth,f1='dose',f2='supp',var='len') 15

16 30 25 len 20 supp OJ VC dose Figura 12: Variación de la longitud de los dientes en función del suplemento vitamínico y la dosis Podemos apreciar que la media de longitud se incrementa con la dosis y que la diferencia entre los dos suplementos es importante a dosis bajas pero parece desvanecerse a dosis altas. Plantearemos un modelo donde se consideren tanto la dosis como el suplemento y su posible interacción: > res <- lm(len~factor(dose)+factor(supp),data=toothgrowth) > anova(res) Analysis of Variance Table Response: len Df Sum Sq Mean Sq F value Pr(>F) factor(dose) < 2e-16 factor(supp) Residuals factor(dose) *** factor(supp) *** Residuals --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 La tabla de ANOVA tiene ahora otro aspecto. Dado que tenemos dos factores, la suma de cuadrados se descompone en la variabilidad entre dosis (primer factor) y entre suplemento (segundo factor). La suma de cuadrados residual corresponde a la variabilidad dentro de los grupos. Ahora valoramos dos hipótesis. Por una parte el efecto de la dosis y por otra la del suplemento alimenticio. En ambos casos, obtenemos p < 0,05, por lo que podemos concluir que tanto la dosis como el suplemento tienen un efecto significativo. 16

17 La fig.12 sugiere que existe interacción, ya que la diferencia de medias para dosis alta es nula. Para evaluar la interacción, el modelo se especifica: > res.int <- lm(len~factor(dose)*factor(supp),data=toothgrowth) > anova(res.int) Analysis of Variance Table Response: len Df Sum Sq Mean Sq factor(dose) factor(supp) factor(dose):factor(supp) Residuals F value Pr(>F) factor(dose) < 2e-16 *** factor(supp) *** factor(dose):factor(supp) * Residuals --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Podemos ver que el término de interacción es significativo (p=0.022). Por lo tanto, concluimos que las diferencias entre medias de cada suplemento dependen de la dosis. Podemos comparar dos modelos jerárquicos mediante: > anova(res,res.int) Analysis of Variance Table Model 1: len ~ factor(dose) + factor(supp) Model 2: len ~ factor(dose) * factor(supp) Res.Df RSS Df Sum of Sq F Pr(>F) * --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 El modelo de interacción tiene más parámetros que el modelo sin interacción. En esta nueva prueba se valora si el hecho de considerar más parámetros introduce una diferencia significativa en el ajuste del modelo. Como p = 0,22 podemos concluir que si, y por lo tanto seleccionar el modelo con interacción com el más adecuado Ejemplos e interpretación del ANOVA de dos factores Para empezar, consideraremos la situación en que la variabilidad intragrupo es alta y trabajamos con muestras pequeñas (fig.13). En esta figura, se presentan los resultados de cuatro casos generados al azar de la situación ɛ se distribuye según una N(0, 3) y n = 5 en cada grupo. Hemos considerado que el efecto de F1 es α = (5, 3, 0), mientra que para el segundo factor F2 es β = (0, 2). En este caso, definios que no hay interacción entre ambos factores. Por lo tanto, al representar las medias esperaíamos ver dos rectas paralelas descendentes. Podemos observar que los cuatro resultados difieren bastante. Incluso en la gráfica fig.13(c) parece que tenemos interacción y que para F2=1, los efectos son divergentes del caso F2=2. 17

18 Podemos ver que el efecto para F1 es significativo, pero no para F2. La interacción no es, aunque lo parezca, significativa. Comparemos ahora el ANOVA para el caso (a). Ahora, tanto el efecto de F1 como el de F2 son significativos. Además, la interacción es significativa. Que está sucediendo? Com siempre que trabajamos con resultados obtenidos con pocas observaciones, las conclusiones no se corresponden con la realidad ya que disponemos de poca información. En este caso, solo obtendremos resultados consistentes con la realidad si aumentamos el tamaño muestral. Df Sum Sq Mean Sq F value Pr(>F) F F F1:F Residuals Cuadro 3: Caso (c) N(0,3) y n=5 Df Sum Sq Mean Sq F value Pr(>F) F F F1:F Residuals Cuadro 4: Caso (a) N(0,3) y n=5 Figura 13: Ejemplos de resultados con dos factores (primer factor con tres niveles y segundo factor con dos niveles. En este caso, σ = 3 y n = 5. Podemos observar que los distintos experimentos dan resultados relativamente distintos. Ver texto En la fig.14 podemos apreciar que los resultados son más similares en los cuatro casos. En este segundo 18

19 ejemplo, hemos generado muestras de la misma situación anterior, pero co n = 20. Veamos los ANOVA resultantes para los cuatro casos: Figura 14: Ejemplos de resultados con dos factores (primer factor con tres niveles y segundo factor con dos niveles. En este caso, σ = 3 y n = 20. Podemos observar que los distintos experimentos dan resultados más consistentes. Ver texto Caso (a): Caso (b): Caso (c): Caso (d): Df Sum Sq Mean Sq F value Pr(>F) F F F1:F Residuals Cuadro 5: Caso (a) Df Sum Sq Mean Sq F value Pr(>F) F F F1:F Residuals Cuadro 6: Caso (b) 19

20 Df Sum Sq Mean Sq F value Pr(>F) F F F1:F Residuals Cuadro 7: Caso (c) Df Sum Sq Mean Sq F value Pr(>F) F F F1:F Residuals Cuadro 8: Caso (d) Figura 15: Ejemplos de resultados con dos factores (primer factor con tres niveles y segundo factor con dos niveles. En este caso, (a) y (c) σ = 3, (b) y (d) σ = 0,5. n = 5 En todos los casos. Podemos observar que los distintos experimentos dan resultados más consistentes cuando σ es menor. Para σ altas es necesario utilizar muestras más grandes. Ver texto En la fig.16(a), la tabla de ANOVA es: Df Sum Sq Mean Sq F value Pr(>F) F F F1:F Residuals

21 Figura 16: Ejemplos de resultados con dos factores (primer factor con tres niveles y segundo factor con dos niveles. Ver texto Figura 17: Ejemplos de resultados con dos factores (primer factor con tres niveles y segundo factor con tres niveles. Ver texto 21

22 4. Ejercicios Df Sum Sq Mean Sq F value Pr(>F) factor(supp) factor(dose) factor(supp):factor(dose) Residuals

23 5. Apéndice: Funciones auxiliares 5.1. Generación de experimentos de uno y dos factores > Sim.ANOVA.1F <- function(k=3,n=5,mu=10,sigma=1,effects){ + f <- rep(1:k,n) + f <- sample(f,k*n) + fun <- function(j) mu + effects[j] + rnorm(1,0,sigma) + y <- 1:(k*n) + for (i in 1:(k*n)) y[i] <- fun(f[i]) + data.frame(factor=factor(f),y=round(y,1)) + } > Sim.ANOVA.2F <- function(k=c(3,3),n=5,mu=10,sigma=1,effects1,effects2,inter) { + f1 <- sort(rep(1:k[1],k[2]*n)) + f2 <- rep(1:k[2],k[1]*n) + fun <- function(i,j) mu + effects1[i] + effects2[j] + inter[i,j] + rnorm(1,0,sigma) + y <- 1:(n*k[1]*k[2]) + for (i in 1:(n*k[1]*k[2])) y[i] <- fun(f1[i],f2[i]) + data.frame(f1=factor(f1),f2=factor(f2),y=round(y,1)) + } 5.2. Gráficos de medias por grupos > library(ggplot2) > ggplotmeans2f <- function(df,f1,f2,var,fun="mean_cl_normal") { + ggplot(df,aes_string(x=f1,y=var)) + + stat_summary(aes_string(colour=f2,shape=f2,group=f2), fun.data = fun, size=1.1) + + stat_summary(aes_string(colour=f2,shape=f2,group=f2), fun.y=mean, geom="line", size=1.1 + } > ggplotmeans1f <- function(df,f1,var,fun="mean_cl_normal") { + ggplot(df,aes_string(x=f1,y=var)) + + stat_summary(aes_string(colour=f1,group=f1),fun.data = fun, size=1.1) + + stat_summary(aes_string(colour=f1,group=f1),fun.y=mean,geom="point", size=1.1) + } 23

1 Ejemplo de análisis descriptivo de un conjunto de datos

1 Ejemplo de análisis descriptivo de un conjunto de datos 1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

10. DISEÑOS EXPERIMENTALES

10. DISEÑOS EXPERIMENTALES 10. DISEÑOS EXPERIMENTALES Dr. Edgar Acuña http://math.uprm.edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ Diseños Experimentales de Clasificación Simple En un diseño experimental

Más detalles

ANÁLISIS DE DATOS NO NUMERICOS

ANÁLISIS DE DATOS NO NUMERICOS ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas

Más detalles

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO Análisis estadístico 31 3. ANÁLII ETADÍTICO DE LA PRECIPITACIONE EN EL MAR CAPIO 3.1. ANÁLII Y MÉTODO ETADÍTICO UTILIZADO 3.1.1. Introducción Una vez analizado el balance de masas que afecta al mar Caspio

Más detalles

EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones

EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones Ricard Boqué, Alicia Maroto Grupo de Quimiometría y Cualimetría. Universitat Rovira i Virgili. Pl. Imperial Tàrraco, 1. 43005Tarragona

Más detalles

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009 Índice general 6. Regresión Múltiple 3 6.1. Descomposición de la variabilidad y contrastes de hipótesis................. 4 6.2. Coeficiente de determinación.................................. 5 6.3. Hipótesis

Más detalles

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos.

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos. PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) PRUEBAS NO PARAMÉTRICAS F(X) es la función de distribución que hipotetizamos. Fs(X) es la probabilidad o proporción teórica de

Más detalles

Covarianza y coeficiente de correlación

Covarianza y coeficiente de correlación Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también

Más detalles

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se

Más detalles

Principios de Estadística. Intro. En R. Ejercicios

Principios de Estadística. Intro. En R. Ejercicios Leonardo Collado Torres y María Gutiérrez Arcelus Licenciatura en Ciencias Genómicas, UNAM www.lcg.unam.mx/~lcollado/index.php www.lcg.unam.mx/~mgutierr/index.php Cuernavaca, México Febrero - Junio, 2009

Más detalles

Tema 7: Modelos de diseños de experimentos

Tema 7: Modelos de diseños de experimentos Tema 7: Modelos de diseños de experimentos Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 7: Modelos de diseños de experimentos Curso

Más detalles

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n Un diseño experimental que se utiliza muy a menudo es el de un grupo control y uno de tratamiento. En el caso de que los datos sean cuantitativos y sigan una distribución normal, la hipótesis de interés

Más detalles

TEMA 4: Variables binarias

TEMA 4: Variables binarias TEMA 4: Variables binarias Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 4: Variables binarias Curso 2011-12 1 / 51 Variables

Más detalles

EXPERIMENTACIÓN. Eduardo Jiménez Marqués

EXPERIMENTACIÓN. Eduardo Jiménez Marqués EXPERIMENTACIÓN Eduardo Jiménez Marqués 1 CONTENIDO: 1. Experimentación...3 1.1 Concepto...3 1. Definición...4 1.3 Dificultad...4 1.4 Ventaja...5 1.5 Planificación...5 1.6 Aplicaciones...5 1.7 Metodología...6

Más detalles

Estimación de una probabilidad

Estimación de una probabilidad Estimación de una probabilidad Introducción En general, la probabilidad de un suceso es desconocida y debe estimarse a partir de una muestra representativa. Para ello, deberemos conocer el procedimiento

Más detalles

Divisibilidad y números primos

Divisibilidad y números primos Divisibilidad y números primos Divisibilidad En muchos problemas es necesario saber si el reparto de varios elementos en diferentes grupos se puede hacer equitativamente, es decir, si el número de elementos

Más detalles

Indicaciones específicas para los análisis estadísticos.

Indicaciones específicas para los análisis estadísticos. Tutorial básico de PSPP: Vídeo 1: Describe la interfaz del programa, explicando en qué consiste la vista de datos y la vista de variables. Vídeo 2: Muestra cómo crear una base de datos, comenzando por

Más detalles

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 2011 UNED DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 7] Diseños con más de dos grupos independientes. Análisis de varianza con dos factores completamente aleatorizados 1 Índice 7.1 Introducción...

Más detalles

Profr. Efraín Soto Apolinar. Función Inversa

Profr. Efraín Soto Apolinar. Función Inversa Función Inversa Una función es una relación entre dos variables, de manera que para cada valor de la variable independiente eiste a lo más un único valor asignado a la variable independiente por la función.

Más detalles

Detergente Lavad.1 Lavad.2 Lavad.3 Media A 45 43 51 46.3 B 47 44 52 47.6 C 50 49 57 52 D 42 37 49 42.6. Media 46 43.2 52.2 47.16

Detergente Lavad.1 Lavad.2 Lavad.3 Media A 45 43 51 46.3 B 47 44 52 47.6 C 50 49 57 52 D 42 37 49 42.6. Media 46 43.2 52.2 47.16 3. DISEÑO EN BLOQUES ALEATORIZADOS En muchos experimentos además de que interesa investigar la influencia de un factor controlado sobre la variable de respuesta, como en la sección anterior, existe una

Más detalles

Capítulo 7: Distribuciones muestrales

Capítulo 7: Distribuciones muestrales Capítulo 7: Distribuciones muestrales Recordemos: Parámetro es una medida de resumen numérica que se calcularía usando todas las unidades de la población. Es un número fijo. Generalmente no lo conocemos.

Más detalles

Tema 3. Comparaciones de dos poblaciones

Tema 3. Comparaciones de dos poblaciones Tema 3. Comparaciones de dos poblaciones Contenidos Hipótesis para la diferencia entre las medias de dos poblaciones: muestras pareadas Hipótesis para la diferencia entre las medias de dos poblaciones:

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

Práctica 5. Contrastes paramétricos en una población

Práctica 5. Contrastes paramétricos en una población Práctica 5. Contrastes paramétricos en una población 1. Contrastes sobre la media El contraste de hipótesis sobre una media sirve para tomar decisiones acerca del verdadero valor poblacional de la media

Más detalles

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros. QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros. Qué significa esto? Decir que una empresa es eficiente es decir que no

Más detalles

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD.

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD. Experimentos con un solo factor: El análisis de varianza Jhon Jairo Padilla Aguilar, PhD. Experimentación en sistemas aleatorios: Factores Controlables Entradas proceso Salidas Factores No controlables

Más detalles

SPSS: ANOVA de un Factor

SPSS: ANOVA de un Factor SPSS: ANOVA de un Factor El análisis de varianza (ANOVA) de un factor nos sirve para comparar varios grupos en una variable cuantitativa. Esta prueba es una generalización del contraste de igualdad de

Más detalles

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1 . ESPACIOS VECTORIALES Consideremos el siguiente subconjunto de R 4 : S = {(x, x 2, x 3, x 4 )/x x 4 = 0 x 2 x 4 = x 3 a. Comprobar que S es subespacio vectorial de R 4. Para demostrar que S es un subespacio

Más detalles

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

E 1 E 2 E 2 E 3 E 4 E 5 2E 4 Problemas resueltos de Espacios Vectoriales: 1- Para cada uno de los conjuntos de vectores que se dan a continuación estudia si son linealmente independientes, sistema generador o base: a) (2, 1, 1, 1),

Más detalles

Tema 2. Espacios Vectoriales. 2.1. Introducción

Tema 2. Espacios Vectoriales. 2.1. Introducción Tema 2 Espacios Vectoriales 2.1. Introducción Estamos habituados en diferentes cursos a trabajar con el concepto de vector. Concretamente sabemos que un vector es un segmento orientado caracterizado por

Más detalles

PRUEBA DE HIPÓTESIS CON CHI CUADRADO EMPLEANDO EXCEL Y WINSTATS

PRUEBA DE HIPÓTESIS CON CHI CUADRADO EMPLEANDO EXCEL Y WINSTATS PRUEBA DE HIPÓTESIS CON CHI CUADRADO EMPLEANDO EXCEL Y WINSTATS La finalidad de una prueba de k muestras es evaluar la aseveración que establece que todas las k muestras independientes provienen de poblaciones

Más detalles

Tema 12: Contrastes Paramétricos

Tema 12: Contrastes Paramétricos Tema 1 Tema 1: Contrastes Paramétricos Presentación y Objetivos. Se comienza este tema introduciendo la terminología y conceptos característicos de los contrastes de hipótesis, típicamente a través de

Más detalles

Cálculos con el programa R

Cálculos con el programa R Cálculos con el programa R Introducir el concepto de distribución normal Aprender el uso del programa R para realizar cálculos con la distribución normal Probabilidad de intervalos Cálculo e interpretación

Más detalles

REGRESION simple. Correlación Lineal:

REGRESION simple. Correlación Lineal: REGRESION simple Correlación Lineal: Dadas dos variable numéricas continuas X e Y, decimos que están correlacionadas si entre ambas variables hay cierta relación, de modo que puede predecirse (aproximadamente)

Más detalles

Aproximación local. Plano tangente. Derivadas parciales.

Aproximación local. Plano tangente. Derivadas parciales. Univ. de Alcalá de Henares Ingeniería de Telecomunicación Cálculo. Segundo parcial. Curso 004-005 Aproximación local. Plano tangente. Derivadas parciales. 1. Plano tangente 1.1. El problema de la aproximación

Más detalles

Solución ESTADÍSTICA. Prueba de evaluación contínua 2 - PEC2

Solución ESTADÍSTICA. Prueba de evaluación contínua 2 - PEC2 Semestre set04 - feb05 Módulos 11-17 Prueba de evaluación contínua 2 - PEC2 Solución Presentación i objetivos Enunciados: descripción teórica de la práctica a realizar Materiales Criterios de evaluación

Más detalles

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral

ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral ANÁLISIS DE LA VARIANZA (ANOVA) José Vicéns Otero Ainhoa Herrarte Sánchez Eva Medina Moral Enero 2005 1.- INTRODUCCIÓN En múltiples ocasiones el analista o investigador se enfrenta al problema de determinar

Más detalles

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Índice 1. Objetivos de la práctica 2 2. Estimación de un modelo de regresión logística con SPSS 2 2.1. Ajuste de un modelo de regresión logística.............................

Más detalles

Integrales y ejemplos de aplicación

Integrales y ejemplos de aplicación Integrales y ejemplos de aplicación I. PROPÓSITO DE ESTOS APUNTES Estas notas tienen como finalidad darle al lector una breve introducción a la noción de integral. De ninguna manera se pretende seguir

Más detalles

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica. PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica. Profesores: Javier Faulín y Francisco Ballestín 1. Introducción. El objetivo de esta parte es obtener resultados sobre contrastes de hipótesis

Más detalles

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro de una distribución de datos. Las medidas de dispersión, variabilidad o variación

Más detalles

SESION 4. 1. El comando Integrate 2. Aproximación de integrales definidas 3. Integración de funciones racionales

SESION 4. 1. El comando Integrate 2. Aproximación de integrales definidas 3. Integración de funciones racionales SESION. El comando Integrate. Aproimación de integrales definidas. Integración de funciones racionales . El comando Integrate El cálculo de integrales definidas e indefinidas en MATHEMATICA es sencillo

Más detalles

Comparación de medias

Comparación de medias 12 Comparación de medias Irene Moral Peláez 12.1. Introducción Cuando se desea comprobar si los valores de una característica que es posible cuantificar (como podría ser la edad o la cifra de tensión arterial,

Más detalles

Calculadora de Tamaño muestral GRANMO

Calculadora de Tamaño muestral GRANMO Calculadora de Tamaño muestral GRANMO Versión 7.12 Abril 2012 http://www.imim.es/ofertadeserveis/software-public/granmo/ Entre las distintas ofertas que existen para el cálculo del tamaño muestral, ofrecemos

Más detalles

Tests de hipótesis estadísticas

Tests de hipótesis estadísticas Tests de hipótesis estadísticas Test de hipótesis sobre la media de una población. Introducción con un ejemplo. Los tests de hipótesis estadísticas se emplean para muchos problemas, en particular para

Más detalles

4 Pruebas y análisis del software

4 Pruebas y análisis del software 4 Pruebas y análisis del software En este capítulo se presentan una serie de simulaciones donde se analiza el desempeño de ambos sistemas programados en cuanto a exactitud con otros softwares que se encuentran

Más detalles

Subespacios vectoriales en R n

Subespacios vectoriales en R n Subespacios vectoriales en R n Víctor Domínguez Octubre 2011 1. Introducción Con estas notas resumimos los conceptos fundamentales del tema 3 que, en pocas palabras, se puede resumir en técnicas de manejo

Más detalles

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases. BASES Y DIMENSIÓN Definición: Base. Se llama base de un espacio (o subespacio) vectorial a un sistema generador de dicho espacio o subespacio, que sea a la vez linealmente independiente. β Propiedades

Más detalles

Ejercicio de estadística para 3º de la ESO

Ejercicio de estadística para 3º de la ESO Ejercicio de estadística para 3º de la ESO Unibelia La estadística es una disciplina técnica que se apoya en las matemáticas y que tiene como objetivo la interpretación de la realidad de una población

Más detalles

ESTADÍSTICA BÁSICA en LABORATORIOS (Físico - Químicos)

ESTADÍSTICA BÁSICA en LABORATORIOS (Físico - Químicos) ESTADÍSTICA BÁSICA en LABORATORIOS (Físico - Químicos) (Aplicaciones de Microsoft Excel ) Curso a distancia (EDICIÓN Junio 2012) ASECAL, S.L. MADRID-ESPAÑA RONDA DE TOLEDO, 8, LOCAL 1º- 28005 MADRID. Teléfono:

Más detalles

x 10000 y 8000 x + y 15000 a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

x 10000 y 8000 x + y 15000 a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas. Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Septiembre 2012 - Propuesta A 1. Queremos realizar una inversión en dos tipos

Más detalles

Funciones de varias variables

Funciones de varias variables Funciones de varias variables Derivadas parciales. El concepto de función derivable no se puede extender de una forma sencilla para funciones de varias variables. Aquí se emplea el concepto de diferencial

Más detalles

Matrices equivalentes. El método de Gauss

Matrices equivalentes. El método de Gauss Matrices equivalentes. El método de Gauss Dada una matriz A cualquiera decimos que B es equivalente a A si podemos transformar A en B mediante una combinación de las siguientes operaciones: Multiplicar

Más detalles

LÍMITES Y CONTINUIDAD DE FUNCIONES

LÍMITES Y CONTINUIDAD DE FUNCIONES Capítulo 9 LÍMITES Y CONTINUIDAD DE FUNCIONES 9.. Introducción El concepto de ite en Matemáticas tiene el sentido de lugar hacia el que se dirige una función en un determinado punto o en el infinito. Veamos

Más detalles

Profr. Efraín Soto Apolinar. Factorización

Profr. Efraín Soto Apolinar. Factorización Factorización La factorización es la otra parte de la historia de los productos notables. Esto es, ambas cosas se refieren a las mismas fórmulas, pero en los productos notables se nos daba una operación

Más detalles

Pruebas de. Hipótesis

Pruebas de. Hipótesis Pruebas de ipótesis Pruebas de ipótesis Otra manera de hacer inferencia es haciendo una afirmación acerca del valor que el parámetro de la población bajo estudio puede tomar. Esta afirmación puede estar

Más detalles

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido Tema 3 Medidas de tendencia central Contenido 31 Introducción 1 32 Media aritmética 2 33 Media ponderada 3 34 Media geométrica 4 35 Mediana 5 351 Cálculo de la mediana para datos agrupados 5 36 Moda 6

Más detalles

Definición 2.1.1. Se llama suceso aleatorio a cualquier subconjunto del espacio muestral.

Definición 2.1.1. Se llama suceso aleatorio a cualquier subconjunto del espacio muestral. Capítulo 2 Probabilidades 2. Definición y propiedades Al realizar un experimento aleatorio nuestro interés es obtener información sobre las leyes que rigen el fenómeno sometido a estudio. El punto de partida

Más detalles

Capítulo 8. Tipos de interés reales. 8.1. Introducción

Capítulo 8. Tipos de interés reales. 8.1. Introducción Capítulo 8 Tipos de interés reales 8.1. Introducción A lo largo de los capítulos 5 y 7 se ha analizado el tipo de interés en términos nominales para distintos vencimientos, aunque se ha desarrollado más

Más detalles

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

Metodología. del ajuste estacional. Tablero de Indicadores Económicos Metodología del ajuste estacional Tablero de Indicadores Económicos Metodología del ajuste estacional Componentes de una serie de tiempo Las series de tiempo están constituidas por varios componentes que,

Más detalles

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma: Ignacio Martín Tamayo 25 Tema: ANÁLISIS DE VARIANZA CON SPSS 8.0 ÍNDICE --------------------------------------------------------- 1. Modelos de ANOVA 2. ANOVA unifactorial entregrupos 3. ANOVA multifactorial

Más detalles

1. MEDIDAS DE TENDENCIA CENTRAL

1. MEDIDAS DE TENDENCIA CENTRAL 1. MEDIDAS DE TENDENCIA CENTRAL Lo importante en una tendencia central es calcular un valor central que actúe como resumen numérico para representar al conjunto de datos. Estos valores son las medidas

Más detalles

Definición 1.1.1. Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

Definición 1.1.1. Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas. Tema 1 Matrices Estructura del tema. Conceptos básicos y ejemplos Operaciones básicas con matrices Método de Gauss Rango de una matriz Concepto de matriz regular y propiedades Determinante asociado a una

Más detalles

Grado en Finanzas y Contabilidad

Grado en Finanzas y Contabilidad Econometría Grado en Finanzas y Contabilidad Apuntes basados en el libro Introduction to Econometrics: A modern Approach de Wooldridge 5.2 Estimadores de Variables Instrumentales La endogeneidad aparece

Más detalles

Control Estadístico de Procesos

Control Estadístico de Procesos Control Estadístico de Procesos Gráficos de Control Los gráficos de control o cartas de control son una importante herramienta utilizada en control de calidad de procesos. Básicamente, una Carta de Control

Más detalles

Ecuaciones de primer grado con dos incógnitas

Ecuaciones de primer grado con dos incógnitas Ecuaciones de primer grado con dos incógnitas Si decimos: "las edades de mis padres suman 120 años", podemos expresar esta frase algebraicamente de la siguiente forma: Entonces, Denominamos x a la edad

Más detalles

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11 Tema 5 Análisis de regresión (segunda parte) Estadística II, 2010/11 Contenidos 5.1: Diagnóstico: Análisis de los residuos 5.2: La descomposición ANOVA (ANalysis Of VAriance) 5.3: Relaciones no lineales

Más detalles

PRUEBAS NO PARAMÉTRICAS

PRUEBAS NO PARAMÉTRICAS PRUEBAS NO PARAMÉTRICAS 1. PRUEBAS DE NORMALIDAD Para evaluar la normalidad de un conjunto de datos tenemos el Test de Kolmogorov- Smirnov y el test de Shapiro-Wilks La opción NNPLOT del SPSS permite la

Más detalles

El sistema decimal, es aquél en el que se combinan 10 cifras (o dígitos) del 0 al 9 para indicar una cantidad específica.

El sistema decimal, es aquél en el que se combinan 10 cifras (o dígitos) del 0 al 9 para indicar una cantidad específica. 5.2 SISTEMAS DE NUMERACIÓN. DECIMAL El sistema decimal, es aquél en el que se combinan 10 cifras (o dígitos) del 0 al 9 para indicar una cantidad específica. La base de un sistema indica el número de caracteres

Más detalles

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS 6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS Esquema del capítulo Objetivos 6.1. 6.. 6.3. 6.4. ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS COEFICIENTES DE CONTINGENCIA LA

Más detalles

Diseños en cuadrados latinos

Diseños en cuadrados latinos Capítulo 7 Diseños en cuadrados latinos 7.1. Introducción En el modelo en bloques aleatorizados, que estudiamos en el capítulo anterior, considerábamos un factor principal y un factor de control o variable

Más detalles

CORRELACIÓN Y PREDICIÓN

CORRELACIÓN Y PREDICIÓN CORRELACIÓN Y PREDICIÓN 1. Introducción 2. Curvas de regresión 3. Concepto de correlación 4. Regresión lineal 5. Regresión múltiple INTRODUCCIÓN: Muy a menudo se encuentra en la práctica que existe una

Más detalles

Aula Banca Privada. La importancia de la diversificación

Aula Banca Privada. La importancia de la diversificación Aula Banca Privada La importancia de la diversificación La importancia de la diversificación La diversificación de carteras es el principio básico de la operativa en mercados financieros, según el cual

Más detalles

Sistemas de numeración

Sistemas de numeración Sistemas de numeración Un sistema de numeración es un conjunto de símbolos y reglas que permiten representar datos numéricos. Los sistemas de numeración actuales son sistemas posicionales, que se caracterizan

Más detalles

Una serie temporal o cronológica es en una sucesión de valores que adopta una variable (Y):

Una serie temporal o cronológica es en una sucesión de valores que adopta una variable (Y): INTRODUCCIÓN Nos vamos a ocupar ahora de estudiar un fenómeno desde la perspectiva temporal, observando su evolución a través del tiempo, lo que se denomina investigación diacrónica o longitudinal, en

Más detalles

Medidas de tendencia central o de posición: situación de los valores alrededor

Medidas de tendencia central o de posición: situación de los valores alrededor Tema 10: Medidas de posición y dispersión Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores que sintetizan la información. Estudiaremos dos grandes secciones: Medidas

Más detalles

1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B(1, p), donde

1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B(1, p), donde Soluciones de la relación del Tema 6. 1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B1, p), donde p = P X = 1) = P la persona presente síntomas)

Más detalles

CURSO 2010-2011 TECNOLOGÍA TECNOLOGÍA 4º ESO TEMA 5: Lógica binaria. Tecnología 4º ESO Tema 5: Lógica binaria Página 1

CURSO 2010-2011 TECNOLOGÍA TECNOLOGÍA 4º ESO TEMA 5: Lógica binaria. Tecnología 4º ESO Tema 5: Lógica binaria Página 1 Tecnología 4º ESO Tema 5: Lógica binaria Página 1 4º ESO TEMA 5: Lógica binaria Tecnología 4º ESO Tema 5: Lógica binaria Página 2 Índice de contenido 1. Señales analógicas y digitales...3 2. Código binario,

Más detalles

Introducir el concepto de comparación de modelos. Ajuste de una recta a varios grupos. Ajuste de una recta a cada grupo. Ajuste de rectas paralelas.

Introducir el concepto de comparación de modelos. Ajuste de una recta a varios grupos. Ajuste de una recta a cada grupo. Ajuste de rectas paralelas. Introducir el concepto de comparación de modelos. Ajuste de una recta a varios grupos. Ajuste de una recta a cada grupo. Ajuste de rectas paralelas. Comparación de modelos. Disponemos de la edad y de la

Más detalles

Tema IV. EL ANOVA de un factor

Tema IV. EL ANOVA de un factor 4.1. La estrategia del Análisis de varianza: - Los test t múltiples (múltiples tratamientos); corrección a posteriori - La mejora del ANOVA: necesidad de análisis a posteriori C Test t A versus B A versus

Más detalles

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz Control Estadístico del Proceso Ing. Claudia Salguero Ing. Alvaro Díaz Control Estadístico del Proceso Es un conjunto de herramientas estadísticas que permiten recopilar, estudiar y analizar la información

Más detalles

Diseño Estadístico de Experimentos

Diseño Estadístico de Experimentos Capítulo 3 Diseño Estadístico de Experimentos Una prueba o serie de pruebas en las cuales se introducen cambios deliberados en las variables de entrada que forman el proceso, de manera que sea posible

Más detalles

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson 3datos 2011 Análisis BIVARIADO de variables cuantitativas OBJETIVO DETERMINAR 1º) si existe alguna relación entre las variables;

Más detalles

1 1 0 1 x 1 0 1 1 1 1 0 1 + 1 1 0 1 0 0 0 0 1 1 0 1 1 0 0 0 1 1 1 1

1 1 0 1 x 1 0 1 1 1 1 0 1 + 1 1 0 1 0 0 0 0 1 1 0 1 1 0 0 0 1 1 1 1 5.1.3 Multiplicación de números enteros. El algoritmo de la multiplicación tal y como se realizaría manualmente con operandos positivos de cuatro bits es el siguiente: 1 1 0 1 x 1 0 1 1 1 1 0 1 + 1 1 0

Más detalles

6. DISEÑOS FACTORIALES 2 K NO REPLICADOS

6. DISEÑOS FACTORIALES 2 K NO REPLICADOS 6. DISEÑOS FACTORIALES 2 K NO REPLICADOS 6.1 INTRODUCCION El aumentar el numero de factores en un diseño 2 k crece rápidamente el numero de tratamientos y por tanto el numero de corridas experimentales.

Más detalles

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA PROF. Esther González Sánchez Departamento de Informática y Sistemas Facultad de Informática Universidad de Las Palmas de Gran Canaria

Más detalles

Lecturas previas Cuando llegue a su primera sesión de laboratorio debe haber estudiado el contenido de la lectura que aparece a continuación.

Lecturas previas Cuando llegue a su primera sesión de laboratorio debe haber estudiado el contenido de la lectura que aparece a continuación. Laboratorio 1 Medición e incertidumbre La descripción de los fenómenos naturales comienza con la observación; el siguiente paso consiste en asignar a cada cantidad observada un número, es decir en medir

Más detalles

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 Fundamentos de Investigación de Operaciones Investigación de Operaciones 1 1 de agosto de 2003 1. Introducción Cualquier modelo de una situación es una simplificación de la situación real. Por lo tanto,

Más detalles

Inferencia Estadística

Inferencia Estadística EYP14 Estadística para Construcción Civil 1 Inferencia Estadística El campo de la inferencia estadística está formado por los métodos utilizados para tomar decisiones o para obtener conclusiones sobre

Más detalles

Los polinomios. Un polinomio es una expresión algebraica con una única letra, llamada variable. Ejemplo: 9x 6 3x 4 + x 6 polinomio de variable x

Los polinomios. Un polinomio es una expresión algebraica con una única letra, llamada variable. Ejemplo: 9x 6 3x 4 + x 6 polinomio de variable x Los polinomios Los polinomios Un polinomio es una expresión algebraica con una única letra, llamada variable. Ejemplo: 9x 6 3x 4 + x 6 polinomio de variable x Elementos de un polinomio Los términos: cada

Más detalles

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones Fracciones. Las fracciones y los números Racionales Las fracciones se utilizan cotidianamente en contextos relacionados con la medida, el reparto o como forma de relacionar dos cantidades. Tenemos entonces

Más detalles

Análisis de la Varianza de un Factor

Análisis de la Varianza de un Factor Práctica de Estadística con Statgraphics Análisis de la Varianza de un Factor Fundamentos teóricos El Análisis de la Varianza con un Factor es una técnica estadística de contraste de hipótesis, cuyo propósito

Más detalles

Funciones polinomiales de grados 3 y 4

Funciones polinomiales de grados 3 y 4 Funciones polinomiales de grados 3 y 4 Ahora vamos a estudiar los casos de funciones polinomiales de grados tres y cuatro. Vamos a empezar con sus gráficas y después vamos a estudiar algunos resultados

Más detalles

TEMA 7: Análisis de la Capacidad del Proceso

TEMA 7: Análisis de la Capacidad del Proceso TEMA 7: Análisis de la Capacidad del Proceso 1 Introducción Índices de capacidad 3 Herramientas estadísticas para el análisis de la capacidad 4 Límites de tolerancia naturales 1 Introducción La capacidad

Más detalles

Diagonalización de matrices

Diagonalización de matrices diagonalizacion.nb Diagonalización de matrices Práctica de Álgebra Lineal, E.U.A.T., Grupos ºA y ºB, 2005 Algo de teoría Qué es diagonalizar una matriz? Para estudiar una matriz suele ser conveniente expresarla

Más detalles

CAPÍTULO 10 DISEÑOS EXPERIMENTALES

CAPÍTULO 10 DISEÑOS EXPERIMENTALES CAPÍTULO 10 DISEÑOS EXPERIMENTALES 10.1 Diseños Experimentales de Clasificación Simple En un diseño experimental de clasificación simple, se trata de comparar varios grupos generalmente llamados Métodos

Más detalles

ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso

ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 3 - Septiembre - 2.6 Primera Parte - Test Las respuestas del TEST son las siguientes: Pregunta 2 3 4 5 6 Respuesta C A D C B A Pregunta 7 8 9 2 Respuesta

Más detalles

Generación de funciones lógicas mediante decodificadores binarios con salidas activas a nivel alto

Generación de funciones lógicas mediante decodificadores binarios con salidas activas a nivel alto Generación de funciones lógicas mediante decodificadores binarios con salidas activas a nivel alto Apellidos, nombre Martí Campoy, Antonio (amarti@disca.upv.es) Departamento Centro Informática de Sistemas

Más detalles

1.4.- D E S I G U A L D A D E S

1.4.- D E S I G U A L D A D E S 1.4.- D E S I G U A L D A D E S OBJETIVO: Que el alumno conozca y maneje las reglas empleadas en la resolución de desigualdades y las use para determinar el conjunto solución de una desigualdad dada y

Más detalles