1 El Análisis de Varianza

Tamaño: px
Comenzar la demostración a partir de la página:

Download "1 El Análisis de Varianza"

Transcripción

1 1 El Análisis de Varianza Objetivo: Explicar (controlar las variaciones de una v.a. Y continua (numérica, mediante factores (variables cualitativas que definen categorías que controlamos (no aleatorios. Este análisis permite poner en evidencia eventuales relaciones entre Y y estos factores. 1.1 Análisis con un solo factor Un ejemplo Queremos estudiar la influencia de la operadora sobre el importe de nuestra factura anual de teléfono (Y. Denotamos: m 1 el valor medio de Y con la operadora 1. m 2 el valor medio de Y con la operadora 2. m 3 el valor medio de Y con la operadora 3. PREGUNTA: m 1 = m 2 = m 3?Disponemos de datos que corresponden al gasto anual de teléfono en Euros (Y de 15 clientes: Vocabulario: Operadora 1 Operadora 2 Operadora Medias Y = Gasto anual de teléfono es una variable cuantitativa. La Operadora es una variable cualitativa con la cual queremos explicar las variaciones de Y : un factor. 1

2 Los factores tienen un cierto número de niveles. El factor Operadora tiene aquí 3 niveles. Notaciones: y ij valor observado de Y para el j esimo cliente de la i esima operadora, i = 1,..., I, j = 1,..., n i = 5; y 13 = 810. y i media observada de Y para la i esima operadora; y 2 = 864. y media global observada de Y (media de las medias; y = 1 3 (y 1 + y 2 + y 3 = Indicios para medir la variabilidad: Variabilidad explicada por el factor: V E = I n i (y i y 2 i=1 Variabilidad no explicada: V NE = I n i (y ij y i 2 i=1 j=1 Descomposición de la variabilidad total: I n i V T = (y ij y 2 i=1 j=1 = V E + V NE Con los datos precedentes, obtenemos los valores V E = 22230, V NE = V T = =

3 1.1.2 El Modelo Para contestar a nuestra pregunta ( m 1 = m 2 = m 3? consideramos que cada dato observado y ij es igual al valor medio en el nivel del factor que le corresponde (m i más una desviación aleatoria ε ij (o perturbación respecto a este valor medio: Para i = 1,..., I y j = 1,..., n i tenemos y ij = m i + ε ij Supondremos que las desviaciones ε ij = y ij m i, verifican las hipótesis siguientes: Las desviaciones están centradas: E(ε ij = 0, para cualquier i, j. Homocedasticidad: Var(ε ij = σ 2, para cualquier i, j. No correlación: E(ε ij ε ik = 0, para cualquier i, j, k. Normalidad: ε ij tiene una distribución normal, para cualquier i, j. Otra formulación del modelo: donde y ij = µ + α i + ε ij, µ = 1 n I i=1 n im i es el efecto global (o medio. α i = m i µ es el efecto del i esimo nivel del factor. Necesariamente i n iα i = 0. Con esta nueva formulación nuestra pregunta se puede escribir: α 1 = α 2 = α 3 = 0? 3

4 1.1.3 Estimación de los parámetros del modelo El modelo depende de I + 1 parámetros: Las I medias m i, y la varianza común σ 2. Para estimar estos parámetros utilizamos el criterio de mínimos cuadrados (minimizar las desviaciones: Para cada i = 1,..., I, m i valor de m i que mínimiza n i j=1 (y ij m i 2, Obtenemos: m i = y i Deducimos que µ = y α i = m i µ = y i y (en el ejemplo: α 1 = y α 2 = Propiedad de los estimadores: Bajo las hipótesis del modelo, tenemos ( que m i = y i sigue una distribución normal N m i, σ2 n i. Prueba: ( 1 E(y i =E ni n i j=1 y ij = 1 ni n i j=1 E(y ij = m i ( 1 var(y i =var ni n i j=1 y ij = 1 ni n 2 j=1 var(y ij = σ2 i n i y i es una combinación lineal de variables normales, por tanto es también normal. ( Deducimos que µ sigue una normal N(µ, σ2 y α n i una normal N α i, (I 1 n σ2. 4

5 Estimación de los residuos: Las desviaciones observadas e ij (residuos del modelo se calculan por: Por tanto, tenemos que e ij = y ij m i = y ij y i V E = V NE = I n i α 2 i i=1 I n i i=1 j=1 e 2 ij Grados de libertad: Definición: Número de variables linealmente independientes utilizadas para describir una dispersión.. Utilidad: Números con los cuales es necesario dividir los indicios de variabilidad (VE;VNE para compararlos. obtener las varianzas. Estimación de las varianzas: V E está calculada con I 1 variables linealmente independientes, puesto que I i=1 n 1 i α i = 0. Por tanto, si α 1 =... = α I = 0, V E sigue, σ 2 Bajo H 0, una distribución del χ 2 con I 1 grados de libertad. V N E está calculada con n I variables linealmente independientes, puesto que n i j=1 e 1 ij = 0, para cada i. Por tanto, V NE sigue una distribución del χ 2 con n I grados de σ 2 libertad. Además se puede demostrar que V E y V NE son independientes. Por consiguiente, 5

6 La varianza explicada por el modelo σ 2 e (o varianza inter-niveles está estimada por s 2 e = V E I 1 La varianza no explicada por el modelo σ 2 R estimada por s 2 R = V NE n I (o varianza residual está El contraste de igualdad de medias Queremos contrastar las hipótesis: { } Las mi son iguales : H 0 : m 1 = m 2 =... = m I. { frente a No todas las mi son iguales : H 1 : Existe i, k, tal que m i m k. } O de manera equivalente, H 0 : {α 1 = α 2 =... = α I = 0} frente a H 1 : {Existe i, tal que α i 0.} Rechazaremos H 0 cuando el factor explica poca variabilidad. Basamos nuestra decisión sobre el ratio F = s2 e, s 2 R y rechazaremos H 0 cuando F es grande. Pero Cómo de grande? Bajo las condiciones sobre las desviaciones ε ij (independencia, homocedasticidad, normalidad, tenemos que si H 0 es cierto el estadístico F sigue una distribución de Fisher con (I 1, n I grados de libertad. 6

7 Por tanto rechazamos H 0 si F > f 1 α (I 1,n I, ( donde α es el nivel (o tamaño del test y f(i 1,n I α el valor tal que P F > f 1 α (I 1,n I H 0 es cierto = α. Tabla ADEVA: Se resume la descomposición de la variabilidad de los datos en la tabla siguiente: Fuentes de Variaciones Entre niveles Interna o residual Suma de cuad. Gr. de lib. Varianzas F V E I 1 s 2 e = V E I 1 V NE n I s 2 R = V NE n I Total V T n 1 s 2 y = V T n 1 F = s2 e s 2 R Con los datos anteriores obtenemos: Fuentes de Variaciones Suma de cuad. Gr. de lib. Varianzas F Entre niveles Interna o residual Total Para α = 5%, consultando la tabla de la Fisher(2, 12, obtenemos f 0.05 (I 1,n I = 3.885, por tanto rechazamos H 0. 7

8 El p valor: Medida de la credibilidad de H 0, en nuestro ejemplo: p = P (F > F H Coeficiente de determinación: Una medida relativa de la variabilidad explicada por el modelo es el cociente: R = V E y por tanto, 0 R 1. V T Análisis de las diferencias entre medias Si la hipótesis de igualdad de medias (H 0 se rechaza, tiene interés estimar las diferencias entre las categorías.. Se puede construir un intervalo de confianza para la diferencia m i m j mediante la distribución ( de m i m j = y i y j. Tenemos que y i y j N (m i m j, σ 2 1 n i + 1 n j, por tanto: ( yi y j (mi m j ( t(n I s 2 1 R n i + 1 n j Por consiguiente, deducimos el intervalo de confianza 1 α de la diferencia (m i m j : [ ( (yi (n I 1 y j ± t α/2 s 2 R + 1 ] n i n j 1.2 Análisis con dos factores Un ejemplo Estudio de la cantidad de cerveza bebida (Y por los alumnos durante la fiesta de fin de año, en función del sexo y del curso. Las Preguntas: Los chicos beben mas que las chicas? Los alumnos de Economía y Derecho beben mas que los alumnos de Administración y Empresa? Existe una interacción entre sexo y curso? 8

9 Datos (n = 18 alumnos cantidad en litro. Chico (j = 1 Chica (j = 2 Derecho (i = Economía (i = Ad. & Emp. (i = Derecho (i = 1 Economía (i = 2 Ad. & Emp. (i = 3 Medias Chico (j = Chica (j = Medias Notaciones: Para i = 1,..., I, j = 1,..., J, k = 1,..., K (I = 3, J = 2, K = 3 : y ijk valor observado de Y del k esimo alumno del curso i y del sexo j, ; y 121 = 0.1. y ij media observada de Y en la categoría de los alumnos del curso i y del sexo j; y 12 = y i media observada de Y en la categoría de los alumnos del curso i ; y 3 = y j media observada de Y en la categoría de los alumnos del sexo j; y 2 = 0.53 y media global de Y ; y =

10 1.2.2 El Modelo Consideramos que cada dato observado y ijk es igual al valor medio en su categoría (m ij más una desviación aleatoria ε ijk : Para i = 1,..., I, j = 1,..., I y k = 1..., K, tenemos y ijk = m ij + ε ijk (Modelo 0 Supondremos que las desviaciones ε ijk = y ijk m ij son independientes y siguen una distribución normal N(0, σ 2. Por tanto tenemos que las observaciones y ijk son independientes e y ijk N(m ij, σ 2. Este modelo es útil para describir los datos pero no permite contestar a nuestro problema: Varios modelos: Suponemos que Cómo varia m ij con i y j? y ijk = µ + α i + ε ijk (Modelo 1 donde m ij = µ + α i. Con el Modelo 1, estamos suponiendo que el factor Sexo no tiene un efecto sobre Y (no explica sus variaciones. Suponemos que y ijk = µ + β j + ε ijk (Modelo 2 donde m ij = µ + β j. Con el Modelo 2, estamos suponiendo que el factor Curso no tiene un efecto sobre Y. Ahora, suponemos el modelo aditivo siguiente y ijk = µ + α i + β j + ε ijk (Modelo 3 donde m ij = µ + α i + β j. Con el Modelo 3, estamos suponiendo que ambos factores, Sexo y Curso, tienen un efecto sobre Y. Pero, suponiendo que el efecto de un factor es constante en cualquier nivel del otro factor (El efecto del Sexo no cambia con el Curso y recíprocamente, el efecto del Curso no cambia con el Sexo. 10

11 Modelo con interacciones: Suponemos que y ijk = µ + α i + β j + γ ij + ε ijk (Modelo 4 donde m ij = µ + α i + β j + γ ij. Los términos de interacción γ ij se denotan también γ ij = (αβ ij Estimación de los parámetros del modelo Hay IJ (IJ = 6 en el ejemplo parámetros m ij que estimamos mediante el criterio de mínimos cuadrados : Para cada i, j m ij valor de m ij que mínimiza K (y ijk m ij 2, k=1 Obtenemos m ij = y ij. Los parámetros α i, β j y γ ij verifican las restricciones: I i=1 α i = 0. I i=1 γ ij = 0, para cada j. J j=1 β j = 0. J j=1 γ ij = 0, para cada i. Por tanto, el número de parámetros linealmente independientes es: }{{} 1 + (I 1 }{{} + (J 1 }{{} + (I 1(J 1 }{{} = }{{} IJ µ α i β j γ ij m ij Los estimadores de α i, β j y γ ij son: µ = y α i = y i y β j = y j y γ ij = y ij y i y j + y 11

12 Aplicación numérica: m ij Derecho (i = 1 Economía (i = 2 Ad. & Emp. (i = 3 Medias Chico (j = Chica (j = Medias Por tanto, tenemos que γ 11 = 0.32 γ 21 = 0.24 γ 31 = 0.08 β1 = 0.33 γ 12 = 0.32 γ 22 = 0.24 γ 32 = 0.08 β2 = 0.33 α 1 = 0.04 α 2 = 0.04 α 3 = 0.08 µ = 0.86 Propiedad de los estimadores: que ( m ij sigue una normal N ( µ sigue una normal N α i sigue una normal N m ij, σ2 K µ, σ2 n. (α i, (I 1σ2 n Bajo las hipótesis del modelo, tenemos.. β j sigue una normal N (β j, (J 1σ2 n γ ij sigue una normal N (γ ij, (I 1(J 1σ2 n Indicios de variabilidad variabilidad Deducimos la distribución de cada indicios de V E (α = JK I i=1 α2 i y bajo la hipótesis H 0 : {α i = 0, i}, V E (α/ σ 2 sigue un χ 2 (I 1. 12

13 V E (β = IK J j=1 β 2 i y bajo la hipótesis H 0 : { β j = 0, j }, V E (β/ σ 2 sigue un χ 2 (J 1. V E (γ = K I i=1 J j=1 γ2 ij y bajo la hipótesis H 0 : { γ ij = 0, i, j }, V E (γ/ σ 2 sigue un χ 2 ((I 1 (J 1. V NE = i,j,k e2 ijk, y V NE/ σ2 sigue un χ 2 (n IJ. V T = (y ijk y 2 i,j,k = V E(α + V E(β + V E(γ + V NE En el ejemplo, obtenemos que V E (α = gdl α = 2 V E (β = gdl β = 1 V E (γ = gdl γ = 2 V NE = gdl Residual = 12 Calculo de las varianzas Obtenemos las varianzas dividiendo cada indicio por el número de grados de libertad asociado: s 2 α = V E (α /(I 1 s 2 β = V E (β /(J 1 s 2 γ = V E (γ / [(I 1(J 1] s 2 R = V NE/(n IJ Contraste sobre los efectos Test de interacción Hay un riesgo de llegar a una conclusión falsa sobre la influencia de cada factor si existe interacción! Queremos contrastar las hipótesis H 0 : No { hay interacciones γij = 0, i, j } frente a H 1 : { Hay interacciones i, j, γij 0 } 13

14 Bajo H 0, el estadístico F = s2 γ s 2 R sigue una distribución de Fisher F ((I 1(J 1, n IJ. Por tanto, para un riesgo de tipo I α, rechazaremos H 0 si F > f 1 α (I 1(J 1,n IJ. Si la interaction no es significativa (el test acepta H 0 podemos contrastar los efectos de cada factor. Si en cambio la interaction es significativa (el test rechaza H 0 tenemos que contentarnos con análizar las diferencias en cada categoria. Test sobre cada factor Basamos el test del contraste de la hipótesis H 0 : {α i = 0, i} frente a su alternativa, sobre el estadístico F = s2 α que sigue s 2 R bajo H 0, una Fisher F ((I 1, n IJ. Para un riesgo I α, la regla de decisión será entonces: Rechazar H 0 si F > f 1 α (I 1,n IJ El test del contraste de la hipótesis H 0 : { β j = 0, j } frente a su alternativa, está basado sobre el estadístico F = s2 β que sigue bajo H s 2 0, una Fisher R F ((J 1, n IJ. Para un riesgo I α, la regla de decisión será entonces: Rechazar H 0 si F > f 1 α (J 1,n IJ Resume de la descom- Tabla ADEVA (dos factores con interacción: posición de la variabilidad: Fuentes de Variaciones de cuad. gdl Varianzas F Efecto α V E(α I-1 s 2 α = V E(α I 1 Efecto β V E(β J-1 s 2 β = V E(β J 1 Efecto de V E(γ (I-1(J-1 s 2 γ = V E(γ (I 1(J 1 interacción Interna o residual V NE n-ij s 2 R = V NE n IJ Total V T n-1 s 2 y = V T n 1 14 F = s2 α s 2 R F = s2 β s 2 R F = s2 γ s 2 R

15 p-valor: p = P (F > F H 0 Cuanto más pequeño sea p, menor será la credibilidad de H 0. Comentario: gdl R = n (número total de parámetros. Tabla ADEVA (dos factores sin interacción: Si aceptamos la hipótesis H 0 : No hay interacciones, podemos volver a estimar los parámetros utilizando el modelo (3. Se obtiene la tabla ADEVA: Fuentes de Variaciones de cuad. gdl Varianzas F Efecto α V E(α I-1 s 2 α = V E(α I 1 Efecto β V E(β J-1 s 2 β = V E(β J 1 Interna o residual V NE n-(i+j+1 s 2 R = V NE n-(i+j+1 Total V T n-1 s 2 y = V T n 1 F = s2 α s 2 R F = s2 β s 2 R Aquí gdl R = n (I + J + 1. Por tanto, los tests para contrastar los efectos de cada factor son: Rechazamos H 0 : {α i = 0, i} si F = s2 α > f 1 α s 2 (I 1,n (I+J+1 R Rechazamos H 0 : { β j = 0, j } si F = s2 β s 2 R > f 1 α (J 1,n (I+J Intervalos de confianza (I.C. IC para la varianza residual Utilizamos que V NE σ 2 χ 2 (gdl R. donde por ejemplo gdl R = n IJ en el modelo 4. Podemos hallar a α y b α tal que P (χ 2(gdlR a α = P (χ 2(gdlR b α = α/2. 15

16 El I.C. con nivel α para σ 2 será entonces: VNE b α σ 2 VNE a α I.C. para las medias Utilizamos que T = y ij m ij s 2 R /K t (gdl R ( Utilizando el cuantil t (gdl R α/2 de la distribución de Student: P T t (gdl R α/2 = α/2, obtenemos el I.C. con nivel α para la media m ij : y ij + t (gdl R α/2 s 2 R /K m ij y ij t (gdl R α/2 s 2 R /K Contraste múltiples: método de Bonferroni Suponemos que I = 3 y queremos hacer los tres contrastes siguiente sobre las medias m i2 (cantidad media de cerveza bebida por las chicas del curso i : H 1 0 : m 12 = m 22 frente a H 1 1 : m 12 m 22 H 2 0 : m 12 = m 32 frente a H 2 1 : m 12 m 32 H 3 0 : m 22 = m 32 frente a H 3 1 : m 22 m 32 Para cada uno de esos contrastes, construimos un test con nivel α = 5% (ver sección Análisis de las diferencias entre medias. Para r = 1, 2, 3, Sea C r el suceso Rechazar H r 0 cuando H 0 es cierto, por construcción del test, tenemos: P (C r = α Por tanto, la probabilidad de que se acepte conjuntamente la tres hipótesis cuando H 0 es cierto será (caso independiente: P ( C 1 C 2 C 3 = P (C 1 P (C 2 P (C 3 = (1 α 3 = ! 16

17 Método de Bonferoni: Denotamos C el suceso Rechazar al menos una hipótesis nula H0 r cuando H 0 es cierto. Entonces C será la unión: C = C 1 C 2 C 3 Puesto que las regiones de rechazo C r no son necesariamente incompatibles, tenemos que α T = P (C = P (C 1 C 2 C 3 P (C 1 + P (C 2 + P (C 3 = 3α Por tanto, si se pretende garantizar un riesgo α T = 5%, tendremos que fijar α tal que α = α T /3. De manera general, si hacemos un contraste múltiple con p contrastes tendremos que elegir α = α T p Comentario: Este método es muy conservador! : α puede ser muy pequeño. 1.3 Modelos en Bloques Objetivo: Reducir la varianza residual para mejorar la visibilidad de los efectos de los factores de interés, introduciendo un factor cuyo efecto sobre la variable Y no es de interés. Llamamos este tipo de factor: variable bloque. Comentarios: En el modelo, se supone que no hay interacción entre las variables bloques y los factores.de interés Ejemplo: Supongamos que el importe de la factura de telefono mensual (en Euros utilizando dos operadoras distintas (O1 y O2. Disponemos de los datos siguientes: O1 O2 120; 230; 45; 65; 200; ; 105; 40; 180; 155; 75 La varianza residual es tán grande (σ , que será muy dificil rechazar la hipótesis H 0 : m 1 = m 2 cuando es falsa. De hecho, obtenemos la tabla 17

18 ADEVA siguiente: Fuentes de Variaciones Suma de cuad. Gr. de lib. Varianzas F p Operadora Residual Para reducir la varianza residual, introducimos la variable bloque taza diaria de llamadas con 3 niveles: baja,media,alta. Obtenemos la tabla de datos siguiente donde las diferencias entre operadoras son más visibles: O1 O2 Baja 45; 65 20; 40 Media 100; ; 105 Alta 200; ; 180 Vemos en la tabla ADEVA siguiente, que el factor Operadora es ahora significativo Fuentes de Variaciones Suma de cuad. Gr. de lib. Varianzas F p Operadora Taza Residual Modelos con efectos aleatorios. En los modelos anteriores con uno o dos factores, los efectos fueron prefijados. Si queremos alcanzar un grado de generalidad superior para un cierto factor tenemos que suponer que sus efectos son aleatorios. Así en el estudio sobre la cantidad de cerveza consumida por los alumnos, podemos considerar que los cursos han sido elegidos al azar. Con este tipo de diseño podremos extender nuestra interpretación a cualquier curso. La formulación del modelo es idéntica, pero en el modelo de efectos fijos, estimamos medias, y en el de efectos aleatorios, varianzas. En el primero, los efectos α i, β j, γ ij..., etc representan la respuesta media, y son parámetros fijos a estimar; en el de efectos aleatorios, son variables aleatorias normales independientes de media cero y varianza σ 2 α, σ 2 β, σ2 γ, siendo estas varianzas el parámetro a estimar. 18

19 Efectos fijos Efectos aleatorios Modelo y ij = µ + α i + ε ij αi = 0 y ij = µ + α i + ε ij α i N (0, σ 2 α Los efectos α i son parámetros desconocidos variables aleatorias Los efectos en la respuesta influyen media en la varianza Se pretende estimar los α i Estimar σ 2 α se fijan se selecionan Los niveles α i arbitrariamente al azar La hipotesis H 0 es α i = 0 σ 2 α = 0 La descomposición de la variabilidad en fuentes de variaciones y la tabla ADEVA se realiza igual en ambos tipos de modelos y, si no existe interacción, los tests de que un factor no influye son idénticos.. ADEVA Fuente cuadrados gdl varianza F P Sexo Curso Curso*Sexo residual Test de interacción: H 0 : σ 2 Curso Sexo = 0 El estadístico utilizado para el test es el mismo que en el modelo con efectos fijos. Por tanto, F = = conviene para contrastar la interacción Dos casos: La interacción es significativa (es el caso aquí P < 0.05 y seguimos la análisis La interacción no es significativa, entonces quitamos la interacción y volvemos a estimar los parámetros. 19

20 Test del efecto Curso: H 0 : σ 2 Curso = 0 Igual que en el modelo con efectos fijos, calculamos el F correspondiente. En nuestro ejemplo, este efecto no es significativo. Test del efecto sexo: H 0 : β 1 = β 2 El estadístico utilizado aquí no es el bueno! Dos casos: - la interacción es significativa: F = s 2 Sexo s 2 Curso Sexo que comparamos con f 1 α (J 1,(I 1(J 1. - la interacción no es significativa, utilizamos el F habitual en el modelo estimado sin interacción. Comparación de modelos con interacciones Esperanza var. Fuente S.C. gdl Varianza α, β fijos Factor α VE(α I 1 s 2 α σ 2 + JK i α2 i I 1 Factor β VE(β J 1 s 2 β σ 2 + IK j β2 j J 1 factor γ VE(γ (I 1(J 1 s 2 γ σ 2 + K i,j γ2 ij (I 1(J 1 residual VNE n IJ s 2 R σ 2 Total VT n 1 Esperanza α, β aleat. σ 2 + JKσ 2 α + Kσ 2 γ σ 2 + IKσ 2 β + Kσ2 γ Esperanza α aleat, β fijo σ 2 + JKσ 2 α σ 2 + IKσ 2 β + Kσ2 γ σ 2 + Kσ 2 γ σ 2 + Kσ 2 γ σ 2 σ 2 20

21 1.5 Dos ejemplos Análisis con un solo factor (Alturas de árboles ni ni Bosque 1 Bosque 2 Bosque n i j=1 y ij j=1 y2 ij Donde y ij es la altura del j esimo árbol en el i esimo bosque. Sea m i la altura media en el i esimo bosque. Preguntas: 1. La altura media de un árbol depende del bosque al cual pertenece? Contrastar la hipótesis de igualdad de medias: H 0 : m 1 = m 2 = m 3 con un nivel de significación igual al 5%. 2. Dar un intervalo de confianza del 99% para la altura media en cada bosque. Soluciones: 1. El modelo que aquí consideramos es: para i = 1,..., 3 y j = 1,..., n i y ij = m i + ε ij = µ + α i + ε ij, 21

22 donde ε ij N(0, σ 2. (a Validación del modelo: Verificamos que la hipótesis de homocedasticidad (la varianza residual es constante en cada bosque es razonable. Sea σ 2 i = 1 n i (y ij y n i 2 i = j=1 n i yij 2 n i j=1 ( 1 y 2 i es el estimador de la varianza de las alturas en i esimo bosque. Obtenemos que σ 2 1 = 1.24, σ 2 2 = 1.02, σ 2 3 = Estas varianzas son semejantes, aceptamos la hipótesis de homocedasticidad: σ 2 1 = σ 2 2 = σ 2 3 = σ 2. (b Estimación de los parámetros del modelo: Obtenemos que µ = 25.35, α 1 = 0.91, α 2 = 0.56, α 3 = 1.97, y la restricción 3 i=1 n i α i = 0 se cumple. (c Calculo de los indicios de variabilidad: Tenemos que V E = = 3 n i (y i y 2 i=1 3 n i α 2 i i=1 = y donde V T = = V NE = V T V E 3 n i (y ij y 2 i=1 j=1 ( 3 n i i=1 = j=1 y 2 ij ny 2 22

23 Deducimos que V NE = (d Tabla Adeva Fuentes de Variaciones de cuad.. gdl Varianzas F Factor α s 2 α = F = Residual s 2 R = 1.32 Total Puesto que f 95% 2,34 = 4.1, tenemos que F > f 95% 2,34, por tanto rechazamos H 0 para un nivel α = 5%. 2. Sabemos que para cada i = 1, 2, 3, y i sigue una normal N(m i, σ 2 /n i. Por tanto, el estadístico T = y i m i s 2 R /n i sigue una distribución de Student t(n I. Consultando la tabla de la Student, obtenemos que t , deducimos que: Con probabilidad 99%, m 1 [25.39, 27.12] Con probabilidad 99%, m 2 [25.07, 26.74] Con probabilidad 99%, m 3 [22.39, 24.37] Observamos que la tercera media es significativamente diferente de las demás (nivel de significación α 3%, ver metódo de Bonferoni Análisis con dos factores Modelo sin replicación (K = 1 Preguntas: 1 a clase 2 a clase 3 a clase Hombres Mujeres Proporción de supervivientes de la catástrofe del Titanic 23

24 1. Contrastar el efecto del factor Sexo y del factor Clase (nivel α = 10%, suponiendo que no hay interacción 2. Dar un intervalo de confianza del 95% para la varianza residual. Soluciones: 1. El modelo es para i = 1,..., 3, j = 1,..., 2 y ij = m ij + ε ij = µ + α i + β j + ε ij donde α es el factor clase y β el factor sexo. ADEVA Obtenemos la tabla Fuentes de Variaciones de cuad. gdl. Varianzas F Factor α s 2 α = F = Factor β s 2 β = F = Residual s 2 R = Total tenemos que f 90% 2,2 = 9 y f 90% 1,2 = por tanto aceptamos H 0 : α i = 0 y rechazamos H 0 : β j = Puesto que χ 2 2,0.025 = y χ 2 2,0.975 = deducimos que el intervalo de confianza del 95% para σ 2 es [0.0075, 1.09]. Modelo con replicación (K > 1 Hombres Mujeres Africa oriental Europa Asia Central Esperanza de vida 24

25 Preguntas: 1. Contrastar la interacción entre el factor sexo y continente (nivel α = 10%. 2. Dar un intervalo de confianza del 95% para la varianza residual. Solución 1. El modelo es para i = 1,..., 3, j = 1,..., 2 y ij = m ij + ε ij = µ + α i + β j + γ ij + ε ij donde α es el factor continente, β el factor sexo, y γ el factor de interacción (a Estimación m ij Africa oriental Europa Asia Central Hombres Mujeres (b Obtenemos la tabla ADEVA Fuentes de Variaciones de cuad. gdl. Varianzas F Factor α s 2 α = F = Factor β s 2 β = F = 1.85 Factor γ s 2 γ = F = 1.19 Residual s 2 R = Total tenemos que f 95% 2,12 = 3.88 y f 95% 1,12 = 4.74 por tanto aceptamos H 0 : γ ij = 0: el factor de interacción no es significativo. Luego, aceptamos H 0 : β j = 0 y rechazamos H 0 : α i = 0, o sea, el factor sexo no tiene un efecto significativo y en cambio, el factor continente si. 25

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado. NORMAS El examen consta de dos partes: 0.0.1. Diez Cuestiones: ( tiempo: 60 minutos) No se permite ningún tipo de material (libros, apuntes, calculadoras,...). No se permite abandonar el aula una vez repartido

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis Facultad de Ciencias Sociales, UdelaR Índice 1. Introducción: hipótesis estadística, tipos de hipótesis, prueba de hipótesis 2.

Más detalles

Tema 8: Contraste de hipótesis

Tema 8: Contraste de hipótesis Tema 8: Contraste de hipótesis 1 En este tema: Conceptos fundamentales: hipótesis nula y alternativa, nivel de significación, error de tipo I y tipo II, p-valor. Contraste de hipótesis e IC. Contraste

Más detalles

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para VII. Pruebas de Hipótesis VII. Concepto de contraste de hipótesis Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad

Más detalles

Teorema Central del Límite (1)

Teorema Central del Límite (1) Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico

Más detalles

Tema 4: Probabilidad y Teoría de Muestras

Tema 4: Probabilidad y Teoría de Muestras Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

Diseño de Bloques al azar. Diseño de experimentos p. 1/25

Diseño de Bloques al azar. Diseño de experimentos p. 1/25 Diseño de Bloques al azar Diseño de experimentos p. 1/25 Introducción En cualquier experimento, la variabilidad proveniente de un factor de ruido puede afectar los resultados. Un factor de ruido es un

Más detalles

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith) INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que

Más detalles

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición... Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo Estructura de este tema Tema 3 Contrastes de hipótesis José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Qué es un contraste de hipótesis? Elementos de un contraste: hipótesis,

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Abordaremos en este capítulo el modelo de regresión lineal múltiple, una vez que la mayor parte de las

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre

Más detalles

Tema 7: Estadística y probabilidad

Tema 7: Estadística y probabilidad Tema 7: Estadística y probabilidad En este tema revisaremos: 1. Representación de datos e interpretación de gráficas. 2. Estadística descriptiva. 3. Probabilidad elemental. Representaciones de datos Cuatro

Más detalles

Pruebas de Hipótesis Multiples

Pruebas de Hipótesis Multiples Pruebas de Hipótesis Multiples Cuando queremos hacer comparaciones de mas de dos poblaciones, una alternativa es comparar todos los grupos a la vez con el método de Análisis de Varianza (ANOVA) H o : µ

Más detalles

Tema 5. Muestreo y distribuciones muestrales

Tema 5. Muestreo y distribuciones muestrales 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución

Más detalles

Tema 9: Contraste de hipótesis.

Tema 9: Contraste de hipótesis. Estadística 84 Tema 9: Contraste de hipótesis. 9.1 Introducción. El objetivo de este tema es proporcionar métodos que permiten decidir si una hipótesis estadística debe o no ser rechazada, en base a los

Más detalles

TEMA 3: Contrastes de Hipótesis en el MRL

TEMA 3: Contrastes de Hipótesis en el MRL TEMA 3: Contrastes de Hipótesis en el MRL Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 3: Contrastes de Hipótesis Curso 2011-12

Más detalles

Tema 1. Modelo de diseño de experimentos (un factor)

Tema 1. Modelo de diseño de experimentos (un factor) Tema 1. Modelo de diseño de experimentos (un factor) Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 1: Diseño de experimentos (un factor) 1 Introducción El objetivo del Análisis de la Varianza

Más detalles

INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS

INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS Autor: Clara Laguna 6.1 INTRODUCCIÓN En el tema anterior estudiamos cómo a partir de una muestra podemos obtener una estimación puntual o bien establecer

Más detalles

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS 1. HIPÓTESIS ALTERNA E HIPÓTESIS NULA Para someter a contraste una hipótesis es necesario formular las Hipótesis Alternas ( H1 ) y formular

Más detalles

Problemas Prueba de significación de la hipótesis nula Vicente Manzano-Arrondo, 2013

Problemas Prueba de significación de la hipótesis nula Vicente Manzano-Arrondo, 2013 Problemas Prueba de significación de la hipótesis nula Vicente Manzano-Arrondo, 2013 Ejercicios resueltos En los dos casos que siguen resuelven cada decisión estadística mediante tres procedimientos: intervalo

Más detalles

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado

Más detalles

478 Índice alfabético

478 Índice alfabético Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión

Más detalles

INFERENCIA ESTADISTICA

INFERENCIA ESTADISTICA 1 INFERENCIA ESTADISTICA Es una rama de la Estadística que se ocupa de los procedimientos que nos permiten analizar y extraer conclusiones de una población a partir de los datos de una muestra aleatoria,

Más detalles

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS 1 POR QUÉ SE LLAMAN CONTRASTES NO PARAMÉTRICOS? A diferencia de lo que ocurría en la inferencia paramétrica, ahora, el desconocimiento de la población que vamos

Más detalles

Proyecto Tema 8: Tests de hipótesis. Resumen teórico

Proyecto  Tema 8: Tests de hipótesis. Resumen teórico Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 8: Tests de hipótesis Resumen teórico Tests de hipótesis Concepto de test de hipótesis Un test de hipótesis (o

Más detalles

Contrastes de hipótesis. 1: Ideas generales

Contrastes de hipótesis. 1: Ideas generales Contrastes de hipótesis 1: Ideas generales 1 Inferencia Estadística paramétrica población Muestra de individuos Técnicas de muestreo X 1 X 2 X 3.. X n Inferencia Estadística: métodos y procedimientos que

Más detalles

Conceptos del contraste de hipótesis

Conceptos del contraste de hipótesis Análisis de datos y gestión veterinaria Contraste de hipótesis Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, 14 de Diciembre de 211 Conceptos del contraste de

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.

Más detalles

Contrastes de hipótesis estadísticas. Contrastes paramétricos

Contrastes de hipótesis estadísticas. Contrastes paramétricos Índice 7 Contrastes de hipótesis estadísticas. Contrastes paramétricos 7.1 7.1 Introducción.......................................... 7.1 7.2 Conceptos básicos...................................... 7.2

Más detalles

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la estimación mediante Intervalos de Confianza, que es otro de los tres grandes

Más detalles

Análisis de la varianza ANOVA

Análisis de la varianza ANOVA Estadística Básica. Mayo 2004 1 Análisis de la varianza ANOVA Francisco Montes Departament d Estadística i I. O. Universitat de València http://www.uv.es/~montes Estadística Básica. Mayo 2004 2 Comparación

Más detalles

Pruebas de Hipótesis. Diseño Estadístico y Herramientas para la Calidad. Pruebas de Hipótesis. Hipótesis

Pruebas de Hipótesis. Diseño Estadístico y Herramientas para la Calidad. Pruebas de Hipótesis. Hipótesis Diseño Estadístico y Herramientas para la Calidad Pruebas de Hipótesis Expositor: Dr. Juan José Flores Romero juanf@umich.mx http://lsc.fie.umich.mx/~juan M. en Calidad Total y Competitividad Pruebas de

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

Tema 7 Intervalos de confianza Hugo S. Salinas

Tema 7 Intervalos de confianza Hugo S. Salinas Intervalos de confianza Hugo S. Salinas 1 Introducción Hemos definido la inferencia estadística como un proceso que usa información proveniente de la muestra para generalizar y tomar decisiones acerca

Más detalles

Tema 5: Introducción a la inferencia estadística

Tema 5: Introducción a la inferencia estadística Tema 5: Introducción a la inferencia estadística 1. Planteamiento y objetivos 2. Estadísticos y distribución muestral 3. Estimadores puntuales 4. Estimadores por intervalos 5. Contrastes de hipótesis Lecturas

Más detalles

Determinación del tamaño de muestra (para una sola muestra)

Determinación del tamaño de muestra (para una sola muestra) STATGRAPHICS Rev. 4/5/007 Determinación del tamaño de muestra (para una sola muestra) Este procedimiento determina un tamaño de muestra adecuado para la estimación o la prueba de hipótesis con respecto

Más detalles

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016 Pruebas de Hipótesis-ANOVA Curso de Seminario de Tesis Profesor Q Jose Avila Parco Año 2016 Análisis de la Varianza de un factor (ANOVA) El análisis de la varianza (ANOVA) es una técnica estadística paramétrica

Más detalles

Esquema (1) Análisis de la Varianza y de la Covarianza. ANOVA y ANCOVA. ANOVA y ANCOVA 1. Análisis de la Varianza de 1 Factor

Esquema (1) Análisis de la Varianza y de la Covarianza. ANOVA y ANCOVA. ANOVA y ANCOVA 1. Análisis de la Varianza de 1 Factor Esquema (1) Análisis de la arianza y de la Covarianza ANOA y ANCOA 1. (Muestras independientes). () 3. Análisis de la arianza de Factores 4. Análisis de la Covarianza 5. Análisis con más de Factores J.F.

Más detalles

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas.

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas. Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas. ---Intervalo de probabilidad (IP) Permite predecir el comportamiento de las muestras. Si de una población se sacan

Más detalles

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste 1 Contraste de hipótesis Tema 3 1. Pasos del contraste de hipótesis 1.1 Hipótesis estadísticas: nula y alternativa 1.2 Supuestos 1.3 Estadístico de contraste 1.4 Regla de decisión: zona de aceptación y

Más detalles

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------

Más detalles

ECONOMETRÍA I. Tema 5: Análisis de regresión múltiple con información cualitativa

ECONOMETRÍA I. Tema 5: Análisis de regresión múltiple con información cualitativa ECONOMETRÍA I Tema 5: Análisis de regresión múltiple con información cualitativa Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía Alexandra Soberon (UC) ECONOMETRÍA

Más detalles

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.

Más detalles

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más

Más detalles

ANEXO I. ANÁLISIS DE LA VARIANZA.

ANEXO I. ANÁLISIS DE LA VARIANZA. ANEXO I. ANÁLISIS DE LA VARIANZA. El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más medias. Cuando se quiere comparar más de dos medias es incorrecto utilizar

Más detalles

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 ) Test de Hipótesis II Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ conocida: Suponga que X, X,, X n, es una m.a.(n) desde N( µ, σ ) Estadística de Prueba X - μ Z 0 = σ / n ~ N(0,)

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción

Más detalles

Resumen teórico de los principales conceptos estadísticos

Resumen teórico de los principales conceptos estadísticos Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Muestreo aleatorio simple Resumen teórico Resumen teórico de los principales conceptos estadísticos Muestreo aleatorio

Más detalles

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos

Más detalles

Tema I. Introducción. Ciro el Grande ( A.C.)

Tema I. Introducción. Ciro el Grande ( A.C.) 1.1. La ciencia de la estadística:. El origen de la estadística:. Ciencia descriptiva. Evaluación de juegos de azar Ciro el Grande (560-530 A.C.) Si tengo 1 As y 2 reyes, que descarte es mas conveniente

Más detalles

Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México

Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México SECCIÓN DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México Presentan: Dr. Miguel

Más detalles

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia

Más detalles

Contrastes de hipótesis paramétricos

Contrastes de hipótesis paramétricos Estadística II Universidad de Salamanca Curso 2011/2012 Outline Introducción 1 Introducción 2 Contraste de Neyman-Pearson Sea X f X (x, θ). Desonocemos θ y queremos saber que valor toma este parámetro,

Más detalles

4.1 Análisis bivariado de asociaciones

4.1 Análisis bivariado de asociaciones 4.1 Análisis bivariado de asociaciones Los gerentes posiblemente estén interesados en el grado de asociación entre dos variables Las técnicas estadísticas adecuadas para realizar este tipo de análisis

Más detalles

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7) TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de

Más detalles

a. Poisson: los totales marginales y el total muestral varían libremente.

a. Poisson: los totales marginales y el total muestral varían libremente. TEMA 2º: TABLAS DE CONTINGENCIA BIDIMENSIONALES 1º Distribución de frecuencias observadas El único aspecto cuantificable en el análisis cualitativo es el número de individuos que presenta una combinación

Más detalles

Contrastes de Hipótesis paramétricos y no-paramétricos.

Contrastes de Hipótesis paramétricos y no-paramétricos. Capítulo 1 Contrastes de Hiptesis paramétricos y no-paramétricos. Estadística Inductiva o Inferencia Estadística: Conjunto de métodos que se fundamentan en la Teoría de la Probabilidad y que tienen por

Más detalles

Apéndice sobre ecuaciones diferenciales lineales

Apéndice sobre ecuaciones diferenciales lineales Apéndice sobre ecuaciones diferenciales lineales Juan-Miguel Gracia 10 de febrero de 2008 Índice 2 Determinante wronskiano. Wronskiano de f 1 (t), f 2 (t),..., f n (t). Derivada de un determinante de funciones.

Más detalles

EJERCICIOS DE SELECTIVIDAD

EJERCICIOS DE SELECTIVIDAD EJERCICIOS DE SELECTIVIDAD INFERENCIA 1998 JUNIO OPCIÓN A Un fabricante de electrodomésticos sabe que la vida media de éstos sigue una distribución normal con media μ = 100 meses y desviación típica σ

Más detalles

en Enfermería del Trabajo

en Enfermería del Trabajo revista noviembre:maquetación 1 16/11/2011 6:27 Página 30. 203 Metodología de la investigación Metodología de Investigación en Enfermería del Trabajo Autor Romero Saldaña M Enfermero Especialista en Enfermería

Más detalles

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA 3.- INTERVALO DE CONFIANZA PARA LA VARIANZA 4.- INTERVALO DE

Más detalles

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN En este artículo, se trata de explicar una metodología estadística sencilla y sobre todo práctica, para la estimación del tamaño de muestra

Más detalles

CONTRASTE SOBRE UN COEFICIENTE DE LA REGRESIÓN

CONTRASTE SOBRE UN COEFICIENTE DE LA REGRESIÓN Modelo: Y =! 1 +! 2 X + u Hipótesis nula: Hipótesis alternativa H 1 :!!! 2 2 Ejemplo de modelo: p =! 1 +! 2 w + u Hipótesis nula: Hipótesis alternativa: H :!! 1 2 1. Como ilustración, consideremos un modelo

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

MODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo

MODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo José María Cara Carmona Adrián López Ibáñez MODELO ECONOMÉTRICO Explicación del desempleo Desarrollaremos un modelo econométrico para intentar predecir el desempleo. Trataremos los diversos problemas que

Más detalles

Máster en comunicaciones. Clase 2. Modelos predictores.

Máster en comunicaciones. Clase 2. Modelos predictores. Máster en comunicaciones. Clase 2. Modelos predictores. 1. Introducción Uno de los cometidos más importantes de la estadística es la explotación de los datos observados de una o más características de

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

APUNTES DE QUIMIOMETRIA REGRESIO LINEAL

APUNTES DE QUIMIOMETRIA REGRESIO LINEAL REGRESIO LINEAL APUNTES DE QUIMIOMETRIA Datos anómalos y levas en las rectas de calibrado. Regresión robusta Mínima mediana de cuadrados Recta de calibrado mediante mínimos cuadrados. Hipótesis básicas

Más detalles

Econometría II Grado en finanzas y contabilidad

Econometría II Grado en finanzas y contabilidad Econometría II Grado en finanzas y contabilidad Variables aleatorias y procesos estocásticos. La FAC y el correlograma Profesora: Dolores García Martos E-mail:mdgmarto@est-econ.uc3m.es Este documento es

Más detalles

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción Curso de Estadística Aplicada a las Ciencias Sociales Tema 12. Contraste de (Cap. 22 del libro) Tema 12. Contraste de 1. Tipos de 2. La nula y la Ejercicios Tema 12, Contraste de 2 En muchas investigaciones

Más detalles

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24 Comenzado el lunes, 25 de marzo de 2013, 17:24 Estado Finalizado Finalizado en sábado, 30 de marzo de 2013, 17:10 Tiempo empleado 4 días 23 horas Puntos 50,00/50,00 Calificación 10,00 de un máximo de 10,00

Más detalles

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS Práctica. Intervalos de confianza 1 Práctica ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS Objetivos: Ilustrar el grado de fiabilidad de un intervalo de confianza cuando se utiliza

Más detalles

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema: Modelos de probabilidad Modelos de probabilidad Distribución de Bernoulli Distribución Binomial Distribución de Poisson Distribución Exponencial Objetivos del tema: Al final del tema el alumno será capaz

Más detalles

Unidad IV: Distribuciones muestrales

Unidad IV: Distribuciones muestrales Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia

Más detalles

Distribución Chi (o Ji) cuadrada (χ( 2 )

Distribución Chi (o Ji) cuadrada (χ( 2 ) Distribución Chi (o Ji) cuadrada (χ( 2 ) PEARSON, KARL. On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably

Más detalles

Contraste de hipótesis paramétricas

Contraste de hipótesis paramétricas Contraste de hipótesis paramétricas Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Proceso de la investigación estadística Etapas PROBLEMA HIPÓTESIS DISEÑO RECOLECCIÓN

Más detalles

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords A. PRUEBAS DE BONDAD DE AJUSTE: Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords B.TABLAS DE CONTINGENCIA Marta Alperin Prosora Adjunta de Estadística alperin@fcnym.unlp.edu.ar http://www.fcnym.unlp.edu.ar/catedras/estadistica

Más detalles

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN INTERVALO DE CONFIANZA PARA LA PROPORCIÓN Si deseamos estimar la proporción p con que una determinada característica se da en una población, a partir de la proporción p' observada en una muestra de tamaño

Más detalles

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada. ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos

Más detalles

ÍNDICE INTRODUCCIÓN... 21

ÍNDICE INTRODUCCIÓN... 21 INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...

Más detalles

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] = El peso en kg de los estudiantes universitarios de una gran ciudad se supone aproximado por una distribución normal con media 60kg y desviación típica 8kg. Se toman 100 muestras aleatorias simples de 64

Más detalles

3. Correlación. Introducción. Diagrama de dispersión

3. Correlación. Introducción. Diagrama de dispersión 1 3. Correlación Introducción En los negocios, no todo es el producto, pueden existir factores relacionados o externos que modifiquen cómo se distribuye un producto. De igual manera, la estadística no

Más detalles

Estimación del Probit Ordinal y del Logit Multinomial

Estimación del Probit Ordinal y del Logit Multinomial Estimación del Probit Ordinal y del Logit Multinomial Microeconomía Cuantitativa R. Mora Departmento de Economía Universidad Carlos III de Madrid Esquema Introducción 1 Introducción 2 3 Introducción El

Más detalles

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs

Más detalles

Física Cuántica Partículas idénticas.

Física Cuántica Partículas idénticas. Física Cuántica Partículas idénticas. José Manuel López y Luis Enrique González Universidad de Valladolid Curso 2004-2005 p. 1/18 Partículas idénticas Qué son varias partículas idénticas? Las que tienen

Más detalles

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis Matemáticas 2.º Bachillerato Intervalos de confianza. Contraste de hipótesis Depto. Matemáticas IES Elaios Tema: Estadística Inferencial 1. MUESTREO ALEATORIO Presentación elaborada por el profesor José

Más detalles

Tercera práctica de REGRESIÓN.

Tercera práctica de REGRESIÓN. Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión

Más detalles

PATRONES DE DISTRIBUCIÓN ESPACIAL

PATRONES DE DISTRIBUCIÓN ESPACIAL PATRONES DE DISTRIBUCIÓN ESPACIAL Tipos de arreglos espaciales Al azar Regular o Uniforme Agrupada Hipótesis Ecológicas Disposición al Azar Todos los puntos en el espacio tienen la misma posibilidad de

Más detalles

Intervalos de confianza y contrastes de hipótesis. Intervalo de confianza de la media.

Intervalos de confianza y contrastes de hipótesis. Intervalo de confianza de la media. R PRÁCTICA IV Intervalos de confianza y contrastes de hipótesis Sección IV.1 Intervalo de confianza de la media. 44. Cargar (abrir) el conjunto de Datos Pulso.rda. Se pide: a) Calcular el de confianza

Más detalles

Fundamentos de Estadística

Fundamentos de Estadística Fundamentos de Estadística Introducción a la Estadística Prof. Dr. Eduardo Valenzuela Domínguez eduardo.valenzuela@usm.cl Universidad Técnica Federico Santa María Dr. Eduardo Valenzuela D.; MEE 2005 p.

Más detalles

Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS.

Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS. Estadística Tema 4 Curso /7 Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS. Objetivos Conceptos: Conocer los siguientes modelos discretos de probabilidad: uniforme, binomial, geométrico y Poisson. De cada

Más detalles

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo... CONTENIDO Prólogo a la 3. a edición en español ampliada.................................. Prólogo.................................................................. vii xvii 1. Métodos descriptivos................................................

Más detalles

Espacios Vectoriales. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21

Espacios Vectoriales. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21 Espacios Vectoriales AMD Grado en Ingeniería Informática AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21 Objetivos Al finalizar este tema tendrás que: Saber si unos vectores son independientes.

Más detalles