Modelos lineales. Tema 2: Inferencia en el modelo de regresión lineal simple. 6 de febrero de Carmen Armero

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Modelos lineales. Tema 2: Inferencia en el modelo de regresión lineal simple. 6 de febrero de Carmen Armero"

Transcripción

1 Carmen Armero 6 de febrero de 2012

2 Introducción Distribuciones en el muestreo Intervalos de confianza Contrastes de hipótesis

3 El modelo de regresión lineal simple El modelo de regresión lineal simple para una muestra de datos emparejados {(X i, Y i ), i = 1,..., n} es Y i = β 0 + β 1 X i + ɛ i, i = 1,..., n siendo: Y i la variable respuesta correspondiente al elemento i de la muestra (Y i es una variable aleatoria). X i el valor de la variable predictora correspondiente al elemento i de la muestra (a X i no se le considera variable aleatoria). β 0 y β 1 los coeficientes de la recta de regresión (parámetros desconocidos). ɛ i, i = 1,..., n, los errores aleatorios que son variables aleatorias i.i.d. según N(0, σ 2 ), siendo σ 2 la varianza del modelo (parámetro desconocido).

4 Distribuciones en el muestreo Intervalos de confianza Contrastes de hipótesis Distribución en el muestreo del estimador de β 1 Estimador de β 1, n i=1 b 1 = (X i X )(Y i Ȳ ) n i=1 n i=1 (X i X ) 2 = X i Y i n X Ȳ n i=1 X i 2 n X 2 La distribución en el muestreo de b 1 es la distribución de probabilidad de los diferentes valores de b 1 que podríamos obtener si repitiéramos y repitiéramos el experimento considerando siempre los mismos niveles de la variable predictora. La distribución en el muestreo de b 1 es normal con media y varianza: Estimador de la varianza σ 2 b 1, E(b 1 ) = β 1 σ 2 b 1 = σ 2 / (X i X ) 2. s 2 b 1 = s 2 / (X i X ) 2 siendo s 2 el estimador de la varianza del modelo σ 2.

5 Distribuciones en el muestreo Intervalos de confianza Contrastes de hipótesis Distribución en el muestreo de (b 1 β 1)/s b1 Recordemos que estandarizar una variable aleatoria es construir una nueva restándole su media y dividiendo esa diferencia por su desviación típica. Como b 1 N(β 1, σ 2 b 1 ) si estandarizamos el estadístico b 1 sabemos que b 1 β 1 σ b1 N(0, 1) Como σ b1 es desconocido utilizaremos su estimador s b1, al que se le conoce como error estándard de b 1. Un estadístico estudentizado es un estadístico estandarizado en el que la estandarización se realiza a través de un estimador de su desviación típica. Un importante resultado en Estadística establece que b 1 β 1 s b1 t(n 2) siendo t(n 2) la densidad de una distribución t-student con (n 2) grados de libertad (ver gráfica siguiente).

6 Distribución t Distribuciones en el muestreo Intervalos de confianza Contrastes de hipótesis

7 Distribuciones en el muestreo Intervalos de confianza Contrastes de hipótesis Intervalo de confianza para β 1 Como b 1 β 1 s b1 t(n 2): P(t α/2 (n 2) b 1 β 1 s b1 t 1 (α/2) (n 2)) = 1 α siendo t α/2 (n 2) el percentil de orden 100(α/2) % de una distribución t(n 2), con t α/2 (n 2) = t 1 (α/2) (n 2) Operando: P( t 1 (α/2) (n 2) s b1 b 1 β 1 t 1 (α/2) (n 2) s b1 ) = 1 α P(b 1 t 1 (α/2) (n 2) s b1 β 1 b 1 + t 1 (α/2) (n 2) s b1 ) = 1 α Intervalo de confianza de β 1 con coeficiente de confianza 1 α: b 1 ± t 1 (α/2) (n 2) s b1

8 Distribuciones en el muestreo Intervalos de confianza Contrastes de hipótesis Contrastes de hipótesis para la pendiente del modelo, I Contrastes de hipótesis: H 0 : β 1 = 0, H 1 : β 1 0 contraste de dos colas H 1 : β 1 > 0 contraste de una cola H 1 : β 1 < 0 contraste de una cola Estadístico de contraste: b 1 β 1 s b1 t(n 2) Estadístico de contraste cuando H 0 es cierta: t b1 = b 1 /s b1 Distribución del estadístico de contraste cuando H 0 es cierta, t b1 = b 1 s b1 t(n 2) Regla de decisión con nivel de significatividad α: Contraste de hipótesis Rechazar H 0 H 0 : β 1 = 0, H 1 : β 1 0 t b1 > t 1 (α/2) (n 2) H 1 : β 1 > 0 t b1 > t (1 α) (n 2) H 1 : β 1 < 0 t b1 < t α(n 2)

9 Distribuciones en el muestreo Intervalos de confianza Contrastes de hipótesis Contrastes de hipótesis para la pendiente del modelo, II Contrastes de hipótesis: P-valores: H 0 : β 1 = 0, H 1 : β 1 0 contraste de dos colas H 1 : β 1 > 0 contraste de una cola H 1 : β 1 < 0 contraste de una cola Contraste de hipótesis P-valor H 0 : β 1 = 0, H 1 : β P(t(n 2) t b1 ) H 1 : β 1 > 0 P(t(n 2) > t b1 ) H 1 : β 1 < 0 P(t(n 2) < t b1 ) Si α es el nivel de significatividad en cualquiera de los contrastes planteados: P-valor α No rechazar H 0 P-valor < α Rechazar H 0 Importante: La hipótesis nula establece que la variable respuesta no depende linealmente de la predictora.

10 , I Estimador de β 0, b 0 = Ȳ b 1 X, con b 1 = La distribución en el muestreo de b 0 es Estimador de la varianza σ 2 b 0, n i=1 (X i X )(Y i Ȳ ) n i=1 (X i X ) 2 b 0 N(β 0, σ 2 b 0 = σ 2( 1 n + X 2 (Xi X ) 2 )) s 2 b 0 = s 2( 1 n + X 2 (Xi X ) 2 ) siendo s 2 el estimador de la varianza del modelo σ 2. El estimador s b0 de la desviación típica de σ b0 es conocido como error estándard de b 0. b 0 β 0 s b0 t(n 2).

11 , II Se opera de forma análoga a la presentada con β 0 y b 0. Intervalo de confianza de β 0 con coeficiente de confianza 1 α: b 0 ± t 1 (α/2) (n 2) s b0 Los contrastes de hipótesis sobre β 0 no son habituales, aunque si fueran adecuados en algún estudio concreto se podrían realizar de forma análoga a los desarrollados para β 1.

12 Ejemplo de juguete: Serpientes 2.I Estadísticos: Longitud, cm X = 63 s 2 X = (Xi X ) 2 = Peso, gr Ȳ = 152 sy 2 = Recta ajustada b 0 = b 1 =7.192 s 2 = Errores estándard s 2 b 1 = s 2 (Xi X ) 2 = = 0.908; s b1=0.953 ( s 2 b 0 = s 2 ( 1 n + X 2 (Xi X ) 2 ) = ) = ; s b0 = t (7)= Intervalo de confianza para β 1 (β 0 ) con coeficiente de confianza 0.95: (b 1 ± t 1 (α/2) (n 2) s b1 ) (7.192 ± ) (4.939, 9.446) (b 0 ± t 1 (α/2) (n 2) s b0 ) ( ± ) ( , )

13 Ejemplo de juguete: Serpientes 2.II Estadísticos: Longitud X = 63 s 2 X = (Xi X ) 2 = Peso Ȳ = 152 s 2 Y = Recta ajustada b 0 = b 1 = s 2 = s b0 = s b1 = Contrastes de hipótesis: H 0 : β 1 = 0, H 1 : β 1 0 contraste de dos colas H 1 : β 1 > 0 contraste de una cola H 1 : β 1 < 0 contraste de una cola (no sentido en este problema) Valor observado del estadístico de contraste: t b1 = b 1 = s b = Distribución del estadístico de contraste cuando H 0 es cierta es t(7) P-valores: Contraste de hipótesis P-valor H 0 : β 1 = 0, H 1 : β P(t(7) 7.547)=0.000 H 1 : β 1 > 0 P(t(7) 7.547)=0.000

14 Ejemplo de juguete: Serpientes 2.III Aunque el R te permite calcular los P-valores anteriores (ver secuencia de R al final del tema), posiblemente es más formativo utilizar una herramienta que también te permita visualizarlos. Para ello, entra en la página principal del Rice Virtual Lab in Statistics: y selecciona el apartado Online Statistics: An Interactive Multimedia Course of Study. A continuación, en la nueva ventana que has abierto, procede según: Table of Contents > XVI. Calculators > t Distribution El P-valor solicitado aparece pintado de color azul sobre la distribución t(7).

15 Comentario I: Efectos de posibles incumplimientos de la normalidad. Cuando las distribuciones de probabilidad asociadas a Y X no son normales pero no se alejan excesivamente de la normalidad, la distribución en el muestreo de b 0 y b 1 es aproximadamente normal y la utilización de la distribución t-student proporciona coeficientes de confianza y niveles de significación aproximados. Incluso si las distribuciones de Y se alejan bastante de la normalidad, los estimadores b 0 y b 1 son, en general, asintóticamente normales (bajo condiciones muy generales su distribución se aproxima a la normalidad cuando el tamaño de la muestra se hace cada vez más grande). Por tanto, cuando se dispone de bastantes datos, el intervalo de confianza y las reglas de decisión asociadas a los contrastes de hipótesis son válidas aún cuando la distribución de probabilidad de Y se aleje de la normalidad. Evidentemente, con bastantes datos, la distribución t-student puede reemplazarse por la distribución normal estándard.

16 Comentario II: Interpretación de los coeficientes de confianza y las probabilidades asociadas a los errores de los contrastes de hipótesis Si recordamos la concepción frecuentista de la probabilidad, como el modelo de regresión supone que las X i son constantes conocidas, el coeficiente de confianza y las probabilidades asociadas a los errores de los contrastes de hipótesis se interpretan en términos de repeticiones y repeticiones independientes del mismo experimento, que consistiría en observar las Y i s correspondientes siempre a los mismos valores de los niveles de las X observadas en la muestra. En el ejemplo de las serpientes cuando construimos un intervalo de confianza para β 1 con coeficiente de confianza 0.95 entendemos que si midiéramos el peso de 9 serpientes con las mismas longitudes que los de la muestra observada y repitiéramos este experimento muchas veces (con diferentes serpientes claro), aproximadamente el 95 % de los intervalos construídos contendrían a β 1 y no podemos saber nunca si el intervalo que hemos construido con la muestra dada, (4.939, 9.446), es uno de esos o no.

17 Comentario III: Dispersión de los niveles de la variable predictora Si nos fijamos en las expresiones de la varianza de b 0 y b 1 : σ 2 b 1 = σ 2 (Xi X ) 2 ; σ2 b 0 = σ 2( 1 n + X 2 (Xi X ) 2 ), y consideramos el tamaño de la muestra y la varianza del modelo constante observamos que dichas varianzas dependen de la dispersión de los niveles de la variable predictora. Un gran dispersión en los niveles de X genera valores grandes en (X i X ) 2, y por lo tanto, varianzas pequeñas de b 1 y b 0.

18 , I Estamos interesamos ahora en estimar el valor medio de Y para un cierto nivel de la variable predictora X h, que puede coincidir o no con alguno de los valores observados en la muestra. Si representamos por E(Y h ) (E(Y X h )) la media de Y cuando X = X h, sabemos que un estimador puntual de dicha esperanza es Ŷ h = b 0 + b 1 X h. Vamos a estudiar la distribución en el muestreo de Ŷ h, que se refiere a la distribución de probabilidad de los diferentes valores de Ŷh que obtendríamos en sucesivas repeticiones del experimento consistente en observar Y siempre para el mismo nivel X = X h. La distribución en el muestreo de Ŷ h es normal con media y varianza: E(Ŷh) = E(b 0 + b 1 X h ) = E(b 0 ) + E(b 1 )X h = β 0 + β 1 X h = E(Y h ) ( ) σ 2 = σ 2 1 Ŷ h n + ( X X h ) 2 (Xi X ) 2

19 , II Definimos el error estándard de Ŷh como la estimación de su desviación típica: sŷh = ( ) s 2, con s 2 = s 2 1 Ŷ h Ŷ h n + ( X X h ) 2 (Xi X ) 2 Con lo que: Ŷ h E(Y h ) sŷh t(n 2). Y operando de forma análoga a la presentada para obtener un intervalo de confianza para β 1, obtenemos ahora la expresíon de un intervalo de confianza para E(Y h ) con coeficiente de confianza 1 α: (Ŷh ± t 1 (α/2) (n 2) sŷh )

20 Ejemplo de juguete: Serpientes 2.IV Información: Longitud X = s 2 X = (Xi X ) 2 = Peso Ȳ = sy 2 = Recta ajustada b 0 = b 1 = s 2 = s b0 = s b1 = Percentiles t (7) = Vamos a calcular un intervalo de confianza para el peso medio de las serpientes que miden X h = 63 cm. Para ello: Ŷ 63 = = 152 ( ) s 2 = Ŷ (63 63)2 = sŷ63 = por lo que el intervalo buscado será: (Ŷh ± t 1 (α/2) (n 2) sŷh ) (152 ± ) ( , )

21 Ejemplo de juguete: Serpientes 2.V Calculamos ahora también un intervalo de confianza para el peso medio de las serpientes que miden X h = 54 cm y X h = 69 cm. Y los compararemos con el obtenido para el peso medio de las serpientes que miden 63 cm. Estimación Longitud del peso medio Error estándard Intervalo 63 cm ( , ) 69 cm ( , ) 54 cm (64.724, ) Como el error estándard de la estimación aumenta a medida que consideramos niveles de X que se alejan de la media muestral, la anchura de los correspondientes intervalos de confianza aumentará de la misma forma.

22 , I Estamos interesamos en predecir el valor de una nueva observación de Y para un nivel dado de la variable predictora X. La observación de Y que se quiere predecir se considera como el resultado de una nueva prueba experimental independiente de las pruebas y resultados obtenidos al ajustar el modelo de regresión al banco de datos considerado. Representamos por X h al nivel de X para la nueva prueba y por Y h(nueva) a la correspondiente observación de Y, que es la que se desea predecir. Obviamente suponemos que el modelo de regresión considerado continúa siendo válido en esta nueva etapa. La distinción entre estimación de la respuesta media E(Y h ) (presentada en el apartado anterior) y predicción de una nueva respuesta Y h(nueva) es básica y muy importante. En el primer caso estimamos una media, E(Y X h ), y ahora predecimos un valor de la distribución Y X h.

23 , II: Otro ejemplo de juguete Vamos a ilustrar la naturaleza del concepto de predicción con un ejemplo de juguete en el que todos los parámetros del modelo son conocidos (situación imposible en la práctica claro). Modelo de regresión: Representación 1: Y = X + ɛ, con ɛ N(0, σ 2 = 1.5) Representación 2: (Y X ) N( X, σ 2 = 1.5) Si quisiéramos predecir una nueva observación de Y para el valor X h = 2, hemos de pensar que la distribución predictiva de Y para dicha observación de la variable predictora es: (Y X h = 2) N(30, σ 2 = 1.5) por lo que sabemos que la media de dicha distribución predictiva será 30 y que las probabilidades asociadas a intervalos de predicción centrados en la media y de amplitud 2σ 2, 4σ 2 y 6σ 2 son : P(28.5 < (Y X h = 2) < 31.5) = P(27 < (Y X h = 2) < 33) = P(25.5 < (Y X h = 2) < 34.5) =

24 , III Puedes calcular los intervalos de predicción anteriores y, sobretodo, visualizarlos con el programa Rice Virtual Lab in Statistics: Cuando hayas entrado selecciona el apartado Online Statistics: An Interactive Multimedia Course of Study, y a continuación, procede en la nueva ventana abierta según: Table of Contents > XVI. Calculators > Normal distribution dónde ya puedes calcular y visualizar la probabilidad de los intervalos considerados. Muy importante: El conocimiento de los parámetros del modelo no elimina totalmente la incertidumbre en la predicción.

25 , IV A nivel teórico se demuestra que: siendo: Y h(nueva) Ŷh s predi t(n 2) Y h(nueva) una variable aleatoria que describe la predicción de Y cuando X = X h. Ŷ h = b 0 + b 1 X h predicción puntual de Y h(nueva) s predi = spredi 2, con ( spredi 2 = s n + (X h X ) 2 (Xi ), X ) 2 que es una estimación de la varianza del error predicción, Y h(nueva) Ŷ h.

26 , V Se opera de forma análoga a la presentada para obtener un intervalo de confianza para β 1. Intervalo de predicción para Y h(nueva) con contenido probabiĺıstico 1 α: Ŷ h ± t 1 (α/2) (n 2) s predi

27 Ejemplo de juguete: Serpientes 2.VI Calculamos ahora un intervalo de predicción con contenido probabiĺıstico 0.95 para el peso de una nueva serpiente cuya longiyud es X h = 63, X h = 54 y X h = 69 cm. Longitud del peso Error estándard Intervalo 63 cm ( , ) 54 cm (50.097, ) 69 cm ( , ) Como el error estándard del error de predicción aumenta a medida que consideramos niveles de X más alejados de la media muestral, la anchura de los correspondientes intervalos de predicción aumentará de la misma forma. Para un mismo valor 1 α y el mismo nivel de la variable predictora los intervalos de predicción son siempre más anchos que los intervalos de confianza para la media.

28 Ejemplo de juguete: Serpientes 2.VII Bandas de confianza y de predicción al 95 %: peso longitud

29 Descomposición de la suma de cuadrados, I Vamos a fijarnos en la siguiente expresión: Y i Ȳ = (Y i Ŷ i ) + (Ŷ i Ȳ ), i = 1,..., n }{{}}{{}}{{} (1) (2) (3) (1) Desviación de Y i con respecto a su media muestral Ȳ (2) Desviación de Y i con respecto a su valor ajustado Ŷ i (3) Desviación de Ŷi con respecto a su media muestral Ȳ Además: n n 2 (Y i Ȳ ) 2 = (Y i Ŷ i ) 2 + (Ŷ i Ȳ ) 2 i=1 } {{ } SST i=1 } {{ } SSE i=1 } {{ } SSR SST, Suma de cuadrados total; es una medida de la variabilidad de los datos de Y con respecto a su media muestral. SSE, Suma de cuadrados residual: es una medida de la variabilidad de los datos de Y con respecto a los valores ajustados. SSR, Suma de cuadrados explicada por el modelo; es una medida de la variabilidad de los valores ajustados Ŷ i con respecto a su media muestral.

30 Descomposición de la suma de cuadrados, II Recordamos que: n (Y i Ȳ )2 = n 2 (Y i Ŷi ) 2 + (Ŷi Ȳ )2 i=1 } {{ } i=1 } {{ } i=1 } {{ } SST SSE SSR Cada una de estas sumas de cuadrados tiene asociado un número (grados de libertad). SST = SSE + SSR }{{}}{{}}{{} n 1 n 2 1 Si Y i = Ŷ i, los residuos serán todos cero y, por lo tanto, su suma de cuadrados también, SSE=0. Esta es una situación ideal en la que todos los valores de Y estarían sobre la recta de regresión y SST = SSR. Si Ŷ i = Ȳ, el modelo ajustado no explica nada de la variabilidad de las Y con respecto a su media, con lo que SST = SSE. Esta es la peor situación, el modelo de regresión no nos sirve porque la recta de regresión ajustada tendría pendiente cero e interceptación ȳ.

31 , I : Fuente de Suma de Grados de Cuadrado variación cuadrados libertad medio Regresión Error Total SSR = n i=1 (Ŷ i Ȳ ) 2 1 MSR = SSR/1 SSE = n i=1 (Y i Ŷi ) 2 n 2 MSE = SSE/(n 2) SST = n i=1 (Y i Ȳ )2 n 1 El cuadrado medio MSE es la estimación, s 2, de la varianza del modelo. El cociente SST /(n 1) es la varianza muestral de las Y i, s 2 Y.

32 Ejemplo de juguete: Serpientes 2.VIII Como n = 9, s 2 Y = y s2 = sabemos que: SST = (n 1) sy 2 = = s 2 = MSE = SSE = (n 2) MSE = = SSR = SST SSE = = : Fuente de Suma de Grados de Cuadrado variación cuadrados libertad medio Regresión SSR = MSR = Error SSE = MSE = Total SST =

33 , II La tabla ANOVA proporciona una batería de contrastes de hipótesis útiles en los modelos de regresión. En nuestro modelo de regresión lineal simple: Contraste de hipótesis: H 0 : β 1 = 0 vs H 1 : β 1 0 Estadístico de contraste: MSR/MSE Distribución del estadístico de contraste cuando H 0 es cierta: F = MSR MSE F(1, n 2), siendo F(1, n 2) una distribución F de Snedecor con 1 y n 2 grados de libertad. Regla de decisión con nivel de significatividad α: Rechazar H 0 cuando F > F 1 α (1, n 2) ó P-valor = P(F (1, n 2) > F ) < α siendo F 1 α (1, n 2) el percentil de orden 100(1 α) % de F (1, n 2)

34 , III : Fuente de Suma de Grados de Cuadrado variación cuadrados libertad medio Cociente F P-valor Regresión SSR 1 MSR MSR/MSE P(F(1, n 2) > F ) Error SSE n 2 MSE Total SST n 1

35 Ejemplo de juguete: Serpientes, 2.IX : Fuente de Suma de grados de Cuadrado variación cuadrado libertad medio Cociente F P-valor Regresión Error Total El P-valor de la tabla ANOVA para el contraste de hipótesis H 0 : β 1 = 0, vs. H 1 : β 1 0 es por lo que considerando α=0.05 concluiríamos rechazando H 0 y considerando, por tanto, el modelo de regresión como significativo.

36 Test t para la pendiente del modelo y test F de la tabla ANOVA Tenemos dos formas diferentes para resolver el mismo contraste de hipótesis, H 0 : β 1 = 0 vs. H 1 : β 1 0, el test t y el test F de la tabla ANOVA. Vamos a comprobar que ambos proporcionan el mismo resultado: F = MSR MSE = = = ( Ŷ i Ȳ )2 /1 (Yi Ŷi ) 2 /(n 2) = (b0 + b 1 X i Ȳ ) 2 s 2 = ( Ȳ b 1 X + b1 X i Ȳ )2 s 2 = b2 1 b 2 1 s 2 / (X i X ) 2 = b2 1 s 2 b 1 = t 2. (Xi X ) 2 s 2 = Esta relación también se cumple entre los percentiles tα 2 (n 2) = Fα(1, n 2)

37 Comentarios finales sobre la utilización de los modelos de regresión La aplicación del modelo de regresión lineal para valores de la variable predictora X fuera del rango de los datos observados es un tema delicado que debe, en principio, evitarse porque no se dispone de evidencia experimental de que se conserve la misma relación entre ambas variables. Un contraste de hipótesis que concluye rechazando H 0 : β 1 = 0 no indica que exista una relación de causa-efecto entre la variable predictora y la variable respuesta. Cuando trabajamos con datos no experimentales ambas variables pueden estar influenciadas simultáneamente por otras variables que no aparecen en el modelo de regresión. Sin embargo, la existencia de una relación lineal entre dos variables en experimentos controlados es generalmente una buena evidencia de una posible relación de causa-efecto entre ellas.

38 Ejemplo de juguete: Serpientes 2.X y R # Obtengo el error estándard de b 0 y b 1 con summary(model) # o alternativamente según: SSX<-(length(x)-1)*var(x) SSX n<-length(x) n # Error estándard de b 1 s2.b1<-squadrat/ssx s2.b1 s.b1<-sqrt(s2.b1) s.b1 # Error estándard de b 0 s2.b0<-squadrat*((1/n)+((mean(x) 2 )/SSX )) s2.b0 s.b0<-sqrt(s2.b0) s.b0

39 Ejemplo de juguete: Serpientes 2.XI y R # Intervalo de confianza 0.95 para β 0 y para β 1 : qt(0.975,n-2) b0<-coef(model)[1] b1<-coef(model)[2] c(b0-qt(0.975,n-2)*s.b0, b0+qt(0.975,n-2)*s.b0) c(b1-qt(0.975,n-2)*s.b1, b1+qt(0.975,n-2)*s.b1) # Contraste de hipótesis para β 1 t.b1<-abs(b1/s.b1) t.b1 # P-valor para contraste de dos colas 2*(1-pt(t.b1,n-2)) # P-valor para contraste de una cola 1-pt(t.b1,n-2)

40 Ejemplo de juguete: Serpientes 2.XII y R # Intervalo de confianza con coeficiente de confianza p # para la media de Y en relación a un nivel dado de X (63, 54, 69) prediction<-function(z)predict(model,list(x=z)) prediction(63) prediction(54) prediction(69) se.estimat<-function(z)sqrt(squadrat*((1/n)+((mean(x)-z) 2 )/SSX )) se.estimat(63) se.estimat(54) se.estimat(69) ci<-function(z,p) cuantil<-(p+1)/2 t.cuantil<-qt(cuantil,n-2) distancia<-t.cuantil*se.estimat(z) cat( 95 % intervalo de confianza=, prediction(z)-distancia, prediction(z)+distancia) ci(63,0.95) ci(54,0.95) ci(69,0.95)

41 Ejemplo de juguete: Serpientes 2.XIII y R # Intervalo de predicción con contenido probabiĺıstico p # para una nueva observación de Y en relación a un nivel dado de X (63, 54, 69) se.predi<-function(z)sqrt( squadrat*(1+(1/n)+((mean(x)-z) 2 )/SSX )) se.predi(63) se.predi(54) se.predi(69) pi<-function(z,p) cuantil<-(p+1)/2 t.cuantil<-qt(cuantil,n-2) pdistancia<-t.cuantil*se.predi(z) cat( 95 % intervalo de prediccion=, prediction(z)-pdistancia, prediction(z)+pdistancia) pi(63,0.95) pi(54,0.95) pi(69,0.95)

42 Ejemplo de juguete: Serpientes 2.XIV y R # Dibujo de las bandas de estimacion y de predicción ci.lines<-function(p) min<-min(x) max<-max(x) xv<-seq(min-5, max+5, (max+10-min)/150) cuantil<-(p+1)/2 t.cuantil<-qt(cuantil,n-2) csup<-prediction(xv)+ t.cuantil*se.estimat(xv) cinf<-prediction(xv)-t.cuantil*se.estimat(xv) lines(xv,csup,col= green,lty=1) lines(xv,cinf,col= green,lty=1) pi.lines<-function(p) min<-min(x) max<-max(x) xv<-seq(min-5, max+5, (max+10-min)/150) cuantil<-(p+1)/2 t.valor<-qt(cuantil,n-2) psup<-prediction(xv)+ t.valor*se.predi(xv) pinf<-prediction(xv)-t.valor*se.predi(xv) lines(xv,psup,col= blue,lty=1) lines(xv,pinf,col= blue,lty=1)

43 Ejemplo de juguete: Serpientes 2.XV y R plot(x,y,col= red,xlim=c(50,70),ylim=c(70,230),pch=16, las=1) abline(model) ci.lines(0.95) pi.lines(0.95) # anova(model)

Modelos lineales. Tema 1: Modelo de regresión lineal simple. 6 de febrero de Carmen Armero

Modelos lineales. Tema 1: Modelo de regresión lineal simple. 6 de febrero de Carmen Armero Carmen Armero 6 de febrero de 2012 Introducción Un poco de historia Definición y propiedades Mínimos cuadrados Máxima verosimilitud Ejemplo: Masa muscular y edad 1.I La edad es uno de los factores determinantes

Más detalles

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis TODO ECONOMETRIA Bondad del ajuste Contraste de hipótesis Índice Bondad del ajuste: Coeficiente de determinación, R R ajustado Contraste de hipótesis Contrastes de hipótesis de significación individual:

Más detalles

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple ESTDÍSTIC PLICD Grado en Nutrición Humana y Dietética Planteamiento del problema Tema 4: Regresión lineal simple Recta de regresión de mínimos cuadrados El modelo de regresión lineal simple IC y contrastes

Más detalles

Tema 4. Regresión lineal simple

Tema 4. Regresión lineal simple Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias

Más detalles

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre

Más detalles

Modelo de Regresión Lineal

Modelo de Regresión Lineal Modelo de Regresión Lineal Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Introducción Un ingeniero, empleado por un embotellador de gaseosas,

Más detalles

Matemática Aplicada y Estadística - Farmacia Soluciones del Primer Examen Parcial - Grupo 3

Matemática Aplicada y Estadística - Farmacia Soluciones del Primer Examen Parcial - Grupo 3 1. Se está haciendo un estudio de medicamentos diferentes que contienen un principio activo común La distribución de frecuencias se indica en la tabla que sigue: Cantidad de sustancia mg [10,20 [20,30

Más detalles

Objetivo: Proponer modelos para analizar la influencia

Objetivo: Proponer modelos para analizar la influencia TEMA 3: REGRESIÓN LINEAL SIMPLE Objetivo: Proponer modelos para analizar la influencia de una variable cuantitativa sobre un fenómeno que nos interesa estudiar. 1. Modelo lineal l de regresión 2. Estimación

Más detalles

T2. El modelo lineal simple

T2. El modelo lineal simple T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de

Más detalles

Estadística II Examen final junio 27/6/17 Curso 2016/17 Soluciones

Estadística II Examen final junio 27/6/17 Curso 2016/17 Soluciones Estadística II Examen final junio 27/6/7 Curso 206/7 Soluciones Duración del examen: 2 h y 5 min. (3 puntos) Los responsables de un aeropuerto afirman que el retraso medido en minutos en el tiempo de salida

Más detalles

Regresión Lineal Simple y Múltiple Regresión Logística

Regresión Lineal Simple y Múltiple Regresión Logística Regresión Lineal Simple y Múltiple Regresión Logística Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura MUI en Ciencias de la Salud MUI en Ciencias de la Salud (UEx) Regresión

Más detalles

peso edad grasas Regresión lineal simple Los datos

peso edad grasas Regresión lineal simple Los datos Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos

Más detalles

Multiple Linear Regression

Multiple Linear Regression Multiple Linear Regression Aniel Nieves-González Aniel Nieves-González () LSP 1 / 16 Considere el ejemplo en cual queremos modelar las ventas en una cadena de tiendas por departamento. La v.a. dependiente

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.

Más detalles

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Regresión múltiple. Demostraciones. Elisa Mª Molanes López Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +

Más detalles

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE UNIDAD 3 REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE Relación entre variables de interés 1 Relación entre variables de interés Muchas decisiones gerenciales se basan en la relación entre 2 o

Más detalles

Estadística II Examen final enero 19/1/17 Curso 2016/17 Soluciones Duración del examen: 2 h y 15 min

Estadística II Examen final enero 19/1/17 Curso 2016/17 Soluciones Duración del examen: 2 h y 15 min Estadística II Examen final enero 19/1/17 Curso 016/17 Soluciones Duración del examen: h y 15 min 1. 3 puntos El Instituto para la Diversificación y Ahorro de la Energía IDAE ha publicado un estudio sobre

Más detalles

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación

Más detalles

Tema 6: Introducción a la inferencia estadística Parte 1

Tema 6: Introducción a la inferencia estadística Parte 1 Tema 6: Introducción a la inferencia estadística Parte 1 1. Planteamiento y objetivos 2. Estadísticos y distribución muestral 3. Estimadores puntuales 4. Estimadores por intervalos Lecturas recomendadas:

Más detalles

Estadística I Tema 5: Introducción a la inferencia estadística

Estadística I Tema 5: Introducción a la inferencia estadística Estadística I Tema 5: Introducción a la inferencia estadística Tema 5. Introducción a la inferencia estadística Contenidos Objetivos. Estimación puntual. Bondad de ajuste a una distribución. Distribución

Más detalles

Estadística aplicada al medio ambiente

Estadística aplicada al medio ambiente Estadística aplicada al medio ambiente III. Regresión lineal 3 o de CC. AA. Departamento de Matemáticas Universidad Autónoma de Madrid 2011/12 Planteamiento Modelo Estimación de parámetros Intervalos de

Más detalles

Matemática Aplicada y Estadística - Grado en Farmacia Curso 2014/15 1er. Examen Parcial 6 de noviembre de 2014

Matemática Aplicada y Estadística - Grado en Farmacia Curso 2014/15 1er. Examen Parcial 6 de noviembre de 2014 Matemática Aplicada y Estadística - Grado en Farmacia Curso 2014/1 1er. Examen Parcial 6 de noviembre de 2014 Apellidos y nombre del alumno/a Grupo 4 1. 2 puntos) En la siguiente tabla se refleja la distribución

Más detalles

Modelación estadística: La regresión lineal simple

Modelación estadística: La regresión lineal simple Modelación estadística: La regresión lineal simple Gabriel Cavada Ch. 1 1 División de Bioestadística, Escuela de Salud Pública, Universidad de Chile. Statistical modeling: Simple linear regression Cuando

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 4 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 35 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable respuesta

Más detalles

Econometría Aplicada

Econometría Aplicada Econometría Aplicada Inferencia estadística, bondad de ajuste y predicción Víctor Medina Intervalos de confianza Intervalos de confianza Intervalos de confianza Intervalos de confianza La pregunta que

Más detalles

TEMA 10 Correlación y regresión. El modelo de regresión simple

TEMA 10 Correlación y regresión. El modelo de regresión simple TEMA 10 Correlación y regresión. El modelo de regresión simple Karl Pearson (1857-1936) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales

Más detalles

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15 Unidad Temática 3: Estadística Analítica Unidad 9 Regresión Lineal Simple Tema 15 Estadística Analítica CORRELACIÓN LINEAL SIMPLE Indica la fuerza y la dirección de una relación lineal proporcional entre

Más detalles

Contenido. vii. Prólogo... i Presentación... iii Grupo de trabajo...v. 1. Introducción y conceptos preliminares...1

Contenido. vii. Prólogo... i Presentación... iii Grupo de trabajo...v. 1. Introducción y conceptos preliminares...1 Contenido Prólogo... i Presentación... iii Grupo de trabajo...v 1. Introducción y conceptos preliminares...1 2. Tipos de modelos estadísticos lineales...19 Caso 2.1...20 Caso 2.2...26 Caso 2.3...30 3.

Más detalles

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)

Más detalles

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos TEMA 10 (curso anterior): REGRESIÓN Y CORRELACIÓN 1 Conceptos de Regresión y Correlación 2 Variables aleatorias bidimensionales 3 Ajuste de una recta a una nube de puntos 4 El modelo de la correlación

Más detalles

Estadística II Examen Final 19/06/2015 Soluciones. Responda a las preguntas siguientes en los cuadernillos de la Universidad

Estadística II Examen Final 19/06/2015 Soluciones. Responda a las preguntas siguientes en los cuadernillos de la Universidad Estadística II Examen Final 19/06/2015 Soluciones Responda a las preguntas siguientes en los cuadernillos de la Universidad Utilice diferentes cuadernillos para responder a cada uno de los ejercicios Indique

Más detalles

4.1 Análisis bivariado de asociaciones

4.1 Análisis bivariado de asociaciones 4.1 Análisis bivariado de asociaciones Los gerentes posiblemente estén interesados en el grado de asociación entre dos variables Las técnicas estadísticas adecuadas para realizar este tipo de análisis

Más detalles

Bioestadística: Inferencia Estadística. Análisis de Una Muestra

Bioestadística: Inferencia Estadística. Análisis de Una Muestra Bioestadística: Inferencia Estadística. Análisis de Una Muestra M. González Departamento de Matemáticas. Universidad de Extremadura Estimación Puntual e Intervalos de Confianza Planteamiento del Problema

Más detalles

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................

Más detalles

ESTADISTICA AVANZADA MODULO I

ESTADISTICA AVANZADA MODULO I ESTADISTICA AVANZADA MODULO I Análisis de Regresión Modelo Supuestos Multiple 20.0 25.0 30.0 35.0 40.0 45.0 50.0 55.0 60.0 65.0 70.0 75.0 80.0 85.0 Consumo Energetico Gráfico de Dispersión 110.000 105.000

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente

Más detalles

TEMA 3 Modelo de regresión simple

TEMA 3 Modelo de regresión simple TEMA 3 Modelo de regresión simple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Planteamiento del problema.

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012 Regresión Simple Leticia Gracia Medrano. lety@sigma.iimas.unam.mx 2 de agosto del 2012 La ecuación de la recta Ecuación General de la recta Ax + By + C = 0 Cuando se conoce la ordenada al origen y su pendiente

Más detalles

PP: gran cantidad de faltantes. Mejor solución no siempre es la misma: 1) Trabajar con datos incompletos (ojo con no sesgar la serie!!

PP: gran cantidad de faltantes. Mejor solución no siempre es la misma: 1) Trabajar con datos incompletos (ojo con no sesgar la serie!! PP: gran cantidad de faltantes Mejor solución no siempre es la misma: 1) Trabajar con datos incompletos (ojo con no sesgar la serie!!) 2) Completar con algún método Definición: Homegeneidad 2 estaciones

Más detalles

Estadística II Ejercicios Tema 5

Estadística II Ejercicios Tema 5 Estadística II Ejercicios Tema 5 1. Considera los cuatro conjuntos de datos dados en las transparencias del Tema 5 (sección 5.1) (a) Comprueba que los cuatro conjuntos de datos dan lugar a la misma recta

Más detalles

Los estimadores mínimo cuadráticos bajo los supuestos clásicos

Los estimadores mínimo cuadráticos bajo los supuestos clásicos Los estimadores mínimo cuadráticos bajo los supuestos clásicos Propiedades estadísticas e inferencia Mariana Marchionni marchionni.mariana@gmail.com Mariana Marchionni MCO bajo los supuestos clásicos 1

Más detalles

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min. Estadística II Examen final junio - 17/06/16 Curso 201/16 Soluciones Duración del examen: 2 h. y 4 min. 1. (3, puntos) La publicidad de un fondo de inversión afirma que la rentabilidad media anual del

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis Facultad de Ciencias Sociales, UdelaR Índice 1. Introducción: hipótesis estadística, tipos de hipótesis, prueba de hipótesis 2.

Más detalles

Ejemplo de Regresión Lineal Simple

Ejemplo de Regresión Lineal Simple Ejemplo de Regresión Lineal Simple Países Porcentaje de Inmunización (x) Tasa de mortalidad (y) Bolivia 77 8 Brazil 69 65 Cambodia 3 84 Canada 85 8 China 94 43 Czech_Republic 99 Egypt 89 55 Ethiopia 3

Más detalles

BLOQUE III: INFERENCIA ESTADISTICA. X, variable aleatoria de interés sobre una determinada población

BLOQUE III: INFERENCIA ESTADISTICA. X, variable aleatoria de interés sobre una determinada población BLOQUE III: INFERENCIA ESTADISTICA TEMA 8. MUESTREO Y DISTRIBUCIONES DE MUESTREO 1. Introducción a la Inferencia Estadística X, variable aleatoria de interés sobre una determinada población Observar el

Más detalles

TEMA 4 Modelo de regresión múltiple

TEMA 4 Modelo de regresión múltiple TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.

Más detalles

Regresión Lineal Simple. Dr. Víctor Aguirre Torres, ITAM. Guión 11.

Regresión Lineal Simple. Dr. Víctor Aguirre Torres, ITAM. Guión 11. Regresión Lineal Simple 1 Propósito Cuantificar el cambio en el valor esperado de una variable (y) en función de otra variable (x). y=var. Dependiente (cuantitativa) x=var. Explicativa (cuantitativa) 2

Más detalles

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Índice. Diseños factoriales. José Gabriel Palomo Sánchez E.U.A.T. U.P.M. Julio de 2011

Índice. Diseños factoriales. José Gabriel Palomo Sánchez E.U.A.T. U.P.M. Julio de 2011 Diseños factoriales José Gabriel Palomo Sánchez gabrielpalomo@upmes EUAT UPM Julio de 2011 Índice 1 Diseños factoriales con dos factores 1 Denición 2 Organización de los datos 3 Ventajas de los diseños

Más detalles

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado. NORMAS El examen consta de dos partes: 0.0.1. Diez Cuestiones: ( tiempo: 60 minutos) No se permite ningún tipo de material (libros, apuntes, calculadoras,...). No se permite abandonar el aula una vez repartido

Más detalles

REGRESIÓN LINEAL SIMPLE

REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Abordaremos en este capítulo el modelo de regresión lineal múltiple, una vez que la mayor parte de las

Más detalles

Nota de los autores... vi

Nota de los autores... vi ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...

Más detalles

Estadística I Solución Examen Final - 28 Mayo de 2009

Estadística I Solución Examen Final - 28 Mayo de 2009 Estadística I Examen Final - 28 Mayo de 2009 (1 (10 puntos A 16 estudiantes de Filosofía se les preguntó cuántas clases de esta asignatura habían perdido durante el cuatrimestre. Las respuestas obtenidas

Más detalles

Regresión Lineal Múltiple. Dr. Víctor Aguirre Torres, ITAM. Guión 12.

Regresión Lineal Múltiple. Dr. Víctor Aguirre Torres, ITAM. Guión 12. Regresión Lineal Múltiple 1 Propósito Cuantificar el cambio en el valor esperado de una variable (y) en función del cambio simultáneo otras variables (x 1, x 2,..., x p ). y=variable dependiente (cuantitativa)

Más detalles

Estadística. Contrastes para los parámetros de la Normal

Estadística. Contrastes para los parámetros de la Normal Contrastes para los parámetros de la Normal Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Contrastes para los parámetros de la Normal Contrastes para los parámetros

Más detalles

ECONOMETRÍA I. Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación

ECONOMETRÍA I. Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación ECONOMETRÍA I Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía Alexandra Soberon (UC) ECONOMETRÍA

Más detalles

Relación 3 de problemas

Relación 3 de problemas ESTADÍSTICA II Curso 2016/2017 Grado en Matemáticas Relación 3 de problemas 1. La Comunidad de Madrid evalúa anualmente a los alumnos de sexto de primaria de todos los colegios sobre varias materias. Con

Más detalles

ECONOMETRÍA I. Tema 2: El Modelo de Regresión Lineal Simple. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía

ECONOMETRÍA I. Tema 2: El Modelo de Regresión Lineal Simple. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía ECONOMETRÍA I Tema 2: El Modelo de Regresión Lineal Simple Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía Alexandra Soberon (UC) ECONOMETRÍA I 1 / 42 Modelo de Regresión

Más detalles

Teorema Central del Límite (1)

Teorema Central del Límite (1) Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico

Más detalles

Tema 8: Regresión y Correlación

Tema 8: Regresión y Correlación Tema 8: Regresión y Correlación Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 8: Regresión y Correlación Curso 2008-2009 1 / 12 Índice

Más detalles

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS Práctica. Intervalos de confianza 1 Práctica ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS Objetivos: Ilustrar el grado de fiabilidad de un intervalo de confianza cuando se utiliza

Más detalles

Jesús García Herrero TÉCNICAS CLÁSICAS DE ANÁLISIS DE DATOS

Jesús García Herrero TÉCNICAS CLÁSICAS DE ANÁLISIS DE DATOS Jesús García Herrero TÉCNICAS CLÁSICAS DE ANÁLISIS DE DATOS En esta clase se presentan los primeros algoritmos Análisis de Datos para abordar tareas de aprendizaje de modelos descriptivos y predictivos.

Más detalles

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía Novedades en el Plan de Trabajo Desviación típica sesgada

Más detalles

Estadística Inferencial. Resúmen

Estadística Inferencial. Resúmen Ofimega - Estadística inferencial - 1 Estadística Inferencial. Resúmen Métodos y técnicas que permiten inducir el comportamiento de una población. Muestreo o selección de la muestra: 1. Aleatorio simple:

Más detalles

Tema 5. Muestreo y distribuciones muestrales

Tema 5. Muestreo y distribuciones muestrales 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución

Más detalles

Estadística I Solución Examen Final- 19 de junio de Nombre y Apellido:... Grupo:...

Estadística I Solución Examen Final- 19 de junio de Nombre y Apellido:... Grupo:... Estadística I Examen Final- 19 de junio de 2009 Nombre y Apellido:... Grupo:... (1) La siguiente tabla muestra las distribuciones de frecuencias absolutas de la variable altura (en metros) de n = 500 estudiantes

Más detalles

Al nivel de confianza del 95%, las puntuaciones típicas son: 2- La hipótesis alternativa es; A) ; B) ; C).

Al nivel de confianza del 95%, las puntuaciones típicas son: 2- La hipótesis alternativa es; A) ; B) ; C). A continuación se presentan 4 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la misma así como de preguntas teóricas generales. SITUACIÓN 1: La empresa SND's de sondeos

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

TEMA 2 Diseño de experimentos: modelos con varios factores

TEMA 2 Diseño de experimentos: modelos con varios factores TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial

Más detalles

Taller I Econometría I

Taller I Econometría I Taller I Econometría I 1. Considere el modelo Y i β 1 + ɛ i, i 1,..., n donde ɛ i i.i.d. N (0, σ 2 ). a) Halle el estimador de β 1 por el método de mínimos cuadrados ordinarios. Para realizar el procedimiento

Más detalles

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar

Más detalles

ANÁLISIS DE REGRESIÓN N LINEAL

ANÁLISIS DE REGRESIÓN N LINEAL ANÁLISIS DE REGRESIÓN N LINEAL Varias partes tomadas de Julio H. Cole "Nociones de Regresión Lineal" en Enciclopedia Multimedia Virtual de Economía EMVI. http://eumed.net/cursecon/medir/index.htm Análisis

Más detalles

TEMA 7. Estimación. Alicia Nieto Reyes BIOESTADÍSTICA. Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 7. Estimación 1 / 13

TEMA 7. Estimación. Alicia Nieto Reyes BIOESTADÍSTICA. Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 7. Estimación 1 / 13 TEMA 7. Estimación Alicia Nieto Reyes BIOESTADÍSTICA Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 7. Estimación 1 / 13 1 Estimación Puntual 1 Estimación por intervalos Estimación por intervalos de la Media

Más detalles

1 El Análisis de Varianza

1 El Análisis de Varianza 1 El Análisis de Varianza Objetivo: Explicar (controlar las variaciones de una v.a. Y continua (numérica, mediante factores (variables cualitativas que definen categorías que controlamos (no aleatorios.

Más detalles

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión

Más detalles

Ejercicios T.5 CONTRASTES PARAMÉTRICOS

Ejercicios T.5 CONTRASTES PARAMÉTRICOS Ejercicios T.5 CONTRASTES PARAMÉTRICOS 1. Un fabricante de perfume asegura que los frascos que produce contienen por término medio 100 ml. distribuyéndose el contenido de dichos frascos según una distribución

Más detalles

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento. UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre

Más detalles

Modelos lineales. Tema 4. Diagnóstico del modelo. 9 de febrero de Carmen Armero

Modelos lineales. Tema 4. Diagnóstico del modelo. 9 de febrero de Carmen Armero Carmen Armero 9 de febrero de 2011 Introducción Introducción En general, cuando utilizamos un modelo de regresión para analizar un conjunto de datos no estamos totalmente seguros de si el modelo es apropiado

Más detalles

Bioestadística. Curso Práctica: La recta de regresión

Bioestadística. Curso Práctica: La recta de regresión Bioestadística. Curso 2012-2013 Carmen M a Cadarso, M a del Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Índice 1. Introducción 2 2. El diagrama de dispersión 2 3. Covarianza 4 4. Coeciente de correlación

Más detalles

Matemáticas II en Biotecnología

Matemáticas II en Biotecnología Carmen Armero 21 de mayo de 2010 Introducción E.1 Boca de dragón: Las flores de cada una de las plantas boca de dragón Antirrhinum majus pueden ser de color rojo, rosa o blanco. Según un modelo genético

Más detalles

Ejemplos Resueltos Tema 4

Ejemplos Resueltos Tema 4 Ejemplos Resueltos Tema 4 2012 1. Contraste de Hipótesis para la Media µ (con σ conocida) Dada una muestra de tamaño n y conocida la desviación típica de la población σ, se desea contrastar la hipótesis

Más detalles

Estadística Diplomado

Estadística Diplomado Diplomado HRB UNAM 1 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 Estimación por Intervalos Cantidades Pivotales

Más detalles

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL Msc. Lácides Baleta Octubre 16 Página 1 de 11 REGRESIÓN Y CORRELACIÓN LINEAL Son dos herramientas para investigar la dependencia de una variable dependiente Y

Más detalles

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: Introducción a la estimación de parámetros

Más detalles

Tema 4. Intervalos de confianza. Estadística Aplicada (Bioquímica). Profesora: Amparo Baíllo Tema 4: Intervalos de confianza 1

Tema 4. Intervalos de confianza. Estadística Aplicada (Bioquímica). Profesora: Amparo Baíllo Tema 4: Intervalos de confianza 1 Tema 4. Intervalos de confianza Estadística Aplicada (Bioquímica). Profesora: Amparo Baíllo Tema 4: Intervalos de confianza 1 Definición Sea X una v.a. con distribución de probabilidad dada por un modelo

Más detalles

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición... Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................

Más detalles

Tema 15: Contrastes de hipótesis sobre algunos parámetros

Tema 15: Contrastes de hipótesis sobre algunos parámetros ema 15: Contrastes de hipótesis sobre algunos parámetros 1. CORASE DE HIPÓESIS SOBRE LA MEDIA, Conocida Desconocida. CORASE DE HIPÓESIS SOBRE LA CORRELACIÓ, Bibliografía: ema 15 (págs. 379-4) Ejercicios

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M.

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M. Los modelos de regresión sirven, en general, para tratar de expresar una variable respuesta (numérica) en

Más detalles

La línea recta: Serie1

La línea recta: Serie1 La línea recta: En una línea recta tenemos una relación entre dos variables, la independiente (x) y la dependiente (y). La forma en que se relacionan dependerá de la función que describa dicha relación.

Más detalles

Universidad Técnica de Babahoyo INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

Universidad Técnica de Babahoyo INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA Universidad Técnica de Babahoyo INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA Ateneo Ruperto P. Bonet Chaple UTB-Julio 2016 OBJETIVO Aplicar las técnicas de Muestreo e Inferencia Estadística Determinar el tamaño

Más detalles