TEMA 3 Modelo de regresión simple

Tamaño: px
Comenzar la demostración a partir de la página:

Download "TEMA 3 Modelo de regresión simple"

Transcripción

1 TEMA 3 Modelo de regresión simple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología

2 Estructura de este tema Planteamiento del problema. Ejemplos. El modelo de regresión lineal simple. Recta de regresión de mínimos cuadrados. Estimación, IC y contrastes para los parámetros del modelo. Análisis de la varianza en el modelo de regresión lineal simple. Predicción. Algunos modelos linealizables. Diagnóstico del modelo.

3 Ejemplo: temperatura y vibración de las alas Los grillos son ectotermos, por lo que sus procesos fisiológicos y su metabolismo están influidos por la temperatura. Con el fin de estudiar estas cuestiones se ha medido el número de vibraciones por segundo de las alas de un grupo de grillos a varias temperaturas. Vibraciones/seg. Temp

4 Ejemplo: Temperatura y vibración de las alas Consideramos dos variables (fichero grillos.sav): X : Temperatura Y : Número de vibraciones de las alas por segundo Qué podemos decir sobre la relación entre las dos variables? Podemos afirmar (con un nivel de significación dado) que al aumentar la temperatura, aumenta la frecuencia de vibración? Podemos predecir aproximadamente el valor de la variable Y si sabemos el valor de X? Qué grado de fiabilidad tiene la predicción?

5 Ejemplo: renta y fracaso escolar en la CAM Ejemplo

6 % fracaso escolar Arganda Torrelodones Renta (en miles de euros)

7 Covarianza Se dispone de un conjunto de n pares de observaciones (x 1, y 1 ),..., (x n, y n ). La covarianza entre x e y sirve para cuantificar el grado de relación lineal que hay entre x e y: ( cov xy = 1 n n ) (x i x)(y i ȳ) = 1 x i y i n xȳ n n i=1 Propiedades: cov xy = cov yx. cov xy depende de las unidades en que se miden x e y. cov xx = v x, es decir, la covarianza de x con x es la varianza de x. i=1

8 Interpretación de la covarianza Covarianza positiva y Covarianza negativa y Covarianza aprox. cero y Covarianza aprox. cero y

9 Coeficiente de correlación Resulta conveniente disponer de una medida de relación lineal que no dependa de las unidades. Para ello, se normaliza cov xy dividiendo por el producto de desviaciones típicas, lo que lleva al coeficiente de correlación: r xy = cov xy. vx vy Propiedades: No depende de las unidades Siempre toma valores entre -1 y 1. Su signo se interpreta igual que el de la covarianza Sólo vale 1 ó -1 cuando los puntos están perfectamente alineados. Aunque r xy 0, las variables x e y no son necesariamente independientes.

10 Media Vibraciones 16,633 Media 16,633 Vibraciones Estadísticos descriptivos Desviación típica 1,7319 N Desviación típica N 1, Temperatura 79,973 6, Vibraciones Temperatura Correlación de Pearson Sig. (bilateral) Correlación de Pearson N 15 Temperatura 79,973 6,7170 Sig. (bilateral) 15 N Correlaciones Vibraciones 1 15,836, Vibraciones Temperatura,836,000 Temperatura Correlaciones Vibraciones Correlación de Pearson 1 Sig. (bilateral) N 15 Correlación de Pearson,836 Sig. (bilateral),000 N 15 Temperatura,836, Vibraciones Temperatura Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlaciones 20,0 Vibraciones 19,0 18,0 17,0 16,0 15,0 Vibraciones 1 15,836, Temperatura,836 Vibraciones 20,0 19,0,000 18,0 17, ,0 16,0 20,0 65,0 70,0 75,0 80,0 85,0 Temperatura 15,0 90,0 95,0

11 Problema de regresión Observamos dos variables, X e Y, el objetivo es analizar la relación existente entre ambas de forma que podamos predecir o aproximar el valor de la variable Y a partir del valor de la variable X. La variable Y se llama variable respuesta La variable X se llama variable regresora o explicativa En un problema de regresión (a diferencia de cuando calculamos el coeficiente de correlación) el papel de las dos variables no es simétrico.

12 Recta de regresión Frecuentemente, existe entre las variables una relación aproximadamente lineal: Y i β 0 + β 1 x i. La recta y = β 0 + β 1 x es una recta de regresión. El parámetro β 1 es la pendiente de la recta. Indica la variación media de la variable respuesta cuando X aumenta una unidad. El parámetro β 0 es el término independiente de la recta. Indica el valor medio de Y cuando X = 0. Objetivo: estimar los parámetros β 0 y β 1 a partir de los datos (x i, Y i ), i = 1,..., n.

13 Datos con ˆβ 0 3, ˆβ y r 0.8 y y x x3 y y x x4

14 El modelo de regresión lineal simple Para poder hacer inferencia (IC y contrastes) sobre los parámetros, suponemos que se verifica el siguiente modelo: Para todas las observaciones i = 1,..., n donde: Y i = β 0 + β 1 x i + u i, El valor medio de los errores u i es cero. Todos los errores u i tienen la misma varianza σ 2 (homocedasticidad). Las variables u i tienen distribución normal. Las variables u i son independientes.

15 58 STATISTICAL INFERENCE Figure 3.4 Joint density functions (shown symbolically) of the bivariate normal distributions of the form (3.9) with varying m. where fðx; mþ is the normal density function of Nðm; 1Þ. Figure 3.4 shows symboli-

16 En qué situaciones se verifica el modelo? x y x2 y x y x y4

17 La recta de mínimos cuadrados Si estimamos β 0 y β 1 mediante ˆβ 0 y ˆβ 1, la predicción de la variable respuesta Y i en función de la regresora x i es: Ŷ i = ˆβ 0 + ˆβ 1 x i Unos buenos estimadores deben ser tales que los errores de predicción sean pequeños. e i = Y i Ŷi = Y i ( ˆβ 0 + ˆβ 1 x i ) La recta de regresión de mínimos cuadrados viene dada por los valores ˆβ 0 y ˆβ 1 para los que se minimiza: n [Y i (β 0 + β 1 x i )] 2 i=1

18 x y x y

19 Estimadores de mínimos cuadrados Pendiente: ˆβ 1 = cov xy v x vy = r = r S y. vx S x Término independiente: ˆβ 0 = Ȳ ˆβ 1 x Al igual que en los modelos de los temas anteriores: A las predicciones Ŷ i = ˆβ 0 + ˆβ 1 x i se les llama valores ajustados o pronosticados. A los errores e i = Y i Ŷ i se les llama residuos.

20 Ejemplo: temperatura y vibración de las alas Estimadores de los parámetros: ˆβ 1 = r xy S y S x = = ˆβ 0 = Ȳ ˆβ 1 x = = Recta de regresión: y = x Predicción de Y 0 para x 0 = 80: Ŷ 0 = =

21 Diagrama de dispersión y recta estimada 20,0 19,0 18,0 Vibraciones 17,0 16,0 15,0 R2 Lineal = 0,7 14,0 65,0 70,0 75,0 80,0 85,0 90,0 95,0 Temperatura

22 Observaciones La recta de mínimos cuadrados pasa por el punto cuyas coordenadas son las medias: ( x, Ȳ ). Si la variable regresora se incrementa en una desviación típica x = S x, entonces la predicción de la variable respuesta se incrementa en r desviaciones típicas: Ŷ = rs y Puede demostrarse que la suma de los residuos siempre vale cero. La recta para predecir Y en función de X no es la misma que la recta para predecir X en función de Y.

23 La varianza residual La varianza residual es un estimador insesgado de σ 2 : n n SR 2 = i=1 e2 i n 2 = i=1 (Y i Ŷ i ) 2 n 2 = n i=1 (Y i ˆβ 0 ˆβ 1 x i ) 2. n 2 Se pierden dos grados de libertad puesto que los residuos verifican dos restricciones: La media de los residuos es igual a cero. La covarianza entre los residuos y la variable regresora es también igual a cero.

24 Una simulación Supongamos que σ = 1, β 0 = 0 y β 1 = 1. Entonces el modelo es Y i = x i + u i, donde los errores u i tienen distribución normal estándar y son independientes. Fijamos x i = 1, 2,..., 10 (n = 10) y generamos las respuestas correspondientes de acuerdo con este modelo. Posteriormente calculamos la recta de mínimos cuadrados y la representamos junto con la verdadera recta y = x.

25 Repetimos 6 veces el experimento x x x x x x

26 Repetimos 6 veces el experimento beta1= beta1= beta1= beta1= 0.95 beta1= 1.01 beta1= 0.99

27 Repetimos 1000 veces el experimento β β 1 Los estimadores son centrados y tienen distribución normal. Existen fórmulas del error típico de ˆβ 0 y ˆβ 1 que miden su variabilidad. Estas fórmulas son las que se utilizan para calcular IC y llevar a cabo contrastes en lo que sigue.

28 Error típico del estimador de la pendiente error típico de ˆβ 1 = S R 1 n i=1 (x i x) = S 2 R nv x Al aumentar nv x, el error típico de la pendiente disminuye (es decir, la estimación de la pendiente es más precisa). Conviene diseñar el experimento de forma que los valores x i tengan la mayor dispersión posible.

29 Error típico del estimador del término independiente error típico de ˆβ 0 = S R 1 n + x 2 nv x Si x 2 es grande, se estima con menos precisión el término independiente.

30 Intervalos de confianza Los intervalos de confianza de nivel 1 α para los parámetros ˆβ i (i = 0, 1) tienen la estructura habitual: [ ] IC 1 α (β i ) ˆβi t n 2,α/2 error típico de ˆβ i En comparación con los intervalos de confianza para la media: Los grados de libertad son n 2 en lugar de n 1. La fórmula del error típico es más complicada. El intervalo de confianza para σ 2 también tiene la estructura que ya hemos visto en los modelos de los temas anteriores: [ ] IC 1 α (σ 2 (n 2)SR 2 ) χ 2, (n 2)S R 2 n 2;α/2 χ 2 n 2;1 α/2

31 Ejemplo: temperatura y vibración de las alas Para los datos del ejemplo se ha calculado S 2 R = Calcula los errores típicos de los estimadores de la pendiente y del término independiente. Calcula un intervalo de confianza de nivel 95% para β 1. Calcula un intervalo de confianza de nivel 95% para β 0.

32 Contrastes para los parámetros Contraste bilateral: Hipótesis: H 0 : β i = 0 frente a H 1 : β i 0 Región crítica: { R = ˆβ i error típico de ˆβ i Contrastes unilaterales: Hipótesis: H 0 : β i 0 frente a H 1 : β i > 0 Región crítica: { ˆβ i R = error típico de ˆβ i } > t n 2,α/2. } > t n 2,α. Hipótesis: H 0 : β i 0 frente a H 1 : β i < 0 Región crítica: { ˆβ i R = error típico de ˆβ i < t n 2,α }.

33 Ejemplo: temperatura y vibración de las alas Aportan los datos evidencia para afirmar (α = 0.01) que la temperatura tiene una influencia significativa sobre la frecuencia de vibración de las alas? Podemos afirmar a nivel α = 0.01 que al aumentar la temperatura aumenta la frecuencia media de vibración de las alas? Escribe la región crítica para contrastar H 0 : β 1 = 1 frente a H 1 : β 1 1.

34 Con SPSS: temperatura y vibraciones Resumen del modelo Modelo R R cuadrado R cuadrado corregida Error típ. de la estimación 1,836 a,700,677,9849 a. Variables predictoras: (Constante), Temperatura ANOVA b Modelo 1 Regresión Residual Total Suma de cuadrados 29,383 12,611 41,993 gl Media cuadrática 29,383,970 F 30,290 Sig.,000 a a. Variables predictoras: (Constante), Temperatura b. Variable dependiente: Vibraciones Modelo 1 (Constante) Temperatura Coeficientes no estandarizados Coeficientes tipificados B Error típ. Beta t Sig. -,615 3,144 -,196,848,216 a. Variable dependiente: Vibraciones Coeficientes a,039,836 5,504,000

35 Con SPSS: renta y fracaso escolar Resumen del modelo b Modelo R R cuadrado R cuadrado corregida Error típ. de la estimación 1,742 a,550,528 4,7566 a. Variables predictoras: (Constante), Renta b. Variable dependiente: Fracaso &[PageTitle] Modelo 1 Regresión Residual Total a. Variables predictoras: (Constante), Renta b. Variable dependiente: Fracaso ANOVA b Suma de Media cuadrados gl cuadrática F Sig. 580, ,516 25,658,000 a 475, , , Coeficientes a Coeficientes Coeficientes no estandarizados estandarizad os Modelo B Error típ. Beta t Sig. 1 (Constante) 38,494 3,645 10,562,000 Renta -1,347,266 -,742-5,065,000 a. Variable dependiente: Fracaso

36 Cuestiones Escribe la ecuación de la recta de mínimos cuadrados que describe el nivel de fracaso escolar como función de la renta. Calcula intervalos de confianza de nivel 95% para la pendiente y el término independiente de la recta de regresión. Podemos afirmar, a nivel α = 0.05 que niveles más altos de renta están asociados a niveles más bajos de fracaso escolar? Cuánto vale el coeficiente de correlación entre el nivel de renta y el porcentaje de fracaso escolar? Qué porcentaje de fracaso escolar se predice en una población cuya renta es x 0 = euros? Cuál es el residuo correspondiente a Colmenar Viejo?

37 Análisis de la varianza en regresión simple Y i = Ŷi + e i Y i Ȳ = (Ŷi Ȳ ) + e i n (Y i Ȳ ) 2 = n (Ŷ i Ȳ ) 2 + i=1 i=1 SCT = SCE + SCR n i=1 e 2 i SCT mide la variabilidad total (tiene n 1 gl) SCE mide la variabilidad explicada por el modelo (tiene 1 gl) SCR mide la variabilidad no explicada o residual (tiene n 2 gl)

38 Tabla ANOVA y contraste F Fuente de variación Suma de cuadrados gl cuadrados medios estadístico Explicada (SCE) n i=1 (Ŷi Ȳ )2 1 n i=1 (Ŷi Ȳ )2 F ni=1 Residual (SCR) n i=1 e2 i n 2 SR 2 = ei 2 n 2 Total (SCT) n i=1 (Y i Ȳ )2 n 1 El estadístico F es igual a SCE/S 2 R. Si F es suficientemente grande (la variabilidad explicada es muy grande respecto a la no explicada), se debe rechazar H 0 : β 1 = 0. Bajo H 0 : β 1 = 0, el estadístico F tiene distribución F 1,n 2. La región crítica de nivel α del contraste es: R = {F > F 1,n 2;α }

39 Tabla ANOVA y contraste F Para contrastar H 0 : β 1 = 0 a nivel α hemos considerado tres procedimientos: Calcular un IC de nivel de confianza 1 α para β 1 y rechazar H 0 si 0 no pertenece al intervalo. Dividir ˆβ 1 por su error típico y rechazar H 0 si el valor obtenido es superior a t n 2;α/2. Calcular F = SCE/S 2 R y rechazar H 0 si el valor obtenido es superior a F 1,n 2;α. Los tres métodos son equivalentes en este modelo.

40 Evaluación del ajuste Para valorar el grado con el que la recta se ajusta a los datos se emplean varias medidas: El coeficiente de correlación r. El coeficiente de determinación: R 2 = Variabilidad explicada Variabilidad total = SCE SCT En el modelo de regresión simple R 2 = r 2, el coeficiente de determinación coincide con el coeficiente de correlación al cuadrado. El error cuadrático medio: ECM = n i=1 (Y i Ŷi) 2 n = n i=1 e2 i n. Puede comprobarse que ECM = V y (1 r 2 ).

41 Cuestiones Si SCT = 8100, SCE = 6900 y ˆβ 1 = 6.7. Calcula el coeficiente de correlación entre la variable regresora y la variable respuesta. Para un conjunto de 20 datos se sabe que SCT = 7200, SCE = 2900 y ˆβ 1 = 3.1. Calcula el coeficiente de correlación, el coeficiente de determinación y el error cuadrático medio.

42 Inferencia sobre la variable respuesta Una de las razones para ajustar un modelo de regresión simple es obtener información sobre Y cuando x toma un valor x 0 conocido. Hay dos problemas relacionados con este objetivo: Estimar el valor medio de Y para los individuos de la población para los que X = x 0. Si µ 0 es este valor medio, µ 0 = β 0 + β 1 x 0. Predecir el valor individual que tomará la variable Y para una nueva observación para la que se sabe que X = x 0. Si Y 0 es este valor, Y 0 = β 0 + β 1 x 0 + u 0. Qué problema es más difícil de los dos? Qué estimador y qué predicción resultan razonables para µ 0 y Y 0?

43 Estimación y predicción puntual En ambos casos, el estimador (o predicción) puntual es: Ŷ 0 = ˆβ 0 + ˆβ 1 x 0 = Ȳ + ˆβ 1 (x 0 x). Sin embargo, el intervalo de confianza para µ 0 es diferente del intervalo de predicción para Y 0. Intervalo de confianza para µ 0 de nivel 1 α: 1 Ŷ 0 t n 2;α/2 S R n + (x 0 x) 2 nv x Intervalo de predicción para Y 0 de nivel 1 α: Ŷ 0 t n 2;α/2 S R n + (x 0 x) 2 nv x

44 Ejemplo: temperatura y vibración de las alas Calcula un intervalo de confianza de nivel 95% para el número medio de vibraciones de las alas de los grillos cuando la temperatura es de 80 grados Farenheit. Calcula un intervalo de predicción de nivel 95% para el número de vibraciones de las alas de un grillo cuando la temperatura es de 80 grados Farenheit. En una población de la Comunidad de Madrid se sabe que la renta per cápita es 1000 euros inferior a la media de los datos disponibles. Calcula un intervalo de predicción de nivel 95% del porcentaje de fracaso escolar en esa población. Repite el ejercicio para una población cuya renta sea 1000 euros superior a la media. Medias Cuasidesviaciones típicas % Fracaso Renta

45 Intervalos de confianza y predicción Bandas de predicción Bandas de confianza media

46 Intervalos de confianza para la media &[PageTitle] Intervalos de confianza 40,0 30,0 Fracaso 20,0 10,0 Sq r lineal = 0,55 7,500 10,000 12,500 15,000 Renta 17,500 20,000 22,500

47 Renta Intervalos de predicción para valores individuales Intervalos de predicción 40,0 30,0 Fracaso 20,0 10,0 Sq r lineal = 0,55 7,500 10,000 12,500 15,000 Renta 17,500 20,000 22,500

48 Estimación de algunas relaciones no lineales A veces, aunque la relación entre x e Y no sea lineal, el modelo de regresión simple puede aplicarse después de transformar adecuadamente las variables. Modelos: Modelo de regresión exponencial Modelo de regresión logarítmica Modelo de regresión potencial

49 Modelo de regresión exponencial La variable respuesta es aproximadamente una función exponencial de la variable regresora: Y ae bx Se linealiza tomando logaritmos: log Y log a + bx Si ajustamos un modelo lineal a obtenemos los estimadores log a y ˆb. (x 1, log Y 1 ),..., (x n, log Y n ) Invirtiendo los cambios obtenemos los estimadores â y ˆb.

50 Modelo de regresión logarítmica La variable respuesta es aproximadamente una función lineal del logaritmo de la variable regresora: Y β 0 + β 1 log x Si ajustamos un modelo lineal a obtenemos los estimadores ˆβ 0 y ˆβ 1. (log x 1, Y 1 ),..., (log x n, Y n )

51 Modelo de regresión potencial La variable respuesta es proporcional a una potencia de la variable regresora: Y ax b Se linealiza tomando logaritmos: log Y log a + b log x Si ajustamos un modelo lineal a obtenemos los estimadores log a y ˆb. (log x 1, log Y 1 ),..., (log x n, log Y n ) Invirtiendo los cambios obtenemos los estimadores â y ˆb.

52 Ejemplo: renta y fracaso escolar Fracaso log Fracaso Renta Renta Fracaso log Fracaso log Renta log Renta

53 Ejemplo: renta y fracaso escolar Resumen del modelo y estimaciones de los parámetros Ecuación Resumen del modelo Estimaciones de los parámetros R cuadrado F gl1 gl2 Sig. Constante b1 Lineal,550 25, ,000 38,494-1,347 Logarítmica,572 28, ,000 70,584-19,600 Potencia,610 32, , ,923-1,066 Exponencial,594 30, ,000 51,642 -,074

54 Diagnóstico del modelo: linealidad y homocedasticidad El gráfico más útil para el diagnóstico del modelo es el de residuos frente a valores ajustados: (Ŷ 1, e 1 ),..., (Ŷ n, e n ) Se suelen utilizar los residuos estandarizados, que bajo las hipótesis del modelo tienen aproximadamente la distribución normal estándar. La hipótesis de normalidad se valora a partir de un gráfico de probabilidad de los residuos. La homocedasticidad se puede confirmar si No hay patrones sistemáticos en el gráfico. La variabilidad es aproximadamente constante a lo largo de todo el rango de valores ajustados. Los residuos estandarizados que no están comprendidos entre los valores -3 y 3 pueden corresponder a datos atípicos potencialmente influyentes.

55 Residuos frente a valores ajustados

56 Residuos frente a valores ajustados x y x y x y x y Ajustados Residuos Ajustados Residuos Ajustados Residuos Ajustados Residuos

57 Diagnóstico del modelo: normalidad

58 Precauciones al aplicar el modelo de regresión simple Existencia de datos atípicos Extrapolación Mezcla de poblaciones diferentes Datos temporales

59 Datos atípicos

60 Datos atípicos

61 Datos atípicos

62 Datos atípicos

63 Ejemplo: Temperatura e intensidad de luz en estrellas Para 47 estrellas se han registrado el log de la temperatura efectiva en la superficie (Temp) y el log de la intensidad de su luz (Intens) log(temperatura) log(intensidad)

64 Ejemplo: Temperatura e intensidad de luz en estrellas log(temperatura) log(intensidad)

65 Extrapolación Verdadera relación Y buena Y predicción Recta de regresión estimada x predicción

66 Mezcla de poblaciones Regresión con todos los datos

67 Ejemplo: número de pie y estatura

68 Datos temporales (correlación espúrea PNB en EE.UU e incidencia del melanoma en la población masculina en Connecticut ( )

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple ESTDÍSTIC PLICD Grado en Nutrición Humana y Dietética Planteamiento del problema Tema 4: Regresión lineal simple Recta de regresión de mínimos cuadrados El modelo de regresión lineal simple IC y contrastes

Más detalles

TEMA 4 Modelo de regresión múltiple

TEMA 4 Modelo de regresión múltiple TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.

Más detalles

Estadística aplicada al medio ambiente

Estadística aplicada al medio ambiente Estadística aplicada al medio ambiente III. Regresión lineal 3 o de CC. AA. Departamento de Matemáticas Universidad Autónoma de Madrid 2011/12 Planteamiento Modelo Estimación de parámetros Intervalos de

Más detalles

Tema 4. Regresión lineal simple

Tema 4. Regresión lineal simple Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias

Más detalles

TEMA 2 Diseño de experimentos: modelos con varios factores

TEMA 2 Diseño de experimentos: modelos con varios factores TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial

Más detalles

Estadística II Ejercicios Tema 5

Estadística II Ejercicios Tema 5 Estadística II Ejercicios Tema 5 1. Considera los cuatro conjuntos de datos dados en las transparencias del Tema 5 (sección 5.1) (a) Comprueba que los cuatro conjuntos de datos dan lugar a la misma recta

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

Estadística II Examen final enero 19/1/17 Curso 2016/17 Soluciones Duración del examen: 2 h y 15 min

Estadística II Examen final enero 19/1/17 Curso 2016/17 Soluciones Duración del examen: 2 h y 15 min Estadística II Examen final enero 19/1/17 Curso 016/17 Soluciones Duración del examen: h y 15 min 1. 3 puntos El Instituto para la Diversificación y Ahorro de la Energía IDAE ha publicado un estudio sobre

Más detalles

Objetivo: Proponer modelos para analizar la influencia

Objetivo: Proponer modelos para analizar la influencia TEMA 3: REGRESIÓN LINEAL SIMPLE Objetivo: Proponer modelos para analizar la influencia de una variable cuantitativa sobre un fenómeno que nos interesa estudiar. 1. Modelo lineal l de regresión 2. Estimación

Más detalles

peso edad grasas Regresión lineal simple Los datos

peso edad grasas Regresión lineal simple Los datos Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M.

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M. Los modelos de regresión sirven, en general, para tratar de expresar una variable respuesta (numérica) en

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

Regresión Lineal Simple y Múltiple Regresión Logística

Regresión Lineal Simple y Múltiple Regresión Logística Regresión Lineal Simple y Múltiple Regresión Logística Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura MUI en Ciencias de la Salud MUI en Ciencias de la Salud (UEx) Regresión

Más detalles

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por

Más detalles

Tema 8: Regresión y Correlación

Tema 8: Regresión y Correlación Tema 8: Regresión y Correlación Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 8: Regresión y Correlación Curso 2008-2009 1 / 12 Índice

Más detalles

REGRESIÓN LINEAL SIMPLE

REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias

Más detalles

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)

Más detalles

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar

Más detalles

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago

Más detalles

Modelo de Regresión Lineal

Modelo de Regresión Lineal Modelo de Regresión Lineal Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Introducción Un ingeniero, empleado por un embotellador de gaseosas,

Más detalles

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos TEMA 10 (curso anterior): REGRESIÓN Y CORRELACIÓN 1 Conceptos de Regresión y Correlación 2 Variables aleatorias bidimensionales 3 Ajuste de una recta a una nube de puntos 4 El modelo de la correlación

Más detalles

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión

Más detalles

TEMA 4 Regresión logística

TEMA 4 Regresión logística TEMA 4 Regresión logística José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Variable respuesta dicotómica. Ejemplo. El

Más detalles

Relación 3 de problemas

Relación 3 de problemas ESTADÍSTICA II Curso 2016/2017 Grado en Matemáticas Relación 3 de problemas 1. La Comunidad de Madrid evalúa anualmente a los alumnos de sexto de primaria de todos los colegios sobre varias materias. Con

Más detalles

Estadística; 3º CC. AA. Examen final, 23 de enero de 2009

Estadística; 3º CC. AA. Examen final, 23 de enero de 2009 Estadística; 3º CC. AA. Examen final, 3 de enero de 9 Apellidos Nombre: Grupo: DNI. (5 ptos.) En un estudio sobre las variables que influyen en el peso al nacer se han obtenido utilizando SPSS los resultados

Más detalles

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Regresión múltiple. Demostraciones. Elisa Mª Molanes López Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +

Más detalles

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre

Más detalles

Definición de Correlación

Definición de Correlación Definición de Correlación En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias: Estudiar cómo influye la estatura del padre sobre la estatura del

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez https://torrezcesar.wordpress.com

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez https://torrezcesar.wordpress.com ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez torrezcat@gmail.com https://torrezcesar.wordpress.com 0416-2299743 Programa de Estadística II UNIDAD IV: REGRESIÓN Y CORRELACIÓN MÚLTIPLE LINEAL TANTO

Más detalles

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE UNIDAD 3 REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE Relación entre variables de interés 1 Relación entre variables de interés Muchas decisiones gerenciales se basan en la relación entre 2 o

Más detalles

Estadística II Examen final junio 27/6/17 Curso 2016/17 Soluciones

Estadística II Examen final junio 27/6/17 Curso 2016/17 Soluciones Estadística II Examen final junio 27/6/7 Curso 206/7 Soluciones Duración del examen: 2 h y 5 min. (3 puntos) Los responsables de un aeropuerto afirman que el retraso medido en minutos en el tiempo de salida

Más detalles

Estadística II Examen Final 19/06/2015 Soluciones. Responda a las preguntas siguientes en los cuadernillos de la Universidad

Estadística II Examen Final 19/06/2015 Soluciones. Responda a las preguntas siguientes en los cuadernillos de la Universidad Estadística II Examen Final 19/06/2015 Soluciones Responda a las preguntas siguientes en los cuadernillos de la Universidad Utilice diferentes cuadernillos para responder a cada uno de los ejercicios Indique

Más detalles

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min. Estadística II Examen final junio - 17/06/16 Curso 201/16 Soluciones Duración del examen: 2 h. y 4 min. 1. (3, puntos) La publicidad de un fondo de inversión afirma que la rentabilidad media anual del

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

Tema 3: Análisis de datos bivariantes

Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta

Más detalles

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15 Unidad Temática 3: Estadística Analítica Unidad 9 Regresión Lineal Simple Tema 15 Estadística Analítica CORRELACIÓN LINEAL SIMPLE Indica la fuerza y la dirección de una relación lineal proporcional entre

Más detalles

Modelación estadística: La regresión lineal simple

Modelación estadística: La regresión lineal simple Modelación estadística: La regresión lineal simple Gabriel Cavada Ch. 1 1 División de Bioestadística, Escuela de Salud Pública, Universidad de Chile. Statistical modeling: Simple linear regression Cuando

Más detalles

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión

Más detalles

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.

Más detalles

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II PRÁCTICA 7 Problema 1. Tengamos el siguiente ANOVA obtenido en una investigación con N 15 donde se estudia la relación entre autoeficacia percibida (X y el rendimiento

Más detalles

Curso de nivelación Estadística y Matemática

Curso de nivelación Estadística y Matemática Modelo de Curso de nivelación Estadística y Matemática Pruebas de hipótesis, y Modelos ARIMA Programa Técnico en Riesgo, 2017 Agenda Modelo de 1 2 Asociación Medidas de asociación para variables intervalo

Más detalles

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012

Más detalles

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez.

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez. Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez. Econometría Regresión Múltiple: Municipio Ocupados Población Analfabeta Mayor de 10 años Total de Viviendas Bejuma 18.874 1.835

Más detalles

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento. UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre

Más detalles

Análisis de regresión y correlación lineal

Análisis de regresión y correlación lineal Análisis de regresión y correlación lineal En las unidades anteriores hemos aplicado metodologías estadísticas para analizar la información de una variable desde una o más muestras utilizando las herramientas

Más detalles

Prácticas Tema 4: Modelo con variables cualitativas

Prácticas Tema 4: Modelo con variables cualitativas Prácticas Tema 4: Modelo con variables cualitativas Ana J. López y Rigoberto Pérez Departamento de Economía Aplicada. Universidad de Oviedo PRACTICA 4.1- Se dispone de información sobre 16 familias sobre

Más detalles

Estadística. Contrastes para los parámetros de la Normal

Estadística. Contrastes para los parámetros de la Normal Contrastes para los parámetros de la Normal Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Contrastes para los parámetros de la Normal Contrastes para los parámetros

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4) OBJETIVOS DE APRENDIZAJE: TEMA Nº ANÁLISIS CONJUNTO DE DOS VARIABLES Distinguir entre variables cualitativas y cuantitativas, y saber elegir los métodos en cada caso. Conocer métodos gráficos y cuantitativos

Más detalles

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS FASES EN EL ANÁLISIS DE LOS DATOS DE UNA INVESTIGACIÓN SELECCIÓN HIPÓTESIS DE INVESTIGACIÓN Modelo de Análisis Técnica de Análisis

Más detalles

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------

Más detalles

T2. El modelo lineal simple

T2. El modelo lineal simple T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de

Más detalles

Lección 3. Análisis conjunto de dos variables

Lección 3. Análisis conjunto de dos variables Lección 3. Análisis conjunto de dos variables Estadística Descriptiva Parcialmente financiado a través del PIE13-04 (UMA) GARCÍA TEMA 3. ANÁLII CONJUNTO DE DO VARIABLE 3.1 COVARIANZA COEFICIENTE DE CORRELACIÓN

Más detalles

TEMA 10 Correlación y regresión. El modelo de regresión simple

TEMA 10 Correlación y regresión. El modelo de regresión simple TEMA 10 Correlación y regresión. El modelo de regresión simple Karl Pearson (1857-1936) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales

Más detalles

TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN

TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN 4.5.- En cuál de los siguientes casos se podría utilizar la varianza residual en lugar del coeficiente de determinación para medir la calidad del ajuste? Con el mismo conjunto de datos y dos ajustes distintos.

Más detalles

El modelo de regresión múltiple

El modelo de regresión múltiple El de regresión múltiple Simple El de regresión múltiple es la extensión a k variables explicativas del de regresión simple. La estructura del de regresión múltiple es la siguiente: y = f (x 1,..., x k

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 4 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 35 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable respuesta

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Abordaremos en este capítulo el modelo de regresión lineal múltiple, una vez que la mayor parte de las

Más detalles

Al nivel de confianza del 95%, las puntuaciones típicas son: 2- La hipótesis alternativa es; A) ; B) ; C).

Al nivel de confianza del 95%, las puntuaciones típicas son: 2- La hipótesis alternativa es; A) ; B) ; C). A continuación se presentan 4 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la misma así como de preguntas teóricas generales. SITUACIÓN 1: La empresa SND's de sondeos

Más detalles

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado. NORMAS El examen consta de dos partes: 0.0.1. Diez Cuestiones: ( tiempo: 60 minutos) No se permite ningún tipo de material (libros, apuntes, calculadoras,...). No se permite abandonar el aula una vez repartido

Más detalles

Análisis Multivariado: Modelo Predictivo de Regresión Lineal Múltiple

Análisis Multivariado: Modelo Predictivo de Regresión Lineal Múltiple Análisis Multivariado: Modelo Predictivo de Regresión Lineal Múltiple El modelo predictivo utilizado para realizar el presente análisis es el de regresión lineal múltiple (RLM) 1. Resulta plausible la

Más detalles

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.

Más detalles

1. DEFINICIONES BÁSICAS

1. DEFINICIONES BÁSICAS 1. DEFINICIONES BÁSICAS La estadística tiene dos ramas: La Estadística Descriptiva, que se ocupa de agrupar, resumir y presentar los datos incluidos en una determinada muestra. La Estadística Inferencial

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente

Más detalles

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES TEMA : DISTRIBUCIONES BIDIMENSIONALES 1.- DISTRIBUCIONES BIDIMENSIONALES Cuando estudiamos un solo carácter estadístico, los datos que obtenemos forman una variable estadística unidimensional. También

Más detalles

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL Msc. Lácides Baleta Octubre 16 Página 1 de 11 REGRESIÓN Y CORRELACIÓN LINEAL Son dos herramientas para investigar la dependencia de una variable dependiente Y

Más detalles

= 15 CALIFICACION:

= 15 CALIFICACION: 6 + 4 + 5 = 15 CALIFICACION: Vacacion.xls Este fichero está adaptado del fichero vacation.gdt del libro de Hill et al.(2008) que se puede descargar en: http://gretl.sourceforge.net/gretl data.html PARTE

Más detalles

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Modelado y simulación en Ingeniería Química. Manuel Rodríguez ÍNDICE Modelos de caja gris Calibración de modelos Estimación de parámetros Análisis de la estimación Regresión no lineal 1. Modelos de caja gris Son modelos de un sistema (o proceso), donde: Desarrollados

Más detalles

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias Part I Descripción de dos variables Introducción Si para un mismo individuo observamos simultáneamente k obtendremos como resultado una variable k-dimensional. Nos ocuparemos del estudio de las variables

Más detalles

Taller I Econometría I

Taller I Econometría I Taller I Econometría I 1. Considere el modelo Y i β 1 + ɛ i, i 1,..., n donde ɛ i i.i.d. N (0, σ 2 ). a) Halle el estimador de β 1 por el método de mínimos cuadrados ordinarios. Para realizar el procedimiento

Más detalles

ESTADISTICA AVANZADA MODULO I

ESTADISTICA AVANZADA MODULO I ESTADISTICA AVANZADA MODULO I Análisis de Regresión Modelo Supuestos Multiple 20.0 25.0 30.0 35.0 40.0 45.0 50.0 55.0 60.0 65.0 70.0 75.0 80.0 85.0 Consumo Energetico Gráfico de Dispersión 110.000 105.000

Más detalles

CORRELACIÓN LINEAL SIMPLE

CORRELACIÓN LINEAL SIMPLE CORRELACIÓN LINEAL SIMPLE ANÁLISIS DE CORRELACIÓN Cuando se trabaja con dos variables, pueden surgir diferentes preguntas como: Existe relación entre lo que una empresa gasta en publicidad y el importe

Más detalles

Práctica 3: Regresión simple con R

Práctica 3: Regresión simple con R Estadística II Curso 2010/2011 Licenciatura en Matemáticas Práctica 3: Regresión simple con R 1. El fichero de datos Vamos a trabajar con el fichero salinity que se encuentra en el paquete boot. Para cargar

Más detalles

GEOESTADÍSTICA APLICADA

GEOESTADÍSTICA APLICADA UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO GEOESTADÍSTICA APLICADA Tema: Análisis Exploratorio de Datos Instructores: Dr. Martín A. Díaz Viera (mdiazv@imp.mx) Dr. Ricardo Casar González (rcasar@imp.mx) 2009

Más detalles

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Econometría 1. Karoll GOMEZ   Segundo semestre 2017 Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios

Más detalles

Tema 2: Análisis de datos bivariantes

Tema 2: Análisis de datos bivariantes Tema 2: Análisis de datos bivariantes Los contenidos a desarrollar en este tema son los siguientes: 1. Tablas de doble entrada. 2. Diagramas de dispersión. 3. Covarianza y Correlación. 4. Regresión lineal.

Más detalles

Tercera práctica de REGRESIÓN.

Tercera práctica de REGRESIÓN. Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión

Más detalles

Información de contacto. Tema 1 Análisis exploratorio de datos. Ejemplo de introducción: contaminación por mercurio en el pescado.

Información de contacto. Tema 1 Análisis exploratorio de datos. Ejemplo de introducción: contaminación por mercurio en el pescado. Información de contacto Tema 1 Análisis exploratorio de datos José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid José Ramón Berrendero Díaz Correo electrónico: joser.berrendero@uam.es

Más detalles

T3. El modelo lineal básico

T3. El modelo lineal básico T3. El modelo lineal básico Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 41 Índice 1 Regresión lineal múltiple Planteamiento Hipótesis

Más detalles

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición... Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................

Más detalles

Estadística II. Laura M. Castro Souto

Estadística II. Laura M. Castro Souto Estadística II Laura M. Castro Souto Segundo Cuatrimestre Curso 2000/2001 Modelos de Regresión Diferencias con el Diseño de Experimentos Los modelos de regresión estudian relaciones numéricas entre variables

Más detalles

que represente lo mejor posible la relación entre valores X e Y permitiéndonos inferir un valor a partir del otro.

que represente lo mejor posible la relación entre valores X e Y permitiéndonos inferir un valor a partir del otro. Regresió n josé a. mañas 8.2.2017 1 Introducción El objetivo de las técnicas de regresión es identificar una función que permita estimar una variable Y en función de la otra X. Es decir, averiguar una

Más detalles

Regresión con variables independientes cualitativas

Regresión con variables independientes cualitativas Regresión con variables independientes cualitativas.- Introducción...2 2.- Regresión con variable cualitativa dicotómica...2 3.- Regresión con variable cualitativa de varias categorías...6 2.- Introducción.

Más detalles

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo Estructura de este tema Tema 3 Contrastes de hipótesis José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Qué es un contraste de hipótesis? Elementos de un contraste: hipótesis,

Más detalles

Regresión lineal simple

Regresión lineal simple Regresión lineal simple Unidad 1 Javier Santibáñez IIMAS, UNAM jsantibanez@sigma.iimas.unam.mx Semestre 2018-2 Javier Santibáñez (IIMAS, UNAM) Regresión simple Semestre 2018-2 1 / 62 Contenido 1 Planteamiento

Más detalles

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Econometría 1. Karoll GOMEZ   Segundo semestre 2017 Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios

Más detalles

TEMA N 1.- ANÁLISIS DE REGRESIÓN Y MÉTODO DE MÍNIMOS CUADRADOS

TEMA N 1.- ANÁLISIS DE REGRESIÓN Y MÉTODO DE MÍNIMOS CUADRADOS UNIVERSIDAD DE ORIENTE NÚCLEO DE ANZOÁTEGUI EXTENSIÓN REGIÓN CENTRO-SUR ANACO, ESTADO ANZOÁTEGUI Asignatura: Estadística II Docente: Ing. Jesús Alonso Campos TEMA N 1.- ANÁLISIS DE REGRESIÓN Y MÉTODO DE

Más detalles

Matemática Aplicada y Estadística - Farmacia Soluciones del Primer Examen Parcial - Grupo 3

Matemática Aplicada y Estadística - Farmacia Soluciones del Primer Examen Parcial - Grupo 3 1. Se está haciendo un estudio de medicamentos diferentes que contienen un principio activo común La distribución de frecuencias se indica en la tabla que sigue: Cantidad de sustancia mg [10,20 [20,30

Más detalles

ECONOMETRÍA I. Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación

ECONOMETRÍA I. Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación ECONOMETRÍA I Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía Alexandra Soberon (UC) ECONOMETRÍA

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.

Más detalles

SPSS Aplicación práctica: Base de datos del HATCO

SPSS Aplicación práctica: Base de datos del HATCO Aplicación práctica: Base de datos del HATCO Datos: observaciones de variables obtenidos desde encuentas a clientes de un distribuidor industrial. Variables de interés en la aplicación: Percepciones de

Más detalles

Regresión lineal

Regresión lineal 86 Bioestadística: Métodos y Aplicaciones coeficiente de determinación de la regresión de Y sobre X, R 2 Y X, como R 2 Y X = 1 S2 E S 2 Y (3.4) Si el ajuste de Y mediante la curva de regresión Ŷ = f(x)

Más detalles

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal Estadística Inferencial Sesión No. 9 Regresión y correlación lineal Contextualización En la administración, las decisiones suelen basarse en la relación entre dos o más variables. En esta sesión se estudia

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse

Más detalles

Sesgo y varianza del estimador de la razón. con el problema de presición vs. sesgo que ya discutimos. t y. ˆt x

Sesgo y varianza del estimador de la razón. con el problema de presición vs. sesgo que ya discutimos. t y. ˆt x Sesgo y varianza del estimador de la razón A diferencia de los estimadores lineales vistos en las clases anteriores, los estimadores de la razón son usualmente sesgados. La varianza, comunmente más reducida,

Más detalles