Segunda práctica de REGRESIÓN.



Documentos relacionados
Primera práctica de REGRESIÓN.

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Práctica 4 EJERCICIOS 1.- REGRESIÓN LINEAL SIMPLE 5.1 Regresión de Peso sobre Altura Datos en Encuesta.sgd a) Estudio descriptivo de ambas variables

ANALISIS DE LA ESTATURA

Tercera práctica de REGRESIÓN.

Práctica de AJUSTE DE DISTRIBUCIONES II (ajuste de datos)

Estadística II Examen Final - Enero Responda a los siguientes ejercicios en los cuadernillos de la Universidad.

5 Relaciones entre variables.

Estadística II Ejercicios Tema 5

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Y = ßo + ß1X + ε. La función de regresión lineal simple es expresado como:

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

peso edad grasas Regresión lineal simple Los datos

Práctica 3: Regresión simple con R

Estadística II Ejercicios Tema 4

ACTIVIDAD 5: Correlación y Regresión Lineal

Regresión lineal múltiple con R

Práctica 1: Introducción a SPSS 1

Regresión múltiple. Efecto de varias variables ambientales sobre una especie de ganso migratorio. Luz

Relación 3 de problemas

Bioestadística. Curso Práctica: La recta de regresión

Laboratorio 2: Análisis de datos bivariantes

Estadística Avanzada y Análisis de Datos

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746)

y = b 0 + b 1 x b k x k

CAPÍTULO 5 ANÁLISIS DE VARIANZA

Práctica 2: Intervalos de confianza y contrastes con SPSS 1

#Solución base de datos BOSQUE (pag 187 en papel y 201 del pdf del libro)

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

Polinomios. 1.- Funciones cuadráticas

Aplicación del Análisis de la Varianza para estudiar el tiempo de acceso en las aulas informáticas

Introducción al Tema 3. Tema 3. Correlación y regresión Covarianza y correlación. Propiedades y relación con el diagrama de dispersión. Regresión.

Econometria. 4. Modelo de Regresión Lineal Simple: Inferencia. Prof. Ma. Isabel Santana

Caso 314: Cálculo de velocidades iniciales en Cinética. Discriminación entre modelos, cálculo de pendientes y asíntotas (F.J.

Regresión lineal múltiple

Comparación de Líneas de Regresión

Función lineal y afín

Teoría de la decisión Estadística

Conocer la forma de analizar las Medidas de Tendencia Central de una distribución con OpenOffice Calc.

PRÁCTICA 4. REGRESIÓN CURVILÍNEA. INTRODUCCIÓN DE VARIABLES ARTIFICIALES EN REGRESIÓN LINEAL

D.2 ANÁLISIS ESTADÍSTICO DE LAS TEMPERATURAS DE VERANO

Ejemplo de Análisis de la Covarianza

11. PRUEBAS NO PARAMÉTRICAS

FUNCIONES CUADRÁTICAS. PARÁBOLAS

REGRESIÓN LINEAL CON SPSS

ECONOMETRÍA II: ECONOMETRÍA DE SERIES TEMPORALES. Regresión con autocorrelación

Errores frecuentes en la interpretación del coeficiente de determinación lineal

Ecuación de la Recta

Distribuciones bidimensionales. Regresión.

Prueba de hipótesis. 1. Considerando lo anterior específica: a. La variable de estudio: b. La población: c. El parámetro. d. Estimador puntual:

Estadística I Solución Examen Final- 19 de junio de Nombre y Apellido:... Grupo:...

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

ANALISIS DE REGRESIÓN. El análisis de regresión involucra el estudio la relación entre dos variables CUANTITATIVAS. En general interesa:

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Relación entre variables: causalidad, correlación y regresión

Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme.

Potencia estadística

INTRODUCCIÓN DIAGRAMA DE DISPERSIÓN. Figura1

INFORMACIÓN SOBRE LA PRUEBA DE ACCESO (PAU) A LA UNIVERSIDAD DE OVIEDO. CURSO 2015/2016

4,2 + 0,67 Y c) R 2 = 0, En la estimación de un modelo de regresión lineal se ha obtenido:

Ajuste de Regresión Lineal Simple

Técnicas Cuantitativas para el Management y los Negocios I

Análisis estadístico básico (I) Magdalena Cladera Munar Departament d Economia Aplicada Universitat de les Illes Balears

Explorando la ecuación de la recta pendiente intercepto

LAB 13 - Análisis de Covarianza - CLAVE

Ejemplo de Regresión Lineal Simple.

Lección 10: Representación gráfica de algunas expresiones algebraicas

Estadística I Examen Final - 28 Mayo de 2009 Tiempo: 2.5h - Total: 40 puntos. Nombre:... Grupo:...

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

CALIDAD 1 JOSÉ MANUEL DOMENECH ROLDÁN PROFESOR DE ENSEÑANZA SECUNDARIA

Estadística I Solución Examen Final - 28 Mayo de 2009

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

Estadística II Tema 2. Conceptos básicos en el contraste de. Curso 2010/11

APÉNDICE A GRÁFICAS Y TABLAS EMPLEADAS PARA LA DETERMINACIÓN DE LOS MODELOS

Estadística Industrial. Universidad Carlos III de Madrid Series temporales Práctica 5

CLAVE Lab 11 - Regresión Lineal Simple y Polinomial

Capítulo 2. Cómo utilizar la ayuda

Profesorado para el 3º Ciclo de la EGB y Educación Polimodal en Tecnología Espacio de Definición Institucional LA TRANSFORMACIÓN DE DATOS EN

Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Junio Propuesta B

CONCEPTOS FUNDAMENTALES

Cuaderno de prácticas de Estadística

Transcripción:

Segunda práctica de REGRESIÓN. DATOS: fichero practica regresión 2.sf3. Objetivo: El objetivo de esta práctica es interpretar una regresión y realizar correctamente la diagnosis. En la primera parte se partirá de la ecuación ajustada, se construirán intervalos de confianza, se interpretará en contraste t, el p-valor y R 2. En la segunda parte se realizará la diagnosis de los modelos mediante un gráfico de residuos frente a valores predichos. Finalmente en la tercera parte se ajustará un modelo a datos que precisan una transformación. Temas ya conocidos de prácticas anteriores: Estudiar si los datos son adecuados para analizarlos mediante regresiones. Ajustar la regresión y escribir la ecuación 2. Intervalos y contrastes. Vamos a utilizar las dos primeras columnas del fichero de datos. Altura muestra la altura de 4 estudiantes de ingeniería. La variable Peso contiene el peso de los estudiantes. Pretendemos estudiar cómo depende el Peso (Y) de la Altura (X) Si realizamos el gráfico de dispersión, vemos que cumple las hipótesis del modelo por lo que ajustamos la recta de regresión, tal como hicimos en la primera práctica, y obtenemos:

Regression Analysis - Linear model: Y = a + b*x Dependent variable: peso Independent variable: altura Standard T Parameter Estimate Error Statistic P-Value Intercept -90,2579 2,3654-7,29923 0,0000 Slope 0,90765 0,0704586 2,882 0,0000 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 638,99 638,99 65,95 0,0000 Residual 4264,77 2 38,0783 Total (Corr.) 0583,8 3 Correlation Coefficient = 0,772687 R-squared = 59,7046 percent Standard Error of Est. = 6,7076 La ecuación de regresión será: Peso=-90.3+0.9Altura Intervalo de confianza: El intervalo de confianza cuando hay más de 30 datos y quiere construirse al 95% (α=0.05) se calcula como: ˆ β ± 2SE( ˆ ) β ˆβ es el valor estimado del parámetro y ˆ β ) Donde estimar dicho parámetro. SE el error estándar al En nuestro caso el parámetro estimado vale 0.9 y su error estándar se encuentra en la segunda columna de la regresión (Marcado en rojo). Vale 0.07. El intervalo de confianza será por tanto: ( 0.9-2x0.07 ; 0.9+2x0.07 0.86 ;.04

Contraste t: En teoría ya se ha visto la necesidad de decidir si una variable es o no significativa. Esta decisión se toma en función del valor del estadístico t. Si t>2 decimos que la variable es significativa. Si t<2 la variable no es significativa. El valor del estadístico t se encuentra en la tercera columna de la tabla de resultados. Está marcado en azul. El valor de t para ˆβ es 2.88. Como es mayor que 2 podemos concluir que la altura es significativa, es decir que saber la altura de una persona aporta información sobre el peso de la misma. p-valor: El p-valor es análogo al contraste t. Si p-valor<0.05 tenemos evidencia de que la variable x es significativa. En el ejemplo, como el p-valor vale 0.0 el peso de una persona depende de la altura. R 2 : R 2 da información de cuánta variación de Y es explicada por X. En la regresión se ha marcado en rojo R-squared = 59,7046 percent Este resultado indica que el 59.70% de la variación del PESO entre personas se debe a su ALTURA. Queda un 40.3% debido a otras causas. La ecuación de regresión se escribe poniendo bajo el parámetro estimado de la pendiente su valor t entre paréntesis. Peso=-90.3+0.9Altura (2,88) R 2 =59,7% 3. Diagnosis Una vez ajustado el modelo es preciso comprobar las hipótesis a posteriori. Este análisis se hace mediante el gráfico de Residuos frente a Valores Previstos.

Para hacerlo se pincha en el icono de gráficos de la pantalla del resultado. Se obtiene el siguiente menú: Y se selecciona la opción Residuals ersus Predicted, obteniéndose Studentized residual 3, 2,, 0, Residual Plot 4. Interpretación -0,9 de logaritmos E -,9-2,9 El gráfico muestra unos residuos sin estructura, por lo que concluimos que el modelo es adecuado. 50 60 70 80 90 predicted peso Si los residuos hubiesen mostrado estructura, habría que transformar los datos y volver a ajustar la recta de regresión. 4. Regresión con transformación. A continuación se va a ajustar un modelo de regresión a los datos de las columnas tercera y cuarta del fichero de datos. (Tomados de Weisberg)

Los datos representan el peso medio del cuerpo y del cerebro para un conjunto de mamíferos. Vamos a ver cómo influye el peso del cuerpo en el tamaño del cerebro. Haciendo un gráfico de dispersión encontramos: Peso cerebro (X 000) 6 5 4 3 2 0 Plot of Peso cerebro vs Peso cuerpo 0 2 4 6 8 (X 000) Peso cuerpo Como puede verse, los datos no cumplen las hipótesis. Vamos a transformar ambas variables a logaritmos. 0 Plot of log(peso cerebro) vs log(peso cuerpo) log(peso cerebro) 8 6 4 2 0-2 -6-3 0 3 6 9 log(peso cuerpo) Tras la transformación podemos ajustar la regresión. Regression Analysis - Linear model: Y = a + b*x Dependent variable: log(peso cerebro) Independent variable: log(peso cuerpo) Standard T Parameter Estimate Error Statistic P-Value Intercept 2,348 0,0960442 22,2274 0,0000 Slope 0,75682 0,0284638 26,4084 0,0000 Correlation Coefficient = 0,959574 R-squared = 92,0782 percent Standard Error of Est. = 0,694302

Con los datos proporcionados:. Escribir la ecuación de regresión. 2. Construir un intervalo de confianza para la pendiente. 3. Es significativo el peso del cuerpo para determinar el peso del cerebro? 4. Cuantificar el efecto de un incremento del peso del cuerpo sobre el peso del cerebro. (Atención a los logaritmos que implican relaciones porcentuales) 5. Diagnosis del modelo. El gráfico de residuos Es adecuado? 6. Qué tamaño de cerebro previsto tendrá un mamífero de 80Kg?